검색창

에피소드 10. 통계프로그램과 모델링, 가설채택의 기준 - 「알고 보면 별거 아닌 논문의 기술」 칼럼

페이지 정보

작성자
김태경 박사 | 올브레인뉴스…
댓글
0건
조회
3,432회

본문

알고 보면 별거 아닌 논문의 기술  

에피소드 10. 통계프로그램과 모델링


(1) 통계프로그램은 다 배워야 할까?


“잘 돼가냐?”

영수 형이 뒤에서 툭 물어본다.


“그냥~ 그럭저럭 이요~. 형, 궁금한 게, 통계프로그램이 다양하던데 그거 다 배워야 돼요?

SPSS, SAS, R, STATA, AMOS …. 이것저것 다 배워야하는 것처럼 느껴져서 부담감이 이만저만이 아니에요.


“뭐~ 배우면 좋지만 기능은 크게 다르지 않아.

일단 SPSS가 쉽고 요즘에는 기능이 많이 좋아져서 주로 많이 쓰고

SAS는 매크로 기능으로 순환적인 계산식을 직접 프로그래밍할 수 있다는 게 차이점이랄까.

다른 프로그램에서는 공간통계나 추가적인 분석 같은 것도 가능한데 다들 SPSS와 크게 다르지는 않아.

먼저 한 가지 프로그램에 능숙해지면 다른 프로그램도 쉽게 배울 수 있어.”

24fd5995bb4c6e3891b03b2461a2e11a_1538041630_8986.jpg
 

-


(2) 모델링은 무엇인가?


모델링은 '결과를 일으키는 원인(인과)을 분석하는 것'이다.


우리가 세운 연구가설(대립가설; H1) ‘A는 B에 영향을 미칠 것이다.’에 대하여

“A가 B에 영향을 미친다는 것이 사실일까?”에 대해 통계적으로 판단하는 과정인데

즉, “A가 B에 영향을 미칠 확률이 얼마나 될 것인가?”를 확인하는 작업이다.


이 때, 가설에서 제시한 특정 영향요인 외에 가설과 관련되지 않는 요인들은 제외되거나 기타 조건이 동일할 것이라는 전제 하에 모델링을 해야 한다. 이 법칙을 ‘세테리스 파리부스’라고 한다.

24fd5995bb4c6e3891b03b2461a2e11a_1538041640_9183.jpg

어떤 현상(결과)에 직·간접적으로 영향을 끼치는 수많은 원인 중 가장 주요하고 상관관계가 있는 원인을 찾아내고 또 현상을 일반화하고 설명해야하기 때문에

내가 가설에서 가정한 영향요인 외에 모든 조건을 동일하다고 가정한 후 의미 있게 변화하는 단일한 요인을 찾아내야한다.

이렇듯 설명변수와 그 외의 조건들이 통제되어 있기 때문에 모델링을 통해 일반화를 거칠 수 있을지언정 보편적 법칙이라고는 할 수 없다1). 


※ 모델링을 통해 나온 값을 통해 무엇을 기준으로 A가 B에 영향을 미쳤다고 하는지, 하지 않는지를 판단하기 위해 유의수준(significant level)을 참고한다. 

<논문에서 α값, p값, t값으로 표시되는 것들. α=유의수준, p=확률; probability, t=검정통계량; t-value>

일반적으로 사회과학 분야에서는 p<.05   |   α=.05   |   t값 ±1.96 기준으로 한다.

유의수준 α=.05를 기준으로 확률을 나타내는 p값이 .05보다 작으면 서로 관련이 있다고 보기 때문에 가설이 채택된다. (p<α).


모델링에서 유의수준이 *p<.05 로 나타나는 결과를 통계적으로 설명해보면 아래와 같다.

“A가 B에 영향을 미친다고 내가 95%정도 확신할 수 있어. A가 B에 영향을 미치지 않을 확률이 5% 정도이기 때문에 결국, A가 B에 영향을 미친다고 할 수 있지.”

(**p<.01 이면 99%, ***p<.001이면 99.9%)

 

인과를 분석하는 가장 기본적인 통계모형은 회귀분석(Regression analysis)이다.

회귀분석은 A가 B에 영향을 미치는가, 어느 정도 확률로 미치는가? 를 판단하는 모델링이다.

예시)


24fd5995bb4c6e3891b03b2461a2e11a_1538041466_9511.jpg
출처: 허지영, 안지령. (2016). 어머니의 스마트폰 중독의 정도가 양육효능감과 유아의 사회적 능력에 미치는 영향 . 육아정책연구, 10(2), 39. 


위의 예시에서 t값이 ±1.96 이상이면서 유의수준을 나타내는 p값이 <.05, <.001 미만으로 나타났기 때문에 어머니의 스마트폰 중독의 정도가 양육효능감에 유의하게 영향을 미치는 것으로 나타난 것을 알 수 있다.

그리고 t값에 –가 붙어 독립변인이 종속변인에 부적으로 영향을 미치는 것으로 해석되었다.

즉, 설명변수인 ‘어머니의 스마트폰 중독의 정도’가 높아질수록 종속변인 ‘양육효능감’은 낮아지는 것으로 해석된다.

-가 붙지 않는 결과 값은 정적(+) 영향을 미친다고 해석할 수 있다.



당신이 통계식이나 수학식을 만드는 연구자가 아니라면,

이렇듯 다양한 모형들을 다룰 때 우리가 해야 할 일은 ‘모형을 이해하고 연구에 필요한 모형을 선택하는 능력을 키우는 것’이다.



그 외의 모형들을 참고해보세요.

▶ 차이분석 모델: 요인분석, 군집분석, t-test, ANOVA 등

▶ 민감도모형 : log-log모형 : 설명(독립)변수 값의 변화에 따라 종속변수 값이 어느 정도 변하는지 판다하는 분석모형.

▶ 수학적 모델: CGE(Computable General Equilibrium Model; 일반균형모델), 경제기반모형(Economic Base Thoery), 투입산출모형(Input-Output Model), 최적화모형 등

▶ 공간상 경로 최적화 모형: 네트워크 모형

▶ 단순 분석방법으로 현상의 해답을 찾기 어려운 경우: 시뮬레이션 모형, Chaos모형, 복잡계 모형 등

이외에도 다양합니다.



| 김태경 박사. 사회현상 분석가. (tk-lab@daum.net) 

사회에서 나타나는 현상을 사람들에게 알기 쉽게 설명하고자 하는 목표를 가진 필자는 미국의 Georgia Tech, Ohio State University 등을 거치며 Ph.D.를 수여받았으며, 기존 논문실적을 인정받아 Ph.D.를 받기 2년 전부터 University of Michigan의 Institute for Social Research에서 Post-Doctoral Researcher, Research Fellow로서 쇠퇴한 자동차도시 Detroit지역 주민들의 Quality of Life에 대해 연구하고 전 세계 13개 도시의 학자들과 연구방법과 결과를 공유한 바 있다. 현재는 국내의 정부 연구기관에서 도시분야 연구자로 활약 중이다. 




「알고 보면 별거 아닌 논문의 기술」 전문을 더 빠르게 소장하면서 볼 수 있는 방법과 구체적인 팁을 알고 싶다면?  

교보문고 https://goo.gl/yjvoG6

  교보  e북  https://goo.gl/6WYc83

예스24 https://goo.gl/ZuaLfB

  예스24 e북 https://goo.gl/LQfPxB

알라딘  https://goo.gl/gcJhKT

  알라딘 e북 https://goo.gl/2QkCvN

- 리디북스 https://goo.gl/Q7D63f



올브레인은 논문작성에 도움이 될 수 있는 김태경 박사님의 저서 「알고 보면 별거 아닌 논문의 기술」을 요약 및 발췌, 2차 가공하여 매주 목요일 연재합니다. 

편집자주※단락으로 제시된 내용은 올브레인이 편집, 추가한 사항으로 원문과는 관련이 없습니다. 

1) "세테리스 파리부스 [Ceteris Paribus]" 두산백과; 네이버 지식백과, accessed Sep 27, 2018. https://goo.gl/NTWk1M




-----------------

김태경님의 연재

실전, 데이터분석! 기초통계량으로 알 수 있는 것

/bbs/board.php?bo_table=news&wr_id=1506


에피 9. 조사데이터 분석의 기본

/bbs/board.php?bo_table=news&wr_id=1499


에피 8. 통계 수식 외워야할까? & 통계자료 구축(자료조사) 방법


실전. 선행연구 인용과 검토방법

/bbs/board.php?bo_table=news&wr_id=1487


에피 7. 선행연구 작성 순서

/bbs/board.php?bo_table=news&wr_id=1482


에피 6. 선행연구 검토부분 작성
/bbs/board.php?bo_table=news&wr_id=1477


서론쓰기 실전. "논문의 골격은 서론에서 익히자."  B-P-M-R-C

/bbs/board.php?bo_table=news&wr_id=1468


에피5. 기대와 현실의 차이

/bbs/board.php?bo_table=news&wr_id=1462


「번외」 실전 논문 주제잡기: 현상분해와 인과분석
/bbs/board.php?bo_table=news&wr_id=1456 

에피4. 주제를 어떻게 잡는지 가르쳐주시면 안되나요? - 교수님을 찾아뵙자!

에피3. 주제 파악하기에 아직은 이른? - 무슨 논문 주제를 벌써 정해요?

에피2. 키워드로 논문찾기

에피1. 논문에 도움이 될 수 있는 커리큘럼을 놓치는 우를 범하지 말라 - 타 연구실 담당 교수님 수업 듣기

프롤로그. 길을 잃은 당신을 위한 단상 
  • 트위터로 보내기
  • 페이스북으로 보내기
  • 구글플러스로 보내기

댓글목록

등록된 댓글이 없습니다.