본문 바로가기
728x90

탐색적요인분석이란 설문조사 등으로 관찰된 변수를 몇 개의 변수로 축약하는 기법이다. 관찰된 변수를 그대로 변수로 이용하지 않고 축약하는 이유는 다음과 같다.

1. 분석에 모든 변수를 이용할 수 없다
두번째 이유와도 연결되는 문제이긴 하지만 간단한 논리로 설명하겠다. 사회과학계열에서 분석이라는 것은 이공계열의 실험과도 같다. 이런 실험에서 유의미한 결과를 얻기 위해서는 적절한 통제를 해야 한다. 예를 들어 햇빛이 작물의 성장에 미치는 영향을 알기 위해서는 햇빛 외의 흙, 온도, 습도와 같은 변수들을 동일하게 맞춰준다. 마찬가지로 사회과학계열에서 분석 시 이용하는 회귀분석의 계수는 다른 변수들이 일정하다는 가정 하에서 도출된다. 문제는 현실에서 실제로 고정될 수가 없다. 즉, 변수가 많을 수록 우리는 더 많은 상황을 가정해야만 한다.

2. 다중공선성(Multicollinearity)문제를 해결한다
다중공선성에 대한 자세한 내용은 해당 페이지에서 설명할 것이다. 여기서는 변수 간 강한 상관관계가 발생하면 모형의 설명력이 떨어진다고만 설명하겠다. 설문조사를 예로 들면, '즐거웠다'라는 문항과 '만족했다'라는 문장은 아마도 서로 강한 양의 상관관계로 나타날 것이다. 이러한 경우 모형의 설명력이 떨어질 수 있으므로 이 둘을 하나로 묶어주는 작업이 필요하다. 사실 "다중공선성문제를 해결한다"는 표현이 맞는지는 잘 모르겠다. 아무튼 요인분석을 통해 원활한 분석이 가능해진다.

728x90

이러한 탐색적요인분석을 활용한 논문은 너무 쉬워서 많은 사람들이 작성한다. 그러나 정확하게 이해한 사람은 별로 없으며, 연구 주제만 잘 선정한다면 SCI급 저널에도 퍼블리시가 될 만큼 강력한 툴이다. 따라서 탐색적요인분석에 대해 잘 이해하고 어떤 내용들을 논문에 제시해야하는지 알 필요가 있다. 아래에서는 탐색적요인분석의 개념에 대해 설명할 것이다.

탐색적요인분석을 활용하여 논문 작성 시 들어가야하는 내용과 각 분석프로그램에서의 분석방법은 아래 링크를 참고하기 바란다.

<논문 작성>

<SPSS>


탐색적요인분석을 포함한 요인분석의 회귀식은 아래와 같다. (요인분석에 대한 대략적인 개념이 알고 싶다면 다음 링크를 확인하면 된다; https://s-ea.tistory.com/104)

y는 우리가 설문조사 등으로 얻은 관찰값이고, f는 factor 즉 요인이다. 회귀식을 보면 알겠지만 요인분석이라는 것은 하나의 관찰변수를 각 요인들이 얼마나 설명할 수 있는지를 파악하는 것이다. 이때 하나의 요인이 모든 관찰된 변수들에 대해 가지는 계수 a를 요인적재치(또는 요인적재량, 영어로는 Factor Loading)라고 부른다. 

탐색적요인분석이 가지는 확인적요인분석(CFA; Confirmatory Factor Analysis)과의 차이는 탐색적요인분석은 모든 요인들에 대해 시행하지만 확인적요인분석은 사전에 세팅된 요인에 대해서만 시행한다는 점이다. 즉, (설문조사를 예시로 들면) 탐색적요인분석은 어떤 문항에 대한 응답에 각 요인들이 얼마나 영향을 주었는지를 보는 것이고, 확인적요인분석은 사전에 이론적으로 존재하는 이론이 문항에 대한 응답들을 얼마나 잘 설명하는지 보는 것이다.

김계수. (2015). R-구조방정식 모델링 발췌

이러한 회귀를 진행한 뒤에는 회전이라는 것을 하는데, 직각회전과 사각회전으로 나눌 수 있다. 이에 대한 설명은 이 링크( https://m.blog.naver.com/shoutjoy/221802826087)를 확인하기 바란다. 사회과학계열에서 크게 중요한 부분은 아니다. 물론 해당 모델을 이용하여 새로운 응용을 하거나 전문가가 되려면 알아야겠지만, 다른 배울 것도 많기 때문에 그런 게 아니라면 굳이 깊게 알 필요는 없다. 그냥 값의 차이가 더 명확하게 보여주는 방법이라고 이해하면 된다. 통상적으로 베리맥스(Varimax)회전방법을 많이 이용한다.

한편, (논문 작성 파트에서 설명하겠지만) 분석을 시행하면 요인적재치(혹은 적재량, 영어로는 Factor Loading)라는 값이 나온다. 이는 위 회귀식에서 a에 해당하는 계수값으로, 클수록 대상이 되는 관측된 변수를 잘 설명한다고 보면 된다. 만약 '맛있다'라는 설문문항에 대한 요인적재치가 각각 0.800, 0.211, 0.200 ... 으로 나타났다면 요인1이 '맛있다'를 가장 잘 설명하는 요인이라고 볼 수 있다.

추가적으로 이미 요인분석 페이지에서 언급했지만, 주성분분석(PCA; Principal Component Analysis)과는 다른 것이다. 오류를 답습하는 일은 없길 바란다. ( https://s-ea.tistory.com/104에서 설명하였다)

728x90

Starlight, Economic, Agriculture

농업경제학으로 석사학위를 마치고 때려침