본문 바로가기
728x90

요인분석이란 여러개의 변수를 몇 개의 변수로 요약해주는 기법이다.

요인분석은 탐색적요인분석(EFA; Exploratory Factor Analysis)과 확인적요인분석(CFA; Confirmatory Factor Analysis)으로 나눌 수 있는데, 각각에 대한 자세한 소개는 각각의 게시글에서 따로 할 것이다. 여기서는 강력한 이론적 배경이 있으면 확인적요인분석, 없으면 탐색적요인분석을 이용한다고만 언급하고 넘어가겠다.

과거에는 주성분분석(PCA; Principal Component Analysis)을 탐색적요인분석의 기법 중 하나로 사용했으나 현재에는 거의 이용하지 않는다. 그 이유는 주성분분석은 애초에 요인분석과 회귀식부터 다르기 때문이다. 일반적인 요인분석의 회귀 식은 다음과 같다

y는 우리가 설문조사 등으로 얻은 관찰값이고, f는 factor 즉 요인이다. 회귀식을 보면 알겠지만 요인분석이라는 것은 하나의 관찰변수를 각 요인들이 얼마나 설명할 수 있는지를 파악하는 것이다. 이때 하나의 요인이 모든 관찰된 변수들에 대해 가지는 계수 a를 요인적재치(또는 요인적재량, 영어로는 Factor Loading)라고 부른다. 

그러나 주성분분석의 회귀식은 F=ay+ay+ay+e 와 같은 형태이다. 다시 말하면 성분이 어떤 관찰된 변수들로 이루어져있는가를 의미한다. 이에 따라 요인분석에서 주로 이용하는 회전방법인 '베리맥스(Varimax)'를 주성분분석에 이용하는 것은 애초에 말이 되지 않는다. (자세한 내용은 '주성분분석'파트에서 다룰 것이다.) 

그렇다면 왜 과거에 국내 학자들은 요인분석을 수행할 때, 주성분분석과 베리맥스 회전방법을 이용했는가? 정확한 이유는 알 수 없으나, 요인분석 시 가장 편리하고 강력한 툴인 SPSS에 보면 주성분분석이 요인분석 안에 포함되어있다. 심지어 주성분분석을 선택하고도 베리맥스 회전방식을 선택할 수 있다. 문제는 요인분석은 폭넓은 분야에서 이용되는 분석방법이라는 것이다. 이들은 통계전문가가 아니다. 따라서 SPSS에 있는대로 그대로 이용한 결과이며, 이를 답습하는 것이다.

728x90

추가적으로 회전을 하는 이유는 값의 차이를 명확하게 보여주기 위해서이다. 이에 대해서는 굳이 다루지 않을 것이다. 이를 완벽히 이해하는 것은 통계학과나 수학과가 해줄 것이다. 그럼에도 수학적인 부분 외에 자세한 부분이 궁금하다면 아래 블로그에 정리가 잘 되었으니 참고하기 바란다. (https://m.blog.naver.com/shoutjoy/221802826087)

 

요인분석(Factor analysis)시 회전방법( varimax, quartimax, oblimin,promax)

이번시간에는 인터넷 등에서 조사한 요인분석에 대한 자료를 정리하려고 한다. [요인분석을 하는 이유] 요...

blog.naver.com

 

728x90

Starlight, Economic, Agriculture

농업경제학으로 석사학위를 마치고 때려침