33. 요인분석의 주요 개념

지난 시간에는 '제14장. 상관분석과 회귀분석' 의 마지막 파트인 다중회귀분석에 대한 내용을 요약해보았다. (지난 시간의 요약내용은 아래 타이틀 하단의 '이전글' 을 통하여 확인할 수 있다)


이어서 이번 시간에는 '제15장. 요인분석' 에 대한 주요개념들을 정리해볼텐데, 앞서 분석기법의 유형과 구분에서 살펴보았듯이 요인분석은 독립변수와 종속변수의 구분이 없고, 간격척도나 비율척도로 측정된 자료를 이용하여 분석하며, 독립변수와 종속변수의 구분이 없는 기술통계학이다.


참고로 경영지도사 2차시험에서 기술통계학에 대한 파트의 중요도는 조금 떨어지는 편이나, 전에도 언급하였듯이 매 년 시험의 난이도가 올라가고 있고, 출제의 의외성도 높아지고 있는 상황이니 주요 개념은 파악하고 넘어가는 것이 좋겠다.


그럼 시작해보자!



-------------------------------------------------

Written by 행복을만드는전략가

독한 세상에서 행복을 만드는 전략과 정보

-------------------------------------------------


 Theme 

요인분석의 주요 개념

※처음글 - 1. 마케팅조사의 역할

※이전글 - 32. 다중회귀분석




1. 요인분석(Factor analysis) 의 종류와 목적


1-1. 주성분분석 (Principal component analysis) :


다수의 변수들을 소수의 요인으로 축약하기 위한 분석으로써, 가장 많이 사용되는 방법이며, 아래의 내용도 주성분분석에 대한 내용이다.


1-2. 공통요인분석 (Common factor analysis) : 


분석대상 변수들의 기저를 이루는 구조를 정의하기 위한 방법이다.



2. 요인분석의 개념


요인분석은 기본적으로 상관관계가 높은 변수들끼리 그룹핑하는 것이므로, 변수들 간의 상관관계가 매우 낮다면 요인분석에 부적합하다.


또한 요인분석을 통하여 산출된 요인(축약된 변수)은 회귀분석 or 판별분석을 위한 독립변수로 사용될 수 있다.





3. 요인의 개수 결정방법


3-1. Eigenvalue (고유값) : 가장 많이 이용하는 방법이다.


3-1-1. 한 요인의 설명력을 가리킨다. 즉, Eigenvalue가 크다는 것은 그 요인이 변수들의 분산을 잘 설명한다는 것을 의미한다.


3-1-2. 요인적재값의 제곱합이다.


cf. 요인적재값(factor loading) 이란? : 요인이 갖는 각 변수와 해당 요인 간의 상관계수를 의미한다.


3-1-3. 일반적으로 Eigenvalue 1 이상을 갖는 요인의 수만큼 추출한다.


3-2. 요인의 수를 사전에 결정 : 연구자의 사전지식이나 경험에 의하여 임의로 요인의 수를 결정.


3-3. 전체 요인들의 설명력 기중으로 결정


요인들의 설명력의 합에 대한 기준을 사전에 정해놓고, 그 수준의 설명력을 가져오는 요인들을 추출하는 방법이다. 보통 60% 내외로 결정한다.


3-4. 스크리 도표 (scree table) : 

Eignevalue의 감소폭이 매우 체감하기 직전까지의 요인의 수를 기준으로 추출하는 방법.



4. 요인의 회전


4-1. 요인 회전의 필요성 : 


통계패키지에 의해 요인분석을 하면 비회전 요인행렬이 구해지지만 이로써는 어떤 변수들이 어떤 요인에 높게 관계되는지 명확하게 알기 어렵다. 그러므로 요인구조를 명확히 알 수 있는 방법이 필요한데, 그것이 바로 요인을 회전시키는 방법이다.


4-2. 요인 회전의 종류


4-2-1. 직각회전방식 (orthogonal factor rotation) : 


직각을 유지하면서(즉, 요인들 간 독립성을 유지하면서) 요인구조가 가장 뚜렷할 때까지 요인을 회전시키는 방법이다. 요인들 간의 상관관계를 '0' 으로 만드는 비현실적인 부분이 있기는 하지만 객관적이어서 가장 많이 사용되는 방법이다.


4-2-2. 사각회전방식 (oblique factor rotation) : 


직각을 유지하지 않은 채, 요인구조가 가장 뚜렷해질 때까지 요인을 회전시키는 방법이다. 강제로 직각화하지 않으며, 직각회전에 비하여 더 뚜렷한 정보를 제공한다는 장점이 있지만 주관이 개입될 여지가 많아 사용빈도는 떨어진다.


4-3. 직각회전방식의 종류


4-3-1. VARIMAX : 요인행렬의 열의 분산의 합계를 최대화함으로써, 열을 단순화하는 방식으로써, 가장 많이 사용되는 방법이다.


cf. 단순화 : 적재값을 아주 의미가 있거나(-1, +1) 아주 의미가 없도록(0) 한다.


4-3-2. QUARTIMAX : 요인행렬의 행을 단순화하는 방식.


4-3-3. EQUIMAX : 위 두가지 방법을 절충한 방식.



5. 요인행렬의 해석


5-1. Communality : 


한 변수의 분산이 추출된 요인들에 의해 설명되는 정도를 의미하며, 0과 1사이의 값을 갖는다. 보통 0.5보다 큰 것이 바람직한데 이 보다 작은 경우에는 그 변수를 무시하거나 제거할 수 있다.


5-2. 요인적재값 : 


요인분석결과를 해석할 때에는 통계적 유의성 대신 실제적 유의성에 관심을 갖는다. 흔히 요인적재값이 ±0.5 이상일 때 실제적 유의성을 갖는 것으로 받아들인다.


5-3. 명칭부여 : 


요인 개수의 결정방법에 따라 요인의 수가 결정되었다면 해당 요인들에 포함된 변수들의 성격을 잘 대변하는 적합한 명칭을 부여한다.


5-3. 요인점수(factor score) 계산 : 


다수 변수들에 대한 응답을 소수의 요인으로 축약시킨 것으로써, 요인분석결과를 회귀분석이나 판별분석과 같은 추가적인 분석에 사용할 때 필요한 계산이다.


이 글을 공유하기

Designed by JB FACTORY