26. 적합도 검증

지난 시간에는 12장에서 소개된 여러 자료분석방법 중 교차분석 (x² 독립성 검증) 에 대한 내용을 요약해보았다. (지난 시간의 요약내용은 아래 타이틀 하단의 '이전글'을 통하여 확인할 수 있다)


이어서 이번 시간에는 12장의 마지막 부분인 'x² 적합도 검증 (chi-square goodness of fit test)' 에 대한 내용을 정리해보도록 할텐데, 적합도 검증 역시도 지난 시간에 정리한 교차분석과 마찬가지로 빈도자료에 의하여 통계적 검증을 하는 방법으로, 어떤 조건에서의 기대빈도에 관측빈도가 적합한가(fit)를 조사하는 데 사용하는 방법이라고 할 수 있다.


그래서 적합도 검증 역시도 교차분석과 같은 x²-검증을 사용하며, 검증통계량 계산식도 동일하고, 또한 측정된 수치(관측빈도)에서 기대빈도를 산출하여 x² 검증통계량을 계산한 후 임계치나 p-value를 찾아 기각여부를 결정하는 절차 역시도 동일하다.


다만, 교차분석에서는 변수가 2개였던데 비하여 적합도 검증에서는 변수가 1개이고, 기대빈도를 계산하는 방법이 다소 다르므로 이러한 점에 유의해서 학습해야겠다.



--------------------------------------------------

Written by 행복을만드는전략가

독한 세상에서 행복을 만드는 전략과 정보

--------------------------------------------------


 Theme 

x² 적합도 검증

※처음글 - 1. 마케팅조사의 역할

※이전글 - 25. 교차분석 (독립성 검증)





검증통계량 직접 계산



1. 검증통계량 계산식



지난 시간 교차분석에서의 검증통계량 계산식과 동일하나, 자유도(d.f.) 구하는 방법이 '셀의수 - 1' 로 다르니 이 점만 유념하면 되겠다.



2. 예제


Q) 아래 자료에 의해 각 색깔을 선호하는 소비자들의 비율이 다르다고 할 수 있는가? (α = 0.01)


* 신제품 승용차의 색깔대안을 다섯 가지 고려하고 있다.


* 300명의 소비자들에게 색깔 대안 A, B, C, D, E 의 승용차를 보여주고 가장 선호하는 것을 질문하였다.


* 그 결과 아래의 표와 같이 나타났다.


D

합계

88 (60)

65 (60)

52 (60)

40 (60)

55 (60)

300 


cf. 하나의 셀 내에는 관측빈도와 기대빈도가 같이 표시되어 있다. 괄호 안의 수치가 기대빈도이다.





A-1) 검증통계량이 기각역에 위치하는지 확인


Step 1) 가설설정 : 


* H0 : 각 색깔을 선호하는 소비자들의 비율은 동일하다.

* H1 : 각 색깔을 선호하는 소비자들의 비율은 다르다.


Step 2) 검증방법 결정 : 적합도 검증 -  검증


Step 3) 기대빈도의 계산 : 기대빈도 = 합계 / 셀의 수 = 300 / 5 = 60


Step 4) 검증통계량 계산 : 


x² obs = {(88 - 60)² / 60} + {(65 - 60)² / 60} + .... + {(55 - 60)² / 60} = 21.63


Step 5) 통계표에서 임계치를 찾아 기각역 설정 : x² crit = x² (0.01 : 4) = 13.27


cf. 지난 시간에 언급하였지만, x² 검증의 경우는 거의 대부분 우측검증만 하기 때문에 별 다른 언급이 없는 경우는 우측검증을 가정하고 문제를 풀면 된다. 따라서 임계치를 찾을 때 '0.01' 과 자유도는 '5 - 1 = 4' 를 이용하여 찾으면 된다.


Step 6) 귀무가설의 기각여부 결정 : 


기각역은 'x² obs ≥ 13.27' 로써, 여기서 x² obs는 '21.63' 이었으므로 귀무가설은 기각된다. 따라서 각 색깔을 선호하는 소비자들의 비율은 다르다고 할 수 있다.


A-2) p-value로 검증


Step 1, 2, 3, 4) 'A-1' 과 동일


Step 5) 통계표에서 x² obs 에 해당하는 p-value 찾기 : p-value < 0.005


cf. x²분포표에서 자유도 4에서의 가장 큰 x² 값이 '14.8602' 이므로 x² obs 값이 21.63인 경우는 이보다 더 크게 된다. 즉 p-value는 더 작게된다.


Step 6) 귀무가설의 기각여부 결정 : 'α > p-value' 이므로 귀무가설은 기각된다.




SPSS 24에 의한 분석결과 해석



아래 표는 위의 예제에 대한 SPSS 24에 의한 분석결과표이다. 



분석결과표의 '검증 통계량' 에서 '카이제곱' 값이 앞서 구한 x² obs 이고 '근사 유의확률'이 이에 대한 p-value 이다. 앞서 통계표에서 찾은 p-value는 구체적인 값이 아닌 범위 'p-value < 0.005' 였지만 SPSS 프로그램에서는 정확하게 '0.000' 이라는 p-value 값을 보여준다.


이 글을 공유하기

Designed by JB FACTORY