19. 가설검증의 기초

지난 시간에는 '제11장. 자료분석의 준비와 기초통계' 의 내용 중 자료분석의 준비, 통계학의 종류와 관련 용어, 그리고 추정의 오류진단과 표본추출분포에 대한 내용을 요약해보았다. (지난 시간의 요약내용은 아래 타이틀 하단의 '이전글'을 통하여 확인할 수 있다)


이어서 이번 시간에는 11장의 내용 중 가설검증의 기초와 관련한 내용을 정리해보도록 할텐데, 지난 시간과 마찬가지로 모든 개념들을 반드시 다 이해하고 넘어가야 할 부분이고, 암기해야 할 부분도 많으니 집중하도록 해야겠다.


그럼 시작해보자!



-------------------------------------------------

Written by 행복을만드는전략가

독한 세상에서 행복을 만드는 전략과 정보

-------------------------------------------------


 Theme 

가설검증의 기초

※처음글 - 1. 마케팅조사의 역할

※이전글 - 18. 통계학의 종류와 표본추출분포





가설의 설정과 오류의 종류



1. 대립가설과 귀무가설


가설검증(Hypothesis test) 시 설정되는 가설에는 아래와 같이 대립가설 귀무가설이 있다.


1-1. 대립가설 (Alternative hypothesis) _ H1 : 


연구자가 어떤 현상에 대하여 "~ 일 것이다."라고 생각하는 것으로써, 연구자가 지지하기를 원하는 가설이다. 연구가설, 주장가설이라고도 한다.


1-2. 귀무가설 (Null hypothesis) _ H0


대립가설의 반대에 해당하는 진술로써, 통계적 검증의 대상이 된다. 영가설이라고도 한다. 


ex> 예시: 소비자 단체는 우유 1리터에 담긴 우유의 양이 1리터가 되지 않을 것이다라고 생각한다.

* H0 : 우유 1리터 팩의 평균량 = 1리터

* H1 : 우이 1리터 팩의 평균량 < 1리터


cf. 무엇이든지 둘 간의 크기를 비교할 때 차이가 없다라는 것을 보다 보수적인 견해로 보며, 이러한 보수적인 견해 or 주장이 귀무가설로 설정된다.


1-3. 가설검증의 결과


가설검증을 거쳐 귀무가설은 기각되거나 기각되지 않는다. 즉 귀무가설이 기각되면 연구가설(대립가설)은 지지되고, 기각되지 않으면 연구가설은 지지되지 못하게 된다.


1-4. 검증결과의 표현


1-4-1. 귀무가설을 검증하는 경우 : 귀무가설을 기각한다 or 기각하지 않는다.

1-4-2. 연구가설(대립가설)을 검증하는 경우 : 통계적으로 유의적이다 or 비유의적이다.


cf. 검증결과를 표현하는 답안 작성 시에는 반드시 위의 표현으로 작성하도록 하자.





2. 1종 오류와 2종 오류


가설검증은 모수를 통계량으로부터 추정하므로, 어떠한 결론이 나오든 그것은 추정이므로 오류의 가능성이 있다. 이와 관련한 오류에는 다음의 두 가지가 있다.


2-1. 1종 오류 (Type 1 error) : 귀무가설이 진실인데, 이를 기각하는 오류.


2-2. 2종 오류 (Type 2 error) : 귀무가설이 허인데, 이를 기각하지 않는 오류.


cf. 보수적인 견지에서 심각한 오류는 1종 오류이므로, 통계학에서의 가설검증은 1종 오류를 중심으로 이루어진다. (무죄인 사람을 유죄로 판정하는 것을 1종 오류, 유죄인 사람을 무죄로 판정하는 것을 2종 오류에 견줄 수 있다)




유의확률과 유의수준



1. 유의확률 (Significance probability) : 


귀무가설이 옳다는 전제 하에, 현재의 표본으로부터 얻은 통계량보다, 절대값으로 비교하여, 같거나 더 큰 값을 갖는 통계량을 또 다른 표본으로부터 얻을 수 있는 확률로써, p-value라고 나타낸다. 


따라서 p-value가 작다는 것은 귀무가설이 옳다는 전제 하에, 다른 표본으로부터 더 극단적인(그래프의 양 끝을 향하는, 즉 절대값으로 비교해서 같거나 더 큰) 값이 나올 확률이 낮다는 것을 의미한다. 즉, 현재의 표본으로부터 얻은 값이 가장 극단적이라는 의미이다.


그러므로 p-value가 작을수록 귀무가설이 맞을 가능성은 작아지며, 연구자는 보다 자신 있게 귀무가설을 기각할 수 있다.



2. 유의수준 (허용유의확률 _ Significance level)


1종 오류의 허용확률로써, α(alpha) 로 나타내며, 기각 결정의 기준을 제시한다. 따라서 p-value가 α보다 작거나 같으면 귀무가설을 기각하는 결정을 내릴 수 있다.  즉, 'α  p-value' 이면 귀무가설을 기각할 수 있다.



3. 유의수준과 오류


3-1. α의 크기를 작게하면 1종오류를 줄일 수 있다. 하지만 이렇게 되면 2종오류의 확률(β)이 커진다. 즉, α와 β는 반대방향으로 작용한다. 


3-2. 이러한 이유로 α는 적정한 수준에서 결정되어야 하며, 흔히 α=0.05가 사용된다.


3-3. 검증력 (Statistical power) : 귀무가설이 허위일 때, 이를 기각할 확률로써, 검증력이 크면 2종오류는 작아진다. 검증력은 '1 - β' 로 나타낼 수 있다.


3-4. 검증력을 크게 하기 위한 방법은 표본의 크기를 크게하는 것이다. 주어진 α에서 표본의 크기가 클수록 p-value는 작아지며, 이에 따라 귀무가설을 기각하기 쉬워진다. 따라서 β는 작아지며 검증력은 커지게 된다.





가설검증 절차와 종류 및 가설설정의 방법



1. 가설검증 방식과 절차


두 가지 가설검증 방식과 그에 따른 절차는 아래와 같다.


1-1. 검증통계량이 기각역에 위치하는지 보는 방식.


Step 1) 귀무가설과 대립가설 설정

Step 2) 검증방식의 결정 (Z-검증, t-검증, F-검증, x²-검증)

Step 3) 검증통계량 계산 (Z obs, t obs, F obs, x² obs), cf. obs = 관측치 (Observed value)

Step 4) 통계표에서 임계치(Z crit, t crit, F crit, x² crit)를 찾아서 기각역과 채택역 설정.

Step 5) 귀무가설의 기각 여부 결정


1-2. p-value의 크기와 α의 크기를 비교해보는 방식.


Step 1, 2, 3) 1에서 3단계 까지의 절차는 1-1과 동일.

Step 4) 계산된 검증통계량으로 통계표에서 p-value 찾기.

Step 5) 귀무가설의 기각 여부 결정 ( 'p-value ≤ α' 이면 기각) 



2. 추계통계기법에서 사용되는 검증


2-1. 분석방법에 따른 가설검증


2-1-1. 평균검증, 평균차이검증 : Z-검증, t-검증

2-1-2. 비율검증, 비율차이검증 : Z-검증

2-1-3. 상관분석 : t-검증

2-1-4. 분산분석 : F-검증

2-1-5. 회귀분석 : F-검증, t-검증

2-1-6. x² 적합도검증, x² 독립성검증 : x²-검증

2-1-7. 판별분석 : F-검증, x²-검증


2-2. 모집단의 수에 따른 가설검증




3. 가설설정 방법


3-1. 대립가설 설정 시 방향성 설정 여부


3-1-1. 비방향적 가설 : 방향을 갖지 않으며, Z-검증, t-검증의 경우 기각역은 좌ㆍ우 동시에 위치하여 양측검증을 한다. 

ex> 우유 1리터 팩의 평균량은 1리터가 아니다.


3-1-2. 방향적 가설 : 방향을 가지며, 기각역은 좌 또는 우측 어느 한 쪽에 위치하여 단측검증(좌측검증 or 우측검증)을 한다.

ex> 우유 1리터 팩의 평균량은 1리터보다 적다. (이 경우는 'H1 : μ < 1리터' 이므로 좌측검증에 해당한다)


cf. 두 가지 가설 중 방향적 가설이 보다 많은 정보를 제시하므로 더 나은 가설이라 할 수 있다.


3-2. 귀무가설 설정 시에는 반드시 등호를 포함해야 한다 (=, ≤, )

ex> 과거 소비자 불만접수 건수는 10건 이상이었다. (H0 : μ ≥ 15)


3-3. 기각역의 위치는 대립가설에 따라 결정된다. 즉, 양측검증이냐 좌측검증이냐, 우측검증이냐에 따라 결정.


이 글을 공유하기

Designed by JB FACTORY