상관분석과 회귀분석 연습문제 풀이

지난 시간에는 교재(마케팅조사 4판, 이학식_집현재) '제13장. 분삭분석' 편에 수록된 연습문제를 풀어보았다. (지난 시간의 풀이 내용은 아래 타이틀 하단의 '이전글' 을 클릭하여 확인할 수 있다)


이어서 이번 시간에는 '제14장. 상관분석과 회귀분석'에 수록된 연습문제들을 풀어보도록 할텐데, 아래의 풀이는 필자가 생각하는 해답으로써 100% 정답이라고는 할 수 없으니, 본인이 먼저 직접 연습문제를 풀어본 후 본인의 풀이와 비교해보는 용도로 활용할 것을 권장한다.


그리고 혹시 문제풀이 부분 중 본인의 생각과 다른 부분에 대해서는 댓글로 의견을 남겨주면, 필자가 확인 후 답변을 드리도록 하겠다.


그럼 이번 시간도 시작해보자!



-------------------------------------------------

Written by 행복을만드는전략가

독한 세상에서 행복을 만드는 전략과 정보

-------------------------------------------------


 Theme 

'상관분석과 회귀분석' 연습문제 풀이

※이전글 - 분산분석 연습문제 풀이

※관련정리 - 30. 상관분석

※관련정리 - 31. 단순회귀분석

※관련정리 - 32. 다중회귀분석





문제1. 


Q) 한 소비자 단체는 커피소비량과 사람들의 신경과민정도 간의 관계를 조사하기 위하여 13명의 1일 커피소비량과 신경과민 점수를 측정하였다........ (중략) ........ 이 자료로써 커피소비량과 신경과민 점수 간에는 상관관계가 있다고 할 수 있는가? (α = 0.05)


(자료 생략)


A) * 상관계수

- 1일 커피소비량 평균 (X bar) = 3.307

- 신경과민점수 (Y bar) = 5

- SSx = 40.7692

- SSy = 122

- SSxy = 69

- r = 69 / √40.769*122 = 0.978


* 상관계수의 통계적 유의성 검증

- 가설설정 : H0 : ρ = 0 ㅣ H1 : ρ ≠ 0

- t obs = (0.978 * √13-2) / √1-0.956484 = 15.591

- t crit = t(0.025 : 11) = 2.201

- 'l t obs l > t crit' 이므로 귀무가설은 기각된다. 따라서 커피소비량과 신경과민점수 간에는 상관관계가 있다고 할 수 있다.





문제2. 


Q) 어느 회사의 인사부는 사원들의 발표능력이 직무성적에 영향을 미치는지를 조사하고자 하였다. 이를 위하여 입사 3년차 사원들 중에서 무작위로 15명을  선정하여 사례분석 과업을 부과하고 이들의 발표능력을 측정하였다. 이들의 발표능력과 직무성적의 자료를 이용하여 회귀분석한 경과 다음과 같이 나타났다. 이 결과를 해석하시오.


(자료 생략)


A) * 회귀식의 발견 : Y hat = 21.519 + 7.545X

- X값은 8.4~9.7 범위 내에서 Y의 값을 추정할 수 있고, X가 '0.1'씩 증가할 때마다 Y는 '0.7545' 가 증가한다고 해석할 수 있다.


* 독립변수계수의 유의성 검증

- 가설을 'H0 : β₁ = 0 ㅣ H1 : β ≠ 0 (양측검증)' 으로 설정하는 경우, 유의확률이 '0.000' 으로 유의수준 0.05보다 작으므로 귀무가설은 기각된다. 따라서 발표능력이 직무성적에 영향을 미친다고 할 수 있다.

- 만약 가설을 'H0 : β₁ = 0 ㅣ H1 : β > 0 (우측검증)' 으로 설정하는 경우에도 발표능력의 유의확률이 0.000 으로 나타나므로 이 경우에도 귀무가설은 기각된다. 따라서 발표능력이 높을수록 직무성적도 높아진다고 할 수 있다.


* 독립변수의 설명력

R제곱값이 '0.744' 이므로 직무성적의 분산 중 74.4%가 발표능력에 의해 설명될 수 있음을 확인할 수 있다.




문제3.


Q) 연습문제 2에서 예를 든 회사의 인사부는 사원들의 발표능력 뿐만 아니라 분석능력과 응용력도 직무성적에 영향을 미치는지를 조사하기 위하여 그들의 분석능력과 응용력에 대한 자료를 추가적으로 수집하였다. 이 자료로써 발표능력, 분석능력 및 응용력이 직무성적에 영향을 미치는지를 회귀분석한 결과 다음과 같이 나타났다. 이 결과를 해석하시오. 특히 발표능력의 영향력은 연습문제2에서 나타난 것과 어떻게 다른지 비교하고 그 이유를 생각해보시오.


(자료 생략)


A) * 회귀식의 발견 : Y hat = 34.454 + 6.099X₁ + 1.601X₂ - 1.411X₃


* 회귀식의 유의성 검증

- 가설을  'H0 : β₁ = β₂β = 0 ㅣ H1 : β₁, β₂, β₃ 중 어느 하나는 0이 아니다' 라고 설정할 때, F obs는 76.956이며, 이 때 유의확률은 0.000 이므로 유의수준이 0.05 수준일 때 귀무가설은 기각된다. 따라서 위에서 발견한 회귀식은 유의적이며, 직무성적을 설명하고 예측하는데 유용하다고 할 수 있다.


* 회귀식의 설명력

- R제곱값이 '0.955' 이므로 직무성적의 분산 중 95.5%가 독립변수들(발표능력, 분석능력, 응용력)에 의해 설명될 수 있음을 알 수 있다.


* 개별 독립변수 계수의 통계적 유의성 검증

- 분석능력은 다른 두 변수가 회귀식에 존재할 때 유의수준 0.05 수준에서 유의적이나, 발표능력과 응용력은 비유의적이다.


* 각 변수 간 상대적 영향력

- 표준화계수의 절대값이 분석능력이 가장 높으므로 분석능력의 영향력이 가장 높다고 할 수 있다.


* 다중공선성

- 발표능력은 단순회귀분석에서는 유의적이었으나, 다중회귀분석에서는 발표능력의 독립변수 계수가 비유의적으로 나타났다. 이는 독립변수들 간에 높은 상관관계가 존재하는 현상인 다중공선성으로 인해 발생하는 문제로써, 표에서는 분석능력의 공차값이 0.208로 가장 작아 다중공선성이 가장 심한 것으로 나타나고 있다.


이 글을 공유하기

Designed by JB FACTORY