※ 관계 분석을 위한 통계방법: 상관분석
상관계수는 Fisher(1929)의 분산분석 방법이 소개되기 전까지 사회현상을 설명하기 위한 통계적 방법으로 많이 사용되었다. 적률 상관계수(Karl Pearson, 1896)는 수업 연한과 수입의 관계와 같이 두 변수가 양적 변수일 때 사용하는 것으로(지능과 학업성취도의 관계, 체중과 키와의 관계 등), 수업연한 수입의 관계에서 수업 연한은 수업을 받은 총 연수 혹은 개월 수로 표현하여 양적 변수가 되도록 하여야 한다.
예컨대 중졸 이하, 고졸, 대졸, 대학원 이상으로 변수를 구분한다면 이는 양적 변수가 아니라 범주 변수이므로, 이런 경우에는 수업연한이 아닌 학력과 수입의 관계, 즉 학력에 따른 수입의 차이를 검증하는 것이 바람직하다. 그러나 양적으로 측정된 원자료를 상관 연구를 위해 범주화하거나 변형하여 상관분석을 하는 것은 바람직하지 않다. 이럴 경우 자료가 왜곡되거나 중요한 정보를 상실할 수 있기 때문이다.
1. 적률 상관계수의 일반적인 특징
- 첫째, 상관계수의 범위는 -1.0에서 1.0 사이의 값을 갖는다.
- 둘째, 상관계수의 크기는 관련성의 정도를 나타내는 것으로, 절댓값이 크면 두 변수가 밀접하게 관련되어 있음을 의미하며 절댓값이 작으면 두 변수 간의 관련성이 낮음을 의미한다. + 는 정적인 상관을, - 는 부적인 상관을 나타내며 상관계수가 0인 것은 두 변수 간에 선형적인 관련성이 없음을 나타낸다.
- 셋째, 상관관계가 인과관계를 의미하지는 않는다.
2. 적률 상관계수 상관분석을 위해 고려해야 하는 점
- 첫째, 표본의 사례수로서 표본의 크기가 작으면 표본에 따라 상관계수가 변하게 되어 모집단의 상관계수와 멀어지게 된다. 따라서 사례수가 많을 때 더 안정적인 상관계수를 추정할 수 있다.
- 둘째, 분산성으로서 X 변수의 점수에 대응하는 Y 점수의 분산과 변수의 각 점수에 대응하는 X점수의 분산이 동일하여야 한다.
- 셋째, 점수의 분산과 비연속성으로서 점수의 분산이 클수록 높은 상관관계를 나타내며 분산이 작을수록 낮은 상관관계를 나타낸다. 따라서 자료가 절단되어 비연속적 분포를 나타낼 경우에는 상관계수의 해석에 주의를 기울여야 한다.
- 넷째, 극단값(outlier)은 상관계수에 영향을 미치므로 두 변수 간 관계의 경향성으로부터 매우 동떨어진 극단값이 있을 경우 그 자료가 의미가 있는 것인지 고려하여 연구의 특성상 신뢰롭지 못한 자료라면 제거한 후 상관계수를 추정하는 것이 바람직하다.
3. 상관계수 해석 기준
상관계수의 통계적 유의성은 사례수에 민감하게 영향을 받으므로 항상 실제적인 의미에 기초하여 해석을 하여야 하며, 실제적인 의미를 판단할 때 일반적으로 다음 <표>와 같은 기준을 따르게 된다.
<표> 상관계수 범위 및 해석
상관계수 범위 | 상관계수 해석 |
+/- .00 ~ .20 | 상관이 거의 없다 |
+/- .20 ~ .40 | 상관이 낮다 |
+/- .40 ~ .60 | 상관이 있다 |
+/- .60 ~ .80 | 상관이 높다 |
+/- .80 ~ 1.00 | 상관이 매우 높다 |
단순 적률상관계수적률 상관계수 외에도 변수의 특성과 측정척도에 따라 다양한 같은 상관계수(적률 상관계수, Spearman 등위 상관계수, 양류 상관계수, Cramer의 V) 등을 사용할 수 있다. 두 변수가 양적 연속 변수일 경우 상관관계를 알아보기 위해 단순 적률 상관계수를 사용하고, 한 변수는 성별처럼 자연적 이분 변수이며 다른 변수는 양적 연속 변수일 경우 양류 상관계수를 사용한다. 두 변수가 모두 양적 변수이나 한 변수가 인위적으로 양분되었을 경우에는 양분 상관계수를 이용하여 추정한다.
두 변수 모두 질적인 이분 변수일 때 상관 계수는으로 계산하고, 질적 변수가 하나라도 3개 이상의 범주를 가지고 있을 때 두 질적 변수의 관계는 Cramer의 V로 측정한다.
4. 분석의 예
학생부, 논술, 수능점수 간의 상관을 알아보고자 한다.
1) 가설
a. 영가설 : 변수들 간의 상관은 0이다.
b. 대립 가설 : 변수들 간의 상관은 0이 아니다.
2) 분석 결과: 학생부, 논술, 수능점수 간의 상관분석 결과는 다음과 같다.
학생부 | 논술 | 수능 | |
학생부 | - | ||
논술 | .31** | - | |
수능 | .74** | .32** | - |
**p< .01, ***p< .001
3) 결과 해석
학생부, 논술, 수능점수 간의 상관계수를 살펴보면, 학생부와 논술 간의 상관계수는. 31. 논술과 수능점수 간의 상관계수는 . 32로서 상관이 낮은 편이다. 반면, 학생부와 수능점수 간의 상관계수는 .74로 높은 상관을 나타내고 있다. 학생부, 논술, 수능점수 간의 상관관계는 유의수준 .05 에서 유의하였다.
출처: 성태제, 시기자(2007). 연구방법론, pp323~316. 서울: 학지사.
'교육학 > 연구방법' 카테고리의 다른 글
회귀분석(regression) (0) | 2022.07.27 |
---|---|
요인분석(factor analysis) (0) | 2022.07.26 |
분산분석(ANOVA) (0) | 2022.07.19 |
집단비교(Z검정, t검정) (0) | 2022.07.18 |
연구를 위한 통계(2)-가설검정 (0) | 2022.07.17 |