> > 상관분석(correlation analysis) :: 도비의 저장소
반응형

※ 관계 분석을 위한 통계방법: 상관분석

상관계수는 Fisher(1929)의 분산분석 방법이 소개되기 전까지 사회현상을 설명하기 위한 통계적 방법으로 많이 사용되었다. 적률 상관계수(Karl Pearson, 1896)는 수업 연한과 수입의 관계와 같이 두 변수가 양적 변수일 때 사용하는 것으로(지능과 학업성취도의 관계, 체중과 키와의 관계 등), 수업연한 수입의 관계에서 수업 연한은 수업을 받은 총 연수 혹은 개월 수로 표현하여 양적 변수가 되도록 하여야 한다.

 

예컨대 중졸 이하, 고졸, 대졸, 대학원 이상으로 변수를 구분한다면 이는 양적 변수가 아니라 범주 변수이므로, 이런 경우에는 수업연한이 아닌 학력과 수입의 관계, 즉 학력에 따른 수입의 차이를 검증하는 것이 바람직하다. 그러나 양적으로 측정된 원자료를 상관 연구를 위해 범주화하거나 변형하여 상관분석을 하는 것은 바람직하지 않다. 이럴 경우 자료가 왜곡되거나 중요한 정보를 상실할 수 있기 때문이다.

 

1. 적률 상관계수의 일반적인 특징

  • 첫째, 상관계수의 범위는 -1.0에서 1.0 사이의 값을 갖는다.
  • 둘째, 상관계수의 크기는 관련성의 정도를 나타내는 것으로, 절댓값이 크면 두 변수가 밀접하게 관련되어 있음을 의미하며 절댓값이 작으면 두 변수 간의 관련성이 낮음을 의미한다. + 는 정적인 상관을, - 는 부적인 상관을 나타내며 상관계수가 0인 것은 두 변수 간에 선형적인 관련성이 없음을 나타낸다.
  • 셋째, 상관관계가 인과관계를 의미하지는 않는다.

2. 적률 상관계수 상관분석을 위해 고려해야 하는 점

  • 첫째, 표본의 사례수로서 표본의 크기가 작으면 표본에 따라 상관계수가 변하게 되어 모집단의 상관계수와 멀어지게 된다. 따라서 사례수가 많을 때 더 안정적인 상관계수를 추정할 수 있다.
  • 둘째, 분산성으로서 X 변수의 점수에 대응하는 Y 점수의 분산과 변수의 각 점수에 대응하는 X점수의 분산이 동일하여야 한다.
  • 셋째, 점수의 분산과 비연속성으로서 점수의 분산이 클수록 높은 상관관계를 나타내며 분산이 작을수록 낮은 상관관계를 나타낸다. 따라서 자료가 절단되어 비연속적 분포를 나타낼 경우에는 상관계수의 해석에 주의를 기울여야 한다.
  • 넷째, 극단값(outlier)은 상관계수에 영향을 미치므로 두 변수 간 관계의 경향성으로부터 매우 동떨어진 극단값이 있을 경우 그 자료가 의미가 있는 것인지 고려하여 연구의 특성상 신뢰롭지 못한 자료라면 제거한 후 상관계수를 추정하는 것이 바람직하다.

3. 상관계수 해석 기준

상관계수의 통계적 유의성은 사례수에 민감하게 영향을 받으므로 항상 실제적인 의미에 기초하여 해석을 하여야 하며, 실제적인 의미를 판단할 때 일반적으로 다음 <표>와 같은 기준을 따르게 된다.

 

<표> 상관계수 범위 및 해석

상관계수 범위 상관계수 해석
+/- .00 ~ .20 상관이 거의 없다
+/- .20 ~ .40 상관이 낮다
+/- .40 ~ .60 상관이 있다
+/- .60 ~ .80 상관이 높다
+/- .80 ~ 1.00 상관이 매우 높다

단순 적률상관계수적률 상관계수 외에도 변수의 특성과 측정척도에 따라 다양한 같은 상관계수(적률 상관계수, Spearman 등위 상관계수, 양류 상관계수, Cramer의 V) 등을 사용할 수 있다. 두 변수가 양적 연속 변수일 경우 상관관계를 알아보기 위해 단순 적률 상관계수를 사용하고, 한 변수는 성별처럼 자연적 이분 변수이며 다른 변수는 양적 연속 변수일 경우 양류 상관계수를 사용한다. 두 변수가 모두 양적 변수이나 한 변수가 인위적으로 양분되었을 경우에는 양분 상관계수를 이용하여 추정한다.

 

두 변수 모두 질적인 이분 변수일 때 상관 계수는으로 계산하고, 질적 변수가 하나라도 3개 이상의 범주를 가지고 있을 때 두 질적 변수의 관계는 Cramer의 V로 측정한다.

 

4. 분석의 예

학생부, 논술, 수능점수 간의 상관을 알아보고자 한다. 

1) 가설

 a. 영가설 : 변수들 간의 상관은 0이다.

 b. 대립 가설 : 변수들 간의 상관은 0이 아니다.

2) 분석 결과: 학생부, 논술, 수능점수 간의 상관분석 결과는 다음과 같다.

  학생부 논술 수능
학생부 -    
논술 .31** -  
수능 .74** .32** -

**p< .01, ***p< .001

 

3) 결과 해석

학생부, 논술, 수능점수 간의 상관계수를 살펴보면, 학생부와 논술 간의 상관계수는. 31. 논술과 수능점수 간의 상관계수는 . 32로서 상관이 낮은 편이다. 반면, 학생부와 수능점수 간의 상관계수는 .74로 높은 상관을 나타내고 있다. 학생부, 논술, 수능점수 간의 상관관계는 유의수준 .05 에서 유의하였다.

 

 

출처: 성태제, 시기자(2007). 연구방법론, pp323~316. 서울: 학지사.

 


요인분석(factor analysis)

 

요인분석(factor analysis)

※ 관계 분석을 위한 통계방법 1. 요인 분석(factor analysis)? 요인 분석(factor analysis)이란 어떤 특성을 규명하기 위해 문항이나 변수들 간의 상호관계를 분석하여, 상관이 높은 문항이나 변수들을 모

dobbyisfreeya.tistory.com

회귀분석(regression)

 

회귀분석(regression)

1. 회귀분석(regression)? 하나의 종속변수에 영향을 주는 변수와 변수 중 가장 큰 영향을 미치는 변수가 무엇인지 또는 종속변수를 설명해 줄 수 있는 가장 적합한 모형이 무엇인지를 밝히는 통계

dobbyisfreeya.tistory.com

 

반응형

'교육학 > 연구방법' 카테고리의 다른 글

회귀분석(regression)  (0) 2022.07.27
요인분석(factor analysis)  (0) 2022.07.26
분산분석(ANOVA)  (0) 2022.07.19
집단비교(Z검정, t검정)  (0) 2022.07.18
연구를 위한 통계(2)-가설검정  (0) 2022.07.17

+ Recent posts