- 10장 : 상관관계분석
- Pearson 상관관계분석
- 개념
- 두 변수의 관계에서 일반적으로 선형관계에 초점을 둠.
- 분석 내용
- (1) 선형관계를 갖는지
- (2) 선형관계를 갖는다면 어느 방향인지
- (3) 그 관계는 얼마나 큰지 분석함.
- 두 변수가 서로 선형관계를 가질 때 선형상관관계가 있다고 하며, 줄여서 상관관계가 있다고 함.
- 상관관계의 크기를 나타내는 값은 상관계수(correlation coefficient)이며, 상관계수는 -1부터 +1까지 값을 갖음.
- 상관관계의 종류와 자료
- Pearson 상관계수
- 가장 보편적
- 보통 상관계수라고 할 때 의미하는 것.
- 그 외
- Spearman 서열상관관계
- Kendall's tau
- Point-biserial r
- Phi-coefficient
-
종류
척도
의미
Pearson 상관관계
간격/비율 - 간격/비율
두 변수가 각각 간격척도 혹은 비율척도로 측정된 경우 상관관계의 크기. 변수들이 정규분포를 따른다는 가정하에 적용하는 상관계수.
Spearman 서열상관관계
서열 - 서열
- 변수를 구성하는 데이터가 정규분포를 따르지 않거나, 서열척도로 측정된 경우 이용
- Pearson 상관계수의 비모수 버전.
Kendall's tau
서열 - 서열
- 변수를 구성하는 데이터가 정규분포를 따르지 않거나, 서열척도로 측정된 경우 이용
- Pearson 상관계수의 비모수 버전.
Point-biserial r
간격/비율 - 명목(2분화 변수)
Phi-coefficient
명목(2분화 변수) - 명목(2분화 변수)
- 가정
- Pearson 상관관계분석 : 변수들의 쌍은 이변량 정규분포(Bivariate normal distribution)를 따른다는 가정.
- Spearman 상관관계분석
- 개념 : 서열척도로 측정한 자료에서 사용
- 자료 : 둘 이상의 대상에 대한 서열이 같은 경우 가운데 서열을 부여
- 가정 : 변수의 정규분포 가정 불필요
- 편상관관계 분석
- 앞의 상관관계분석은 두 변수들 간의 상관관계를 보는 것이었음.
- 그런데 어떤 두 변수가 다른 제 3의 변수와 상관관계가 높으면 두 변수의 상관관계는 순수한 상관관계보다 높게 나타날 수 있다. 이 때 순수한 상관관계를 알기 위해서는 제3의 변수를 통제해야 한다.
- 편상관관계(partial correlation) 분석은 제3의 변수를 통제한 상태에서 관심을 갖는 두 변수의 상관관계를 분석하는 것이다.
- 예) 여름의 더운 날 콘도 앞에 출몰한 개미숫자와 콘도 앞을 지난 승용차 수는 양의 상관관계를 갖는다. 하지만 개미가 승용차에 붙어서 온 것이 아니라, 여름날 개미는 날씨가 더울수록 더 많이 나타나는 것이다. 온도를 통제변수로 설정해야 한다.
- SPSS 옵션
- 평균과 표준편차 : 각 변수에 대해 평균, 표준편차, 비결측 케이스 수 등을 나타냄.
- 0차 상관 : 0차 상관은 통제변수가 없는 경우의 상관계수를 나타냄.
표본의 수가 30개 이하인 경우는 종속변수가 연속변수이더라도 비모수적인 방법을 선택할 수 있다.
(http://wwww.cbgstat.com/v2/method_Mann_Whitney_U_test/Mann_Whitney_U_test.php)
'Books (Etc)' 카테고리의 다른 글
SPSS 20.0 매뉴얼 : 4장. 통계분석을 위한 기초지식 - 효과크기(Effect Size, Cohen's d) (0) | 2013.07.02 |
---|---|
SPSS 20.0 매뉴얼 : 13장. 신뢰성분석과 요인분석 (13.1 신뢰성분석의 개요) (0) | 2013.07.01 |
부모와 아이 사이 (Between Parent And Child) (0) | 2013.06.14 |
오리진(ORIGINS) - 엄마 뱃속 9개월에 관한 모든 오해와 진실 (0) | 2013.05.24 |
문제의 유형과 해결을 위한 접근방법 (0) | 2013.05.04 |