13.3 요인분석의 개요


1. 개념 

요인분석은 다수 변인들간의 관계(상관관계)를 분석하여 변수들의 바탕을 이루는 공통차원들(common underlying dimensions)을 통해 이 변수들을 설명하는 통계기법이다.. 요인분석의 목적은 다수의 변수들을 정보손실을 최소화화면서 소수의 요인들(factors)로 축약하는 것이다. 


요인분석에는 독립변수와 종속변수가 없으며, 모든 변수들 간의 관계를 분석함으로써 변수들의 토대를 이루는 요인을 발견하는 것이다. 요인분석은 주어진 자료 자체를 분석하는 것으로 분석결과로부터 모집단의 특성에 관한 추정을 하지 않는다. 따라서 추계통계기법이 아닌 기술통계기법으로, 모수와 통계량, 가설검증 등의 개념은 요인분석에 적용되지 않는다.



2. 자료

요인분석을 하기 위해서는 변수가 간격척도 혹은 비율척도에 의해 측정되어야 한다. 

또한 표본의 크기(관측치의 수)는 100개 이상이 바람직하며 최소한 50개는 되어야 한다. 

변수의 수를 고려하면 변수의 수보다 관측치의 수가 10배 이상이 바람직하며 최소한 5배는 되어야 한다.


요인분석을 하기 위해서는 먼저 원자료로부터 상관관계행렬이 만들어지며, 이 상관관계행렬이 요인분석을 위한 입력자료(input data)가 된다. 그런데 요인분석은 기본적으로 상관관계가 높은 변수끼리 높은 변수들끼리 그룹핑하는 것이므로 변수들 간의 상관관계가 전반적으로 매우 낮다면 (대체로 ±0.3 이하), 그 자료는 요인분석에 부적합하다고 할 수 있다. 



3.. 요인추출방법

요인추출방법에는 주성분분석과 공통요인분석의 두 가지가 있는데, 주성분분석이 보다 널리 이용된다.

  • 주성분분석(principal component analysis) : 원래의 변수들의 분산 중 가급적 많은 부분을 설명하는 소수의 요인을 추출하는 데 목적이 있다. 그러므로 이 경우 변수들로부터 요인이 추출된다(variables → component). 주성분분석의 경우 상관행렬의 대각선에 1이 사용되는데 이는 모든 분산(total variance)이 사용된다는 것을 의미한다.
    (※ SPSS의 경우 주성분분석에 의해 요인을 추출하는 경우 추출된 요인을 성분(component)으로 표기한다.)
  • 공통요인분석(common factor analysis) : 원래 변수들의 토대가 되는 잠재차원들(latent dimensions or constructs)을 찾아내는 데 목적이 있다. 그러므로 이 경우 요인들로부터 변수들이 산출된 것으로 본다(factor→variables), 상관행렬의 대각선에는 communalities가 사용되는데 이는 공통분산(common variance, shared variance)만이 사용된다는 것을 의미한다. (※공통요인분석은 실행상 몇 가지 문제를 갖는다.)

추출할 요인의 수를 결정하는 방법에는 다음의 몇 가지가 있다.


(1)Eigenvalues 

eigenvalue는 한 요인의 설명력을 나타내는데 한 요인에 대한 '요인적재값의 제곱의 합'을 가리킨다. 그러므로 eigenvalue가 크다는 것은 그 요인이 변수들의 분산을 잘 설명한다는 것을 의미한다. eigenvalue를 기준으로 할 때는 보통 eigenvalue 1이상을 갖는 요인의 수만큼 추출한다. 원칙적으로 변수의 수가 20개를 넘는 경우 이 방법이 적절하나, 변수의 수가 그보다 적은 경우에도 이 방법이 많이 사용된다.


(2)요인의 수를 사전에 결정한다.

이 방법은 요인분석에서 추출될 요인의 수를 미리 결정하여 지정하는 방법이다. 이 방법은 연구자가 몇 개의 요인이 적절하다는 것을 사전에 알거나 다른 연구자가 수행한 연구를 반복하면서 그 연구에서 추출된 요인의 개수만큼 요인을 추출하고자 할 때 사용된다.


(3)전체 요인들의 설명력 기준

이는 요인들의 설명력의 합이 어느 정도는 되어야 한다는 것을 사전에 정하고 그 수준의 설명력을 가져오는 요인들을 추출하는 것이다. 절대적인 기준은 없으나 사회과학에서는 60% 내외로 결정하는 경향이 있다.


(4)스크리 도표

컴퓨터 프로그램을 이용하여 스크리 도표(scree table)를 그릴 수 있다. 스크리 도표는 각 요인의 eigenvalue를 그림으로 보여주는데 첫 번째 요인부터 마지막 요인으로 갈수록 eigenvalue는 점점 작아진다. 스크리 도표는 각 요인의 설명력이 처음 몇 개 요인까지는 큰 폭으로 감소하다가 어느 위치부터는 감소폭이 매우 체감하는 경향을 보여줄 수 있다. 이 때 감소폭이 체감하기 직전까지의 요인의 수를 기준으로 요인을 추출할 수 있다. 


(5)종합

요인의 수를 미리 결정하는 방법 외의 다른 세 가지 방법은 자료분석의 결과에 따라 요인의 수를 결정하는 방법이다. 이 세 가지 방법에 의해 요인의 수를 결정할 때 얼마든지 다른 결과가 나올 수 있다. 조사자 혹은 분석자는 자신의 판단에 따라 방법을 결정하는데 eigenvalue를 이요하는 경우가 가장 많으며 기준은 보통 eigenvalue 1이 된다. 그리고 요인의 수를 미리 결정하는 방법을 다음으로 많이 이용한다.



4. 요인의 회전

통계패키지에 의해 요인분석을 하면 비회전 요인행렬(unrotated component matrix)이 구해진다. 요인의 수를 결정하는 방법이 사전에 지정되면 이에 맞도록 요인의 수가 도출된다. 그런데 이 때 도출되는 요인은 원래 변수들의 선형결합(linear combination of original variables)이다. 요인행렬에 있는 요인적재값(factor loading)은 각 변수와 해당 요인 간의 상관관계계수이다. 그런데 요인행렬은 기초자료를 축소시켜 보여주기는 하지만 이로부터 어떤 변수들이 어떤 요인에 높게 관계되는지 명확하게 알기 어렵다. 그렇기 때문에 추출된 요인을 회전하게 되며, 회전에 의하여 요인구조(factor structure)를 명확히 알 수 잇다. 다시 말하면 요인을 회전함으로써 어떤 변수가 어떤 요인에 높게 관계되는지 알 수 있다. 


요인을 회전하는 방법에는 직각요인회전과 사각요인회전의 두 가지가 있다

  • 먼저 직각요인회전(orthogonal factor rotation)직각을 유지하면서(즉, 요인들간에 독립성을 유지하면서) 요인구조가 가장 뚜렷할 때까지 요인을 회전시키는 방법이다. 
  • 사각요인회전(oblique factor rotation)직각을 유지하지 않은 채 요인구조가 가장 뚜렷할 때까지 요인을 회전시키는 것이다. 

요인을 회전할 때 직각을 유지한다는 것은 곧 요인들 간에 상관관계가 '0'임을 가정하는 것이다. 사각회전은 직각을 유지하지 않고 요인구조가 가장 뚜렷할때까지 각각의 요인을 회전하는데, 요인들 간에 '0'의 상관관계를 가정하지 않으므로 보다 실제적(realistic)이다. 사각 회전은 직각회전에 비하여 변수들이 회전된 요인에 보다 가깝게 군집하는 결과를 가져다준다. 뿐만 아니라 사각회전결과는 요인들이 서로 간에 얼마나 관계게 있는지에 대한 정보를 제공한다. 즉, 각도가 직각보다 작을수록 正(+)의 상관관계, 그리고 직각보다 클수록 負(-)의 상관관계가 있음을 보여준다. 그런데 이론적으로 사각회전방식이 우수한 면이 있으나 사각회전 수행절차가 그다지 잘 개발되어 있지 않고 또한 논쟁의 여지가 있어 직각회전방식이 보다 자주 사용된다. 


직각회전방식에는 세 가지가 있다 : VARIMAX, QUARTIMAX, EQUIMAX. 

  • 먼저 VARIMAX 방식은 요인행렬의 열(column)의 분산의 합계를 최대화함으로써(maximize the sum of variances) 열을 단순화하는 방식이다. 여기서 열의 분산의 합계를 최대화하는 것은 적재값을 가급적 +1, -1, 혹은 0에 가깝게 하도록 함으로써 가능하다. 회전이후 각 요인의 적재값은 회전 이전에 비하여 0 혹은 1에 보다 가까워지는 것으로 나타났다. 
  • QUARTIMAX방식은 행(row)을 중심으로 하는데 한 변수가 한 요인에는 가급적 높게 그리고 다른 요인들에는 가급적 낮게 적재되도록 함으로써 행을 단순화하는 방식이다. 
  • EQUIMAX방식은 두 가지를 절충한 방식이다. 세 가지 방식 중 요인구조를 단순화(혹은 명확화)하고 해석이 가장 용이한 방식은 VARIMAX방식이며, 따라서 VARIMAX방식이 가장 많이 쓰인다.













7.2 무작위 블럭디자인 ANOVA

1. 무작위 블럭디자인에 의한 ANOVA의 개요

(1) 개념 

  • 앞에서 설명한 일원분산분석은 두 개 이상의 독립모집단들의 평균값 (혹은 처치 집단들의 평균값)을 비교하는 것으로 두 개의 독립모집단의 평균비교를 확장한 것임.
  • 이와 유사하게 무작위 블럭디자인에 의해 수집한 자료의 분산분석은 paired-difference test를 확장한 것.
    (Paired-difference test 의 예 : 슈퍼마켓1 부터 슈퍼마켓7 까지 7개 슈퍼가 있고, 각각에서 패키지 디자인이 A와 B인 두 가지 종류의 비누를 판다. 패키지 디자인에 따라 비누 매출이 다르다고 할 수 있는가?)


H0 : 세 가지 패키지 디자인에 따른 매출은 모두 동일하다.

H1 : 세 가지 패키지 디자인에 다른 매출이 모두 동일하지는 않다.


SPSS : 분석->일반선형모형->일변량

  • 모형설정해야 함. 모형설정의 의미는 다음과 같음
  • 완전요인모형 : 분석결과에는 주효과, 블럭변수효과, 상호작용효과 및 절편이 포함된다(기본설정)
  • 사용자 정의 : 슈퍼마켓을 블럭변수로 설정하고 매출액에 대한 디자인의 주효과를 보기 위한 실험이므로, 상호작용을 고려하지 않는 모형을 설정해준다. 이 경우 모형에 포함시키려는 변수들을 오른쪽 '모형(M)' 상자로 옮긴다. 또한 항 설정 조건에서 주효과만 나타나도록 설정해 준다.
  • 제곱합

- 제I유형 : 제곱합 계산방법을 설정하는 것으로서, 각 셀의 크기가 같은 경우에만 사용될 수 있다.

- 제III유형 : 결측 셀이 없는 경우, 제III유형 제곱합 방법이 가장 일반적으로 사용된다. 각 셀의 크기가 같거나 다르거나 상관없이 사용될 수 있다.(기본설정)

- 제IV유형 : 결측 셀이 있는 경우 사용된다.


eta-square(ES)에는 완전ES와 부분ES가 있다. 완전ES는 분모에 수정합계값을 이용한다. 한 변수의 완전ES는 다른 변수의 제곱값(분산)에 영향을 받는다. 이러한 이유로 SPSS는 부분ES만을 산출한다.


7.3 이원분산분석(Two-Way ANOVA) - 팩토리얼 디자인

1. 팩토리얼 디자인에 의한 이원분산분석의 개요

(1) 개념 

  • 7.2에서 설명한 무작위 블럭디자인에 의한 분산분석은 한 처치변수의 수준에 따라 결과변수의 값이 달라지는가를 조사할 때 외생변수로 작용할 수 있는 변수를 통제하기 위하여 블럭변수로 처리한 것이었다. 그러므로 엄격히 말해 한 개의 처치변수의 효과를 조사하는 것이었다.
  • 그런데 마케팅조사에서 동시에 두 개 이상의 처치변수의 효과를 조사하는 경우가 흔히 있다. 팩토리얼 디자인은 두 개 이상의 독립처치변수의 수준변화에 따른 결과변수값의 변화를 조사하기 위한 실험디자인으로 이 때 각 처치변수를 factor라고 부른다. 
    • 예를 들어 factor A의 처치수준은 a이고, factor B의 처치수준은 b이면 이 실험디자인을 aXb factorial design이라 부르며, 처치변수가 두 개이므로 처치효과(treatment effect)를 조사하기 위하여 이원분산분석을 적용한다.
    • 만약 여기에 추가적으로 factor C가 있으면 처치수준이 aXbXc factorial design이 되며 삼원분산분석을 적용한다. 
  • 일원분산분석에서 연구자가 관심을 갖는 것은 주효과(main effect)인데, 이는 한 처치변수의 변화가 결과변수에 미치는 영향에 관한 것이다. 이에 비해 이원분산분석은 연구자가 관심을 갖는 것은 두 처치변수의 상호작용효과이다. 여기서 상호작용효과(interaction effect)는 한 처치변수의 변화가 결과변수에 미치는 영향이 다른 처치변수의 수준에 따라 달라지는가 하는 것이다.











Chapter 1. Medial Anthropology : An Introduction to the Fields

Peter J. Brown

Ronald L. Barrett

Mark B. Padilla

Erin P. Finley


 What do anthropologists mean by "culture," and how is it related to health and healing?

• Why is the distinction between disease and illness important in medical anthropology? Why might this difference not be very important to physicians and other health care providers?

• Which of the different approaches in medical anthropology do you think will be of most interest to you? Why?



Brown, Peter et al(2010)는 의료인류학이라는 분야에 대한 전반적인 소개를 다루고 있다

내용은 크게 Culture, Sickness(disease and illness), Different approaches로 나뉘며 간략히 요약하면 다음과 같다.


- Culture : infrastructure, structure, superstructure의 세 가지 domain으로 이루어져 있으며, cultural anthropology와 biological anthropology는 밀접한 관계를 가지고 있다.

- Sickness : disease는 신체 기능의 변화, 감염 등으로 인해 겉으로 드러나는 임상양상이며 illness는 이보다 더 넓은 범위에서 사회 문화적인 것을 포괄하여 건강의 변화에 대한 개인의 경험과 인식을 통칭한다.

- Approaches : Biological, Ecological, Critical, Ethnomedical, Experiential, Applied의 여섯 가지 접근법이 있으며 첫 두 가지는 사람과 환경의 상호작용을 중요하게 생각하며, 나머지 네 가지는 culture의 개념을 중요하게 생각한다





Chapter 2. Stone Agers in the Fast Lane : Chronic Degenerative Diseases in Evolutionary Perspective

S. Boyd Eaton

Marjorie Shostak

Melvin Konner


 How can you tell that this selection was written for physicians reading a medical journal? What kind of assumption may be embedded here regarding the nature and causation of health?

• If there is a "discordance" in the evolution of our genes and culhtre, why haven't our genes caught up?

• Can you devise an evolutionary explanation for why we like to eat things (say, ice cream or alcohol) that are bad for us?



Eaton, S. Boyd et al(2010[1988])가 쓴 이 챕터에서는 후기구석기(late paleolithic) 시대의 사람들의 생활패턴을 현대 사람들의 생활패턴과 비교하면서(Nutrition, Physical Exercise, Alcoholic Beverages, Tobacco Abuse) 이 같은  생활패턴의 변화가 질병 유병률(Hypertension, Atherosclerosis, Cancer)의 변화에 어떤 영향을 주었는가를 살펴보고 있다.





Chapter 7. Health and Disease in Prehistoric Populations in Transition

George J. Armelagos


• In what ways can the domestication of Plant and animals be considered the worst mistake of the most important event in human history?

 Why is it important for bioarchaeologists and paleopathologists to study disease history and biochemistry as well as anatomy?

 Why do you think that family size and fertility would increase when humans changed from hunter-gatherers to farmers?


Armelagos, George J.(2010[1990])의 글에서는 수렵, 채집생활을 하는 구석기 시대에서 농경생활을 하게 되면서 정착생활을 하게 된 신석기 시대로 옮겨가는 과정에서 인구가 급격히 증가했다는 것을 언급하면서 과연 이러한 인구의 증가가 전반적으로 신석기시대의 사람들이 더 건강해졌다는 것을 의미하는 것인지에 대한 의문을 제기하였다. 그리고 그 근거로서 당시 사람들의 뼈에 남아있는 영양상태 변화의 흔적을 같이 제시하고 있다.






1 Page Proposal이란 무엇인가?

- 추진하고자 하는 사업 혹은 프로젝트를 둘러싼 모든 객관적 사실, 추론, 상황을 간결하게 표현한다.

- 동의를 얻어내기 위한 것이므로 설득력 있는 언어를 사용한다.

- 구체적인 실행 과정을 설명한다.

- 이 모든 것을 1 Page Proposal 분량으로 프린트한다.


1.5 Page는 왜 안되는가?

일단 기획서가 1 Page를 넘기면 전투에서 패한다. 1 Page 이상의 분량이면 첫 번째 쪽마저도 읽히지 않을 확률이 높다. 기획서가 1 Page Proposal 일 때는 간결함에서 오는 우아함이 두드러지는데, 그 형식이 허물어지면 모두 무너지게 된다. 


자신의 사업 계획을 1 Page Proposal 분량으로 압축하는 일은 프로젝트에 대한 스스로의 이해에도 중요하다. 필요한 경우 완벽하고 간략한 구술을 할 수 있게 해줄 뿐만 아니라, 훌륭한 의사 전달자로서 자신을 연마시킨다. 기획서를 1 Page Proposal 분량으로 쓰는 것은 목표를 명확히 해주고, 그것에 집중하게 해주며, 함정을 찾아내고 판단력을 높여줄 뿐 아니라, 아이디어를 완벽하게 만든다. 


1 Page Proposal을 한 장의 사진처럼 생각하라. 하나의 틀에 완벽한 이미지를 함축해 놓은 사진 말이다. 사진을 찍을 때 당신의 어린 두 아이들이 틀 밖에 서 있다는 이유로 그들을 따로 찍겠는가? 물론 아닐 것이다. 마찬가지로 당신이 상대방을 설득할 결정적인 요소 몇 가지를 두 번째 쪽에 담는 것은 좋은 생각이 아니다. 그것은 기획서의 가치를 떨어뜨리고 분산시켜 마침내는 아이디어마저 퇴색시킨다. 


1 Page Proposal은 언제 필요한가?

1 Page Proposal은 시작의 도구이다. 여기에서부터 일이 시작된다. 관성은 사업에 있어서 가장 막강한 걸림돌이다. 모든 것은 폭력, 이성, 두려움, 사리, 생존 본능 같은 힘이 작용하기 전까지는 현 상태를 유지하려 한다. 1 Page Proposal은 현 상태로 남아 있으려는 상대방의 본능에 도전하고 새로운 것을 제안해 움직이게 만든다.


각 부분들의 전체적 파악

  • 제목과 부제는 기획서 전체를 규명하고 한계를 명확히 한다.
  • 목표와 2차 목표는 기획서의 궁극적인 목적을 규정한다.
  • 논리적 근거는 제안된 실행이 필요한 기본적 이유를 설명한다.
  • 재정은 거래와 관련한 금전적 부분을 명시한다.
  • 현재 상태는 일의 현재 상황을 보여준다.
  • 실행은 기획서를 작성한 사람이 그것을 읽는 사람에게 원하는 행동을 직접적으로 명시한다. 






목차위로

옮긴이의 말 

01 아이디어의 탄생 

02 1 Page Proposal 
1 Page Proposal이란 무엇인가? 
왜 1 Page 인가? 
전통적인 사업 기획서의 문제점은 무엇인가? 
1 Page Proposal의 다른 점은 무엇인가? 
1 Page Proposal은 언제 필요한가? 
1 Page Proposal이 최선의 선택이 아닌 경우도 있다 
그래도 화려한 포장이 주는 가치가 있지 않는냐고? 
짧은 시간 안에 읽히는 것이므로 쓰는 데 오래 걸리지 않는다고? 
1 Page Proposal과 당신 

03 준비 과정 
냉정하고, 침착하게 자료를 수집하라 
어떻게 시작할 것인가? 
자료를 수집하라 
목표는 완전한 이해다 
인터넷상에서의 리서치 
전통적 방법의 리서치 
1 Page Proposal을 누구에게 제출할 것인가? 
직접 나서라 
상대에 따라 거래가 달라져야 한다 
반대 세력 다루기 
사실을 반드시 확인하라 
질문을 예상하라 

04 로드맵 - 전체적 윤곽 꾸미기 
각 부분들의 전체적 파악 
1 Page Proposal의 예 
각 부분 자세히 살펴보기 

05 지식을 1 Page 형식으로 바꾸기 
1단계: 리서치 자료와 생각을 정리해 분류하기 
2단계: 축소 
3단계: 우선 순위 정하기 
4단계: 쓰기의 시작 
5단계: 휴식 

06 1 Page Proposal 쓰기 
제목: 스토리의 헤드라인 
부제: 제목을 보강하라 
목표: 원하는 바를 진술하라 
2차 목표: 목적을 상세히 밝힌다 
논리적 근거: 누가, 무엇을, 어디서, 왜, 어떻게 
재정: 숫자로 말하기 
현재 상태: 사업이 위치한 현 상태 
실행: 아무것도 부탁하는 것이 없다면 그것은 기획서가 아니다 
날짜를 쓰고 서명하라 
쓸 준비가 되었는가? 

07 교정, 축소, 압축 
길이 
문체 
단어 선택 
보편적인 내용을 만들라 

08 위대한 1 Page Proposal 
이집트의 대 피라미드에 관한 1 Page Proposal 
아쉬웠던 카쇼기 기획서 

09 상품 가치 
인쇄 
활자체와 크기 
튀지 않게 만들기 

10 1 Page Proposal 제출하기 
어떤 방법으로 제출할 것인가? 
전화 통화 요령 
기획서의 내용에 통달하라 
자신이 속한 조직에 제안하기 
성심을 다하라 
거절의 대답을 들으면? 
내가 여러분에게 바라는 것 

1 Page Proposal 지원 네트워크 



(출처 : http://www.kyobobook.co.kr/product/detailViewKor.laf?barcode=9788932460109)









(1) 0차 상관계수(zero-order correlation) : B+C , D+C


0차 상관계수는 두 변수간의 상관계수, 즉 Pearson 상관계수 값이다.

교육기관과 종속변인인 TV시청시간의 상관관계는 -0.612, 그리고 동거여부와 TV시청시간의 상관관계는 -0.521이다.


B+C와 D+C는 각각 교육기간과 동거여부가 Y를 설명하는 정도로서, 0차 상관계수를 제곱하면 각각 다음과 같다.

(-0.612)^2 = 0.3745

(-0.521)^2 = 0.2714


즉, 교육기간은 Y의 분산을 37.45% 설명하며, 동거여부는 Y의 분산을 27.14% 설명한다.




(2) 회귀식의 설명력 (두 변수에 의해 설명되는 Y의 분산) : B+C+D


B+C+D는 교육기간과 동거여부가 결합하여 Y를 설명하는 정도이다. 

앞의 예제에서는 '교육기간'과 '동거여부'를 투입하여 회귀분석한 결과로 얻어진 R(0.774)의 제곱값인 0.599이다.




(3) 교육기간에 의해 설명되지 않는 Y의 분산 : A+D


색깔로 표시된 부분은 교육기간에 의해 설명되지 않는 분산으로서 1-0.3745 = 0.6255이다.




(4) 편상관계수 (partial correlation) : 동거여부가 진입함으로써 설명하는 부분 : D


편상관계수는 다른 독립변수의 효과를 제거한 후(혹은 통제된 상태에서) 한 독립변수와 종속변수의 상관관계이다.

여기서는 교육기간이 통제된 상태에서 동거여부와 TV시청시간의 상관계수는 -0.599이다.

D는 교육기간에 의해 설명되지 않는 분산 중 동거여부가 설명하는 부분을 나타낸다.

이 부분이 동거여부의 편상관계수와 관련된다.

동거여부의 편상관계수를 제곱하면, (-0.599)^2 = 0.3588이 된다. 즉 교육기간에 의해 설명되지 않는 Y의 분산 중 35.88%는 동거여부에 의해 설명된다.




(5) 부분상관계수(part correlation)


부분상관계수는 Y의 전체 분산 중 특정 변수의 순수한 설명력을 제곱한 것이다.

A+D는 Y의 전체 분산 중 0.6255이며, 이 중 동거여부가 설명하는 부분은 D, 35.88%이다.

따라서 0.6255 X 0.3588 = 0.2244이며, 이는 Y의 전체 분산 중 22.44%가 동거여부에 의해 설명됨을 의미한다.

따라서 이 값을 제곱근한 값 sqrt(0.2244) = ±0.4737이 동거여부의 부분상관계수가 된다. 












1. 피실험자내 디자인/반복측정 디자인 ANOVA의 개요

(1)개념

* 일원분산분석   

- 가장 전형적인 실험에 의해 수집한 자료의 분산분석이다.

- 피실험자간 디자인(between subjects design)

예) 다수의 사원들을 네 집단으로 나누어 집단별로 다른 처치를 한 결과를 비교하는 것.

= 이 경우 교육받기 전의 판매능력은 동일한 것으로 가정함

= 이러한 실험 디자인은 집단에 따라 다른 피실험자들이 할당되므로 피실험자간 디자인(between subjects design)이라고 함.

- 피실험자내디자인(within subjects design)

= 그런데 실제로 개인들의 능력은 다르며 그 차이가 클수록 노이즈로 작용하여 결과값에 영향을 줄 수 있다.

= 이러한 노이즈를 방지하기 위해서는 개별 피실험자들에게 모든 처치를 하는 것이다. 이와 같은 실험 디자인을 피실험자내 디자인(within subjects design)이라고함.

= 이 경우 개별 피실험자들에게 여러 처치를 하고 복수의 값들을 측정하므로 반복측정 디자인(repeated measures design)이라고도 함.

= 노이즈를 측정할 수 있다는 장점, 피실험자들의 수를 줄일 수 있다는 장점.

(2)자료

* 독립변수 : 명목척도

* 종속변수 : 간격척도 or 비율척도

(3)가정

* 구형성 가정(sphericity assumption)이 필요

- 구형성 가정(sphericity assumption)은 반복측정 디자인의 경우 요구되는 가정으로 일원분산분석(피실험자간)의 경우 분산의 동일성 가정에 해당한다.

- 연구 대상인 집단들 중에서 어느 두 집단의 차이값들의 분산(variance of the differences for any two groups)은 다른 어느 두 집단의 차이값들의 분산과 동일하다는 가정이다.

- Mauchly의 구형성 검정에서 W가 1이면 완벽한 구형성이며, 1에 가까울수록 구형성이 강해진다.

- 구형성 검정에서 귀무가설은 데이터가 구형성을 갖는다는 것이다. 


* 구형성 가정을 충족시키지 못하면 1종 오류가 커질 수 있다. 

- 즉 집단 간 차이가 없는데 차이가 있다고 잘못 결론내릴 수 있다.

- 이 경우 보다 보수적으로 검증할 필요가 있으며 Greenhouse-Geisser, Huynh-Feldt, 혹은 하한값 행의 값으로 검증하면 된다.

= 이 중에서 하한값이 가장 보수적, Greenhouse-Geisser가 중간 보수적, 그리고 Huynh-Feldt가 가장 덜 보수적이다.


2. 삼원분산분석(Three-Way ANOVA) - 팩토리얼 디자인

(1) 개념

* 팩토리얼 디자인에 의한 이원분산분석의 경우 처치변수(독립변수)가 두 개이다. 이러한 디자인에 한 개의 처치변수를 추가하여 세 개가 되면 삼원분산분석 (three-way ANOVA)을 실시할 수 있다.

* 이 경우 연구자의 주 관심은 세 개의 처치변수들 간의 상호작용효과에 관한 것이 된다.

(2) 자료

일원분산분석의 경우와 동일

(3) 가정

일원분산분석의 경우와 동일


광고대안과 성별의 상호작용효과에 학력이 조절적(moderating) 작용을 하는가?

=> 광고대안과 성별의 상호작용효과는 학력에 따라 다르다 (= 광고대안과 성별의 상호작용효과에 학력이 조절적 작용을 한다)






1-way ANOVA

Are there differences in the degree of religious commitment between countries (UK, USA, and Australia)?


1-way repeated measures ANOVA

Do university students have different levels of satisfaction for educational, social, and campus-related domains ?


Factorial ANOVA

Are there differences in the degree of religious commitment between countries (UK, USA, and Australia) and gender (male and female)?


Mixed ANOVA

Does couples' relationship satisfaction differ between males and females and before and after having children?


ANCOVA

Are there differences in university student satisfaction between males and females (gender) after controlling for level of academic performance?


(출처 : http://www.slideshare.net/jtneill/anova-12554263)








귀무가설이 진실일 때 이를 기각하는 것(즉, 1종 오류)는 잘못된 결정이다. 

이와는 반대로, 귀무가설이 허위일 때는 이를 기각하는 것(즉 연구가설이 옳을 때 이를 지지하는 것)이 바른 결정이다. 

귀무가설이 허위일 때 이를 기각할 확률을 통계적 검증력(statistical power; 혹은 줄여서 검증력)이라고 한다.


검증력

검증력이 크면 귀무가설이 허위일 때 이를 기각하지 않는 오류 (2종 오류)는 작아진다. 

그러므로 검증력과 2종 오류의 확률은 서로 반대로 작용한다. 2종 오류의 확률을 β로 나타내므로 검증력은 1-β 가 된다.


검증력을 결정짓는 것은 α, 표본의 크기, 그리고 효과크기이다. 

즉, α가 클수록, 표본의 크기가 클수록, 그리고 효과크기가 클수록 검증력은 커진다.

이는 α가 클수록 귀무가설을 보다 쉽게 기각하며

표본의 크기가 클수록 그리고 효과크리가 클수록 검증통계량(절대값)이 커지기 때문이다.


효과크기

효과크기(effect size)는 연구되는 현상이 실제로 모집단에 존재하는 정도(the degree to which the phenomenon being studied exists in the population)을 말한다.

예를 들어, 두 집단 평균차이 검증의 경우 효과크기는 집단간 차이의 표준화 측정치(Cohen's d)로서 집단 평균값들 간의 차이를 표준편차로 나눈 것이다.

분산분석의 경우 η^2, 회귀분석의 경우 R^2 등은 각각의 경우 효과크기를 나타낸다. 







In statistics, an effect size is a measure of the strength of a phenomenon[1] (for example, the relationship between two variables in a statistical population) or a sample-based estimate of that quantity. 

An effect size calculated from data is a descriptive statistic that conveys the estimated magnitude of a relationship without making any statement about whether the apparent relationship in the data reflects a true relationship in the population

In that way, effect sizes complement inferential statistics such asp-values. Among other uses, effect size measures play an important role in meta-analysis studies that summarize findings from a specific area of research, and in statistical power analyses.

The concept of effect size already appears in everyday language. 

For example, a weight loss program may boast that it leads to an average weight loss of 30 pounds. In this case, 30 pounds is an indicator of the claimed effect size. 

Another example is that a tutoring program may claim that it raises school performance by one letter grade. This grade increase is the claimed effect size of the program. 

These are both examples of "absolute effect sizes", meaning that they convey the average difference between two groups without any discussion of the variability within the groups. For example, if the weight loss program results in an average loss of 30 pounds, it is possible that every participant loses exactly 30 pounds, or half the participants lose 60 pounds and half lose no weight at all.


Reporting effect sizes is considered good practice when presenting empirical research findings in many fields.[2][3] The reporting of effect sizes facilitates the interpretation of the substantive, as opposed to the statistical, significance of a research result.[4]Effect sizes are particularly prominent in social and medical research. Relative and absolute measures of effect size convey different information, and can be used complementarily. A prominent task force in the psychology research community expressed the following recommendation:


Always present effect sizes for primary outcomes...If the units of measurement are meaningful on a practical level (e.g., number of cigarettes smoked per day), then we usually prefer an unstandardized measure (regression coefficient or mean difference) to a standardized measure (r or d).

— L. Wilkinson and APA Task Force on Statistical Inference (1999, p. 599)




(출처 : http://en.wikipedia.org/wiki/Effect_size)





Cohen's d is an effect size used to indicate the standardised difference between two means. It can be used, for example, to accompany reporting of t-test and ANOVA results. It is also widely used in meta-analysis.

Cohen's d is an appropriate effect size for the comparison between two means. APA style strongly recommends use of ESs. Partial eta-squared covers how much variance in a DV is explained by an IV, but that IV possibly has multiple levels and hence partial eta-squared doesn't explain the size of difference between each of the pairwise mean differences.

Cohen's d can be calculated as the difference between the means divided by the pooled SD::

\frac {\textrm{mean \ difference}} {\textrm{standard \ deviation}}  or \frac {\textrm{M2 \ - \ M1}} {\textrm{pooled \ standard \ deviation}}


Cohen's d, etc. is not available in PASW, hence use a calculator such as those listed in external links.


In an ANOVA, you need to be clear about which two means you are interested in knowing about the size of difference between. This could most likely mean that you are interested in several d's, e.g., to compare marginal totals (for main effects) or cells (for interactions). In general, it is recommended to report all relevant Cohen's d values unless you've got a particular reason to just focus on a one or some of the possible values. From a descriptive statistics table, calculating Cohen's d is relatively straightforward.


Calculating Cohen's d provides useful information for discussion (e.g., allows ready comparison with meta-analyses and the size of effects reported in other studies). Where you are reporting about differences between two means, then a standardised mean effect size (such as d) would be an appropriate accompaniment to inferential testing.



(출처 : http://en.wikiversity.org/wiki/Cohen's_d)









13.1 신뢰성분석의 개요


척도의 신뢰성(reliability)

한 대상을 유사한 측정도구로 여러 번 측정하거나 한 가지 측정도구로 반복 측정했을 때 일관성 있는 결과를 산출하는 정도

일관성 있는 결과가 산출될수록 그 척도(혹은 측정치)의 신뢰성은 높다.


척도의 신뢰성 평가하는 방법

내적일관성 (internal consistency) : 가장 많이 사용되는 방법

반복측정 신뢰성(test-retest reliability)

대안항목 신뢰성(alternative form reliability)


내적일관성

한 construct를 다항목(multi-item)으로 측정했을 때 항목들이 일관성(consistency) 혹은 동질성(homogeneity)를 갖는가에 관한 것이다.

내적일관성은 항목들 간의 상관관계로써 평가되는데, 항목들 간의 상관과계가 높을수록 내적일관성이 높다.

일반적으로 가장 많이 쓰이는 내적일관성에 의한 척도의 신뢰성 평가방법은 Cronbach's coefficient alpha (줄여서 Cronbach's α 계수)를 이용하는 것이다.


Cronbach's α 계수

0에서 1 사이의 값을 가지며, 높을수록 바람직하나 반드시 몇 점 이상이어야 한다는 기준은 없다.

흔히 0.8~0.9 이상이면 바람직하고 0.6~0.7이면 수용할 만한 것으로 여겨진다.

그러나 0.6보다 작으면 내적일관성을 결여한 것으로 받아들여진다.

=> 이 경우 Cronbach's α 계수의 크기를 저해하는 항목들을 제거함으로써 계수값을 크게 할 수 있다.

이러한 항목들은 그 항목과 전체 항목들 간의 상관관계(item-to-total correlation)가 낮은 항목들이다.







When the entire scale points to the same direction, you can compute the overall Cronbach Coefficient Alpha. In this example, the standardized Cronbach Coefficient Alpha is .85. It is a good sign if the entire instrument is considered one scale. However, this instrument carries seven subscales. A high Alpha indicates that all response patterns are internally consistent. The next questions are: Are there seven subscales in this instrument? If there are subscales, are they independent from each other conceptually?


어떤 설문조사의 Cronbach's α가 높게 나올 경우, 그 설문조사 문항이 단차원(한 가지 면만 검사하고 있는지)적일 것이다라는 주장이 있을 수 있다. 그래서 subscale에 대한 추가적인 확인이 불필요하다고 주장하는 사람이 있다. 하지만 이것은 흔히 저지르는 오류이다. consistency와 dimensionality는 서로 별개로 확인되어야 한다.


One may argue that when a high Cronbach Alpha indicates a high degree of internal consistency, the test or the survey must be uni-dimensional rather than multi-dimensional. Thus, there is no need to further investigate its subscales. This is a common misconception. Actually consistency and dimensionality must be assessed separately. 


The relationship between inconsistency and uni-dimensionality is illustrated in the figure on the left. Uni-dimensionalityis a subset of consistency. If a test is uni-dimensional, then it will show internal consistency. But if a test is internally consistent, it does not necessarily entail one construct (Gardner, 1995; 1996). 


Internal consistency는 reliability와 연관이 되어있고, dimensionality는 validity와 연관이 있다.

Internal consistency is a form of reliability while dimensionality is associated with construct validity. Reliability is a necessary, but not a sufficient condition, for validity. This logic works like this: If I am a man, I must be a human. But if I am a human, I may not be a man (could be a woman). The logical fallacy that "if A then B; if B then A" is termed as "affirming the consequent" (Kelly, 1998). This fallacy often happens in the misinterpretation of Cronbach Alpha.


(출처 : http://www.creative-wisdom.com/teaching/assessment/subscales.html)




  • 10 : 상관관계분석
  • Pearson 상관관계분석
    • 개념
      • 변수의 관계에서 일반적으로 선형관계에 초점을 .
      • 분석 내용
        • (1) 선형관계를 갖는지
        • (2) 선형관계를 갖는다면 어느 방향인지
        • (3) 관계는 얼마나 큰지 분석함.

 

  • 변수가 서로 선형관계를 가질 선형상관관계가 있다고 하며, 줄여서 상관관계가 있다고 .
  • 상관관계의 크기를 나타내는 값은 상관계수(correlation coefficient)이며, 상관계수는 -1부터 +1까지 값을 갖음.

  • 상관관계의 종류와 자료
    • Pearson 상관계수
      • 가장 보편적
      • 보통 상관계수라고 의미하는 .
      • Spearman 서열상관관계
      • Kendall's tau
      • Point-biserial r
      • Phi-coefficient

 

  • 종류

    척도

    의미

    Pearson 상관관계

    간격/비율 - 간격/비율

    변수가 각각 간격척도 혹은 비율척도로 측정된 경우 상관관계의 크기. 변수들이 정규분포를 따른다는 가정하에 적용하는 상관계수.

    Spearman 서열상관관계

    서열 - 서열

      • 변수를 구성하는 데이터가 정규분포를 따르지 않거나, 서열척도로 측정된 경우 이용
      • Pearson 상관계수의 비모수 버전.

    Kendall's tau

    서열 - 서열

      • 변수를 구성하는 데이터가 정규분포를 따르지 않거나, 서열척도로 측정된 경우 이용
      • Pearson 상관계수의 비모수 버전.

    Point-biserial r

    간격/비율 - 명목(2분화 변수)

     

    Phi-coefficient

    명목(2분화 변수) - 명목(2분화 변수)

     

 

  • 가정
    • Pearson 상관관계분석 : 변수들의 쌍은 이변량 정규분포(Bivariate normal distribution) 따른다는 가정.

 

  • Spearman 상관관계분석
    • 개념 : 서열척도로 측정한 자료에서 사용
    • 자료 : 이상의 대상에 대한 서열이 같은 경우 가운데 서열을 부여
    • 가정 : 변수의 정규분포 가정 불필요

 

  • 편상관관계 분석
    • 앞의 상관관계분석은 변수들 간의 상관관계를 보는 것이었음.
    • 그런데 어떤 변수가 다른 3 변수와 상관관계가 높으면 변수의 상관관계는 순수한 상관관계보다 높게 나타날 있다. 순수한 상관관계를 알기 위해서는 3 변수를 통제해야 한다.
    • 편상관관계(partial correlation) 분석은 3 변수를 통제한 상태에서 관심을 갖는 변수의 상관관계를 분석하는 것이다.
      • ) 여름의 더운 콘도 앞에 출몰한 개미숫자와 콘도 앞을 지난 승용차 수는 양의 상관관계를 갖는다. 하지만 개미가 승용차에 붙어서 것이 아니라, 여름날 개미는 날씨가 더울수록 많이 나타나는 것이다. 온도를 통제변수로 설정해야 한다.
    • SPSS 옵션
      • 평균과 표준편차 : 변수에 대해 평균, 표준편차, 비결측 케이스 등을 나타냄.
      • 0 상관 : 0 상관은 통제변수가 없는 경우의 상관계수를 나타냄.


표본의 수가 30개 이하인 경우는 종속변수가 연속변수이더라도 비모수적인 방법을 선택할 수 있다.

(http://wwww.cbgstat.com/v2/method_Mann_Whitney_U_test/Mann_Whitney_U_test.php)







1. 규율 : 감정에는 너그럽지만 행동에는 엄격하게

어떤 행동은 용납이 되고, 어떤 행동은 용납이 되지 않는지, 아이들은 명확하게 알고 있어야 한다. 부모의 도움 없이 아이들이 충동과 욕망을 행동에 옮기기란 어려운 일이다. 부모의 허락을 받을 수 있는 행동의 분명한 한계를 알게 되면, 아이들은 훨씬 더 안정감을 느낀다. 

2. 아이를 배려하면서도 부모의 의지를 관철시킨다.

1) 지혜의 출발점은 아이의 말에 귀를 기울이는 것이다.

2) 아이의 지각을 부정하지 말아야 한다. 

감정을 반박하지 말아야 한다. 소원을 무시하지 말아야 한다. 아이의 취미를 조롱하지 말아야 한다. 아이의 의견을 헐뜯지 말아야 한다. 아이의 인격을 훼손하지 말아야 한다. 아이의 경험에 대해 이러쿵저러쿵 하지 말아야 한다. 그 대신 이를 인정해야 한다.

인정이 꼭 찬성을 뜻하는 것은 아니다. 그것은 아이의 의견을 존중한다는 것을 보여줄 따름이다.

3) 비난하지말고 길잡이를 해주어야 한다.

4) 화가 날 때는 '나'라는 말로 시작하여 자기가 본 것, 느낀 것, 기대했던 것을 이야기하는 것이 좋다.

5) 아이들의 노력에 대해서 높이 평가한다는 점을 말해 주기 위해서 칭찬할 때는 그 특별한 행동을 언급해야 한다. 인격을 평가해서는 안 된다.

6) 현실에서는 허락할 수 없는 것을 상상 속에서는 허락하여, 거절하더라도 마음이 덜 아프게 하는 방법을 알아두는 것이 좋다.

7) 아이들의 삶에 영향을 미치는 문제들에 대해서는 그들에게 선택권과 발언권을 주는 것이 좋다.








앨리스 기너트(Alice Ginott) 박사 

옛체코슬로바키아 출생. 이미 세상을 떠난 하임 G. 기너트 박사와 함께 슬하에 두 딸을 두었고, 현재는 두 손자의 할머니이다. 심리학자이며, 전문심리치료사, 저자, 강사로 활동 중이다. 주 관심 분야는 언어를 통한 의사 소통이다. <생각이 건강한 아이로 키우는 방법>, <아이들의 슬픔을 덜어주는 방법>이라는 제목으로 칼럼을 연재하기도 했다. 

월리스 고더드(Wallace Goddard) 박사 

미국 유타 주 출생. 아내 낸시와 함께 슬하에 세 자녀를 두었고, 수 년 동안 20명의 입양아를 돌보았다. 현재 아칸소 주의 리틀 록에 살고 있다. 
아칸소 대학교 사회교육원에서 가족 생활 지도 전문가로 활동하고 있으며, 사회교육원 웹사이트에 글을 올리고 있다. <어린이를 위한 성공적인 길잡이(Guiding Children Successfully)>라는 제목의 텔레비전 프로그램에 출연하고 있다. 
강연 활동과 아울러 <가족 생활 교육(family life education)에 관한 교재를 집필 중이다. 



목차

제1장 아이와 대화 나누기 
제2장 말의 힘: 격려하고 이끌어주는 좋은 방법 
제3장 아이를 망치는 부모: 부모의 잘못 
제4장 책임감: 먼저 가치 있는 행동을 알려준다 
제5장 규율: 처벌을 대신할 효과적인 대안 
제6장 적극적으로 아이 키우기: 아이의 하루 
제7장 질투: 아이의 비극 
제8장 아이의 불만: 아이의 마음 안정시키기 
제9장 성과 인간: 예민하고도 중요한 주제 
제10장 요약: 아이를 올바르게 키우기 

부록_323 
부록 1 : 도움이 필요한 아이들 
부록 2 : 심리 치료사들은 자기 아이들을 어떻게 대하는가 

옮긴이의 말_347 


(출처 : http://www.kyobobook.com/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9788990220127)





"우리는 아기를 처음 떠올릴 때, 새롭고 깨끗하고 삶의 흔적이 묻지 않은 아기를 상상한다. 

사실 아기들은 이미 세상과 우리에 의해 형성되어 있는데 말이다. 

이는 부모에게 주어진, 숙고해볼 가치가 있는 선문답이다. 

'잘 아는 누군가를, 우리가 처음으로 만난다.'" 


"When we hold our babies for the first time, we imagine them clean and new, unmarked by life, when in fact they have already been shaped by the world, and by us. It's a koan of parenthood, one worthy of long contemplation: We are meeting someone we know well for the very first time." 









http://book.daum.net/detail/book.do?bookid=BOK00014896983BA


1개월-인간이 태어나기 전 9개월의 역사 
우리를 만든 것은 무엇인가 
태아의 재발견 
오해와 몰이해 
살아 있는 실험 

2개월-음식이 전하는 메시지 
“먹는 음식이 곧 아기가 됩니다” 
상식인가, 미신인가 
바커 가설-뱃속에서의 영양결핍이 심장질환으로 
생선의 딜레마 
음식 해방 
행복한 아기를 위한 초콜릿 한 줌 

3개월-엄마의 스트레스 
불현듯 우리를 위협하는 것들 
극단적 스트레스 
일상적 스트레스-임신한 슈퍼우먼 
일할 권리, 쉴 권리 

4개월-금지된 물질로 만든 세상 
사물을 새롭게 바라볼 것 
자궁은 완전한 차단막인가 
흡연과 음주 
플라스틱의 배반 
위험한 공기? 
좋은 약은 없는가 

5개월-초음파 정치학 
신의 계획을 엿보다 
태아를 훔쳐보는 카메라 
자궁 속의 다윈론 
분홍 알약, 파랑 알약 
두려움과 유혹 

6개월-엄마의 우울 
토끼 생각에 토끼를 낳다 
어느 여성 정신분석가의 고백 
임신우울증 
자아의 재구성 

7개월-우리의 시작은 태아였다 
생의 기원 
유아기는 언제 시작되는가 
자궁은 말한다 
태아기, 인간의 아틀란티스 

8개월- 엄마라는 이름의 시민(市民) 
경제학이 본 뱃속 9개월 
알파 계급과 엡실론 계급 
‘어머니’를 돌보는 사회 
보호받을 권리 

9개월-끝이면서 시작인, 안녕! 
출생 트라우마 
엄마 길들이기 
가장 생생한 만남 







+ Recent posts