질적 연구 방법론과 그 철학적 토대

신충식(성균관대)





1. 질적 연구방법과 제일인칭 시각의 현상학


이러한 참여적 관찰보다 심층 인터뷰 기법을 사회학자는 물론 여타 사회영역에서 널리 활용하고 있다. 심층 인터뷰는 반쯤 구조화되거나 전혀 구조화되지 않은 방식으로 문 제들을 토론하는 것을 쉽게 하기위해서 인터뷰 가이드와 끝없이 진행되는 질문 및 정보를 얻기 위한 끊임없는 탐구에 기초하고 있다. 이러한 심층 인터뷰는 안내를 받고 있는 대화라 할 수 있을 것이다. 또한 이러한 긴 인터뷰는 일상적으로 작은 샘플들에 한해서 행해질 수 밖에 없다. 마지막으로 연구자들은 집단 인터뷰를 활용한다. 개인들 인터뷰보다 집단 인터 뷰가 갖는 이점은 특수한 주제에 대한 토론에서 참여자들이 상호작용을 할 수 있으며 어떤 관점에서 다른 인터뷰를 받는 자들과 동의하거나 반대하며 새로운 이슈와 관심을 제기할 수 있다는 점이다. 의사-자연적인 환경에서 모든 참여자들 간의 상호 작용은 일상적인 집단 대 화와 그렇게 다르지 않다.


따라서 질적 연구의 목적은 근본적으로 사람들의 주관적인 경험들과 그들이 그러한 경험들에서 얻게 되는 의미들을 탐구하는 것이다. 예컨대 심층 인터뷰는 사건의 당사자들이 자유롭게 이야기하고 사건에 대한 그들의 해석들을 제공할 수 있으며 그들이 구성하고 있는 사고과정과 이야기들을 재구성할 수 있도록 해준다. 결국 질적인 방법은 의미과정의 맥락을 포착하는 데 가장 유용한 방식이라 할 수 있을 것이다.




I. 질적인 연구방법의 철학적 토대


1. 서론


2. 객관학문의 발생


3. 초월학문의 발생


4. ‘초월론적인(transcendental)’ 것의 의미











II. 질적 연구방법의 특징과 연구 설계


1. 양적인 연구와 질적인 연구 방법의 차이


방법에 있어 옳고 그름의 문제는 있을 수 없다. 문제는 자신이 선택하고자 하는 방 법이 연구 주제와 연구 모델에 얼마큼 부합하는지에 있다.


이러한 양적 연구와 질적 연구의 진리주장의 차이를 다음과 같이 도표화할 수 있을 것이다.




2. 질적 연구의 특징


Dryman, A. (1988) Quality and Quantity in Social Research, London; Macmillan. 


1. 연구 참여자의 눈을 통하여 보는 것, 또는 연구 참여자의 관점을 수용하는 것 

2. 일상세계; 세속적 일들을 기술하는 것 

3. 사회적 상황에서 행위와 의미들을 이해하는 것 

4. 개방적이고 비구조화된 연구 설계들이 사용되는 것 

5. 연구 초기 단계에 개념들과 이론들을 결정하지 않는 것


Hammersley, M. (1990). Classroom Ethnography: Empirical and methodological Essays, Open University Press.


1. 실험적 조건 대신에 일상적인 상황에서 연구 

2. 다양한 자료수집 방법들 

3. 비구조화된 자료수집 방법 

4. 사회생활에서 나타나는 미시적 특징에 대한 관심 

5. 사회적 행위의 의미와 기능에 대한 관심 

6. 양화가 부수적인 역할을 함


Hammersley, (1992), Some


1. 수 대신에 언어의 사용 

2. 자연적인 상황에서의 자료수집 

3. 행동 대신에 의미에 대한 관심 

4. 연구 방법으로서 자연과학 모델의 거부 

5. 가설 검증이 아니라 가설 생성적 방법


Bogdan and Biklen (1992), Qualitative Research for Education, Bacon.


1. 자연적 상황 

2. 연구 도구로서 연구자 

3. 수가 아닌 언어나 사진 형식을 통한 서술 

4. 결과나 산출보다 과정에 대한 관심 5. 귀납적 분석 방법 

6. 연구의 목적으로서 의미


Eisner (1991), The Enlightened Eye, Macmillan.


1. 현장 중심 

2. 연구 도구로서 연구자의 자아 

3. 해석의 강조 (상황에 대한 참여자의 설명) 

4. 표현적 언어의 사용 

5. 특별한 세부사항에 대한 관심 

6. 글쓰기와 자료제시를 통한 설득


김영천 (2006)『질적연구방법론 I』문음사.


1. 내부자적 관점의 포착


연구 참여자인 내부자의 시각을 기술하고 이해하는 데 있다. 이는 특정한 생활세계의 참여 자가 가지고 있는 그들의 시각을 기술하고 이해하는 것이다. 또한 문화적 상대주의 관점에 서 그들이 삶을 어떻게 구조화시키고 의미를 부여하며 상호작용하였는지를 기술하고 이해하 고자 한다.


2. 특정 사례에 대한 연구 관심


일반화를 목적으로 대규모의 소집을 대상으로 하는 양적 연구와는 달리 연구자가 관심을 두 고 있는 특정한 사례나 사건 그리고 현상에 대하여 심층적으로 연구하고자 한다.


3. 목적 표집


이것은 연구자가 관심을 둔 특별한 사례를 의도적으로 선택하여 연구대상으로 삼은 표집방 법을 말한다.


4. 현장 작업


현장 작업은 연구자가 직접 현장에 들어가 참여자들과의 계속적인 상호작용을 하면서 자료 를 수집하고 연구하는 것을 말한다.


5. 장기간의 관찰


진실한 자료를 얻기 위하여 연구자는 연구 현장 속에서 연구자들과 생활하거나 대화하면서 장기간 그들을 관찰할 필요가 있다.


6. 유연한 연구 설계


이는 연구 설계가 연구 이전에 결정되는 것이 아니라 연구가 진행되면서 점차적으로 구체화 되는 것을 말한다.


7. 자료 수집과 자료 분석의 순환성


이는 자료 수집 단계와 자료 분석 단계가 일직선상으로 전후 관계가 있는 것이 아니라 수집 과 분석이 사이클을 이루면서 진행된다는 것을 의미한다. 따라서 자료 수집 단계와 자료 분 석의 단계는 선후의 관계로서 확실하게 분리되어 진행되는 것이 아니라 두 개의 연구 과정 이 상호 보완적인 관계를 유지하면서 진행되는 것을 말한다.


8. 연구자와 연구 대상 간의 친밀도


이는 연구자가 연구 참여자와 심리적 공감대인 라포르를 형성하는 것을 의미한다. 외부자의 시각인 연구자의 관점을 확인하려는 양적 연구의 경우 연구 참여자와의 이러한 라포르의 형 성이 굳이 필요가 없지만 내부자의 시각과 그들의 생각을 이해해야 하는 질적 연구의 경우 연구 참여자와의 심리적 공감대의 형성은 무엇보다 연구 작업의 성공에 필요한 작업 요소가 된다.


9. 점진적 주관성


이는 연구가 진행되면서 초기에 설정한 연구 문제나 연구 내용에 비하여 어떠한 새로운 변 화가 생겼으며 얼마나 현장에 대한 이해가 깊어졌는가를 연구 도구인 연구자가 개인적으로 반성하는 작업을 뜻한다.


10. 기술적 형태의 자료 표현


기술적 형태의 자료 표현은 연구의 결과가 기술적인 형식의 글쓰기 양식을 통해서 표현된다 는 것을 의미한다. 따라서 질적 연구를 질적으로 만들게 하는 특징 중의 하나인 이 준거는 연구자가 수집한 연구 자료나 연구 결과를 숫자가 아닌 기술적인 형식의 표현 체계로서 나 타내는 것을 의미한다.


11. 투명성


투명성은 질적 연구의 결과가 연구 현장의 세계를 얼마나 투명하게 그리고 이해할 수 있을 정도로 자세하게 기술되어 있느냐를 나타내는 언어이다.


12. 연구 도구로서 연구자


연구 도구로서 연구자는 연구자가 연구의 전체 과정에서 연구 도구가 되어 연구에 참여하는 것을 말한다. 더욱 구체적으로 자료를 수집하는 작업을 연구자가 하고 수집된 자료를 분석하는 과정 역시 연구자가 직접 하는 것을 의미한다. 연구 도구로서 연구자의 역할은 첫째, 연구자가 직접 현장에 들어가 필요한 자료들을 수집하고 둘째, 자료 분석의 과정에서 연구 자의 직접적인 개입이 이루어진다는 점에서 양적 연구의 자료 수집과 다르다.


13. 반성적 연구 활동


이는 연구자가 질적 연구를 하면서 끼친 여러 가지 인간적인 제약들과 특징들이 연구의 전 체 과정에 어떻게 영향을 끼치는지를 해체적으로 분석하고 기술하고 노출시키는 작업을 말 한다.




3. 질적 연구자의 기본적인 절차


    1. 첫째, 친숙한 영역에서 시작하라. 

    2. 째, 우리가 작업하고 있는 완결된 이론적인 정향을 발견하라. 

    3. 셋째, 일단 정해진 분야에 대해서 느낌을 갖게 되면 가능한 빨리 연구 주제를 좁혀가 라. 

    4. 넷째, 기존의 다른 사람이 연구했던 것을 발견하고 그것을 따르라. 다시 말해서 연구를 위 한 새로운 바퀴를 발명하려 하지 마라. 

    5. 다섯째, 계속 써라. 그 페이퍼가 얼마나 짧고 거친지에 대해서는 걱정하지 마라. 

    6. 여섯째, 즉시 데이터 분석을 시작하라. 우리가 초기 연구 단계에 어떤 데이터를 얻지 못했 다면 다른 사람의 데이터를 가지고 분석하려 하라. 

    7. 일곱째, 자신의 데이터에 대해서 비판적으로 생각하라. 그 데이터에서 어떤 패턴을 확인하 기 시작할 때도 서둘러서 결론을 끌어내려 하지 마라. 

    8. 여덟째, 지도교수에게 자신의 아이디어를 시험하라. 지도교수는 우리의 아이디어를 실험하 는 것을 도울 수 있고, 자신감을 부여할 것이다. 

    9. 아홉째, 자기 자신의 분야 안과 밖에서 다른 자료들과 기회들을 활용하라. 가급적 자신의 연구 분야와 상관있는 학술 모임에 참석할 기회를 찾고, 가능하다면 작업 중인 페이 퍼들을 소개할 필요가 있다. 

    10. 열째, 꾸준한 학습곡선을 기대하지 마라. 어떤 연구도 위기 없이 진행될 수는 없다. 

    11. 열한째, 연구 일기를 작성하라. 

    12. 열두째, 다른 여타 활동들을 완성하기 위한 작업시간을 책정하라. 

    13. 열셋째, 연구가 진전이 없을 때 자기 자신을 책망하지 말고 휴식을 위한 시간을 가져라. 

    14. 열넷째, 자신의 연구 분야에 있어서의 관계들을 데이터로 다루어라. 즉 연구 주제와의 상호 작용이 자신의 데이터를 어떻게 형성해 가는지 숙고할 필요가 있다. 

    15. 열다섯째, 완벽한 연구 디자인 모델이 없음을 숙지할 필요가 있다. 이 말은 우연하게 얻게 될 어떤 데이터를 가지고 작업하는 것을 두려워할 필요가 없다는 것이다.



4. 질적인 연구 프로포잘 작성방식


1. 제목


제목은 독자의 관심을 끌 수 있으면서도 연구 주요 사안에 관한 정보를 적절히 제공할 수 있어야 할 것이다. 통상 주제목과 부제목의 이단으로 된 제목이 효율적이다. 주제목은 논문 주제를 포괄적으로 제시하면서 독자의 시선을 끌 수 있어야 할 것이고, 반면에 부제목은 보다 기술적이면서 한정적이어야 할 것이다.


2. 초록


초록은 첫째, 연구문제(research problem)를 드러내야 하고, 둘째, 그 문제가 왜 중요하고 연구할 가치가 있는지를 보여주어야 하고, 셋째, 연구 데이터와 방법, 넷째, 연구를 통한 주 요 발견(findings), 마지막으로, 다른 연구에 비추어 볼 때 그 연구가 갖는 함의를 밝힐 필 요가 있다. 초록 형식의 글쓰기는 가능한 한 적은 단어로 가능한 한 많을 것을 말하는 것이 다. 또한 초록은 연구주제를 가급적 생생하게 보여주고 필요한 정보도 제공할 수 있어야 한 다.


3. 연구 배경을 알리는 짤막한 서론


첫째, 다른 어떤 것보다 왜 이 주제를 선택하였는가? (예컨대, 연구 부재 또는 기존 연구의 부적절성 등) 둘째, 이 연구 주제가 관심을 끄는 이유는 무엇인가> 셋째, 원용하고자 하는 연구 방법이나 기법은 무엇인가? 넷째, 연구를 주도하게 될 질문이나 문제는 무엇인가?


4. 연구 목적 또는 연구 질문


5. 연구에 적절한 문헌에 대한 조명 (궁극적으로는 연구 분야에서 고전적인 문헌의 맥락에 서 연구 프로젝트의 중요성을 보여 줄 수 있어야 함)


6. 연구 방법론 소개 (선택된 사례나 기법에 대한 소개, 이론적인 정향과 연구 기법의 적절 성의 측면에서 데이터 수집과 데이터 분석의 절차에 대한 소개를 담아야 한다)


7. 정교한 참고문헌 소개: 각 문헌에 대한 비판적인 논평 환영




III. 스토리텔링과 전기적 생애사


IV. 근거이론


근거이론은 콜롬비아 대학 출신으로 양적 연구방법의 훈련을 받은 글래이져 교수 와17) 시카고 대학의 상징적 상호작용론(symbolic interaction) 전통의 영향 하에18) 질적 연구를 추구해온 슈트라우스 교수(Barney Glaser & Anselm Strauss의 저서 The discovery of Grounded Theory, 1967를 참조하라)가 1960년대 초반 병원에서 임종을 앞둔 환자들 을 돌보는 의료진들의 관찰을 토대로 한 현장 연구의 일부로서 최초로 개발하였다. 서로 상 이한 전통에서 훈련받은 이 두 연구자는 공히 모든 전문가들뿐만 아니라 일반 대중에게도 유용할 수 있는 연구 기법을 추구하였다. 그러면서도 그들은 분석대상이 되는 현상에 대해 최대한 있는 그대로를 엄밀하게 기술하며 귀납적인 방식으로 현상의 구조를 도출해내고자 일정한 지침과 절차를 제공하고자 하였다.


이러한 근거이론은 접근방법에 있어 두 가지로 나뉜다. 

  • 첫째, 앞에서 언급한 글래이져의 방식으로 이는 해석주의적 시각을 가지고 연구자가 선행이론을 정교화하거나 수정하 고자 하는 의도 없이 축적된 자료로부터 이론을 생성하고자 하는 정통적인 근거이론 방식이 다. 다시 말해서, 연구자가 연구 이전에 어떤 이론도 정립하지 않은 가운데에 여러 단계와 절차를 거쳐 자료를 수집하고 분석한 다음 여러 정보군 간의 내적 관련성에 대해 비교분석 하여 새로운 이론을 도출해내는 방식이라 할 수 있다. 

  • 반면에 슈트라우스와 간호사였던 코 빈(Corbin)이 새롭게 제시하고 있는 방식에서 연구자는 현상을 연구하는 데 근거가 되는 이 론으로부터 그의 연구를 시작하며 수집된 자료를 중심으로 이론을 형성하거나 근거가 되는 이론을 수정, 보완, 재해석하여 이론을 도출하는 방식이다. 다시 말해서 이 방법은 선행 연 구를 바탕으로 하는 이론을 근거로 사회현상을 비교분석하며 기존의 이론을 보완하거나 수 정하려는 방식이다.


따라서 근거이론은 실제 현장에서 어떤 행동의 변화를 설명하고 범주와 범주, 개념 과 개념 간의 관계를 형성하는 것을 그 목적으로 하며 해석주의자들과 같이 실재하고 있는 사회적, 문화적 현상의 바탕이 되고 있는 전체적인 과정을 기술하고자 한다. 이러한 점에서 관찰 가능한 것만 선택적으로 파악하려고 하는 실증주의적 분석 방식과 확연히 구분된다. 요컨대 근거이론은 현장에서 수집한 자료에 근거하여 개발된 이론으로서 수집하는 자료가 포화상태에 이를 때 가능한 범주를 상세히 기술하고자 한다. 자료가 포화상태에 이른다 함 은 연구자가 범주의 속성을 파악하는데 더 이상 새로운 자료를 발견할 수 없는 단계까지 도 달하였음을 의미한다.




제1단계. 자료수집: 녹취(transcribing)와 메모 작업(memoing)



근거이론에서 자료 수집은 통상 20-30명과의 심층 면접, 포커스 집단 면접, 직접 관찰 및 기록 등을 통해서 이루어진다. 일반적으로 자료 수집은 주로 현장참여 관찰과 심층 인터뷰 방식을 통해서 이루어지며 항상 인터뷰의 지속성과 관찰 자료들의 연계성을 고려할 필요가 있다. 근거이론에서 표본의 크기는 생성된 자료에 의한 자료 분석에 따라 결정된다.


아무래도 표본크기의 적정선은 

1) 범주에 대한 자료들의 다양성과 자료집단 간의 차이를 극 대화하는 지점; 

2) 이론의 통일성과 밀도; 그리고 무엇보다 

3) 연구자의 이론적 민감도 (theoretical sensitivity)에 따라서 결정되어야 할 것이다.


한편 이론적 민감성을 제고하고 자료 수집의 연속성을 유지하기 위해서 연구의 전 과정을 통해서 꾸준히 메모를 해 나갈(memo-ing) 필요가 있다. 이것은 연구자가 연구과정 에서 주제에 관련된 아이디어를 적는 과정이자 이론 형성에 도움이 되는 분석의 기록이기도 하다. 질적 연구의 유일한 연구수단인 연구자가 메모하는 동안의 사고과정은 귀납적임과 동 시에 연역적이다. 코딩하고 메모할 때 범주화 및 개념화하는 과정은 귀납적이다. 그러나 그 개념이 이론 구성에 어떻게 적절할 수 있는지를 메모하는 과정은 연역적이라 할 수 있을 것 이다.




제2단계: 자료의 분석으로서 코딩작업


1) 코딩의 정의


근거이론은 수집된 자료의 분석 과정에서 체계적인 이론 설계를 도출해 내기위해서 코딩(coding) 과정을 강조한다. 코딩은 근거이론은 물론 질적 분석의 가장 대표적인 방법으 로 이른바 ‘주제별 약호화’라 할 수 있다. 수집되고 녹취된 자료들을 계속 읽으면서 그 속에 내재된 주제를 찾아내는 과정으로서 코딩은 텍스트가 담고 있는 메시지와 의도 그리고 의미 가 무엇인가를 최초로 개념화하는 작업이다. 사실 질적 자료의 많은 분석들은 텍스트에 담 겨져 있는 중요한 주제나 패턴 등을 찾는 것을 목적으로 한다. 한마디로 코딩은 구분한 자 료에 상징, 기술적인 단어, 범주 등을 가지고 명칭을 부여하는(labeling) 과정이다.


2) 코딩의 역할


1. 텍스트를 특정 주제나 이름으로 범주화시켜 하나의 분석 단위를 생성함으로써 무수히 많 은 자료들 중에서 분석의 대상이 될 자료와 그렇지 않을 자료를 구분한다.


2. 자료의 내용이나 의미를 개념화시킴으로써 텍스트를 특정한 탐구의 대상으로 승화시켜 준다. 무의미해 보이는 자료들이 살아있는 새로운 가치 있는 자료들로 재인식된다. 즉 무관 해 보이는 자료들을 공통주제나 범주로 연계시켜 많은 원자료들을 의미 있는 방식으로 체계 화, 배열 및 조직화시켜준다.


3. 코딩은 연구자에게 연구의 결론을 도출할 수 있는 기초적인 정보를 제공해준다. 현장 작 업을 통하여 수집된 자료들을 이 과정을 통하여 분류하고 특징화하고 개념화하여 연구 질문 이나 목적에 부합한 연구 결과를 도출해낸다.



3) 코딩 방법


1. 개방코딩(open coding)


개방 코딩이란 논리적이고 연역적인 추론대신 수집된 자료들을 연구자의 감(sense) 또는 직관(categorial intuition)에 따라 최초로 귀납적 방식을 통해서 범주화하고 코드를 만 들어 내는 과정을 의미한다. 즉 피면담자의 진술을 ‘행 분석(line-by-line)' 하여 자료 속에 함축된 의미에 맞는 주제나 용어를 연구자가 직접 찾아내거나 만들어내는 방법이다. 이러한 코딩의 절차로 첫째, 세그멘팅(segmenting), 둘째, 초기 코드의 발견, 셋째, 심층 코드의 생성을 생각해 볼 수 있다.


1) 세그멘팅


세그멘팅은 어떤 자료들(문장, 단락, 대화, 관찰 자료 등)에서 그 자료의 의미나 요지가 잘 들어가 있는 문장들을 추후 코딩을 위하여 괄호를 치거나 줄을 긋는 작업을 의미한다.


2) 초기 코딩


초기 코딩은 세그멘팅이 끝난 자료들 중에서 첫 단계로서 코딩을 하는 작업을 말한다. 세그 멘팅을 통하여 집적한 많은 자료들 중에서 중요하게 의미를 도출하고 메시지를 찾을 필요가 있는 자료들을 가지고 연구자가 그 세그멘팅 된 자료들을 종합적으로 평가하면서 일련의 반 복되는 내용, 의미, 주제에 최초로 이름을 부여하는 작업이다.


3) 심층 코드의 생성


심층 코드를 생성하기 위해서 템플릿 분석 방식이 원용된다. 이 분석은 텍스트 자료의 핵심 적인 주제들을 목록(템플릿)으로 제작하는 접근 방법이다. 이는 내용 분석과 근거 이론을 바탕으로 이루어진다. 즉 코드를 일목요연하게 정렬함으로써 해석을 보다 용이하게 하고 주 제 간의 내용을 비교분석할 수 있다.


2. 축 코딩(axial coding)


축 코딩은 개방 코딩한 다음 범주들을 서로 연결함으로써 자료들을 새로운 방식으 로 다시 조합하는 과정이다. 연구자는 하나의 개방 코딩 범주를 선택하고 이것을 탐구하려 는 과정의 중심에 위치시킨 다음 이것과 다른 범주들을 연계시키고자 한다. 


이 과정은 

      • 핵심 범주에 영향을 미치는 인과관계 조건

      • 전략에 영향을 미치는 구체적인 조건인 맥락

      • 전략에 또 다른 영향을 미치는 일반적인 배경으로서 중재적인 조건

      • 그 다음 핵심 범주로부터 발생 하는 구체적인 행위 또는 상호작용인 전략 그리고 

      • 전략을 채택한 성과물인 결과로 진행된 다.


3. 선택적 코딩(selective coding)


선택적 코딩은 이론을 통합하고 정교화 하는 과정이다. 통합 과정에서는 문제의 연 구가 무엇에 관한 것인지를 보여주는 선택된 중심사상을 근간으로 축 코딩 모형에서의 범주 들을 조직화하게 된다. 그러한 조직화를 통해서 연구자는 연구에서 탐구하려는 과정에 대해 이론적 설명을 제공한다. 따라서 이 과정에서 이론구도를 개략할 필요가 있으며 이론의 정 교화를 꾀할 필요가 있다. 즉, 내적 일관성을 위한 구도의 재검토와 논리의 간극을 메우기 위해 개발이 미흡한 범주들의 보완과 과도한 범주의 간소화 및 구도의 타당성 검증으로 이 루어진다. 여기서 개발이 미흡한 범주들은 추가적인 이론적 표본추출을 통해서 보완되어야 할 것이다.




V. 질적 연구의 타당성과 신뢰성 제고 방법


질적인 연구의 질은 어떻게 결정되는가? 질적 연구의 신뢰도와 타당도는 어떻게 가능한가? 질적 연구자의 초미의 관심사는 타당성과 신뢰도는 제고할 수 있는 연구 설계 방법 들을 결합하는데 있다. 복잡한 통계처리를 가하지 않는 이러한 질적 연구를 위해서 우리는 연구주제를 이론적으로 정교화 할 필요가 있으며 이와 동시에 방법론적 엄밀성(rigor)을 보 다 강화할 필요가 있다. 이러한 이유에서 D. 실버만은 질적인 연구에서 질적인 이슈는 이른 바 방법론적 자각과 동일시 할 필요가 있다고 주장한다(David Silverman & Am Marvasti, Doing Qualitative Research: A Comprehensive Guide, 2008, 257). 여기서 방법론적 자 각(awareness)은 특수한 결론으로 이끌었던 절차와 증거를 최대한 드러내려는 투신 (committment)과 결부된다. 물론 그 결론은 또 다시 새로운 증거에 비추어 언제나 수정될 가능성에 열려있다.


현상학적 사고에 기초한 질적 연구는 집적된 연구 자료들을 통해서 어떤 객관적이 고 절대적인 진리를 드러내는 것보다 다양한 시각들을 끌어내는 사고를 형성하는 데 주안점 을 두고 있다. 일반적으로 타당성은 과학적 연구결과의 정확성을 의미한다. 즉 연구자가 자 신의 연구에서 측정하고자 하는 것을 정확히 측정하고 있는지 그리고 연구에서 일반적인 구 성개념들이나 전제들이 다른 집단에서도 얼마나 적용가능한지의 문제와 관련이 있다. 하지 만 질적 연구에 있어서 타당성은 보통 진리에 대한 또 다른 이름이다. 즉 타당성은 “I mean truth: interpreted as the extent to which an account accurately represent the social phenomena to which it refers” (258). 여기서 해석은 필수불가결한 문제이다. 심 지어는 ‘탄탄한’ 양적 수치를 원용할 때조차도 해석의 문제가 개입된다. 그 이유는 모든 방 식의 데이터 수집은 분석 행위가 하나의 해석인한 질적으로 분석될 수밖에 없으며 따라서 필연적으로 “선택적 번역(a selective rendering)”(259)의 문제가 되기 때문이다.


하지만 질적 연구자들이 극복해야 할 문제는 일화주의(anecdotalism)의 유혹이다. 다시 말해서 문화적 필드 연구의 강점 즉 사회적 환경에 대해서 두텁게 기술할 수 있는 능 력은 그 자체로 약점이 될 수 있다는 것이다. 수집된 데이터가 양적이 되었던 질적이 되었 던 무엇으로 추론과정을 보장할 수 있는가? 나아가서 질적 연구에서 얻어진 발견이 데이터 에 대한 비판적 검토는 거쳤으며 단지 몇몇 잘 선정된 샘플에만 의존하고 있는 것은 아닌 가?


질적인 연구의 타당성에 늘 오류의 소지(fallible)가 있다. 여기서는 삼각측정 (triangulation) 방법을 통해서 그 방법 이외의 질적 연구 분석을 비판적으로 사유할 수 있 는 네 가지의 상호 관련된 방식들을 논의할 것이다. 물론 여기에 소개된 방법들은 보다 타 당한 발견들을 그 목표로 하고 있다.


  • 1. 적절한 삼각측정 방법의 활용 

  • 2. 논박가능성의 원리 

  • 3. 지속적인 비교방법 

  • 4. 포괄적인 데이터 처리 

  • 5. 일탈사례 분석 

  • 6. 현상학적 자명함(self-evidence)


1. 적절한 삼각측정 방법의 활용


질적연구의 타당성을 제고하기 위해서 연구과정에 대한 헌신과 연구시간의 양도 중 요하겠지만, 보다 근본적으로 우리는 

      • 다양한 시간과 공간의 자원들을 끌어들이는 데이터의 삼각측정법(data triangulation), 

      • 다수의 조사자들을 연구의 과정에 개입하도록 하는 조사자 의 삼각측정법(investigator triangulation), 그리고 

      • 다중적 연구방법들을 동원하는 방법적 삼각측정법(methodological triangulation)


을 적극적으로 원용할 필요가 있다. 하지만 무엇 보다 중요한 것은 질적 연구 결과의 타당성과 신뢰도를 높이기 위해서 어떤 현상에 대한 연 구자의 편견, 즉 주관성을 가능한 한 피할 수 있는 방안이 연구되어야 한다.


2. 논박가능성의 원리


질적 연구자들은 객관성을 확보하기 위해서 그들의 데이터에 대한 초기과정들을 논 박할 필요가 있다. 커크와 밀러에 따르면, “객관성을 위한 탐구 저변에 깔려있는 가정들은 단순하다. 세계 밖에 경험적 실재의 세계가 있다. 우리가 그 세계를 지각하고 이해하는 방 식은 대체로 우리에게 달려있다. 하지만 그 세계는 그것을 모두가 동일하게 이해하는 것을 용납하지 않는다” (Kirk, J. & Miller, M. Reliability and Validity in qualitative Research 1986, 11).


오늘날의 영점가설개념은 포퍼식 사고의 좋은 예라 할 수 있다. 그의 기본 입장은 우리들이 논리실증주의의 열망과는 반대로 어떤 진술을 ‘증명하거나’ ‘검증할’ 수는 없지만 최소한 그것을 ‘오류화’ 할 수 있다는 것이다. 어떤 진술이 그것을 오류화하려는 반복된 시 도들을 견디면 견딜수록 그 진술은 더욱더 진리인 것으로 받아들여진다. 어떤 관계의 존재 를 더 이상 논박할 수 없는 경우에야 비로소 “객관적인” 지식에 대해서 말할 수 있게 된다 는 것이다.


3. 지속적인 비교방법


이 방법은 질적인 연구자가 늘 잠정적인 가설을 시험하는 또 다른 사례들을 발견하고자 시도하는 것이다. 베커와 기어(Becker & Geer)는 의과대학생들 수련과정에서 한 그룹의 학생들과 또 다른 그룹의 학생들을 비교함으로써 각자의 커리어단계의 영향에 대한 떠오르는 가설들을 테스트하였다. 예컨대 이 테스트 결과 초창기 의과대학생들은 이상주의적인 경향을 띠고 있다고 주장할 수 있다. 이러한 지속적인 비교방법은 단순사례에서 발생하는 모든 데이터 파편들을 단순히 검토하고 비교하는 것과 상관있다. 이런 방법이 가지고 있는 두 개의 실질적인 어려움으로써 

    • 첫째, 질적 연구자들은 분석 가능한 형식 안에서 모든 데이터들을 끌어 모으는 자원들이 부족할 수 있다는 점이다. 예컨대 모든 데이터 집합들을 글로 옮긴다는 것은 대단히 많은 시간을 요하고 연구자들을 데이터 분석으로부터 분산시킨다는 점이다. 
    • 둘째, 우리가 잠정적인 가설이나 초기에 어떤 범주집합들을 낳을 수 없는 경우 데이터를 비교하는 것이 불가능할 것이라는 점이다. 이러한 문제들을 극복하기 위해서 우리는 상대적으로 적은 양의 데이터를 분석하여 어떤 의미를 도출해내고 그런 다음 일단의 범주들을 생성해 내고 그 다음 데이터 군을 꾸준히 확장시켜서 드러나게 되는 가설들을 테스트할 수 있게 된다. 


하지만 지속적인 비교방법은 연구자가 수집한 상향 데이터 부분 사이에서 반복해야하므로 훨씬 더 큰 데이터 집합을 포함하며 그 데이터들의 모든 부분을 분석하고 검사할 필요가 있게 된다.



4. 포괄적인 데이터 처리


텐 헤브는 지적하기를 회화분석에서 발견된 통찰들은 주관적으로 선택이 되어서 아마도 편견이 들어있는 사례들의 샘플에 입각할 수 있을 것이라는 점을 지적하였다. 이러한 문제는 일화주의의 비난을 면할 수 없는 것으로서 우리는 이를 포괄적 데이터처리라 부른다. 이런 포괄성이 발생하는 이유는 질적인 연구에서 모든 데이터 사례들이 분석 안에서 서로 얽혀있기 때문이다. 그런 포괄성은 또 많은 양적인 방법에서 정상적으로 필요로 하는 범주들을 뛰어넘고 있다. 예컨대 서베이 리서치에서 사람들은 의미 있는 확고한 상호 관련성을 확보함으로써 만족하게 되는 것과 대조적으로 질적인 연구에 있어서는 반복되는 검토가 가능한 작은 집단의 데이터를 가지고 작업하게 되므로 연구자가 일반화하는 과정은 그 연구자가 수집했던 적절한 데이터들 모두에게 적용될 수 있을 때까지 만족하지 말아야 한다. 그 결과가 바로 통계학적 상관관계와 같이 모든 부분이 타당할 수 있는 일반화이다. 미한(Mehan)의 표현에 의하면 “결과는 특정한 현상을 포괄적으로 기술하는 통합되고 정확한 모델이지 이전과 이후 조건들에 대한 단순히 상호연관성이 있는 명제들이 아니다”(


5. 일탈사례 분석


앞에서 살펴본 포괄적인 데이터처리 기법은 적극적으로 일탈사례나 비정상성을 찾고자하는 것을 의미한다. 바로 일탈이나 비정상성을 기술함에 있어서 무엇이 중요한가의 문제가 따를 것이다. 이러한 일탈사례분석에 있어서 필요한 분석기법은 적은 양의 데이터로부터 시작해서 잠정적인 분석구도(scheme)를 잡아내는 것이다. 그 다음 그 구도와 다른 데이터들을 비교하고 점차적으로 그 구도 내에서 어떤 수정을 필요로 하게 될 것이다. 이러한 잠정적인 분석구도는 연구자가 분석에서 모든 데이터들을 끌어 모으는 반복적인 일단의 규칙들을 얻어낼 때까지 부정적이거나 상이한 사례들을 끊임없이 대면해야 한다. 이러한 방법은 양적인 서베이 연구에서 일탈사례분석의 의미와 다음 두 가지 측면에 있어서 매우 차이가 있다.


양적 연구자는 

    • 첫째, 기존의 변수들이 매우 높은 통계적 상관성을 낳지 못할 때, 
    • 둘째, 흡족한 상관성이 발견되었지만 우리가 이것들을 확신하지 못하고 의심하게 되는 상황에서 

일탈적인 사례들을 주목하게 된다. 


이와 대조적으로 질적인 연구자들은 그들의 데이터 안에서 나타나는 모든 변수들을 설명함으로써 만족하지 말아야한다. 다시 말하지만 질적인 연구에서 모든 데이터들은 그 데이터 조각이 충분히 설명될 수 있을 때까지 이용되어야 한다. 결국 일탈사례분석은 포괄적인 데이터처리를 지향하며 모든 일탈사례에서 응답자들은 그들의 입장에 대한 정당성을 제공하도록 해야 할 것이다. 요컨대 일탈사례에 있어서 응답자들은 도덕적 적절성을 드러내는 것으로부터 출발하는 것이 아니라 대안적인 수단을 통해서 그들의 도덕적 적절성을 성공리에 드러낸다. 이러한 과정에서 그들은 정상적인 행위로부터 일탈한 사건에 대한 정향을 보여주었고, 이는 반드시 설명을 요하며 오히려 일반적인 사례들을 강화시키는 장점이 있다.


6. 현상학적 자명성(self-evidence)


보다 구체적으로 그 극복방안을 현상학적으로 살펴보면 다음과 같다. 본래 현상학자들은 의식의 나타남을 기술할 뿐이다. 의식은 주어진 사실이고 이 사실로부터 의식의 현상을 기술할 뿐이다. 이 정도의 수준에서 모든 현상학이 이루어진다면 굳이 이를 심각하게 궁구할 필요가 있을까 하고 의아해 할 수 있다.


우리는 이러한 의식의 중층기술(thick description)로서 현상학적 과제는 무엇일까에 대해 간단히 살펴보자. 현상학적 과제는 엄밀한 과학적 정신 속에서 모든 학문의 진정한 출발점의 찾고자 하는 시도에서 기인하는 것이라 할 수 있다. 여기에 모든 학문적 접근이 피해갈 수 없는 '방법론적 자각(methodological awareness)'의 문제가 걸려 있다. 그렇다면 무엇을 위한 방법론적인 자각인가? 양적인 연구에서의 연구 설계와 분석과정에서는 연구자의 주관성은 철저히 배제되어야 할 사안이었던 반면에, 우리는 지금까지 질적 연구에서 가장 관심을 쏟는 것은 연구자의 주관성(subjectivity)임을 누누이 강조해 왔다. 이러한 의미에서 질적인 연구에서 무엇이 진리, 즉 타당성의 문제는 개인의 주관성에 의해서 좌우된다는 현상학적/초월론적 사고에 기초하고 있다.


따라서 타당성을 위한 질적 연구의 방법론적 자각은 초월론적 동기와 자명함(self-evidence)을 위한 것이라 할 수 있다. 잘 알려져 있는 바와 같이 19세기 현상학은 물론 20세기 현상학은 철저하게 초월론적 전통 위에 서있다. 먼저 19세기 이전의 초월철학과 20세기 초월철학의 근본적인 차이는 무엇일까? 그것은 판단중지와 환원이라는 방법에 의해서 확연히 구분된다 할 수 있다. 후설 이후 하이데거, 사르트르, 레비나스 등을 포함한 거의 모든 현상학적 전통위에 있는 사상가들은 현상학적 환원의 진정한 의미에 대해서 무시해왔다. 바로 그 무시를 통해 대단히 다양하고 풍요로운 현상학적 사유의 가능성이 열린 것도 사실이다




V. 혼합 활용 방법연구(Mixed Methods)


1. 혼합 활용 방법의 가능성


왜 혼합활용된 방법 설계를 사용하게 되는가? 그린, 카라첼리 및 그레함의 연구에 따르면 혼합활용된 연구방법을 원용하는 데 다섯 가지 이유가 있다.


첫째, 가장 일반적인 이유로 삼각측정(tringulation)이 있다. 이러한 전략은 동일한 연구 질문을 연구하는 데 있어서 한 방법 이상을 활용해야 하는 경우와 관계있다. 특히 이 러한 전략은 양적인 데이터가 부분적이고 질적인 연구가 연구 여건에 의해서 방해 받는 경 우에 적절하다. 예를 들어서 우리의 사회 체계 네트워크 안에서 리더십 순환의 정책 효과를 양적으로 분석하고 사례연구 방법을 활용하려는 경우에 적절하다. 즉 양쪽 방법론을 채택하 여 공공정책의 순환 효과를 테스트하는 데 있어서 더 나은 방식에 대해서 소홀하게 되는 경 우 이러한 접근들 중에 하나를 선정하는 과정에서 필요한 방식이다.


또한 삼각측정은 다른 방식들로 가설을 구체화하는 데 적절하다. 어쨌든 연구자는 연구에서의 발견들에 신뢰도를 높이기 위해서 그 여타 발견들을 끌어 모을 필요가 있다. 여 기에 여타 이론적인 시각들을 활용하는 이론적 삼각측정과 동일한 방법 내지는 상이한 방법 들을 활용하여 다른 데이터 자료들을 활용하는 데이터 삼각측정이 있다. 예컨대 쓰나미 프 로젝트에 있어서 우리가 인터뷰한 사람들의 복지를 확인하기 위해 양적인 심리테스트를 주 도하면서 보다 광범위한 심층 인터뷰도 곁들일 수 있다. 그렇게 함으로 해서 심리적 양적 측정은 인터뷰를 통해서 끌어 모은 심층심리학적 발견들에 대한 타당성 체크를 시도하는 데 활용할 수 있다.


둘째, 혼합활용된 연구방법을 채택하게 되는 두 번째 이유는 연구자가 연구 문제를 보다 잘 이해하려 하고 주어진 연구 결과를 명확히 할 수 있는 보완적인 속성을 가지고 있 다는 데 있다. 혼합활용된 방법들은 무엇보다도 연구 문제에 대한 연구자의 전체적인 이해 를 돕는 목적으로 활용된다. 그 적절한 예로서 다시금 우리는 쓰나미 재난에 대한 질적 연 구가 재난 생존자들의 생생한 경험들을 확인하기 위해서 활용되는 반면에 양적인 연구는 마 을 사람들이 어떻게 재난 구호 노력의 효율성을 지각하고 있는지 평가하려는 서베이 연구를 활용하는 것과 결부된다.


셋째, 다른 방법을 발전시키는 데 도움을 주는 한 방법으로부터 빚어지는 발전과 상관이 있다. 쓰나미 재난 연구에 있어서 연구자는 양적인 연구를 위한 설문지를 발전시키 기 위해서 질적인 연구로부터의 발견들을 활용할 수 있다.


넷째, 주어진 연구에 있어서의 여러 발견들이 보다 명확한 해명을 요구하는 질문들 을 제기하거나 모순들을 포함하고 있는 시발점에 있는 경우이다. 이러한 경우 새로운 연구 는 연구 중인 현상을 이해하는 데 있어서 새로운 통찰들을 더할 목적으로 시작된다. 다시금 쓰나미 재난 연구에 있어서 마을 사람들이 자연적인 재해를 어떻게 바라보고 있는지와 관련 된 모순적이며 질적인 발견들이 나타날 수 있음을 고려할 필요가 있다. 그러한 상이한 발견 들은 성별과 민족성에 의한 연구 결과에 대해서 보다 미묘한 해석으로 이끌 수 있다. 사실 그러한 발견은 전체적으로 새로운 연구를 시작하도록 한다.


마지막으로 이러한 연구 주제의 확대과정에서 연구 기법을 활용할 필요가 있다. 여 기서 연구 주제 확대는 연구 범위와 영역의 확장으로 이어진다. 예컨대 상이한 재난 유형을 대면했을 때 성차를 비교할 필요가 있을 것이다. 또 다른 예로 911테러 생존자들의 인터뷰 를 포함하는 연구를 성별과 국적 및 재난유형에 의한 메커니즘과 관련하여 유사성과 차이점 들을 음미하는 것으로 자신의 연구를 확대시킬 필요가 있다. 이러한 경우 연구 확장의 목적 은 자신의 연구에 타당성을 증대시키기보다는 보다 광범위한 영역의 연구목적을 포괄하는 것으로 확대된다.


2. 혼합 활용 방법의 연구 설계


우리는 데이빗 모오간의 제안에 따라 혼합활용 연구방법을 설계하는 실질적 전략들 을 살펴볼 필요가 있다. 그는 연구의 시차적 관점과 각 방법의 상대적 중요성에 입각하여 네 종류의 혼합방법을 제시하고 있다. 특수한 혼합방법을 설계함에 있어서 고려해야할 두 가지 질문은 

      • 첫째, 무엇이 주된 연구방법이고 무엇이 부차적인 것이냐이다. 

      • 둘째, 어떤 방법 이 선행하고 어떤 방법이 그 다음인가이다. 


이에 따라서 모오간의 가능한 네 가지 연구 설 계를 제공한다. 

      • 설계 1) 양적인 연구에 이은 질적 연구; 

      • 설계 2) 질적인 연구에 이은 양적 연구; 

      • 설계 3) 질적인 연구에 이은 양적 연구; 

      • 설계 4) 양적인 연구에 이은 질적 연구 


상이 한 범주들을 활용하여 양적인 연구와 질적 연구방법들을 결합시키는 다양한 혼합방법 설계 가 있음을 주목할 필요가 있다.


첫 번째 연구 설계는 연구 프로젝트의 질적인 구성요소를 첫째로 행하고 그것을 프 로젝트의 목적을 위해 부차적으로 유지하는 것과 관련이 있다. 여기서 양적인 연구가 우선 이고 질적인 연구는 이를 뒷받침하는 것으로 활용된다. 양적인 연구에 앞서 질적인 설계를 활용하는 것은 특정한 주제에 친숙하지 않은 연구자에게 프로젝트의 양적부분에 필요로 하 는 특정한 이념들이나 가설들을 생성할 수 있는 기회를 제공한다. 예를 들어서 연구자들은 불치병을 앓고 있는 환자들의 생생한 체험을 이해하는 데 흥미를 가질 수 있다. 이러한 단 계의 환자에게 ‘케어는 환자의 마음, 몸 및 정신적인 필요를 설명하는 것이지 의학적인 개 입을 강조하는 것이 아닐 수 있다. 이러한 경우 불치병 환자의 생생한 경험을 이해하고 케 어를 제공하는 사람들에게 직접 그 필요성을 전달하는 것이 중요한 사안이 될 것이다. 연구 자는 그들 연구의 결과를 양적으로 보다 광범위하게 일반화시킬 수 있기를 바랄 것이다. 따 라서 이러한 연구 설계는 질적인 방법인 환자들 간의 인터뷰로부터 시작하여 필요한 질적 정보를 취합하여 가설적인 시나리오가 아닌 환자들의 경험에 입각한 일단의 설문지를 창출 해낼 수 있을 것이다. 이 경우 양적 연구의 서베이적 요소가 질적 연구 요소인 환자의 직접 적인 경험에 입각하고 있음을 알 수 있다.


두 번째 연구 설계에서는 양적인 연구가 부차적으로 활용되고 질적인 연구가 주가 되는 방법이다. 이 경우에 있어서 양적 연구는 보다 깊은 탐구를 위한 특정한 환자 분포나 이슈들을 확인하는 데 활용된다. 이러한 연구 유형의 예외로서 일반 의사들이 그들 환자들 의 흡연 이슈를 논의하는 태도를 통해서 알아볼 수 있다. 즉 연구자들은 상이한 태도를 주 장하는 일반 의사들의 다양한 경우들을 확인하기를 원한다. 이러한 경우 양적인 연구가 다 양한 태도를 가진 응답자들의 경우수를 확인하는 데 큰 도움을 주게 되고 이와 더불어 흡연 을 보다 심층적으로 이해하려는 질적인 인터뷰 방식이 원용될 수 있을 것이다.


세 번째 연구 설계는 질적인 연구에 이은 양적 연구를 강조하는 것이다. 이 연구 설계는 양적인 연구를 주요탐구 양식으로 삼으면서 질적인 연구를 부차적으로 활용하는 것 이다. 즉 양적인 발견으로부터 나온 연구결과를 명확히 하고 정교화 할 필요성에서 비롯되 었다. 여기서 질적인 연구의 기능은 부정적인 연구결과를 이해하는 데 도움을 주는 것이 될 것이다. 다시 말해서 어떤 연구결과의 발견이 전반적인 가설이나 이론적인 시각에 적합하지 않은 경우(outlier)를 해명하는데 이러한 질적 연구방법이 필요하게 된다. 요컨대 질적인 데 이터는 양적 연구자가 자신의 서베이 데이터의 잘못된 결과를 이해하는 데에 그들의 양적인 데이터들을 보완할 목적으로 이러한 설계의 예로써 저자는 스웨덴 사회에서 이민자 가족의 통합에 대한 연구를 들고 있다. 이 연구의 주요 데이터는 이민자와 본국 스웨덴 사람들에 대한 인구 정보를 수집하려는 두 개의 양적 서베이에 입각하고 있다. 이러한 경우 질적 연 구는 가족의 다이내미즘과 공동체 관계 문제를 해명하기 위해서 부차적인 방식으로 활용된 다. 예컨대 결핍된 서베이 데이터로 나타나는 것은 이민자의 삶에 있어서 종교의 중요성을 질적인 방식을 통해서 이해함으로써 해명될 수 있다. 여기서 연구자는 스웨덴이 종교적 감 각을 크게 강조하지 않는 세속사회임을 주목하게 될 것이다. 이 연구에서 질적인 연구는 인 류학적 관점을 가진 연구자들을 위해서 행해질 수 있는 반면에 양적인 연구는 인구통계학자 의 관점에 의해서 행해짐을 알 수 있다. 따라서 이러한 양자의 방법을 혼합하려는 경우 동 일한 철학적 방법과 시각들을 공유하지 않는 연구자들 사이에 학제 간의 연구 참여를 필요 로 하며 연구자들 간의 소통의 문제가 제기될 수 있을 것이다.


네 번째 연구 설계는 양적인 연구에 이은 질적인 방법을 활용하는 것이다. 여기서 질적인 연구가 추가되고 보다 작은 양적 연구가 뒤따르게 되며, 양적 연구가 갖는 기능은 질적인 연구가 다른 연구에도 적용될 수 있는지를 확인하기 위해서 다른 표본들을 통해서 그 결과를 테스트하려는 데 활용된다. 여기서 연구자는 예컨대 한 대학의 관리팀에 대한 단 일한 사례연구와 같은 질적 방법을 활용하여 대학교의 고위층 행정가들의 생생한 체험을 얻 는다. 이러한 질적 사례연구는 연구자들로 하여금 대학 행정가들이 대학정책의 변화를 기하 는 데 도움이 될 만한 핵심적인 두 주제로 대학의 이미지와 정체성을 확인하도록 해준다. 이 경우 질적 연구를 통한 발견은 이미지, 정체성 및 해석들 간의 관계와 관련된 일단의 명 제들로 표현된다. 그 다음 이 명제들은 다른 대학들의 대학 행정가들에 대한 양적 서베이 방식을 통해서 검증된다. 이러한 혼합된 방법을 활용한 연구 설계에서 질적인 데이터는 연 구문제를 이해함에 있어서 핵심적인 사안이 되고 양적인 연구는 연구자들이 질적인 연구로 부터 얻은 발견들을 증명하고 그 결과들을 보다 큰 범주로 일반화시키는 데 도움을 제공한 다.




VI. 질적 연구 평가 기준


1. 질적 연구 일반에 대한 평가 기준


  • 1) 적절한 연구계획인가? 연구계획의 상이한 특징들을 보여주는 설득력 있는 논점을 가지고 있는가? 

  • 2) 신뢰할만한 자료인가? 방법들을 잘 기술하고 있는가? 필드노트 또는 트랜스크립션 관행 은 잘 지켜지고 있는가? 

  • 3) 명확한 이론 가설들이 설정되었는가? 연구과정에 대해 적절한 문헌화가 이루어지고 있는 가? 자료와 방법에 장점과 약점에 대한 논의가 이루어지고 있는가? 연구 설계에 나타나는 변화의 과정을 문헌화하고 있는가? 

  • 4) 연구에서 찾아낸 발견들은 어떻게 신뢰할 수 있는가? 그 발견들이 자료들을 통해서 지지 받고 있는가? 자료, 해석 및 결론들 사이의 연결은 명쾌한가? 

  • 5) 그 발견들이 일반화될 수 있는가? 보다 광범위하게 그 발견들을 추론하고자할 때 그에 상응하는 증거는 잘 제공되고 있는가?


2. 연구 평가 기준


  • 1) 연구자가 제기한 질문이 성격에 부합한 연구의 방법인가? 

  • 2) 기존의 지식이나 이론체계와의 연관성이 분명한가? 

  • 3) 사례연구나 근거이론에 사용된 범주에 대한 설명은 명확한가? 자료 수집과 분석의 범주 에 대한 설명은 명확한가? 

  • 4) 연구 방법의 민간도가 연구 질문의 필요성과 잘 조응하는가? 자료 수집과 자료 기록은 체계적인가? 

  • 5) 추론은 수용되고 있는 분석절차를 위해서 이루어졌는가? 

  • 6) 분석은 어떤 방식으로 체계적인가? 

  • 7) 주제, 개념 및 범주가 자료로부터 파생되는 방법을 적절히 논의하고 있는가? 

  • 8) 연구자 논점의 찬반에 대한 증거를 적절히 논의하고 있는가? 

  • 9) 자료와 그 해석 사이를 명확하게 구분하고 있는가?


3. 근거이론 평가 기준


  • 1) 최초의 표본이 어떻게 선택되었는가? 무엇을 근거로 하는가? 

  • 2) 어떤 주요 범주들이 나타났는가? 

  • 3) 주요 범주로 지목된 사건, 부수적인 사건, 행동 등은 무엇인가? 

  • 4) 어떤 범주에 기초하여 이론적 표본 추출이 이루어졌는가? 자료 수집은 어떤가? 이것이 범주들을 대표하는가? 

  • 5) 개념적 관계(즉, 범주들 간의 개념적 관계)와 관련된 가설은 무엇인가? 가설이 형성되고 검증되는 근거는 무엇인가? 

  • 6) 가설이 실제로 나타나는 것을 지지하지 않을 때가 있는가? 이러한 차이를 어떻게 설명할 것인가? 이들은 가설에 어떠한 영향을 미쳤는가? 

  • 7) 핵심논증은 어떻게, 왜 선택되었는가? (갑자기, 점진적으로, 어렵게, 쉽게)? 어떤 근거에 서?


스트라우스와 코비는 근거이론 연구의 질을 판단하는 기준과 더불어 그 연구에 경험적 근거 와 관련된 다음 여섯 가지 기준을 덧붙이고 있다.


1) 개념이 만들어졌는가? 

2) 개념들이 체계적으로 관련되었는가? 

3) 개념적 연결이 많은가? 범주가 잘 개발되었는가? 밀도는? 

4) 이론이 많은 다양성을 반영하며 구축되었는가? 

5) 광범위한 조건들이 설명되었는가? 

6) 과정(변화 혹은 움직임)이 고려되었는가?




VII. 질적 연구자의 연구윤리


질적 연구/후기 실증주의 연구 과정에서 연구윤리가 핵심적인 문제로 제기된다. 실증주의 연구와 같은 객관학문의 경우 만인을 위한 객관적 연구결과를 얻을 수 있다면 연구에 참여 했던 연구 참여자의 이익과 복지는 중요한 문제가 되지 않았다. 따라서 연구자가 연구 참여 자의 연구자를 속이거나, 기만하거나, 아니면 연구대상으로 물신화시키거나 하는 등의 비윤 리적인 절차나 속임수를 쓰는 연구 활동들은 나쁜 것으로 간주되지 않았다. 하지만 질적 연 구자가 현장에 참여하면서 중요한 것은 현장의 상황적 윤리와 연구의 윤리적 규범을 여하히 잘 조화시켜 가는가이다. 현장연구의 정치와 윤리는 질적 연구 전반에 지대한 영향을 미치 게 된다.


1. 질적 연구에 영향을 주는 주요 요인들


  • 1. 연구자의 인성 - 현장 연구에서 연구자는 그 자신의 연구 도구이다. 즉, 질적 방법의 핵 심은 선택이다. 빈도보다는 의미(sense)가 대단히 중요한 선택의 문제이자 해석의 문제이기 때문이다. 결국 주제의 선택, 연구 접근 방법, 현장에서의 능력이 질적 연구의 결정적인 도 움을 준다. 

  • 2. 연구 대상의 성격 - 이는 연구 배경에서의 접근과 연구 계약 및 대립 가능성과 갈등에 관련된 중요한 문제이다. 

  • 3. 연구비 - 질적 연구를 위한 모든 비용과 시간은 연구의 질을 위해 결정적인 역할을 한 다. 

  • 4. 현장에서 연구자의 영향력 - 연구자의 현장 참여가 갖는 영향력은 현장 연구에 커다란 영향을 미친다. 

  • 5. 연구진 내의 협력과 조화 - 현장에서의 행동을 방해하고 성과에 대해 갈등을 일으킬 수 있는 연구진 각기 그들의 기대와 역할의 다양성을 잘 조절할 필요가 있다. 

  • 6. 연구 수행과 현장에서의 성공은 연령, 성, 지위, 인종적 배경, 지나친 동일시, 거부감, 관 료주의적 태도, 사고, 행운 등 수많은 요인에 영향을 받는다. 7. 현장에서의 조화로운 관계는 전체 연구에 커다란 영향을 미친다. 8. 현장 연구에 의해서 생성된 사회적, 도덕적 의무 사항이 중요하다.


3. 연구윤리 계획서에서 답해야하는 질문 내용


  • 1. 이 연구에 참여하는 피험자가 심리적, 사회적, 신체적 또는 법적으로 위험에 빠질 가능성 이 있는가? 만약 그렇다면 그 상황을 진술하시오. 

  • 2. 이 연구에 참여하는 피험자가 연구에 의한 스트레스를 느낄 가능성이 있는가? 있다면 어 떤 스트레스를 야기할 수 있는지 설명하시오. 

  • 3. 연구의 목적 때문에 이 연구에 참여하는 피험자를 의도적으로 소개하는 경우가 있는지 말씀해주시오. 혹시 있다면 그 이유에 대해 설명하시오. 

  • 4. 수집할 자료의 내용이 지나치게 연구 피험자의 개인적 정보를 묻는 것은 아닌가? 

  • 5. 수집할 자료의 내용이 지나치게 모멸적인 것이어서 피험자의 기분을 상하게 하거나 당황 하게 하지는 않는가? 

  • 6. 이 연구에 참여할 피험자를 어떻게 설득시킬 것인가? 연구 동의를 얻기 위하여 연구 참 여자에게 제출할 연구 계획서를 문서형식으로 그리고 구술형식으로 작성하여 피험자에게 보 여주시오. 

  • 7. 이 연구에 참여하는 피험자는 자발적으로 연구에 참여하는가? 피험자가 자발적으로 참여 하였을 때 피험자가 받게 될 보상은 어떤 것이 있는가? 

  • 8. 피험자가 연구에 자발적으로 참여하였다는 사실을 어떻게 입증하겠는가? 

  • 9. 이 연구에 참여하는 피험자가 연구를 위하여 투자하는 시간은 얼마나 되는가? 

  • 10. 연구를 통하여 획득한 자료의 기밀유지를 위하여 어떻게 보관할 예정인가? 

  • 11. 연구가 끝난 후 수집된 자료는 어떻게 처리할 것인가?


6. 동의의 기본적인 요소


  • 1. 뒤따르는 절차, 실험을 하는 사람들의 신분 증명을 포함한 그들의 실험 목적을 설명하고 연구 참여자가 이 실험에 참여하는 데 소요되는 예상기간을 설명한다. 

  • 2. 실험 참여자들에게 예상되는 불편한 사항과 위험한 사항들에 대해 합리적으로 설명해 준 다. 

  • 3. 실험 참여자들에게 예상되는 이점에 대해 합리적으로 설명해 준다. 

  • 4. 실험 참여자들에게 이득이 되는, 선택 가능한 적합한 절차들을 발표한다. 

  • 5. 연구 참여자의 신분상의 기록에 대한 비밀보장과 그 범위를 설명한다. 

  • 6. 연구 참여자가 어떠한 협박이나 손해 없이 그 연구에서 언제든지 그만둘 수 있음을 알려 준다. 

  • 7. 생물 의학적 또는 행동적 해를 당하였을 경우에 어떠한 의학적 치료와 경제적 보상이 주 어지는 지에 대해 설명한다. 

  • 8. 연구 참여자의 권리와 관련한 질문에 응답해 줄 사람이 누구인지, 그리고 그 실험과 관 련하여 피해를 입었을 경우 누구와 연락해야 하는 지를 설명해 준다.






(방법론)신충식 (1).hwp

(방법론)신충식 (1).pdf


해석적 관점에서의 질적 연구과정과 연구설계(서울행정학회 동계학술대회 발표논문집, 2009)

박석희・이종원(가톨릭대학교)




Ⅰ. 머릿말


질적 연구는 오히려 우리의 삶의 현장으로서 사회적 실체를 보다 제대로 이해하고 해석하기 위한 것으로 우리가 질적 연구에 대한 일정한 ‘입장취하기’를 결정한다면 그것은 보다 용이하게 사회적 실체에 가깝게 접근할 수 있는 방법론적 지평을 제공해 줄 수 있다.


학문이란 주어진 가설에 대한 검증과 반증을 통해 성장한다는 후기실증주의적 사조가 행정학 분야에 널리 받아들여져 왔다.


Ⅱ. 질적 연구의 특징: 포괄적 접근


1. 질적 연구의 의의


질적 연구는 지식 구성에 대한 풍부한 관점을 지닌 매우 흥미 있는 다학문적 지평이라고 할 수 있으며, 지식형성의 과정에 대한 포괄적 접근(holistic approach)을 강조한다. 질적 연구 는 광범위한 인식론적, 이론적, 방법론적 가능성을 제공하며, 지식형성의 포괄적 접근과 관 련해서 질적 연구는 내용, 초점, 형태에 있어 매우 독창적이라고 할 수 있다. 포괄적 접근이라 는 것은 질적 연구가 반성적(reflexive)이며, 과정지향적(process driven) 연구를 통해 이론, 방 법, 연구자와 연구대상 간에 지속적인 상호작용을 통해 궁극적으로 문화적 특수성이 있고 (culturally situated) 이론적으로 짜여진(theory-enmeshed) 지식을 창출한다는 것을 의미한다. 또한 연구과정의 포괄적 특성이란 연구주제 선정부터 연구결과 작성에 이르기까지 연구의 다양한 국면들 간의 상호작용이 이루어짐을 의미한다. 질적 연구는 오랜 기간 지배적 위치를 차지한 인과모형에 의한 설명보다는 탐색적이고 기술적인 지식의 창조를 강조한다.


그 동안 양적 연구는 경성과학(hard science) 혹은 좋은 과학(good science)으로서의 특권적 지위를 점해 왔다. 이에 반해 심층면접, 포커스집단면접, 구전역사면접(스토리텔링), 참여관찰(민속학방법론), 내용분석 등의 연구방법을 채택하는 질적 연구는 공통적으로 응답자의 언어와 관점에 기반해서 주제와 프레임을 발견하고 자료를 해석하는데 초점을 맞춘다. 질적 연구자는 문자(texts)와 언어(words)에 관심을 두고, 문장과 언어에 담겨 있는 일정한 주제 (theme or thematic category)1)를 발견하고 분석하는데 초점을 맞추며, 이러한 주제를 연구대 상자들이 갖고 있는 의미를 해석하기 위해 코드(code)화한다. 이를 위해 질적 연구는 다양한 연구방법을 통합하여 사회현상에 대한 연구대상자들이 갖는 의미에 대한 해석을 시도한다.


1) 양적 연구는 사회현상에 대한 일정한 패턴의 발견과 예측가능성을 강조하지만, 질적 연구는 사회적 의미 이해와 해석을 강조하며, 주제 혹은 주제범주의 개발은 질적 자료로부터 의미를 추출하는 방식 이라고 할 수 있다.


비록 질적 연구방법이 다양한 이론적 패러다임을 갖고 있지만 질적 연구방법론에서는 공 통적으로 사회적 실체의 본성에 관한 해석적 접근법(interpretative approach)을 강조한다. 즉, 사회적 실체를 이해하기 위해 사상(events)을 검정하거나 통제하는 대신 각 개인은 사회적 실 체의 본성에 어떠한 의미를 부여하는지, 인간은 각 개인이 사회적 실체에 부여 다양한 의미 를 어떻게 생각하는지 등에 관심을 갖는다.


논리실증주의(positivist)와 후기논리실증주의(post-positivist)의 시각에서 보면 ‘좋은 과학 (good science)’은 실증주의에 기반을 둔 양적 연구를 의미하며, 질적 연구방법은 방법론적 엄 밀성(rigorousness)이 결여되어 있는 것으로 이해되었다. 

  • 실증주의에 의하면 사회적 실체란 객관적 연구자에 의해 기술되고, 설명되거나, 

  • 후기실증주의 입장에서는 적어도 근사하게 파 악될 수 있는 연구자의 밖(out there)에 존재하는 외부적 실체로 이해된다. 연구의 객관성을 강조하며 가치개입을 배제한다.


Denzin and Lincoln(1998)은 질적 연구에서의 세 가지 해석적 패러다임으로 구성주의적 해 석론(constructivist-interpretive), 비판론(critical), 패미니즘(feminist)을 강조하였고, Newman (2003)은 세 가지 질적 패러다임으로 실증주의(positivism), 해석론(interpretive), 비판론 (critical)을 지적하였다. 각각의 패러다임은 실체와 개인의 본성(존재론), 이론의 유형(방법 론), 무엇이 지식을 형성(constitute)하는지(인식론)에 관해 차별화된 특성을 보인다. 가령 구 성주의 혹은 해석론에 입장을 취할 경우 개인들에 의해 구성되고 생산된 이야기와 의미로 구 성된 주관적 실체를 가정하며, 객관적 사회적 실체의 존재를 부정한다. 사회적 실체는 실제 (real) 혹은 진실(truth)보다는 표상되는 것(representational)으로 이해된다.2)





2. 이론(theory), 연구방법(methods), 방법론(methodology)과 인식론


전통적으로 양적 연구를 통해 획득된 자료는 경성(hard)이며 과학적인 것이고, 일반화가 능하고 대표성 있는 것(representative)으로 간주된 반면, 질적 연구를 통해 얻어진 자료는 연 성(soft)이며 덜 과학적인 것이고, 표상적(representational)인 것 혹은 구성된 것(constructed)으 로 간주되었다.3) 여기서 표상과 구성이란 덜 과학적이고, 덜 엄밀하며, 덜 중요함을 의미한 다. 질적 지식은 사회적 실체에 과한 다양한 관점(perspective)에서 창출되며, 공통적으로 해 석의 과정을 공유하면서도 사회적 실체의 상이한 측면에 초점을 맞춘다.


3) 연구의 가치는 그것이 복제될 수 있느냐(replicable)에 있는 것이 아니라, 오히려 특별한 주제에 대해 그 것이 우리에게 본질적 지식을 더해줄 수 있느냐에 있다.


인식론은 이론과 밀접한 관련이 있으며, 인식론적 신념은 이론적 프레임을 통해 활성화될 수 있다. 이론은 경험적으로 조사되어 온 것 이상의 사회적 실체 또는 그것의 구성요소에 대 한 설명이며, 이론은 연구과정의 일부분이라고 할 수 있다. 질적 연구의 궁극적 목적이 이론 을 창출하고, 형성하며, 정교화하는데 있기 때문에 질적 연구의 수행에 있어 이론은 매우 중 요하다. 질적 연구자들은 단지 이론을 사용하는 것이 아니라 이론을 창조하는데 초점을 맞춘 다. 따라서 연역적 방법을 강조하는 양적 연구와 달리 질적 연구는 귀납적 접근을 강조한다. 가령 해석적 연구자와 패미니즘 연구자들은 근거이론(grounded theory)의 모형을 자주 사용 한다.


흔히 연구방법을 논의할 때 그것은 자료수집방법의 의미로 사용되지만, 보다 궁극적으로 연구방법(research method)은 인식론 및 이론과 밀접한 관련이 있으며, 특히 질적 연구에서 연 구방법과 이론의 연결은 더욱 강조된다. 즉, 질적 연구자들은 자신의 이론적 입장에 따라 민 속학방법론(참여관찰 등), 자전적 민속학방법론(autoethnography), 심층면접, 구전역사면접 (스토리텔링), 핵심집단면접, 사례연구, 담론분석 및 내용분석 등 다양한 연구방법을 사용한 다. 그런데 연구문제 형성부터 자료 분석과 해석에 이르는 연구설계에 대한 지침을 작성하기 위해 방법론 이론과 연구방법을 통합하는 역할을 수행한다. 이에 Harding은 방법론은 연구가 어떻게 수행되는지 그리고 어떻게 수행되어야 하는지에 관한 이론이라고 설명하였다(1987: 3).


요컨대 방법론(methodology)은 일정한 인식론적 토대를 전제로 이론(theory)과 연구방법 (method)을 연결 짓는 가교(nexus)역할을 수행한다. 즉, 각 연구자가 취하는 연구방법론은 논리실증주의 혹은 해석학적 인식론 기반에 따라 달라질 수 있고, 이러한 인식론적 기반에 따 라 비판이론, 현상학, 해석학, 실증주의, 후기실증주의 등의 이론적 입장과 연구방법이 상이 하게 영향을 받는다. 즉, 방법론은 이론, 방법, 인식론의 통합적 연결고리라고 할 수 있다. 방 법론은 연구과정을 통해 전략적이지만 가변적인 지침으로서 역할을 수행하며 이론과 방법 을 통합한다. 가변적이라는 개념은 연구자의 인식론적 신념이 허락하는 범위 내에서 연구수 행 중에 방법론이 변화될 수 있음을 의미한다. 따라서 질적 연구는 연구가 수행되는 맥락에 의존적이기 때문에 연구방법론의 변화에 보다 유연하게 접근할 수 있는 것이다.







3. 실체(social reality)와 객관성(objectivity)의 문제


1) 실증주의의 인식론과 객관성


질적 연구에서는 대체로 사회적 실체가 무엇인지(what) 혹은 사회적 실체가 어떻게(how) 구성되는지에 관심을 가지며, 왜(why) 사회적 실체가 그렇게 형성되는지에 대한 일반화를 지향하는 인과모형적 설명에는 관심을 갖지 않는다. 양적 연구에서는 보편적 시스템으로부 터 인과모형적 설명에 의한 복제(reproduction)를 강조하는 반면 질적 연구에서는 개별 행위 자들 혹은 그들 간의 의미작용에 관심을 둔다.


실증주의 혹은 후기실증주에서 강조하는 객관적 인식론연구자가 파악할 수 있는 인과 모형과 같은 사회적 실체(knowable reality)는 연구과정과 독립해서 존재하며, 주체와 객체의 구분이 지식발견에 있어 필수적이라고 강조한다. 실증주의적 인식론은 연구자와 분리돼서(out there) 존재하며, 객관적이고 가치중립적 연구자에 의해 객관적인 복제가능한 방법 (replicable method)을 통해 설명될 수 있는 객관적 실체가 존재한다고 본다. 이에 의하면 사회 적 실체는 객관적이며, 가치중립적 연구자에 의해 경험적으로 연구되고 검증될 수 있다. 또 한 연구대상자는 물론 연구자도 연구의 복제를 위해 쉽게 대체될 수 있다고 본다.




2) 사회적 실체의 본성에 관한 해석적 인식론


질적 연구방법은 전체주의적 접근법(holistic approach)을 취하며, 의미창출과 해석을 통한 이론형성을 추구하기 때문에 논리실증주의와는 다른 인식론적 기반을 두고 있다. 질적 연구 는 탐색적 지식, 기술적 지식 창출을 모두 목적으로 할 수 있고, 사회적 실체에 대한 유일한 인과모델의 중요성을 배척한다. 이는 연구주제의 선정부터 연구결과의 기술에 이르기까지 연구과의 전 과정이 보여주는 전체적 상호작용에 주목한다.


연구문제의 선정은 연구방법의 유형을 결정지으며, 반대로 특정한 연구방법의 선호가 연 구문제 선정에 영향을 미칠 수도 있다. 연구문제 선정과 구체화에 있어 질적 연구방법론에 있어서도 문헌검토(literature review)는 연구자의 관심영역과 연구문제 선정간의 가교역할을 할 수 있다. 다만 질적 연구에서 문헌검토는 연구과정의 특정한 시점에서만 이루어지는 것이 아니라 연구의 전 과정에서 반복적으로 발생할 수 있다. 특히 분석적 귀납에 의한 새로운 이 론의 발견 시 연구의 후반부에 이러한 새로운 발견을 이해하기 위한 맥락을 제공하기 위해 문헌검토가 이루어지는 경우도 많다.





Ⅲ. 질적 연구과정과 연구설계


1. 질적 연구에서의 타당성(validity)과 신뢰성(reliability)의 의의


1) 질적 연구에서의 타당성의 의의


질적 연구에서는 기존 논리실증주의에서 제시된 타당성 유형인 내용타당성(content validity), 기준타당성(criterion validity), 구성개념타당성(construct validity) 등과는 차별화된 타당성 개념을 강조한다. 질적 연구에서 사회적 실체란 사회적으로 구성된다고 보기 때문에 객관적 실체와의 일치성(correspondency)로서의 타당성 개념을 사용하지 않는다. 질적 연구 에서 타당성이란 진실로 우리가 무엇을 의미하는가를 의미한다. 즉 경쟁적 주장이나 해석에 대해 어떠한 연구자의 발견을 주관화하는 형태 그리고 독자들에게 연구자의 특정한 지식에 대한 강한 논변을 제공하는 형태를 취한다. Kvale(1996)는 질적 연구에서 타당성의 세 가지 타당성(validity as craftsmanship), 기준으로 연구전문가로서의 의사소통적 타당성 (communicative validity), 실천적 타당성(pragmatic validity)을 지적하였다.


(1) 전문가적 타당성(validity as craftsmanship)


전문가적 타당성은 ‘연구자가 도덕적으로 고결한가(moral integrity)’와 같은 연구자와 연 구의 신의(credibility)에 대한 지각의 문제를 말한다. 고결함과 신의는 연구자의 지각된 행동 을 통해 형성된다. 연구자가 발견된 사실을 어떻게 조사하였는가 혹은 연구가 어떻게 검토되 었는가 등과 관련이 있다. 이로 인해 전문가적 타당성은 검토적 타당성(validity as checking) 을 의미하며 질적 연구자료에 대한 검토는 통상 ‘반대사례분석(negative case analysis)’을 통 해 확인될 수 있다. 반대사례분석은 연구자의 초기 이론적 주장이 수집된 자료에 의해 타당 화될 수 있는 정도와 관련하여 일정한 환류를 제공해 줄 수 있다. 전문가적 타당성의 또 다른 측면은 연구자가 질적 자료로부터 이론을 도출하는 능력이다. 즉 질적 연구에서 연구자는 확 신할 만한 이야기를 말할 수 있어야 하며, 이는 연구자가 수집한 자료를 주어진 이론적 프레 임에 적합하게 할 수 있는가 그리고 그것에 대해 독자들에게 신의를 줄 수 있는가와 관련된 다.


(2) 의사소통적 타당성(communicative validity)


의사소통적 타당성은 지식형성에 있어 경쟁적인 주장을 하는 정당성 있는 지식인들 간에 이루어지는 대화를 통해 획득될 수 있다. 어떠한 발견에 대한 각자의 해석은 많은 연구자들 간에 자유롭게 토론되고 반박될 수 있어야 하며, 경우에 따라서는 이러한 토론과 반박이 연 구대상집단에까지 확대될 수 있어야 한다. 의미를 둘러싼 대화가 필요하고, 대화를 통해 의 미에 대한 상호주관적인 이해에 대한 관념으로 나아갈 수 있다. 물론 누가 이러한 대화에 참 여할 수 있고, 지식을 해석할 권한을 누가 갖고 있으며, 의미에 대한 불일치를 어떻게 해소해 야하는지에 대해서는 연구자들 간에 완전한 합의는 없지만, 연구자들 간 혹은 연구자와 연구 대상자 간에 지속적인 대화와 담론이 연구결과의 의사소통적 타당성을 제고할 수 있다.


(3) 실천적 타당성(pragmatic validity)


사회과학연구에서 연구는 연구대상과 분리해서 존재하는 것이 아니며 연구자와 연구대 상자는 상호작용을 하게 된다. 이에 따라 질적 연구에서 실천적 타당성은 매우 중요하다. 실 천적 타당성이란 발견된 사실이 연구대상에 영향을 미치는 정도, 그리고 연구가 수행된 사회 적․역사적 맥락 내에서 발생한 변화와 관련된다. 즉, 수행된 연구와 발견의 유형에 따라서 우리는 어떤 특정한 행동결과를 발견할 것을 기대하는데, 우리는 어떠한 연구의 결과로 발견된 사실이 연구가 수행된 지역이나 사회에 어떠한 영향을 미쳤는가를 확인해야 한다. 따라서 실 천적 타당성은 권력동학(power dynamics)과 관련이 있다.




2) 타당성 확보수단으로서의 통합(triangulation)


연구결과의 타당성을 확보하기 위해 

    • 첫째, 연구방법(methods triangulation)의 통합을 채택 할 수 있다. 두 가지 연구방법이 동일한 결과를 가져다 준다면 이는 연구결과의 타당성을 제 고할 수 있으며, 이를 위해 양적 연구방법(설문조사)과 질적 연구방법(면접)을 통합할 수도 있다. 

    • 둘째, 동일한 연구문제에 대해 이론적 통합(theoretical triangulation)을 채택할 수도 있 다. 

    • 셋째, 동일한 연구 내에서 다양한 자료원천을 사용하는 자료통합(data triangulation)을 채 택할 수도 있다. 

    • 넷째, 동일한 현상을 연구하는 다양한 연구자를 채택하는 연구자 통합 (investigator triangulation)을 활용할 수도 있다.


다만 질적 연구에서 타당성을 확보하는 것은 특정한 실체나 목적이 아니라 그것은 연구자 들이 옳은 길을 가고 있다는 독자들의 신뢰(confidence)를 확보하는 하나의 과정(process)이라 고 할 수 있다. 따라서 질적 연구에서는 진실(truth)보다는 신빙성(trustworthiness)을 강조하며, 따라서 연구자 편이(researcher bias), 측정편이(measurement bias) 등이 타당성을 위협하는 요 인이라고 하더라도 이것을 명확하게 측정할 수 있는 방법은 없다. 질적 연구결과를 평가하는 명확한 기준을 찾는 것은 연구과정에 대한 실증주의적 모형으로의 귀환을 의미한다.




3) 질적 연구에서 신뢰성(reliability)의 문제


전통적 실증주의에서 신뢰성은 반복측정의 일관성을 의미하는 반면, 질적 연구에서 신뢰 성은 크게 내적 일관성(internal consistency)과 외적 일관성(external consistency) 개념에서 접 근할 수 있다(Neuman, 2003). 내적 일관성은 수집된 자료가 합리적인가(reasonable), 수집된 자료들이 모두 일치하는가, 관찰결과가 시간과 공간을 넘어 일관성이 있는가 등의 문제와 관 련된다. 한편 외적 일관성은 관찰결과를 다른 자료원천들과 상호검토(cross-checking) 혹은 확인(verifying)하는 것을 의미한다. 질적 연구에서도 타당성과 신뢰성은 비록 그것이 실증주 의 관점과는 상이하다고 하더라도 그것은 중요하고 복잡한 쟁점이라고 할 수 있다. 타당성은 표상(representation)과 일반화가능성과 밀접한 관련이 있다. Gay and Airasian(2003: 56)은 적 연구에서 신뢰성을 평가하기 위한 체크리스트를 다음과 같이 제시하고 있다.


      • 연구자의 연구대상과 연구현장의 관계가 완전하게 기술되었는가?

      • 모든 현장기록(field documentation)이 포괄적이고, 완전 상호언급되고(cross- referenced), 주석이 달리고, 엄밀하게 상세하게 작성되었는가?

      • 관찰과 면접이 다양한 수단(기록노트, 녹음 등)을 사용해서 기록되었는가?

      • 면접자의 훈련이 기록되었는가?

      • 모든 도구의 구성, 계획, 검증이 기록되었는가?

      • 핵심 피면접자들이 표상하는 집단과 그들의 공동체 지위에 관한 정보를 포함해서 핵심 피면접자들이 완전히 기술되었는가?

      • 조사대상선정방법(sampling technique) 연구에 적합할 정도로 충분히 기술되었는가?




2. 질적 연구에서 연구대상 선정(sampling)


질적 연구는 적은 표본에 대한 심층적 이해에 초점을 맞춘다. 이는 연구대상이 그들의 주 어진 사회적 상황에 부여하는 의미와 과정을 이해하는 것으로 반드시 일반화를 목적으로 하 는 것은 아니다.4) 따라서 이러한 연구목적 달성을 위해 질적 연구에서 자주 활용되는 연구대 상선정방법(sampling)으로 목적표출(purposive sampling) 혹은 판단표출(judgement sampling), 우연표출(opportunistic sampling) 혹은 편의표출(convenience sampling), 이론표출(theoretical sampling) 등이 활용되고 있다.


목적표출과 판단표출은 연구자가 특정한 연구목적에 부합하는 연구대상을 주관적 판단 을 통해 선정하는 것으로 연구자가 이용할 수 있는 자원에 대한 고려뿐 아니라 특정한 연구 문제에 따라서 영향을 받는다. 경우에 따라 연구자는 연구대상들이 갖는 특성이 연구에 포함 되도록 하기 위해 층화목적표출(stratified purposive sampling)을 채택하기도 한다.


둘째, 질적 연구에서는 일정한 논리적 계획 등에 근거하지 않고 상황에 따라 발생하는 우 연표출(opportunistic sampling)이 이루어지는 경우가 많다. 이는 일종의 편의표출(convenience sampling)로서 연구대상집단이 모두 샘플에 포함될 기회를 갖는 것은 아니다.


셋째, 이론표출(theoretical sampling)근거이론접근법(grounded theory approach)의 한 부 분으로 자주 활용되는데 이는 이론형성을 위한 자료수입의 과정을 의미한다(Glaser and Strauss, 1967). 질적 연구에서 분석가는 자료 수집, 코드화 및 분석을 통합적으로 수행하는데, 중요한 것은 이전 단계에서의 연구결과와 비교하기 위해 다음 단계에서는 어떠한 자료를 수 집할 것인가를 결정해야 한다. 만약 다른 표본을 통해서도 똑같은 결론에 도달하고, 새로운 것을 발견하지 못한다면 이는 이론적 포화(theoretical saturation)상태를 의미하며, 따라서 연구자는 새로운 각도에서 연구를 수행하기 위해 다른 집단을 연구대상으로 선정하게 된다.5)


5) Morse(1995)에 의하면 이론적 포화(theoretical saturation)는 이론표출을 통해 가장 빨리 달성될 수 있고, 누적표출과 편의표출에 의해서는 느리게 달성될 수 있다. 이에 반해 무작위표출에 의해서는 표본이 이론적으로 전혀 적합하지 않고, 좋은 정보담지자가 아니므로 이론적 포화가 전혀 달성될 수 없다.




3. 질적 연구의 과정


기존 논리실증주의 연구과정에서는 연구문제의 정의, 선행연구 검토, 가설설정, 연구설계 (연구방법), 도구화(instrumentation) 및 표본추출, 자료수집, 자료분석, 결론 및 해석, 가설수정 등의 단선적 방향으로 이루어져 왔다. 양적 연구과정에서 가설은 반박과 대안가설을 통해 수 정될 수 있으며, 후기실증주의자들은 실체에 대한 진실보다 궁극적 실체에 다가가는 개연성 혹은 실체에 대한 연속적 근사치(successive approximate)를 강조한다. 그러나 질적 연구설계 는 인식론과 방법론 간에 긴밀한 연결을 강조하며 이는 연구문제 선정, 표본추출절차, 자료 분석 유형 및 해석전략 등 질적 연구의 연구궤도를 결정짓는다. 특히 질적 연구에서는 이러 한 연구과정의 각 요소들이 일정한 방향으로 작용하는 것이 아니라 역동적 상호작용을 나타 낸다.


즉, 질적 연구에서의 연구과정은 역동적 무도장(dynamic dance)이라고 할 수 있다. 질적 연 구에서 중요한 것은 철학적 기반(philosophical substructure) 혹은 패러다임 선택(paradigm choice)이라고 할 수 있다. 이는 ‘분석적 귀납화(analytical induction)’를 통한 이론형성(theory generation)을 추구하며, 일부 질적 연구자들은 근거이론관점(grouded theory perspective)6)을 채택하기도 한다. 즉, 질적 연구에서는 가설설정, 자료수집, 자료해석, 결론도출 등이 일방향 적으로 전개되는 것이 아니라 동시적으로(synchronic) 혹은 반복적으로(iteratively) 이루어지 는 과정을 거친다. 연구자는 자료를 수집함과 동시에 그것을 해석하고 광범위한 관념들을 검 증하고, 다시 추가자료를 수집한다.




Ⅳ. 질적 자료의 분석과 해석


질적 연구에서 자료의 수집, 분석 및 해석은 선형적인 것이 아니라 상호적(dialectic)이며, 순환적으로 이루어진다(Agar, 1980: 9). 일반적인 질적 자료의 분석과 해석은 다음과 같은 단 계를 거쳐 이루어진다고 할 수 있지만, 단일의 최선의 방법이 존재하지는 않는다. 이와 관련 Tesch(1990)에 의하면 질적 분석은 예술적으로, 경우에 따라서는 극적으로(playfully) 이루어 질 수 있고, 또 이루어져야 하지만 그것은 많은 방법론적 지식과 지적인 성찰을 요구한다.


첫째, 자료준비(data preparation) 단계는 자료의 필사(transcribing) 단계로서 연구자는 다양 한 연구방법(심층면접, 핵심집단면접 등)을 통해 얻어진 자료를 문자화된 형태로 정리하고, 이를 주의 깊게 읽어보면서 관련 오류를 수정할 수도 있다. 해석적 입장에서 보면 필사단계 에서 연구자가 자료를 어떤 형태로 혹은 어느 정도까지 정리할 것인지는 연구자의 이론적 입 장과 연구질문에 따라 달라질 수 있고, 연구대상과 긴밀한 상호작용을 통해 이루어진다.


둘째, 자료탐색(data exploration) 및 자료축소(data reduction) 단계는 동시에 이루어진다. 탐 색단계에서 연구자는 각종 문자, 시각, 청각자료를 분석하며, 핵심적인 내용 등을 요약하여 문자, 도표, 그래프 형태 등의 메모를 작성하면서 코드화 작업을 하게 된다. 자료의 코딩과 분 석은 주로 근거이론접근7)에 의해 이루어진다. 연구자는 자료수집과 동시에 개방형 코딩 (open coding)을 통해 분석과정을 시작하는데, 메모작성을 통해 코드를 범주(category, 개념) 의 수준으로 발전시킬 수 있다.8) 근거이론접근에 의한 분석은 한 줄 한 줄 주의 깊게 읽어 가 면서 각 줄, 문장, 단락에 대한 코딩과 메모작성을 통해 핵심적인 범주나 개념을 도출하는 것 이다.


7) 근거이론은 Glaser and Strauss(1967)에 의해 개발된 분석의 형태로서 질적 자료로부터 의미를 추출하 는 전략을 제공해 준다. 근거이론접근은 자료수집에서 시작해서 자료에 근거를 두거나 자료로부터 생 성되는 이론으로 종료되는데, 이러한 분석과정이 상호적으로 이루어진다. 그러나 근거이론접근은 담 화분석(narrative analysis), 담론분석(discourse analysis) 등 여러 분석전략의 한 유형일 뿐 유일한 질적 자료 분석방법은 아니다.


연구자가 작성한 코드는 기술적일 수도 있고, 경우에 따라 해석적일 수도 있다. 질적 자료 에 대한 1차 코딩(initial coding)이 이루어지고 나면, 2차적으로 심화된 코딩작업(focused coding)이 이루어지며, 심화코딩을 통해 개념형성과 구체화가 이루어진다. 즉, 심화코딩에서 는 단순히 자료에 이름을 붙이는 것이 아니라 분석적 범주화(analytical category)를 요구하게 되며, 이러한 과정을 통해 이론적 구성(theoretical constructs)을 시작하게 된다. 또한 코딩과 메모작성의 과정은 선형이 아닌 순환적 과정을 통해 역동적으로 이루어지게 된다.


셋째, 자료해석(Interpretation) 단계에서는 코딩과 메모작성을 통해 도출된 질적 자료의 핵 심개념, 주제들에 대한 의미를 부여하게 된다. 최근에는 방대한 양의 질적 자료분석을 위한 각종 컴퓨터 소프트웨어의 발전으로 소프트웨어에 의한 분석과 해석과 관련한 이슈도 제기 되고 있다. 그런데 근거이론접근뿐 아니라 모든 질적 연구에서 자료의 분석과 해석이 구별되 는 것은 아니며, 자료수집과 동시에 분석과 해석이 이루어진다. 특히 메모작성이 질적 자료 의 분석과 해석을 연결하는데 중요한 역할을 수행하게 된다. 또한 질적 자료의 해석에 있어 연구자와 연구대상자의 역학관계(power dynamics)가 중요한 영향을 미칠 수도 있다.9)


넷째, 원고작성(writing up) 단계로서 질적 자료에 대한 분석과 해석이 이루어지고 나면 혹 은 분석 및 해석과 동시에 원고를 작성하게 된다. 여기에는 실존주의적 관점(realist)과 비실존 주의적 관점(non-realist)이 대립된다. 연구자에 의해 발견될 수 있는 실재가 연구자 밖에 존재 한다고 가정하는 실존주의 관점에서는 전통적으로 공식화된 글씨기가 강조되는 반면, 포스 트모더니즘을 토대로 하는 비실존주의 관점에서는 연구발견을 표출(represent)하는 방식에 차이가 있다. 즉, 극장공연과 같이 예술과 인문으로부터 글쓰기 장르를 차용하면서, ‘공연과 같은 글쓰기(performative style)’ 형태를 취하게 된다. 그러나 이러한 실험적 글쓰기와 전통적 글쓰기가 상호 배타적인 것은 아니며, 연구과정에서 상호 활용되기도 한다.


Ⅴ. 맺음말


질적 연구들은 어떠한 이론적 입장을 채택하든지 공통적으로 사회적 실체에 대한 접근에 있어 해석적 과정(interpretative)을 통한 사회적 구성(social construction)을 강조한다.


질적 연구에 있어서는 정형화된 단일의 연구방법과 연구설계가 존재하지 않는다. 질적 연구는 응답자의 특성, 연구가 수행되는 맥락 등에 따라 상황의존적으로 이루어지게 된다. 단일의 질적 연구방법을 강조하는 것은 역설적으로 양적 패러다임으로의 귀환을 의미하기 때문이다.






제어번호

76359530

저자명

박석희 ,이종원

학술지명

서울행정학회 학술대회 발표논문집

권호사항

Vol.- No.- [2009]

발행처

서울행정학회

발행처 URL

http://www.sapa21.or.kr

자료유형

학술저널

수록면

785-799(15쪽)

언어

Korean

발행년도

2009년

KDC

350

판매처

  (주)누리미디어 에서 제공하는 논문입니다.

목차 (Table of Contents)

o Ⅰ. 머릿말

o Ⅱ. 질적 연구의 특징: 포괄적 접근

o Ⅲ. 질적 연구과정과 연구설계

o Ⅳ. 질적 자료의 분석과 해석

o Ⅴ. 맺음말




질적 연구 방법의 내용과 적용전략: 양적인 질적 연구와 질적인 질적 연구*

1)임도빈**





Ⅰ. 질적 연구가 왜 중요한가?


질적연구방법이란 빈도(frequency) 등 수치적 방법에 의한 이외의 방법으로 현 상을 해석하고, 재코딩하고, 설명하는 다양한 방법론을 의미하는 광범위한 개념 이다(Van Maanen, J. 1979).


한국의 행정학 및 정책학의 연구경향은 경험적이고 실증적인 연구가 큰 비중을 차지하고 있다(권경득, 2006; 박흥식, 2006). 이에 따라 학생들의 질적 연구에 대한 이해는 매우 혼란스럽고 단순히 계량연구의 반대적인 것으로 오해하는 경우도 있 다. 하지만, 밀턴 프리드만(Friedman, M,1966:4)이 제기한 대로, 실증연구는 원칙적 으로 규범적 연구와는 다른 연구이므로, 만약 어떤 질적 연구가 계량 연구가 아니 면서 동시에 규범적 연구가 아니라고 한다면 이는 실제 일어난 일 또는 행위에 대 한 연구일 수 있으므로 경험적, 실증적 연구로 볼 수도 있을 것이다. 따라서 질적 인 방식으로 수행된 연구가 경험적 실증적 연구가 아닐 것이라는 편견은 일종의 과학주의의 미신이다. 다만, 질적 연구의 중대한 특성으로 연구자와 사물 간에 상 호의존과 상호작용을 토대로(윤견수, 2005:1) 연구자 저마다의 사회적 현실 (multiple realities)의 형성(구성)이 가능하다. 그 과정은 연구자가 사물을 이해해가 는 의미해석(sensemaking)과정과도 무관하지 않으므로 가치개입적일 수 있으며, 결국은 “실증적(positive)”이라는 용어는 ‘질적 연구다운’ 것과는 어느 정도는 상존 하기 곤란한 것이 되기도 한다.




Ⅱ. 기존 질적 연구들의 맥락적 이해


질적 연구(qualitative research)라는 용어가 가져다주는 의미는 다른 배경을 가진 사람들에게 다 다르게 나타난다(Strauss and Corbin, 1998:11).


1. 무엇이 ‘ 질적’ 인 것인가에 관한 다양한 견해들


질적 연구를 정의하기는 쉽지 않다. 많은 사람들은 비수학적(non-mathematical) 분석, 비수치적(non-numeric) 자료, 비통계적(non-statistical) 방법을 차용(Strauss & Corbin, 1998: 10-12) 하는 연구를 질적 연구라고 알고 있다. 또한 어떤 이들은 질적 인 것이란 주관적인 것과 동일하다고 보아 심지어 비과학적인 것으로 보기도 한 다. 혹은 계량적 방법이나 사례연구를 하지 않은 것이란 의미에서 이론적인 것과 동일한 것으로 받아들이는 경향이 있다.


그러나, 사회과학에서 완벽하고 객관적이고 명확한 사실이나 개념이란 존재하 지 않는다. 사회현상에 대한 서로 다른 다양한 견해가 존재할 뿐이다. 이런 점에서 질적인 것은 주관적인 것 즉, 가치적인 측면을 포함하여 생각하는 경우가 많다. 따 라서 많은 사회과학자들은, 관찰이란 것이 이론에 기반하여 이루어지기 때문에 체계적인 관찰이 현실에 대해 진실을 말해줄 것이며 과학적 주장은 검증할 수 있 다고 보는 실증주의자들의 생각에 동의하지 않는다(Johnstone, 2000). Cameron 등 (1992)은 관찰과 현실에 대한 이러한 딜레마를 해결할 수 있는 두 가지 방법을 제 시한다. 


  • 하나는 이른바 상대주의(relativism)로서 관찰만이 아니라 현실 또는 이론 에 의존하므로, 세상은 개인들에 따라 차이가 나며 따라서 기술(describe)할 수 있 는 단일한 현실은 존재하지 않는다고 본다. 이들은 서로 다른 사례에서 관찰과 현 실간의 상호작용이 같은 방식으로 일어나는지 여부에 대한 일반화 작업을 하지 않는다.

  • 반면 객관적 현실주의(realism)는 관찰은 이론에 기반하지만 현실은 그렇지 않 다고 보면서, 사람들이 사용하는 문장들은 서로 다르며 잘못 들릴 수도 있지만 같 은 발언을 듣는 두 사람의 경험은 어느 정도 같다고 보고 있다. 대부분의 사회학자 들은 다소 차이가 있겠지만 현실주의적 입장에 서 있다고 볼 수 있다(Johnstone, 2000).


한편, 어떤 이들은 접근방법과 패러다임 등도 질적인 것으로 간주하기도 한다. 접근방법이란 어떤 현상의 가장 두드러진 특징을 중심으로 연구하는 것을 말하 며, 이러한 특징은 특정 학문분과에 있어서 “문제와 자료”의 선정기준이 된다.


이렇듯, 질적 연구란 매우 다양하고 다중(multiplicity)적인 방법론을 포괄하는 것 으로 ‘질적’의 의미를 밝히기 위해서는 여러 질적 연구방법의 공통분모를 추출해 보는 것이 유용할 수 있다. 질적 연구는 비교적 덜 알려진 영역에서의 사회적 실체 와 현상이 어떻게 해석, 이해되고 경험되거나 생성되는가에 관심을 두기 때문에, 무엇보다도 연구대상의 사회적 맥락에 큰 관심을 갖는다. 설명방법에 있어서도


현상의 피상적인 유형, 추세나 상관관계의 묘사보다는 ‘본질적인’ 형태의 분석과 설명을 보다 강조한다(제니퍼 메이슨, 1999).





2. 양적 연구와 어떻게 다른가?


일반적으로 양적 연구는 질적 연구와는 달리 ‘객관적 연구’라고 받아들여지고 있다. 그렇다면 객관적이라는 것이 어떤 의미인가를 살펴볼 필요가 있다. 객관적 이라는 말은 사실(fact)이라는 말과 일맥상통한다. Simon(1958)은 행정현상을 가치 (values)와 사실(facts)로 분리하여 후자에만 국한하여 실증적으로 연구할 것을 주 장하였다.


사회과학에서 통상적으로 간주하는 ‘객관성’2)의 의미는 첫째, 경험적 사실인가 여부, 둘째, 모든 사람들이 동일하게 느끼는가의 여부, 셋째, 신뢰성 있는 사실인 지에 따라 달라진다. 그런데 모든 사람들이 동일하게 인식하거나 느끼는가 하는 문제에서 많은 사람들이 특정 현상을 동일하게 보고 느낀다는 이유자체만으로 그 현상을 사실이라고 규정할 수는 없다. 과거 천동설이 지배적인 시대에 사람들은 지구가 고정되어 있고, 태양이 움직인 것으로 경험적으로 느꼈지만, 실제로는 지 구가 움직이는 것이 올바른 사실이었다. 신뢰성이 있는 사실이란 같은 조건에서 같은 실험을 수행했을 때 동일한 결과를 가져오는 경우에 성립한다.


질적 연구는 양적 연구가 추구하는 수치의 통계적 결과에 의해 제시된 “사실 (facts)”를 추구하는 것(남궁근, 2004)과는 다르다. 즉, 연구대상이 특정 사회 환경에 놓여 있는 행위자에 의해 지각된 사회적으로 구성된 실제(socially constructed reality)를 추구한다(Meyer and Rowan, 1977; Granovetter, 1985; Weick, 1993). 행위자나


연구자의 인식(perception)을 중시한다는 점에서 상술한 객관성의 기준에서 볼 때 문제성을 띠고 있는 것이 사실이다.


<그림 1> 연구방법의 유형




그런데, <그림 1>의 [유형 Ⅱ, Ⅲ, Ⅳ] 모두 질적 연구로 알려져 있다. [유형 Ⅱ, Ⅲ, Ⅳ]는 귀납적이라는 점에서 질 적인 방법론이라고 알려져 있는 것 같다.


그러나 [유형 Ⅱ]는 일단 자료수집단계에서 개방적인 태도로 문제를 본다는 점 에서 질적인 연구로 간주하는 경향이 있는데, 실제 연구에서 주장하고자 하는 것 을 수치(즉, 통계)로 판별한다는 점에서 엄밀한 의미에서는 질적인 연구라고 보기 는 어렵다. 특히 [유형 I]은 물론이고 [유형 II]의 연구도 연구자가 연구대상이란 연 구자와는 별도로 객관적으로 존재하는 것으로 보는 자세를 갖는 경우, 협의의 질 적 연구라고 보기 어렵다.


흔히 알려진 내용분석(contents analysis)이 그것인데, 연설이나 대화에서 특정단 어의 출현빈도수를 찾아 통계법(예, 카이자승법)으로 분석하는 것이 대표적인 예 이다. 또한 과거 인간관계를 연구하는 방법으로 소시오메트리(sociometry)를 사용 하다가 최근에는 네트워크 이론이 발달되고 있다. 컴퓨터를 이용한 네트워크 분 석기법에 의해 시각적으로 일목요연하게 네트워크가 표시될 수 있다. 그러나 이 를 그래픽화하는 것을 넘어서 통계적 유의성 검증기법에 의해(예컨대 두 네트워 크의 중심성(centrality)을 유의성여부를 검증하는 소프트웨어가 있다) 검증한다면 질적 연구라기보다는 오히려 ‘양적 연구에 가깝다’고 할 수 있다.


본고에서 말하는 질적인 질적 연구는 결국 [유형 Ⅲ]과 [유형 Ⅳ]이다. 이 두 유형 의 공통점은 주요한 결론을 통계방법에 의존하지 않고 연구자의 사유능력에 의존 한다는 점이다. [유형 Ⅲ]의 대표적인 것은 근거이론과 행위이론 등이다. 미리 정 해진 분석틀이 아니라 철저히 개방적인 태도로 현실을 이해하고 순차적인 귀납적 방법에 의해 이론에 도달한다는 것이다. Michel Crozier(1964)나 Friedberg의 행위이 론은 조직연구에서 인터뷰에 의하고, 연구대상 행위자들의 실제 행위내용을 근거 로 한다는 점에서 연구자의 주관을 배제하려고 한다. 이런 점에서 연구자의 주관 을 인정하고 밝히도록 하는 근거이론과는 차이가 있다.


[유형 Ⅳ]는 현상학이나 비판이론과 같이, 통합적 접근법이라는 점에서 [유형 Ⅲ]과 구분된다. 결국 연구자의 주관이 가장 중요한 연구추진력이 되고, 사회는 부 분으로 나누어 분석적으로 하기보다는 전체적으로 이해되는 경향이 있다.





3. 양적 연구와의 보완 가능성


King et.al.(1995)은 최고의 사회과학 연구들은 계량적 연구와 질적 연구의 혼합이 주류인데, 이것은 근본적인 추론과정 간 에 모순이 없기 때문이라고 말한다. 그러나 엄밀성이라는 가치를 얻기 위해서는 지불해야 하는 비용이 반드시 있기 마련이다. <그림 1>에서 제시한 유형들을 기분으로 할 때, [유형 I]과 다른 유형들 간 결합을 한다는 것은 그리 쉬워보이지 않는다.


그러나 국내 질적 연구가로서 조용환(1999a:104~109)은, 한국에서 수행되는 소 위 양적 연구와 질적 연구의 결합은 “질적 연구와 양적 연구를 어정쩡하게 결합시 켜놓은 경우로, 석・박사 학위논문에서 자주 발견되며, 그 원인으로써, 질적 연구 에 관심을 가진 학생이나 지도교수가 심사위원들의 몰이해와 반발을 우려하여 과 감하게 질적 연구를 추진하지 못하고 우회”하기 때문에 발생한다고 주장하면서 “질적 연구와 양적 연구가 연구기법상 혼합할 수는 있지만 연구논리상 화합할 수 는 없다”고 강조하고 있다. Sydney Tarrow(1995) 역시도 다각화(Triangulation)의 효 능은 양적 데이터가 부분적이고 질적 조사가 정치적 환경에 의해 막혀있을 때 특 히 적합하다고 강조하고 있다.





Ⅲ. 질적 연구의 유형과 연구전략


1. 양적인 질적 연구: [유형 II]


양적인 질적 연구에서는 ‘검증해야 하는 기존이론이란 좋은 것’이라는 암묵적 인 전제를 하고 있다. 가상적 예로서, 대통령의 라디오 연설에서 ‘공공서비스’ 정 신이 많이 포함되면 될 수록 대통령의 지지율이 높을 것이라는 가설을 검증하는 것이다. 이때 ‘공공서비스 정신’을 담은 단어를 찾아내는 내용분석을 하는 것이다.


즉, 양적인 질적 연구를 옹호하는 시각을 가진 사람들은, 질적 연구를 수행하는 방식에 있어서도, 선행연구를 통해 연구문제를 도출하는 쪽으로 흐를 가능성이 크므로 이론으로부터 가설을 도출할 가능성이 많으며, 자료에서 가설을 도출하는 세련되지 못한 경험주의((brute empiricism)를 피할 수 있게 된다. 충분히 개방되고 유동성 있는 질문(홍영기, 2006)을 가지고 자료와 연구자와의 상호작용을 토대로 (Creswell, 1998) 진행되는 질적인 질적 연구와는 다른 것이다,


결국 진정한 질적 연구는 연구문제에서부터 차이가 있게 된다. 

  • 양적인 연구는 사회의 모든 현상이 인과관계라는 법칙에 의해 움직인다고 전제하고 이를 규명하 기위해 이론(가설)검증한다. 따라서 어떤 설명대상(종속변수)이나 독립변수의 출 현여부나 정도를 어떻게 경험적으로 측정하느냐의 문제와 이들 간에 관계가 있느 냐 여부를 통계적 유의성으로 검증하는데 중점이 있다. 이에 비하여 

  • 질적 연구는 사회현상의 단일성이나 인과관계를 전제하지 않고, 개별 사례(연구대상)의 독특 성을 이해하는데 중점을 둔다. 따라서 독립변수나 종속변수의 측정보다는 이들이 어떤 과정을 통해 왜 일어나는가를 탐구하는데 연구자의 노력이 집중된다. 

  • 예컨 대 관료부패와 관료의 월급관계를 규명하는 것이 양적 연구가 해결해야 하는 연 구문제라고 한다면, 젊고 청렴한 관료가 어떤 환경과 과정을 통해 부패에 연루되 는가의 과정을 이해하는 것은 질적 연구의 대상이 된다. 따라서 같은 관료에 대한 인터뷰의 내용도 이 접근방법에 따라 상이할 수밖에 없다.


이러한 시각에서 볼 때 아무리 계량화되지 않는 자료(인터뷰, 비디오, 문서 등의 질적 자료)를 활용한다고 하더라도 모두 질적인 연구라고 보기는 어렵다. 양적인 질적 연구는 방법 자체가 이론부터 설 명하고 들어가거나, 혹은 그렇지 않더라도 이론을 전제로 연구 참여자의 인터뷰 내용이 사실을 뒷받침하는 수단으로 사용된다. 이 점은 인터뷰 내용의 진실의 신 빙성 여부나 인지적 편이(bias)문제를 중요 이슈로 다루는 질적인 질적 연구에서 는, 인용문을 사실적 주장의 수단으로 보지 않는다. 이 점에서 두 연구방식의 인식 의 간극이 매우 큼을 알 수 있다.





2. 질적인 질적 연구


1) 연구의 관심과 특성


흔히 질적인 연구를 겨냥한 잘못된 비판(Eight Common Erroneous Critiques)을 보면 다음과 같다.7)


첫째, 논문작성은 가설을 가지고 출발해야 한다(This paper needs to start with a hypothesis). 이것은 가설검증을 연구의 핵심으로 보는 실증주의자들이 주장하는 내용이다. 연구자가 어떤 연구대상을 대상으로 가지고 있는 궁금증(즉, 넓은 의미 의 연구문제)만 가지고 있어도 연구의 개시는 충분한 것이다. 넓은 의미의 연구문 제가 있으면 논문작성에 아무런 지장이 없다.


둘째, 외적 타당성이 있어야 한다(This study lacks external validity). 가설검증을 주 장하는 실증주의자들이 가진 편견으로 이를 해결하는 방법이 통계적 유의성검증 이다. 즉, 일반화를 위해 다른 유사한 집단에 적용가능성을 표본추출 오차라는 측 면에서 검증하는 것이다. 그런데 질적 연구에서는 개별 연구대상의 독특성을 강 조하기 때문에 연구결과의 외적 타당성에 비중을 두지 않는다.


이와 같은 맥락에서 왜 극단사례를 가지고 연구하느냐(Why are you focusing on these extreme, negative cases anyway?)라는 비판을 하게 된다. 그래도 대표성이 있는 중간정도의 사례를 연구하는 것을 선호하는 경향이 있다. 그러나 극단적 사례를 통한 이해가 훨씬 설명력이 더 클 수 있다. 더구나 사회과학 연구의 목적이 현실을 이해하는 것에 중점을 둔다는 점과 모든 연구대상들은 독특하다는 것을 전제하기 때문이다.


셋째, 종속변수가 무엇인가( So what’s the dependent variable?)라는 비판을 받게 된다. 질적 연구에서 현상에 대한 이해에 중점을 두면 소위 독립변수라고 할 수 있 는 것을 파악하는데 전력을 기울이게 된다. 이런 과정에서 작성된 연구는 가설검 증을 지지하는 연구가의 눈에는 가치가 없는 것으로 보인다. 질적 연구는 무엇이 원인이고 결과인가를 묻는 연구가 아니다. 따라서 시간선행, 혹은 인과관계를 규 명하는 것이 아니다. 다만, 질적 연구의 관점은 “현재진행형(ongoing)”으로 진리를 향해 정진하는 것이다. 나아가서 연구대상은 항상 진화 내지 변하는 것이기 때문 에 어떤 확정성은 없다고 봐야 한다.


넷째, 연구자의 주관성 문제나 오류문제(Author error)가 배제되었느냐의 비판이다. 실증주의에서는 연구자의 무오류성을 추구한다. 그러나 질적 연구는 객관적 데이터를 해석하는 것이 아니라 연구자가 가진 편견을 그대로 내포하면서 연구를 진행하므로 항상 연구자로부터 기인하는 오류가 있다고 비판을 받는다.


그러나 질적 연구에서는 객관적인 데이터는 존재하지 않는다고 믿는다. 예컨대 GNP와 같은 자료도 사실 그 나라의 자연적 조건, 산업구조, 인적 자원, 분배구조 등에 따라 나라마다 서로 다른 의미를 가질 수 있는 것이다. 이런 차이를 무시한채 국가간 GNP를 비교하는 가설 검증을 한다면 ‘다른 것을 같은 것으로 믿는 더 큰 오류’를 범할 수 있는 것이다. 두 사람이상의 연구자가 인터뷰를 하고 코딩을 하는 경우에는 이들 연구자들간의 일관성이 문제가 될 수 있다. 특히 근거이론과 같이 개방코딩, 축코딩을 하는 경우 이들 간 코딩결과가 완전히 서로 다른 것이 된다면 문제가 될 수도 있을 것이다( The problem with this coding process is that you can’t establish inter-rater reliability about what things mean?). 이 점은 질적인 연구방법의 태 생적인 약점으로 연구자간에 상호비교하고 토론하는 과정을 거침으로써 어느 정 도 해결할 수 있다. 그러나 질적 연구는 일반화나 객관성의 확보가 연구의 핵심적 목적이 아니므로 치명적이라고 할 수는 없다.


다섯째, 질적 연구는 소수 표본이어야 한다는 믿음도 절대적인 기준은 아니다 (But Helen, you’re not a qualitative type; you interviewed 200 people!). 200명이 넘는 사 람을 인터뷰하여 질적인 연구를 진행할 수도 있다. 사실 질적인 연구도 다양한 사 례를 보고 연구를 하면 바람직할 것이다. 그러나 질적인 연구에서는 연구대상 표 본이 많을수록 좋은 것은 아니다. 따라서 소수 표본으로도 훌륭한 연구가 가능하 다. 거꾸로 최근 통계기법이 발달하여 소수의 표본의 경우는 정규분포를 가정하지 않고 통계검증을 하는 양적 연구를 할 수 있다.


여섯째, 질적인 연구는 사적인 비밀보호의 원리를 침해한다(Aren’t the death row inmates at risk of having their privacy violated by your research?). 연구의 기본단위가 주 로 개인이고, 인터뷰나 관찰 등의 방법으로 이들 연구대상 인간들의 생각이나 행 동을 면밀히 이해하는 데에서 시작하고 그 과정이 어떻게 되었느냐가 연구의 질 을 좌우 한다. 이 연구과정에서 연구대상인 개인의 사적 생활이 연구자에게 노출 될 수밖에 없다. 이로 인해 연구자와 연구대상간의 정보보호의 문제가 생긴다. 따 라서 질적인 연구에서는 연구윤리를 매우 중시한다. 우선 연구대상으로부터 연구 를 진행하겠다는 동의를 얻는 것이 필수적이고, 연구결과물에서는 익명성을 유지 하기 위한 각종 장치가 필요하다.


논문제목이나 내용목차에 “질적” 혹은 그밖에 질적 연구의 전통에 해당하는 용어가 포함되어있다고 해서 모두 질적 연구로 섣불리 단정할 수는 없음(조용환, 1999a:92)을 명심해야 한다.




2) 질적 연구방법(유형 Ⅲ)의 특성


Guba & Lincoln(1994:107)에 의하면 양적 연구와 질적 연구는 연구를 이끄는 존 재론, 인식론, 방법론상에 그 전제가 되는 신념체제(belief system)가 다르다고 한다. 바꾸어 말하면, 양자의 차이가 단순한 연구방법상의 차이가 아니라, 연구논리상 에 그 기저가 다름을 의미한다. 질적인 질적 연구란, 이렇게 연구방법상의 차이 뿐 만이 아니라 연구논리상 차이 즉, 패러다임이 완전히 다른 연구 방식인 것이다.


질적인 질적 연구(즉, [유형 Ⅲ], [유형 Ⅳ])는 연구의 출발 단계에서 전혀 이론 (theory)에 근거를 두지 않고 출발한다. 왜 이러한 질적 연구를 해야 하는가에 대한 이유(moments)는 다음 세 가지로 요약할 수 있다.


첫째, 연구참여자(natives 즉 연구대상)의 모멘트, 

둘째, 연구자(researcher)의 모멘트, 

셋째, 독자(audience)의 모멘트이다(Brower, 2007).


질적 연구는 바로 이 세 가지 모멘트들의 상호의존과 상호작용을 토대로 ‘의미’를 이끌어내는 장점이 있다(윤견수, 2005:1). 요컨대, 질적인 질적 연구는 기존 용어나 이론에 기대지 않 고, 생활세계(life world)의 상황에 근거를 두고, 그것을 담아 낼 수 있는 이론적 개 념(theoretical concept)을 정립(build)해 나간다.8) 그 일천(一淺)한 수준으로부터 발 견된 몇 가지 사실로부터 점점 더 코딩 작업을 고양화시킴으로써 마침내 모든 개 념을 아우르는 이론을 도출하는 것이다. 즉, 자료로부터 명명된(label) 개념으로부 터 점점 더 넓게 추상화 시켜나가는 상향식(bottom-up) 귀납연구이다.9)


9) 결국은 기존에 코딩된 개념이 모든 개념을 포착해낼 수는 없기 때문에, 연구자 자신이 최종 범 주를 독자적으로(즉, 질적으로) 산정하게 된다. 그 최종범주가 더 이상의 내러티브한 군더더기 없다고 평가가 되면, 만족(saturation)스러운 단계에 도달했다고 보는 것이다. 이 순간 마침내 “질적인 모멘트의 발견”이 이루어지게 된다.




이러한 과정에서, 많은 질적 연구가들이 여전히 자료 수집 이후의 과정을 ‘분석’ 으로 통칭하는 관행을 보여 왔다. 이는 다분히 양적 연구의 전통을 따른 것이라고 비판받을 수 있다(조용환, 1999b:28). 

      • 나아가서 양적 연구(혹은 양적인 질적 연구) 에서는 연구자가 사물(thing)에 대해 대자(對自)적 관계로 설정되기 때문에 ‘적용’ 이라는 용어가 성립 가능하나, 

      • 질적인 모멘트에서는, 연구자와 대상 간에 주객의 혹은 주종적 존재 양식의 구분이 더 이상 의미가 없어지게 되는 것이다. 이와 같 이, 질적인 질적 연구에서는 연구자가 사물과 즉자(卽自)적 관계에 놓여있음으로 말미암아, 연구자의 인식의 범위(perceptual field) 내에서 사물이 지각되고, 의미가 해석・재해석되는 것이다.10)



이러한 설명방식은 기존 이론을 사례를 통해 확인하는 연역주의적 방식과는 거 리가 있는 방식이고, 이러한 설명방식이 설득력이 있는 이유는 자료로부터 범주 화된 개념들이 이론을 구성함에 있어 직결되는 증거(evidence)가 되기 때문이기도 하지만, 연구자가 독자적(질적)으로 구축한 이론이 결국 ‘왜(why)에 대한 대 답’(Kaplan, 1964; Merton, 1967; Sutton & Staw, 1995: 378)으로서 그 역할을 잘 해주기 때문이다.


결국 이러한 질적인 질적 연구는, 개인 조직원이 제도를 사회적으로 습득한 사 고방식 즉, 각 개인의 의식에 각인된 사고의 사회적 습관으로 보는 사회학적 신제 도주의에 기초하여 질적 연구의 의미를 재조명할 수 있고, 그 방법으로서의 현상 학과 깊은 관련을 가지는 것이다.


따라서 질적 연구를 진행하는 데에는 중점을 둬야하는 측면이 타당도와 신뢰도 에 중점을 두는 양적인 연구의 경우와 다르다. 이를 몇 가지로 정리하면 다음과 같 다.(Lawrence F. Locke, Stephen J. Silverman & Waneen Wyrick Spirduso, 2004:221~225)


우선 충분한 연구기간(The machinary of time)의 문제이다. 사실 이러한 연구성과 물의 질은 연구자가 연구대상 상황에 얼마나 충분한 시간을 보냈는지가 절대적 결정요인이다. 실제로 몇 시간, 몇 일을 보내야 하는지 잘라서 말하기 어렵다. 그 러나 연구자가 연구대상에 대해 충분한(만족할만한) 수준의 정보를 얻는데 필요한 시간을 의미한다. 대체로 행정학계에서 질적 연구를 표명한 연구들이 매우 짧 은 시간을 소비하여 질을 담보하지 못하는 경우가 많다.


둘째, 주관성의 원칙(The machinary of subjectivity)이다. 질적 연구는 연구자의 주 관이 개입되는 것을 당연한 것으로 받아들이는데, 연구자가 이에 대해 스스로 어 느 정도 의식하고 있는가가 중요하다. 이 세상에서 객관성이라는 것은 존재하지 않는다고 보는 것이다. 1차 자료의 획득 후 한 걸음 물러서서 이를 관조해보는 자 세 등이 필요하다.


셋째, 부정합성의 원칙(The machinary of What Does Not Fit)이다. 조사결과 연구 목적에 부합되지 않는 것, 논리적으로 맞지 않는 것, 극단적 예외 등에 대해 양심 적으로 처리하고 깊이 생각해야 한다. 이를 그냥 무시하거나 의도적으로 누락시 키고, 마치 자신의 결론이 거의 현실에 부합되는 것처럼 해서는 절대로 안된다. 사 실 복잡한 현실세계를 이해하기 쉽게 멋있게 설명하는 것은 쉬운 일이 아니다. 그 러다 보니 거짓연구를 하려는 유혹이 있는 것이다.


넷째, 관계성의 원칙(The machinary of Relationship)이다. 연구 대상 사람들 간에 오간 대화나 인터뷰 내용에는 이들 간의 인간관계가 내포되어 있음을 항상 주의 깊게 감안해야 한다. 연구자와 인터뷰 대상자의 관계도 마찬가지 차원에서 엄격 히 고려되어야 한다. 즉, 연구자와 연구대상간의 상호작용에 각별히 주의해야 한 다. 정책연구에서는 정책입안부터 집행 시, 그리고 평가 시까지 외부연구자가 대 상집단과 긴밀히 상호작용하여 추진해야 한다. 예컨대 조직진단의 경우, 조직개 편안을 담은 보고서 제출이 최종점이면 안 되고, 그 개편안의 실행에도 연구자가 깊이 관여하여 소정의 효과가 나오도록 해야 한다.


다섯째, 맥락의 원칙(The machinary of Context)이다. 사회적, 역사적, 물리적 환경 을 제대로 묘사하고 분석(설명)의 주요 내용으로 포함시켜야 한다. 이를 통해 독자 들은 연구의 결론을 유사한 상황으로 적용해 볼 수 있을지를 판단하게 된다. 이것 은 두터운 기술(Thick description)의 주요 부분이기도 하다.


우선 근거이론을 사용한 정책시뮬레이션(권선필, 2007:34) 연구에서, 예컨대 검색된 뉴스기사 데이터는 개방코딩(open coding)의 개념들의 소스이다. 이후, 상위 범주인 축코딩(axial coding) 단계에서는 몇 개의 하위 단계의 개념들이 하나의 상 위 범주의 소속으로 묶이게 된다. 이때 하나의 개방코딩은 복수의 축코딩에 중복 되게 소팅(sorting)이 된다거나 혹은 누락되지 아니하며, 타개념과 상호 배타적으 로(즉, 비중복적으로) 일관성있게 범주화가 진행된다. 그러한 작업에 도움을 주는 것이, ATLAS.ti나 MAXqda와 같은 소프트웨어들이다.




3. 질적 연구의 유형별 연구전략


질적 연구를 하는 데에는 많은 타당한 이유들이 있다(Strauss & Corbin, 1998:11). 

  • 첫째, 연구자들의 경험이나 선호로 인하여, 

  • 둘째, 연구자들의 기질이 질적 연구 작 업의 형태를 수행하는데 더 적합하기 때문에, 

  • 셋째, 연구자의 배경 학문 분야가 인 류학(anthropology)에서 왔거나, 전통적으로 질적인 방법을 이용하는 현상학이라 는 철학적 지향을 들고 있다. 

이러한 이유 중 어디에 속하느냐에 따라 여러 질적 방법론중 어느 방법에 의존할 것인가가 어느 정도 정해질 것이다.




우선 사례연구는 연구대상의 단위(unit)를 결정할 때 적어도 지리적으로 혹은 물리적으로 어느 정도 경계가 뚜렷한 경우를 의미한다. 사례의 크기는 천차만별 인데, 질적 연구를 할 때에는 대규모의 사례단위를 다루기는 쉽지 않다. 사례연구 란 이런 연구대상에 대한 관찰, 인터뷰, 자료분석 등을 통해 어떤 현상을 기록, 보 고, 진술하는 것이다. 실험이 자연과학에서 이론의 검증과 발전의 재료이듯이, 사 회과학에서는 관찰이 이론의 검증과 발전의 재료이고, 사례연구는 이 재료의 한 종류이다.13)


사례연구는 관찰의 보고 및 기록이고, 관찰은 어떤 시각과 관점이 없이는 이루 어질 수 없다. 이때 시각과 관점은 불가피한 선택이다. 포퍼는 관찰은 더욱이 관찰 진술이나 실험결과의 진술은 언제나 관찰된 사실의 해석이고, 이론에 비추어본 해석이라고 말한다. 뒤집어 본다면 이론(혹은 가설)이 없으면 어떤 의미 있는 해석 도, 관찰도 이루어질 수 없다는 뜻이다(최병선, 2006).




다음으로, 문화기술적 연구방법은 사회집단의 총체적인 문화(holistic culture), 즉 집단구성원들의 행위, 신념, 가치, 그리고 그러한 것들을 구성하는 문화적 요소들 을 종합적으로 기술하여 이해하고자 한다(남궁근, 2004). 이 경우 특정 민족집단, 원시사회, 갱(gang)집단과 같은 특수하위집단을 대상으로 심층연구하기 때문에 전술한 사례연구의 범주에 들어간다.


문화기술적 방법에서는 인간의 행위는 맥락적 성향(contextual orientation)이 있 다고 본다. 즉, 인간의 행위는 사회문화적 환경의 맥락에서 형성되며 모든 인간사 는 문화와 분리될 수 없다는 의미이다(남궁근, 2004). 따라서 이 연구에서는 사회 문화적 유형이 행위자들의 활동을 어떻게 규정하는가에 관심을 갖게 되며, 활동 이 일어나는 상황과 조건들에 집중한다. 문화기술적 연구는 양적 연구와는 달리, 사전에 연구가설을 명확하게 설정하지 않고, 자료를 수집하면서 연구가설을 명확 하게 하고 이에 따라 연구전략을 수시로 수정하는 전형적인 질적 연구방법의 특징을 가지고 있다(남궁근, 2004).




질적 연구 방법론의 의미 있는 또 다른 전통으로서, 근거이론(grounded theory)을 꼽지 않을 수 없다. 근거이론 접근법은 수집한 자료로부터 귀납적으로 이론을 개 발하는 방법이다. 연구자는 자료를 수집하고, 그 자료에 기초하여 가설을 설정하 고, 그 자료를 이용하여 가설을 검증하며, 이론을 개발하려고 시도한다(이종규, 2006). 이렇게 개발된 이론이 근거이론인데, 이는 이론이 특정한 상황에서 도출되 었고 그것에 직접 근거(grounded)하기 때문이다. 근거이론의 연구 절차는 매우 엄 격한 단계를 거치게 된다. 근거이론 방법을 개발한 Glaser와 Strauss는 근거이론 연구의 일곱 가지 주요단계를 제시했다.(남궁근, 2004:317~320)


첫째, 관심주제 선정를 선정한다. 중요한 것은 근거이론 연구에서는 미리 설정 된 가설을 가지고 연구주제를 선택하지 않고 연구를 시작한다. 이렇게 이미 시작 한 연구과정에서 수집한 자료로부터 비로소 가설이 도출되어야 한다. 그러나 반 드시 가설이 있어야 하는 것은 아니다.


두번째로는 연구목적을 결정해야 한다. Glaser와 Strauss는 근거이론의 목적을 

  • 초기증거의 정확성 평가, 

  • 경험에 기초한 일반론의 확립, 

  • 개념의 확인, 

  • 기존이론의 검증, 

  • 새로운 이론 형성 

등 다섯 가지로 제시하고 있다. 


이 중 어느 것 을 연구목적으로 해도 좋은 논문이 될 수 있다. 그러나 이 가운데 가장 중요하고 궁극적인 것은 새로운 이론 형성이다.


세번째로 연구대상 집단을 선택한다. Strauss와 Corbin은 이를 이론적 표본추출 의 문제라고 불렀는데, 이는 연구주제에 관한 상당량의 정보를 제공할 수 있는 대 상을 선택하는 과정이라고 정의할 수 있다. 연구대상의 크기는 연구목적이나 자 연상태의 (연구대상가능) 집단의 크기에 달려 있다. 표본은 미리 몇 개로 정하는 것이 아니고, 대략 몇 개 정도라고 생각하고 시작하는 정도이다. 실제로 표본추출 과정은 한 차례에 끝나는 것이 아니라 연구가 진행되면서 새로운 표본을 추가로 선정한다. 필요에 따라 더 필요한 표본을 추가시키는 방법인 눈덩이(snow ball) 만 들기와 같은 것이다.


네번째로 실제로 연구자료를 수집한다. 이 때 자료는 인터뷰, 회의록 등 언어로 된 것이 지배적이다. 이를 풍부히 획득하는 것이다. 그런데 근거이론 방법이 가진 뚜렷한 특징 중 하나는 자료수집, 코딩, 그리고 해석 단계가 별개로 진행되는 게 아니라 동시에 진행된다는 점이다. 이러한 과정은 조사 시작부터 끝까지 상호 교 차적으로 진행되어야 한다. 따라서 예컨대 학위논문 논문프로포절을 할 때는 상 술한 3번째 단계까지 하고 가상적 설계를 하는 것이 아니라, 초보적이나마 어느 정도 연구를 진행한 상태에서 하는 것이 더 확실한 방법이다.


다섯째, 자료의 개방된 코딩단계이다. 개방형 코딩은 자료분석의 첫 단계이며 그 궁극적인 목적은 범주를 발견하고 설정하는 것이다. 자료분석을 진행하면서 새로운 자료를 범주와 대비하여 검증함으로써 연구자는 범주를 종합하고, 단순화 시키고, 축소하여 핵심개념으로 정립해 나간다.


여섯째, 자료의 이론적 코딩으로 이론적 또는 선택적 코딩은 자료의 최종적인 구조를 확정하고 개념적 범주들을 중요성에 따라 순위를 매기는 과정이다. 연구 자는 소수의 핵심범주를 제시하고, 수집한 자료 중 이에 적합한 자료를 골라낸다. 이 과정을 반복하여 모든 자료가 범주화될 때까지 계속한다.


마지막 단계는 새로운 이론을 개발하는 과정이다. 연역적 방법이 아닌 귀납적 이론개발이기 때문에 연구자의 사유(speculation)능력이 연구의 질을 좌우한다. 이 와 같이 개발된 근거이론은 다음과 같은 특징을 갖추어야 한다. 

  • 첫째, 이론이 연구 주제 및 학문분야와 부합하는 것이어야 한다. 

  • 둘째, 그 이론은 연구 상황의 참여자 들이 이해할 수 있어야 하며, 그들에게 유용해야 한다. 

  • 셋째, 이론은 연구대상 영 역의 상당 부분을 설명할 수 있을 만큼 복잡한 것이어야 한다.




세 번째의 질적 연구방법으로는 행위 연구(action research)를 들 수 있다. Crozier (1964)의 행위연구는 인간의 행위를 체제론적 입장에서 연구하는 것이다.15) 행위 자의 생각보다는 실제로 행위한 결과만을 가지고 분석을 한다는 점에서 실증적이 면서 질적인 연구방법이다(임도빈, 2004;2009). 행위체제론에서는 조직구성원 개 인의 행위를 중시하여 실제로 일어난 조직의 상황을 충분히 고려하여 조직인들의 전략과 조직인들이 벗어날 수 없는 제약점을 본다. 이를 통하여 일종의 반복적인 행위전략들의 총합으로서 행위체제를 이해하는 것이다. 이는 현실에 밀접한 근거 를 둔 조직분석으로서 개인의 생각을 중시하는 포스트모던식 조직이해와는 구분된다. 즉, 주관성을 강조하는 질적인 방법론과는 달리 이런 점에서 행위체제론은 실증적이면서 객관적인 방법이라고 볼 수 있다.




네 번째로 행정학에 있어서 현상학적 방법의 가능성을 탐색하는 것도 실증주의 적 연구경향이 지배적인 한국행정학계에서 의미 있는 일이다.


최근에는 사례조사가 현상학적, 비판이론적 방법론에 적합한 것으로 인식되어 그 중요성이 새롭게 부각되고 있다(Hummel, 1991:31-32; 박병식, 1993:26 재인용).


끝으로, 해석학적 관점은 중요문헌과 서적, 서면 등으로 전달된 의미를 해석하 고자 한다(안영섭, 1996). 해석학은 19세기 성서를 분석했던 독일의 신학자들에 의 해 시작되었다. 그 이후 법규, 고전문학작품 등과 같이 문헌류에 부여된 의미들을 보다 잘 이해하기 위해서 자료에 대한 해석학적 접근이 시도되었다. 최근 사회과 학 연구자들은 성서해석에서 출발한 해석학의 응용영역을 확대하여 세속적인 문 헌을 해석하려고 시도한다(남궁근, 2004).






4. 좋은 질적 연구결과물의 요건


질적인 연구방법론에 입각하여 수행된 결과물에 양적인 결과물과 다른 기준으 로 판단해야 한다. 특히 학술지 논문심사에서 질적 연구방법론을 잘 이해하지 못 하는 심사자들이 맥락에 맞지 않는 평가를 하는 경우가 많이 있다. 그런데 질적 연 구물이 논문이 되었든 보고서가 되었든 전형적인 표현형식은 존재하지 않는다. ‘이론적 배경→가설→표본추출→가설검증→결론’ 으로 이어지는 전형적인 가설 검증적 양적 연구에 비하여 자유로운 편이다. 따라서 이런 기준으로 질적 연구물 을 판단하는 것은 학문발전을 저해하는 요소이다.


그럼에도 불구하고 질적 연구는 무형식에, 아무것이나 해도 되는 것은 아니다. 질적 방법론 나름대로 갖추어야 할 사항이나 조건이 있는 것이다. Lawrence F. Locke, Stephen J. Silverman & Waneen Wyrick Spirduso(2004:214~215)이 주장하는 질 적 연구물이 담아야할 내용은 다음과 같다.


  • 첫째, 어느 것을 연구했는가 연구대상에 대한 설명이 필요하다. (You should find a description of the provenance of the study and what is about). 연구대상의 독특성이 연구의 핵심이 되기 때문이다.

  • 둘째, 정보(자료)가 수집된 맥락에 대한 설명이 있어야 한다. (You should find a description of the context in which the data were collected). 같은 정보라고 하더라도 그 의미나 가치가 맥락에 따라 다르기 때문이다.

  • 셋째, 위와 같은 맥락에서 과연 누가, 무엇을, 언제, 어떻게, 왜 했는가에 대한 설 명이 있어야 한다. (You should find an account of what was done in that context)

  • 넷째, 실제 획득한 1차 정보가 제공되어야 한다. (You should find presentation of actual data) 비록 지면의 제약이 있다고 하더라도 인터뷰 내용 등 1차 정보가 어느 정도 제공되어야 그 내용이 실감 있게 전달된다. 핵심이론부분만 서술하지 왜 인 터뷰 내용을 넣느냐고 지적하는 것이나, 아니면 저속한 용어를 학술논문에 넣는 다고 비판하는 것이 적절치 않다.16)

  • 다섯째, 이런 과정을 통해 얻은 지식을 하나 또는 복수이상의 결론으로 요약해 야 한다. (You should find an explicit effort to summarize as well as articulate, one or several conclusion)


이상의 내용은 보통 양적인 연구에서는 익명성이나 주관성의 배제를 보장하기 위해 연구물에 포함시키지 않는 내용들이다. 반면 양적 연구에서 중시하는 가설 설정이나 표본의 대표성 확보문제는 중요하지 않다. 따라서 질적인 접근법을 연 구물을 심사할 때 기고자와 심사자간에 갈등이 발생하는 것이 드물지 않은 것이 다. 질적인 연구방법에 이해가 부족한 사람은 질적 연구물에 대한 심사를 자제해 야 될 것이다.


그러나 질적인 연구가 제대로 되기 위해서는 외부 심사자의 기준보다는 연구자 자신의 윤리가 더욱 중요하다. 윤리성이 확보되지 않은 질적인 연구는 인권의 침 해는 물론이고 연구의 내용을 왜곡시키게 된다. 즉, 자칫 잘못하여 질적인 연구를 남용하면 거짓연구를 양산하게 될 것이다. 양적연구에 치우친 학계의 풍토를 감 안하면 질적 연구방법론의 확산도 중요하지만, 윤리성이 확보되지 않은 한국학술 풍토에서는 매우 주의를 요한다.


우선 연구자는 본인의 연구가 어떤 목적을 갖고 있으며, 그 연구에 누가 관심을 갖고 있고 있으며 이해관계가 있는지 등을 염두에 두고 연구를 진행해야 한다. 모 든 학술연구가 연구자 윤리를 요구하겠지만, 질적 연구에서는 특히 연구자의 윤 리가 중요하다. 이는 질적 연구의 특성상 연구 대상에 대한 직접적인 면담과 관찰 등으로 인해 프라이버시 침해 등의 직접적인 문제를 야기할 수 있기 때문이다. 연 구대상자도 모르는 사이에 요즘 잘 발달된 녹음기구인 MP3기기와 같은 것으로 녹음하는 것은 명백히 연구윤리를 어기는 것이다.


연구진행과정에서는 질적 연구는 풍부하고 세밀한 속성을 지니고 있으며, 분석 또한 이러한 세밀성을 활용하는 것을 강조한다. 그러므로 연구에 관련된 사람들 의 비밀이나 사생활권을 보호하기가 양적 연구에 비해 어렵게 된다. 질적 연구의 특성상 연구 대상자와 친밀한 관계가 발생할 가능성이 있지만, 이 경우에도 연구 자는 이러한 관계를 공식적인 목적을 위해 활용할 의도를 지닌 전문가일 수밖에 없다. 따라서 이 문제는 연구가 진행되는 동안 계속해서 고민해야 할 부분이다. 더 중요한 것은 연구결과물의 발표단계이다. 연구결과물에서는 전술한대로 생생한 1차 정보를 제공해야 한다는 요건과 연구자의 익명성과 정보비밀의 원칙을 확보 해야 한다는 상반된 요건을 충족시켜야 한다. 더구나 연구자가 고의든 실수든 인 터뷰내용을 다른 맥락에서 사용함으로써 의미를 완전히 왜곡시킬 수 있다.17) 런 오류를 최소화하는 방법은 인터뷰나 관찰 대상이었던 본인들에게 연구논문을 읽히는 것이다. 대부분의 경우 당사자들은 자신이 한 얘기를 불리한 것은 삭제토 록 요구한다. 그러나 연구자와 대상자간에 충분한 대화를 통해 이를 만족할 만한 수준으로 하는 것이 필요하다.


또한 질적 연구는 매우 노동집약적인 연구이기 때문에 실행하기 어려움에도 불 구하고 남용 내지 오용될 소지가 많다. 본인이 현장조사를 직접 해야 가장 신뢰할 수 있으므로 다른 연구보조자에게 현장조사를 대신하게 하면 바람직하지 않다.


그런데 심층면접이나 관찰에 많은 시간이 소요되는데, 이를 실제로 준수하지 않 고 마치 한 것처럼 거짓진술을 하는 경우가 생긴다. 예컨대 실제로는 3명 정도 인 터뷰를 했는데, 일반화가능성에 대한 비판을 피하기 위해 20명을 인터뷰했다고 과장하는 것은 흔히 있는 일인 것 같다. 더 나아가서 하지 않은 말을 한 것처럼 꾸 며 내거나 문장을 의도적으로 바꾸는 행위도 드물지 않다. 사실 연구대상은 현실 은 이론과 같이 잘 정리된 것이 아니라 모순이 얽혀있는 복잡한 것이기 때문에 전 술한 부정합성의 원칙(The machinary of What Does Not Fit)이 많이 발견된다. 그런 데 이를 해결하기 위해 추가적인 인터뷰를 더 하든지, 이론적 사유(speculation)를 하기 위해 시간을 충분히 갖지 않고 성급하게 연구결과를 발표하려 든다. 여기서 정보의 고의적 누락이나 선택의 문제와 왜곡의 문제가 발생하는 것이다.


이런 점을 감안하면 진정한 질적 연구를 진행하는 사람이 일 년에 서로 다른 주 제의 논문이 여러 편 발표되는 다산(多産)은 거의 불가능하다. 이렇게 실제로 이러 한 노력을 기울이지 않았음에도 불구하고, 한 것처럼 위장하는 것은 표절보다 더 무거운 도덕적 윤리적 기준에 어긋나는 것임을 명심해야 할 것이다. 연구윤리가 담보되지 않으면 질적 연구는 사상누각에 불과하고, 진행하지 않는 것이 오히려 낫다.




Ⅳ. 맺는말


일단 질적 연구가 활성화 된다는 전제하에 좋은 질적 연구 를 활용하고 감상하는 방법은 다음과 같다.(Lawrence F. Locke, Stephen J. Silverman & Waneen Wyrick Spirduso, 2004:216~219)


- 연구자의 특성에 대해서 얼마나 잘 알아냈는가? : 질적 연구에서는 연구자가 연 구대상과의 거리를 두고 객관적인 관찰을 하는 것이 불가능하다고 봄으로, 연구 자의 주관적 특성을 이해하고, 그것이 얼마나 연구대상(내용)에 영향을 미쳤는 가를 감안할 수 있도록 이를 파악하는 것이 중요하다. 그래야 소위 ‘객관적’인 내용과 아닌 것과 다른게 비중을 두어 이해할 수 있다.


- 실제 연구에서 얻은 정보를 지칭하는데 얼마나 자주 어떤 단어나 표현을 쓰는가 를 알 수 있어야 한다 : 즉, 어떤 실제 현상에 대한 명명(naming)이 중요하다. 실제 무엇이 일어났는가, 무엇을 실제로 했는가, 어떻게 그것이 작동했는가, 어디에 서 그런 것이 일어났는가 등에 대한 정보가 있다. 예컨대 인터뷰의 실행시 행위 가 일어난 시간의 차원에 주의해야 한다. 주요 정보제공자가 제공해주는 정보는 시간차원에서 혼돈적인 것이 많다. 예컨대 공식적인 계획이 마치 일부 실현된 것처럼 과장하는 경향이 있다. 흔히 정부의 보고문서에도 보면 앞으로 할 일, 아직 진행되고 있는 것도 마치 실적(實績)인 것처럼 포장되어 있는 경우가 많다.


- 연구과정(연구방법이나 연구설계)에서 다른 대안을 얼마나 폭넓게 검토하여 특 정방법을 사용했느냐와 결과의 해석에서 얼마나 개방적으로 대안적 설명들을 충분히 찾았는가가 중요하다.


- 얼마나 생생하게 연구대상의 맥락, 참여자, 연구자, 사건에 대해 묘사했느냐가 중요하다. 양적 연구에서는 설명이나 해석에서 간결하고, 중립적이고, 명확한 표현이 바람직한 조건으로 꼽힌다. 그러나 질적 연구에서는 있는 그대로 생생하 게 표현을 하는 것이 바람직한 요건이다. 1차 자료에서 얻은 것을 인용문 등을 적절히 제시하고 있는지를 보고 판단할 수 있다.








기획논문 「정부학연구」 제15권 제1호(2009): 155~187 원고투고일: 2009. 3. 15

원고수정일: 2009. 3. 29

게재확정일: 2009. 4. 10

질적 연구 방법의 내용과 적용전략:

양적인 질적 연구와 질적인 질적 연구*

1)임도빈**


이 글은 최근 행정학계에서 관심이 제고되고 있는 질적 연구가 무엇인가에 대해 깊이 있는 소개를 하는 것을 목적으로 한다. 우선 흔히 질적인 연구라고 일컬어지는 것중 많은 부분이 양적인 질적 연구로서 협의의 질적인 연구와는 구분됨을 주장한다. 아울러 진정한 질적인 연구란 무엇인가에 대한 논의를 한다. 즉 질적 연구가 가져야 할 요건, 질적인 연구를 해야 하는 이유, 질적인 연구의 구체적인 유형 등을 제시한다. 구체적으로는 연구대상에 대해 얻은 자료를 계량화하는 방법으로 가공을 하느냐의 여부와 논문의 핵심 주장부분을 통계적 유의성 검증에 의존하느냐의 여부가 질적 연구인가 아닌가의 판단기준이 된다. 이런 기준에 의하면 계량적 실증적 연구에서부터 완전한 질적인 연구까지 다양한 연구유형이 존재한다. 이와 같이 질적인 연구가 다양하고 광범위함에도 불구하고, 좋은 질적인 연구란 평가하는 기준이 양적인 연구의 평가기준과는 다름을 제시한다. 마지막으로 질적인 연구는 무엇보다도 연구윤리의 확보가 치명적임을 주장한다. 


주제어: 질적 연구, 연구기준, 연구방법론



논문 프로포잘 양식(질적 논문)


1. 연구제목 혹은 주제

2. 연구의 필요성과 목적

3. 연구 맥락을 이해하기 위한 문헌고찰 / 선행연구의 개관

4. 연구문제 / 연구 질문

5. 연구방법: 방법, 참여자, 표집, 자료수집방법, 분석방법, 연구의 윤리

6. 연구의 타당성

7. 예비결과

8. 연구의 의의

9. 참고문헌

10. 부록

※ 프로포잘 작성의 구체적인 예는 다음 자료를 참고하시기 바랍니다.



합의적 질적 연구법(Consensual Qualitative Research)을 사용하는 논문계획서 작성기준


● Przeworski와 Salomon(1988)은 모든 논문계획서를 심사하는 사람들이 다음 세 가지 질문에 대한 해답을 찾는다고 한다. 


1) 제안된 계획서의 결과로서, 지금까지 알고 있지 못했던 어떤 것을 우리는 알 수 있게 되는가? 

2) 왜 그것은 알만한 가치가 있는가? 

3) 그 결과가 타당하다는 것을 우리는 어떻게 알 수 있는가?


첫 번째와 두 번째 질문에 대한 해답은 연구자들이 자신이 연구하려고 하는 주제 에 대해 기존의 이론이나 선행연구들을 충실하게 검토하면 할수록 더 명확하게 전 달될 수 있다. 연구자들은 선행연구들을 존중하면서도 한편, 비판적인 안목을 갖고 그것의 한계와 문제점을 인식할 수 있어야 한다. 질적 연구에서는 선행연구 뿐 아 니라 연구자 자신의 개인적 경험에 대한 반성과 실천적 목적에 대한 고려도 중요하 다. 이러한 과정을 통해 나온 연구 질문이라야 자신의 연구의 정당성과 가치를 방 어하고 입증하기 쉬울 것이다. 또한, 연구는 어떤 현상에 대한 새로운 지식이나 통찰 그리고 가치와 의미를 제시할 수 있어야 한다.


세 번째 질문에 대한 해답은 질적 연구에서 특별한 의미를 갖는다. 연구의 타당 성을 확보하는 질적 방법론의 절차를 심사자들에게 이해시키기 위해서, 연구자는 양적 연구방법과 질적 연구방법의 철학적, 방법론적 차이를 명확히 이해하고 있어 야 한다. 타당성과 관련된 문제는 뒤에서 다룰 것이다.


● 논문계획서에는 연구자 자신의 아이디어를 논리적으로 전개해야 한다. 기존이론 이나 선행연구들, 연구방법론에 대한 지식을 백화점식으로 나열해서는 안 된다. 자 신의 연구문제를 도출해내게 된 개인적 경험, 실천적 이유, 그리고 기존이론 및 선 행연구들의 모순이나 한계를 보여주는 것이 더 설득력 있을 것이다.


CQR은 비교적 협소한 특정현상(예로, 상담관계에서 일어나는 전이현상)을 경험 한 소수의 참여자들을 집중적으로 연구하는데 적합한 질적 연구방법이다. 분석 데 이타는 대개의 경우 참여자들의 언어적 자료이며, 다수의 공동 평정자 및 감사들을 활용함으로써 연구의 타당성을 확보하려고 한다. 연구자는 자신의 연구목적을 달성 하는데 CQR이 적당한 방법인지 검토해야한다.


1. 서론 / 연구의 목적과 필요성


서론에는 연구자가 어떤 현상을, 왜 연구하고 싶은가에 대해 개요를 기술한다. 여기에서는 연구의 목적이 명확히 제시되어야 한다. 질적 연구의 목적은 연구적 목 적과 더불어 개인적 목적이 포함될 수 있다. 

  • 연구적 목적에는 특정한 경험을 가진 참여자들의 경험에 대한 의미의 이해, 그러한 경험을 발생시키는 맥락에 대한 포괄 적인 이해, 특정사건이 발생하는 과정에 대한 이해 등이 포함된다. 

  • 개인적 목적에는 연구자들이 이 연구를 하도록 동기화시키는 사적경험들, 실천적 이유들이 포함될 수 있다.


또한 연구의 필요성 혹은 정당성에 대해 설명하여야 한다. 기존의 이론이나 연구들의 한계(기존 연구의 부족도 포함) 혹은 기존 연구자들의 추후 연구를 위한 제안 사항, 개인적 경험 등이 연구의 필요성을 설명하기 위해 언급될 수 있다. 이 연구를 통해 얻을 수 있는 새로운 지식과 이해가 가치 있는 것인가? 누구를 위해 그리고 어떤 방식으로 유익한가에 대한 설득력 있는 논리를 개발하는 것이 필요하다.


2. 연구맥락 / 선행연구의 개관 및 문제점


자신이 연구하고자 하는 현상 혹은 문제에 대한 선행연구와 이론들을 논의한다. 그러나 이론이나 선행연구를 단지 요약하거나 제시해서는 안 되며, 자신의 연구에 대한 토대와 정당성을 확보하기 위한 근거로서 이들을 활용해야 한다. 질적 연구에 서 연구자는 문헌을 무비판적으로 따르기 보다는 비판적인 주관성을 갖고 문헌으로 부터 쟁점과 한계를 읽는 눈을 계발해야한다. 이를 위해 연구자는 연구현상에 대한 자신의 개인적 경험과 지식을 적절히 활용할 필요가 있다.


3. 연구문제 / 연구질문


연구 질문은 연구계획서의 가장 핵심적인 부분이다. 연구 질문은 연구의 목적이 나 필요성과 논리적으로 연결되어야한다. 즉, 이러한 연구 질문이 연구의 목적을 달 성할 수 있는 응답을 이끌어 낼 수 있는가 계속해서 질문해야 한다.


좋은 연구 질문은 명확하게 초점이 있어야 한다. 특히 CQR은 비교적 좁은 범위 의 현상을 집중적으로 연구하는 방법이므로 주제에 대한 물음들을 미리 만들어 보 는 것이 좋다. 그러나 명확하게 초점이 있는 질문과 지나치게 구체적인 질문 혹은 연구자의 의도를 이끌어내는 질문을 잘 구분해야한다. 질문은 개방적이어야 하지만 연구의 초점에 대한 일관성 없이 마구잡이식의 자료 수집은 곤란하다.


연구계획서에 포함될 초기 질문은 대략 3-5개 정도가 적당하다. 초심연구자들이 라면 초기질문에 대한 하위질문들을 미리 만들어보는 것이 좋다. 연구 질문은 인터 뷰가 진행됨에 따라 달라질 수 있으나, 초기 질문은 연구하려는 현상에 대해 연구 목적과 관계된 대답을 이끌어 낼 수 있도록 중요한 초점들을 담고 있어야 한다. 비연구를 수행하고 있다면, 인터뷰 전과 후에 연구자가 생각한 질문내용이 어떻게 변화했는지를 계획서에 제시하면 더 설득력이 있을 것이다. 이 밖에 연구 질문과 관련된 주의사항은 질적 연구 방법론 책들을 참고하기 바란다.


4. 연구방법 / CQR소개, 연구참여자, 표집, 자료수집방법, 분석방법, 연구의 윤리.


연구방법에는 우선 자신의 연구목적을 이루기 위해 왜 질적 연구를 그 중에서도 CQR을 선택했는가를 설명한다. 어떤 방법론을 선택할 것인가는 연구의 목적 그리 고 질문과 논리적인 연결이 이루어져야 한다.


연구 참여자들과 연구자간의 관계에 대해 제시한다. 만약, 이중적 관계(예를 들 어,연구자와 상담자 혹은 치료자)에 놓여있다면, 그로인한 윤리적 문제나 연구타당 성 문제를 어떻게 해결할 수 있는지 방안이 제시되어야 한다.


CQR에서 연구 참여자의 표집은 목적적 표본 추출 방법을 사용한다. 이것은 특정 한 기준에 부합되는 사람들을 연구 참여자로서 선정하는 것을 말한다. 연구 참여자 는 연구하려는 현상을 경험했어야 하며 그것을 적절히 표현할 수 있는 사람이어야 한다. 연구현상에 대한 경험이 최근이어야 한다(예로 3개월 이내)는 기준을 정할 수 도 있다. 중요한 점은 연구 참여자는 연구자가 연구 질문에 대한 대답 을 얻을 수 있는 사람이어야 한다는 것이다. 연구 참여자의 대표성 혹은 전형성은 연구의 타당성이나 일반화 가능성(물론 질적 연구에서 일반화가능성은 그리 중요한 이슈가 아니다)을 높일 수 있다. 계획서에는 왜 이 사람들을 특정한 세팅에서 인터 뷰하려고 하는지를 설명한다.


CQR에서 자료수집 방법은 대개 언어적 자료에 의존한다. 인터뷰를 통한 녹음, 메모 등이 주요도구가 된다. 그러나 자료수집에서 삼각검증(triangulation)으로 알려 진 다층적 자료 수집을 할 수 있다면, 결과의 타당성을 확보하는데 좋은 근거가 된 다. 예를 들어, 명상경험에 대한 질적 분석에서 참여자 뿐 아니라 지도자로부터도 자료를 모은다면 더 타당성 있는 결과를 얻을 수 있을 것이다.


CQR의 자료분석 방법은 체계적인 절차를 제공해주고 있으므로 초심자들도 비교 적 손쉽게 따라할 수 있을 것이다. 공동 평정자 팀 및 감사의 구성을 어떻게 할 것 인지 기술한다. 영역설정, 중심개념, 범주생성, 교차 타당화, 감사과정, 데이터의 패 턴 발견하기(예를 들어 영역들 간의 경로생성) 등의 자료 분석 절차를 간단히 제시 한다.


5. 연구의 타당성


연구자는 자신의 연구에서 타당성을 훼손할 수 있는 요소들을 제거하는데 최선의 노력을 해야 한다. 연구 설계 단계에서 타당성 위협요소를 통제하려는 양적 연구와 달리, 질적 연구에서 결과의 타당성과 관련된 가장 중요한 문제는 자료로부터 도출 된 연구결과(연구자의 해석, 설명, 도출한 패턴 등)와는 다른 대안적인 가설들을 어 떻게 배제시킬 것인가이다. 연구자는 우선 데이터를 분석하여 결론을 도출한 후, 도 출된 결론을 반증하는 데이터가 있는지를 면밀히 재검토해야 한다. CQR에서 이러 한 작업은 연구자, 공동 평정자 그리고 감사의 공동과업이기도 하다.


질적 연구의 타당성을 위협하는 가장 큰 문제는 연구자의 편견과 반응성이다. 연 구자들(공동 평정자와 감사를 포함한)은 연구하려는 현상(혹은 연구 참여자들)에 대 한 각자의 이론이나 선입관을 충분히 인지해야 하며(하나의 방법으로 자료 분석전 메모를 활용하여 편견들을 적고 함께 논의할 수 있다), 연구자가 연구 참여자에게 미치는 영향인 반응성에 대해서도 고려해야 한다. 질적 연구에서는 연구자가 연구 참여자에게 미치는 영향을 최소화하려는 노력을 하는 대신, 이를 이해하고 생산적 으로 활용하는 것이 중요하다(예를 들어 연구문제가 사회적 혹은 도덕적으로 민감 한 문제라면 면접에서 나온 결과보다는 질문지를 활용하는 것이 더 나을 수 있다).


이 밖에 질적 연구의 타당성을 확보하는 방법으로 삼각검증(자료수집의 다양화), 참여자선정에서 엄격한 기준제시, 다수평정자의 사용, 참여자 확인(도출된 결과를 참여자에게 확인하는 것), 양적인 자료들의 활용 등이 있다.


6. 예비결과


연구자가 이미 연구를 시작했다면, 지금까지의 연구과정과 잠정적인 연구결과 그 리고 본 연구를 위한 제안사항 등을 제시할 수 있다. 예비연구는 연구의 실행가능 성을 증가시키고, 연구 질문을 정교화하며, 연구의 필요성과 가치를 부각시킬 수 있 다는 점에서 적극 추천한다. 질적 연구에서는 1-2명 정도의 참여자를 대상으로 자 료를 모으는 것으로도 자신의 연구전반에 걸친 훌륭한 통찰을 얻어낼 수 있을 것이 다.


7. 연구의 의의


여기서는 앞에서 논의된 연구의 목적, 필요성, 그리고 연구의 예상되는 공헌 사항 들을 제시한다. 이와 같은 연구를 해서 무엇을 하자는 것인가? 에 대한 답변들이 있어야 한다.


8. 참고문헌


9. 부록


부록에는 연구 진행 계획표, 연구참여동의서, 설문지(참여자들의 인구통계학적 자 료수집을 위한), 인터뷰 질문항목들, 예비연구가 있다면 참여자 정보, 메모노트 등 이 포함된다.



160517 국문참고문헌 2. 논문 프로포잘 양식(질적연구 CQR).pdf


설문 시행, 분석, 보고 (BMJ, 2004)

Administering, analysing, and reporting your questionnaire

Petra M Boynton






파일럿 시행

Piloting


파일럿 검사를 시행할 때 일반적 형식에 대해서, 그리고 구체적 질문에 대해서 설문응답자들이 어떻게 반응하는가를 자세히 기록해야 한다.

During piloting, take detailed notes on how partici- pants react to both the general format of your instrument and the specific questions.

  • 얼마나 오래 걸리나 How long do people take to complete it?

  • 질문을 반복 또는 설명해줘야 하나 Do any questions need to be repeated or explained?

  • 어떻게 답을 골랐는가 How do participants indicate that they have arrived at an answer?

  • 특정 질문에 혼란 또는 놀랐는가 Do they show confusion or surprise at a particular response—if so, why? Short, abrupt questions may unintentionally provoke short, abrupt answers.



자료 수집 계획

Planning data collection


데이터 보호와 관련된 법률, 그리고 기관 차원의 규약code를 따라야 한다.

You should be aware of the relevant data pro- tection legislation and ensure that you follow internal codes of practice for your institution—


파일럿팅 단계에서는 설문을 어떻게 배포하고 다시 받을 것인지를 점검해야 한다.

The piloting phase should include planning and testing a strategy for getting your questionnaire out and back—for example,

  • 누구에게 응답을 요청할 것인가 who you have invited to complete it (the sampling frame),

  • 누가 응답해 주었는가 who has agreed to do so (the response rate),

  • 응답은 활용 가능한 형태로 왔는가 who you’ve had usable returns from (the completion rate), and

  • 언제 reminder를 줄 것인가 whether and when you needed to send a reminder letter.


행정적 실수도 연구 프로세스 진행을 방해hamper할 수 있다.

Administrative errors can hamper the progress of your research.

 


 

설문 시행

Administering your questionnaire



과학적, 윤리적 고려에는 다음을 포함해야 한다.

Scientific and ethical considerations should include:


  • 설문응답자의 니즈와 선호,
    The needs and preferences of participants,

  • (응답자는) 자신에게 요구되는게 무엇인지 알아야 함
    who x should understand what is required of them;

  • (응답자는) 설문 진행과정에서 흥미를 보이고 협조적이어야 함
    remain interested and cooperative throughout completion;

  • (응답자는) 적절한 질문을 받아야 하며, 응답이 잘 기록되게 해야 함
    be asked the right questions and have their responses recorded accurately; and

  • (응답자는) 설문 작성 중, 작성 후에 적절한 서포트를 받아야 함
    receive appropriate support during and after completing the questionnaire


Table A  Pros and cons of different options for administering a questionnaire  

Method of delivery

Pros

Cons

Practical notes

By post

Participants are sent a copy of the questionnaire by post and asked to complete it and return it to the researcher.w5

 

Quick and easy to distribute.

 

Relatively inexpensive.

 

 

They are not useful for the study of very personal issues (without first giving the participant the option of taking part in the study) and have a notoriously low response rate since you are relying on the goodwill and co-operation of individuals.

Remember to enclose a detailed introductory letter, a complete, contact address, and a stamped addressed envelope so the participant does not have to pay postage.

 

You may need to send reminder letters and questionnaires to slow/non-responders.

By telephone

The researcher calls participants and completes the questionnaire over the phone, with the researcher reading out the questions and recording the answers.w6

 

Quick and easy to complete.

 

Relatively inexpensive.

 

 

Due to ethical constraints and sample bias these are used less within health research.

You cannot control for participant refusal, which is often high.

Not suitable for those with hearing problems.

Can become laborious if calling someone who is lonely and wants to talk.

Remember to contact participants by letter in advance of your call – and offer them a chance to opt-out of your study (and avoid your phone call).

 

Many ethics committees won’t permit a study where cold calling is the main design.

By email

Questionnaires are sent to participants via email for completion.w7

Easy to design and send out.

 

Can keep track on who has responded and who hasn’t, and send reminders.

 

 

Only suitable for participants with email access, and who can download a questionnaire.

 

Can lead to confusion, where participants print out questionnaire and answer it by hand, rather than on the computer.

See telephone interview above.  Participants need an introductory email announcing the research and an opt-out option.  Follow data protection legislation, and check sending emails don't breach confidentiality.

By a website

The questionnaire is placed within a website and participants are directed to this and invited to complete it. w8

A simple questionnaire can be easily designed and placed within a website.  Since sites offer more space, it’s possible to have more opportunities for qualitative feedback using this measure.

Participants are only those with access to the Internet.   You may find they are a non-representative sample since they’ll have a special interest for visiting your site (e.g. your site is about testicular cancer and they have a particular view about it, or experience of illness).  It is difficult to stop the same person answering the questionnaire a number of times over.

Check your site regularly to ensure you can access the questionnaire and that there aren’t any ‘bugs’ in it. 

 

Encourage participants to report problems with accessing the questionnaire online.

Participant completion with researcher present

The researcher can answer questions the participants may have, but the participant answers the questions.w2

The researcher is on-hand to offer support and explain any questions participants might not understand. 

 

They can also be sure that questionnaires are completed and collected.

Participants can inadvertently be ‘led’ by asking the researcher for advice on how to answer the questions.

Ensure your staff have training and support in how to deliver and code questionnaires and manage participants.16

Researcher Administered

The researcher asks the question and fills in the appropriate answers as directed by the participant.w9

The researcher can be certain the questionnaires are fully and accurately completed, and collected.

 

 

The researcher may ‘lead’ participants by their tone of voice or phrasing of questions.

 

Participants may not understand what is required of them and not answer in a ‘standardised way’.

As above.

 

If you are using standardised measures researchers have to read these out in exactly the same order as they appear written in the questionnaire.



응답률 높이기

Maximising your response rate


적은 숫자의 좋은 퀄리티의 응답이 많은 숫자의 낮은 퀄리티의 응답보다 낫다.

Note, however, that it is better to collect fewer questionnaires with good quality responses than high numbers of questionnaires that are inaccurate or incomplete. The third article in this series discusses how to maximise response rates from groups that are hard to research.15


응답을 거부한 사람

Accounting for those who refuse to participate


설문연구는 종종 응답을 수행한 사람에 초점을 둔다. 그러나 참여하지 않은 사람도 마찬가지로 동등하게 중요하며, 이들의 특성을 기록해두어야 한다.

Survey research tends to focus on people who have completed the study. Yet those who don’t participate are equally important scientifically, and their details should also be recorded (remember to seek ethical approval for this).41617



응답률을 높이는 요인 

Box 2: Factors shown to increase response rates


• The questionnaire is clearly designed and has a simple layout5
 • It offers participants incentives or prizes in return for completion6
 • It has been thoroughly piloted and tested5
 • Participants are notified about the study in advance with a personalised invitation7
 • The aim of study and means of completing the questionnaire are clearly explained89
 • A researcher is available to answer questions and collect the completed questionnaire10
 • If using a postal questionnaire, a stamped addressed envelope is included7
 • The participant feels they are a stakeholder in the study11
 • Questions are phrased in a way that holds the participant’s attention11
 • Questionnaire has clear focus and purpose and is kept concise7811
 • The questionnaire is appealing to look at,12 as is the researcher13
 • If appropriate, the questionnaire is delivered electronically14



비-완료 비율을 줄이기 위한 방법은 시작부터 엄격한 exclusion criteria를 세우는 것이다. 그러나 접촉하기 힘든 연구대상 그룹을 systematically 배제하는 것은 비윤리적이며, 추가적인 전략이 필요할 것이다.

One way of reducing refusal and non-completion rates is to set strict exclusion criteria at the start of your research. However, research that systematically excludes hard to reach groups is increasingly seen as unethical, and you may need to build additional strate- gies and resources into your study protocol at the outset.15


비-참여자 대상 자료 수집은 연구 프로세스 모니터에도 도움이 된다.

Collecting data on non-participants will also allow you to monitor the research process.



초반의 거절률이 이례적으로 높으면, 전반적 접근법을 다시 생각해봐야 한다.

In addition, if early refusals are found to be unusually high, you might need to rethink your overall approach.10


 

자료 입력, 확인, 클리닝

Entering, checking, and cleaning data



상당히 일이 많다.

In reality, entering, checking, and cleaning the data account for much of the workload. Some principles for keeping quantitative data clean are listed on bmj.com.



연구가 진행될 때 같이 정리해야지, 다 끝나고 해야겠다고 생각해서는 안된다.

It is good practice to enter data into an electronic database as the study progresses rather than face a mountain of processing at the end.




양적자료 다듬기 

Ways of keeping quantitative data clean10

 

1. Be as careful and accurate as possible when entering data into a database.

2. Take breaks. Fatigue causes mistakes.

3. Double check your questionnaire against the data you have entered. You can either do this with every questionnaire, or by picking a random sample and checking how accurately the data in the database matches the answers on the questionnaire.

4. If possible, get a colleague to work with you (eg read out answers from questionnaires to put into a database, or double-enter the data). Some statistical packages include a warning message or tone for double data entry.

5. Run statistical frequencies on all items and scan the results for obvious anomalies. Are any data missing? Are there numbers that don’t seem right (for example, on a questionnaire when participants can only give answers in the range of 1-5, are there any numbers outside that group in your database?). Go back to your coding sheets and check all anomalous data.

6. Create codes for missing data. This allows you to locate errors quickly. For example, if participants refused to answer, or couldn’t answer a question, or only answered part of the study, you can build in codes to account for this. Remember to make each code distinct, so they cannot be confused with numbers elsewhere in database.

7. For questionnaires that have sections that should add up, ensure the answers tally.

8. When answers are missing or don’t add up, take time to locate incorrect answers. Check your database regularly as you add data, so that when errors arise it doesn’t take too much work to find them.

9. Make a note each time you clean your data, and flag where you’ve got up to each time you work on your database. That way, when you find errors, you will have a more precise idea where to locate the problem.

See also www.uiowa.edu/~soc/datarespect/data_training_frm.html



자료 분석

Analysing your data


어떤 분석을 할 것인지를 미리 생각해야 함.

You should be able to predict the type of analysis required for your different questionnaire items at theplanning stage of your study by considering the struc-ture of each item and the likely distribution of responses (box 3).1 Table B on bmj.com shows some examples of data analysis methods for different typesof responses.18 19 w1 



Table B: Analysis options18 19 w1  w10

Type of response required from participant on the questionnaire

You can analyse this data using…

Binary or yes/no answers

c2 (chi squared), Spearmans, Wilcoxon, Mann Whitney, Kruskal Wallis etc.

Rating or visual scales

Pearsons, t test, analysis of variance (ANOVA) etc.

Open-ended (free text) replies

Thematic content or discourse analysis.




논문 작성과 보고

Writing up and reporting



연구방법 부분

Methods section


연구방법 부분은 배제 기준을 구체적으로 기술해야 하며, 이것이 transferability에 주는 영향을 기술해야 한다. 거절refusal 혹은 적합하지 않은unsuitable 참여자가 있다면 이들을 제시하고 논의해야 하며, 참여자 모집 다이어그램을 활용하는 것이 좋다 통계적, 양적 분석법을 기술하고 justify하라.

The methods section should give details of your exclu- sion criteria and discuss their implications for the transferability of your findings. Data on refusals and unsuitable participants should also be presented and discussed, preferably using a recruitment diagram.w2 Finally, state and justify the statistical or qualitative analyses used.18 19 w2



연구결과 부분

Results section

 


연구결과 부분을 정리할 때, 원래의 연구질문으로 돌아가서 이것을 설명해주는 관찰결과를 정리set out해야 한다. 다른 말로는, 결과가 가설로부터 유도된 것이어야 한다hypothesis driven. 유의하지 않게 나온 결과를 보고하는 것을 두려워하지 않아도 되며, 실제로 유의한 결과만큼 중요할 수 있다. 모든 질문에 대해서 다 분석하고 보고하지 말아라

When compiling the results section you should return to your original research question and set out the find- ings that addressed this. In other words, make sure your results are hypothesis driven. Do not be afraid to report non-significant results, which in reality are often as important as significant results—for example, if partici- pants did not experience anxiety in a particular situation (box 4). Don’t analyse and report on every question within your questionnaire


가장 통계적으로 적합하면서 시각적으로 매력적인 형식의 그래프나 표를 사용하라. 그래프의 각각의 축에 대해서 라벨을 붙이고, 의미가 잇는 제목을 달아라. 표를 refer하고 주요 결과를 강조하라.

Choose the most statistically appropriate and visu- ally appealing format for graphs (table). w3 Label graphs and their axes adequately and include meaningful titles for tables and diagrams. Refer your reader to any tables or graphs within your text, and highlight the main findings.


개방형 질문을 했다면 결과 부분에서 cherry pick하지 말아라. 어떤 주제가 등장했는지를 outline해야 하며, 그 주제와 질적 관찰결과를 보충할 수 있는 quote를 사용해야 한다.

If you have used open ended questions within your questionnaire, do not cherry pick quotes for your results section. You need to outline what main themes emerged, and use quotes as necessary to illustrate the themes and supplement your quantitative findings.



고찰 부분

Discussion section


고찰 부분은 결과 부분으로 돌아와서 주요 결과가 무슨 의미인지를 제시해야 한다. 연구의 한계를 인정하고, 이 관점에서 couch the discussion해야 한다. 만약 설문 응답률이 낮으면, 이 preliminary result를 확인하기 위한 추가 연구를 제안해야 한다. 연구의 conclusion은 연구의 scope을 벗어나서는 안된다. 소규모의 지역에 국한된parochial 연구를 했다면, 국가적 정책을 제안해서는 안된다. 지속적으로 응답을 거절한 참여자, 혹은 기대했던 방향이 아닌 방식으로 응답한 것에 대해서 discussion해서는 안된다.

The discussion should refer back to the results section and suggest what the main findings mean. You should acknowledge the limitations of your study and couch the discussion in the light of these. For example, if your response rate was low, you may need to recommend further studies to confirm your preliminary results. Your conclusions must not go beyond the scope of your study—for example, if you have done a small, parochial study do not suggest changes in national policy. You should also discuss any questions your par- ticipants persistently refused to answer or answered in a way you didn’t expect.

 


 

심리적, 사회적 영향력을 고려하기

Taking account of psychological and social influences


설문 연구는 절대로 완벽하게 객관적일 수 없다. 연구자와 참여자는 인간이고 심리적/감정적/사회적 니즈가 있다. 너무 자주 우리는 이 요인을 연구의 계획/수행/분석에서 놓치곤 한다. 설문은 참여자와 응답자에게 서로 다른 식으로 해석될 수 있다. 연구자는 자료를 원한다. 잘 훈련되어있지 않은 상태에서 초보junior 연구진은 압박이 심할 경우 파일럿팅, 샘플링, 배포/수집/코딩에 실수를 저지를 수 있다.

Questionnaire research (and indeed science in general) can never be completely objective. Researchers and participants are all human beings with psychological, emotional, and social needs. Too often, we fail to take these factors into account when planning, undertaking, and analysing our work. A questionnaire means something different to participants and researchers.w4 Researchers want data (with a view to publications, promotion, academic recognition, and further grant income). Junior research staff and administrators, especially if poorly trained and supervised, may be put under pressure, leading to critical errors in

  • piloting (for example, piloting on friends rather than the target group),

  • sampling (for example, drifting towards convenience rather than random samples) and

  • in the distribution, collection, and coding of questionnaires.15

 

설문 시행을 위해서 고용된 연구원은 연구에 익숙하지 않을 수도 있고, 자신의 무지를 덮기 위해서 한 행동이 연구 전체를 망칠 수도 있다.

Staff employed to assist with a questionnaire study may not be familiar with all the tasks required to make it a suc-cess and may be unaware that covering up their igno- rance or skill deficits will make the entire study unsound.


연구 참여자들은 설문에 응답할 때 흥미가 있을 수도 있고, 지루할 수도 있고, 다른 사람을 돕고자 할 수도 있고, 해야 할 것 같아서 할 수도 있고...등등. 이것들이 모두 잠재적인 bias의 요인이다.

Research participants, on the other hand, may be motivated to complete a questionnaire through interest, boredom, a desire to help others (particularly true in health studies), because they feel pressurised to do so, through loneliness, or for an unconscious ulterior motive (“pleasing the doctor”). All of these introduce potential biases into the recruitment and data collection process.


15 Boynton PM., Wood GW, Greenhalgh T. Hands-on guide to questionnaire research: reaching beyond the white middle classes. BMJ (in press).













Ambiguity identified in a pilot study

Rena is a family planning trainee interested in sexual dysfunction. She wishes to explore this in a sample of young women. In a pilot study, she finds that participants interpret the question “Did you get wet during sex?” differently. Some have answered in terms of arousal (which is what Rena wanted to find out about), while others thought wet referred to sweat or urinary incontinence. Each participant answered consistently, but what they thought they were talking about differed between participants. In the final questionnaire, Rena included a short explanation of what wet meant.

 

Documenting data on refusals

Phuong is leading a study on new parents’ experiences of maternity services. She invites people to participate, and notes the age, sex, ethnicity, and reasons given for refusing to join the study. Most commonly, participants refuse because they are too busy, not interested in the research, or dislike the subject matter of the questionnaire. By keeping tabs on participants who refuse, Phuong can check that no particular subgroup of people is being excluded, and she can later formally compare the characteristics of responders with non-responders. An example of the form used for collecting exclusion/refusal data in Phuong’s study is shown below:

Age

Gender

Ethnicity

Maternity ward

Reason given for non-participation

Researcher’s name





 2004 Jun 5;328(7452):1372-5.

Administeringanalysing, and reporting your questionnaire.

Author information

  • 1Department of Primary Care and Population Sciences, University College London, London N19 5LW. p.boynton@pcps.ucl.ac.uk

Erratum in

  • BMJ. 2004 Aug 7;329(7461):323.
PMID:
 
15178620
 
[PubMed - indexed for MEDLINE] 
PMCID:
 
PMC420299
 
Free PMC Article


설문지 선택, 설계, 개발 (BMJ, 2004)

Selecting, designing, and developing your questionnaire

Petra M Boynton, Trisha Greenhalgh







설문이 이렇게 유명해 진 것은 "응급조치"로 쓸수 있기 때문이다. 이렇게 남용된 방법론은 없었다.

The great popularity with questionnaires is they provide a “quick fix” for research methodology. No single method has been so abused.1


무슨 정모를 모으고자 하는가?

What information are you trying to collect?


간략히 말하자면, 연구분야에 대해서 충분히 잘 알지 못하거나, 가능한 응답의 범위를 예측하기 위한 특정 인구집단에 친숙하지 않고, 특히 그러한 자료가 문헌에 없다면 우선적으로 질적접근(포커스 그룹) 등을 통해서 영역territory를 파악하고, 핵심 영역을 파악해야 한다.

As a rule of thumb, if you are not familiar enough with the research area or with a particular population subgroup to predict the range of possible responses, and especially if such details are not available in the lit- erature, you should first use a qualitative approach (such as focus groups) to explore the territory and map key areas for further study.6



설문이 적합한 방법인가?

Is a questionnaire appropriate?


설문의 부적절한 활용 Table A

Table A on bmj.com gives some real examples where questionnaires were used inappropriately.1



기존 도구를 사용할 수 있는가?

Could you use an existing instrument?


시간과 자원을 절약할 수 있고, 다른 연구와 비교할 수 있다. 논문을 쓸 때도 개요만 적어주면 되고 논문 내기도 쉽다.

Using a previously validated and published question- naire will save you time and resources; you will be able to compare your own findings with those from other studies, you need only give outline details of the instru- ment when you write up your work, and you may find it easier to get published (box 1).



설문지가 타당성 신뢰성을 갖추었는가?

Is the questionnaire valid and reliable?





질문을 어떻게 보여줄 것인가?

How should you present your questions?


Open or Closed. 두 접근의 장단점(Table B)

Questionnaire items may be open or closed ended and be presented in various formats (figure). Table B on bmj.com examines the pros and cons of the two approaches.


  • 자료를 빠르게 정리하기는 좋으나, 잠재적 응답의 풍요로움이 낮다.
    Closed ended designs enable researchers to produce aggregated data quickly, but the range of pos- sible answers is set by the researchers not respondents, and the richness of potential responses is lower. Closed ended items often cause frustration, usually because researchers have not considered all potential responses (box 2).18 

  • 개방형 질문을 쓸 때는 사전에 어떤 식으로 분석할지 계획이 있어야 한다. 시간이나 전문성이 없다면 애초에 하지 마라
    If you plan to use open ended questions or invite free text comments, you must plan in advance how you will analyse these data (drawing on the skills of a quali- tative researcher if necessary).19 You must also build into the study design adequate time, skills, and resources for this analysis; otherwise you will waste participants’ and researchers’ time. If you do not have the time or expertise to analyse free text responses, do not invite any.






질문 외에 더 넣을 것은?

Apart from questions, what else should you include?


Table C 체크리스트. 도입부 혹은 설문 정보

A common error by people designing questionnaires for the first time is simply to hand out a list of the ques- tions they want answered. Table C on bmj.com gives a checklist of other things to consider. It is particularly important to provide an introductory letter or information sheet for participants to take away after completing the questionnaire.

 



 


 

어떤 식으로 보여야 하는가? (레이아웃)

What should the questionnaire look like?


연구자들인 물리적 레이아웃에 신경을 잘 안쓴다. 그러나 연구 결과를 보면, 낮은 응답률은 질문을 읽거나 따라잡기 어려워서 생기는 경우가 많다. 일반적으로 질문은 짧고, 요점을 바로 향해야 하며(12단어 이내), 민감하거나 내인적인 질문이 있어서는 안된다. 짧은 질문이 너무 abrupt하거나 threatening하다면, 더 긴 문장을 써도 된다.

Researchers rarely spend sufficient time on the physical layout of their questionnaire, believing that the science lies in the content of the questions and not in such details as the font size or colour. Yet empirical studies have repeatedly shown that low response rates are often due to participants being unable to read or follow the questionnaire (box 3).3w6In general, questions should be short and to the point (around 12 words or less), but for issues of a sensitive and personal nature, short questions can be perceived as abrupt and threatening, and longer sentences are preferred.w6



표본 선정

How should you select your sample?


Table D

Different sampling techniques will affect the questions you ask and how you administer your questionnaire (see table D on bmj.com).

 



 



무슨 승인을 받아야 하는가?

What approvals do you need before you start?



과학적으로 타당하지 않거나 의도하지 않은 offence나 트라우마를 유발하거나, 비밀유지를 깨거나, 사람의 시간이나 돈을 낭비하게 한다면 비윤리적인 것이다.

A study is unethical if it is scientifically unsound, causes undue offence or trauma, breaches confidential- ity, or wastes people’s time or money.



결론

Conclusion


Table E 체크리스트

Table E on bmj.com gives a critical appraisal checklist for evaluating questionnaire studies.



Boynton PM, Wood GW, Greenhalgh T. Hands-on guide to questionnaire 7 research: reaching beyond the white middle classes. BMJ (in press).





Table E Critical appraisal checklist for a questionnaire study

Research question and study design

  • What information did the researchers seek to obtain?

  • Was a questionnaire the most appropriate method and if not, what design might have been more appropriate?

  • Were there any existing measures (questionnaires) that the researchers could have used? If so, why was a new one developed and was this justified?

  • Were the views of consumers sought about the design, distribution, and administration of the questionnaire?


Validity and reliability

  • What claims for validity have been made, and are they justified?
    (In other words, what evidence is there that the instrument measures what it sets out to measure?)

  • What claims for reliability have been made, and are they justified?
    (In other words, what evidence is there that the instrument provides stable responses over time and between researchers?)


Format

  • Was the title of the questionnaire appropriate and if not, what were its limitations?

  • What format did the questionnaire take, and were open and closed questions used appropriately?

  • Were easy, nonthreatening questions placed at the beginning of the measure and sensitive ones near the end?

  • Was the questionnaire kept as brief as the study allowed?

  • Did the questions make sense, and could the participants in the sample understand them? Were any questions ambiguous or overly complicated?


Instructions

  • Did the questionnaire contain adequate instructions for completion
    —eg example answers, or an explanation of whether a ticked or written response was required?

  • Were participants told how to return the questionnaire once completed?

  • Did the questionnaire contain an explanation of the research, a summary of what would happen to the data, and a thank you message?


Piloting

  • Was the questionnaire adequately piloted in terms of the method and means of administration, on people who were representative of the study population?

  • How was the piloting exercise undertaken—what details are given?

  • In what ways was the definitive instrument changed as a result of piloting?

Sampling

  • What was the sampling frame for the definitive study and was it sufficiently large and representative?

  • Was the instrument suitable for all participants and potential participants? In particular, did it take account of the likely range of physical/mental/cognitive abilities, language/literacy, understanding of numbers/scaling, and perceived threat of questions or questioner?


Distribution, administration and response

  • How was the questionnaire distributed?

  • How was the questionnaire administered?

  • Were the response rates reported fully, including details of participants who were unsuitable for the research or refused to take part?

  • Have any potential response biases been discussed?


Coding and analysis

  • What sort of analysis was carried out and was this appropriate?

  • (eg correct statistical tests for quantitative answers, qualitative analysis for open ended questions)

  • What measures were in place to maintain the accuracy of the data, and were these adequate?

  • Is there any evidence of data dredging—that is, analyses that were not hypothesis driven?


Results

  • What were the results and were all relevant data reported?

  • Are quantitative results definitive (significant), and are relevant nonsignificant results also reported?

  • Have qualitative results been adequately interpreted (e.g. using an explicit theoretical framework), and have any quotes been properly justified and contextualised?


Conclusions and discussion

  • What do the results mean and have the researchers drawn an appropriate link between the data and their conclusions?

  • Have the findings been placed within the wider body of knowledge in the field (eg via a comprehensive literature review), and are any recommendations justified?





 



 2004 May 29;328(7451):1312-5.

Selectingdesigning, and developing your questionnaire.

Author information

  • 1Department of Primary Care and Population Sciences, University College London, Archway Campus, London N19 5LW. p.boynton@pcps.ucl.ac.uk
PMID:
 
15166072
 
[PubMed - indexed for MEDLINE] 
PMCID:
 
PMC420179
 
Free PMC Article


설계로 망친 설문을 분석으로 고칠 수 없다: 설문도구 개발과 타당도 근거 수집

You Can’t Fix by Analysis What You’ve Spoiled by Design: Developing Survey Instruments and Collecting Validity Evidence


Gretchen Rickards, MD Charles Magee, MD, MPH Anthony R. Artino Jr, PhD

 

 


 

신뢰도와 타당도에 영향을 미치는 무수한 요인들. 잘 못 쓰여진 글귀, 레이아웃, 부적절한 보기

A plethora of factors affecting reliability and validity in surveys includes, but is not limited to, poor question wording, confusing question layout, and inadequate response op- tions.

 

 

질문1: 내 연구질문에 설문이 적절한 도구인가?

Question 1: Is a Survey an Appropriate Tool to Help Answer My Research Question?

 

 

설문 설계에서 contruct란 평가하고자하는 모델/아이디어/이론이다.

In the language of survey design, a construct is the model, idea, or theory you are attempting to assess.

 

설문은 종종 다른 유형의 자료 수집에서 보조자료이다.

surveys often supplement, rather than replace, other forms of data collection.

 

Contruct의 예로는 동기부여/만족/스스로 인식한 학습 등이 있다.

Examples of the constructs we often want to measure include things like motivation, satisfaction, and perceived learning.

 

 

질문2: 다른 사람이 이 construct를 연구한 적이 있는가?

Question 2: How Have Others Addressed This Construct in the Past?

 

 

당신이 어떤 construct 측정에 흥미가 있다면, 다른 사람들도 측정하려고 시도해봤을 가능성이 높다.

Odds are, if you are interested in measuring a particular construct, someone else has previously attempted to measure it, or something very similar.

 

이전에 타당도를 검증한 설문이라도, 추가적으로 신뢰도/타당도 검증이 필요하다.

It is important to note, however, that previously validated surveys require the collection of additional reliability and validity evidence in your specific context.

 

예컨대, 불안에 관한 설문은 well-being의 측면에서 적절할 수 있으나, 가장 knowledgeable한 학생을 평가하는데는 부적절하다. 평가도구는 그대로이고 해석만 달라져도 이렇게 된다.

For example, a survey of student anxiety might be appropriate for assessing aspects of well-being, but such a survey would be inappropriate for selecting the most knowledgeable medical students. In this example, the survey did not change, only the score interpretation changed.

 

 

질문3: 어떻게 문항을 개발할 것인가?

Question 3: How Do I Develop My Survey Items?

 

연구 대상자의 언어로 문항을 만드는 것이 중요하다. statement가 아니라 questio을 사용하라. 부정형 단어negatively worded 문항을 지양하라, 일반적인 동의 수준을 묻는 보기가 아니라, 측정하려는 구인을 강조하는 anchor를 사용하라 등이 있다. 널리 사용되긴 하나, 일반적인 동의 수준을 묻는 anchor(매우 동의, 동의, 중립, 반대, 매우 반대)는 상당한 측정 오차가 있다.

Developing items by using the vocabulary of your target population is also important. Other key principles of item development include writing questions rather than statements, avoiding negatively worded items, and using response anchors that emphasize the construct being measured rather than using general agreement response anchors.2,8 Although widely used, general agree- ment response anchors (eg, strongly disagree, disagree, neutral, agree, strongly agree) are well known to be subject to considerable measurement error.2

 

These sources have been described in the Standards for Educa- tional and Psychological Testing5 as evidence based on (1) content, (2) response process, (3) internal structure, (4) relationships with other variables, and (5) consequences.

 

질문4: 설문 문항이 construct에 관련되게 명확히 기술되었는가?

Question 4: Are the Survey Items Clearly Written and Relevant to the Construct of Interest?

 

질문5: 응답자는 내가 의도한 대로 문항을 해석할 것인가?

Question 5: Will Respondents Interpret My Items in the Manner That I Intended?

 

질문6: 내 설문 문항에서 얻은 점수의 신뢰도가 충분하며, 다른 척도와 관계는 어떠한가?

Question 6: Are the Scores Obtained FromMy Survey Items Reliable and Do They Relate to Other Measures as Hypothesized?

 

설문을 파일럿 테스트하고, 타당도 근거를 수집한다. 파일럿에서는 실제 수행 예정인 것과 동일한(웹-기반 혹은 종이-기반) 방식으로 설문을 하게 해야 한다.

The next step is to pilot test your survey and to begin collecting validity evidence based on reliability and rela- tionships with other variables. During pilot testing, membersof the target population complete the survey in the planned delivery mode (eg, web-based or paper-based format).

 

가장 흔한 신뢰도 평가는 Cronbach alpha 계수이다.

The most common means of assessing scale reliability is by calculating a Cronbach a coefficient.

 

단순히 말하게, 다섯 개의 문항이 '흥미'라는 구인을 측정하면, 이 다섯 개 문항은 서로 높은 상관이 있어야 한다.

Simply speaking, if 5 items on your survey are all designed to measure the construct resident interest, for example, then it follows that the 5 items should be moderately to highly correlated with one another.

 

composite score는 단순히 가중치 없이 평균낸 것이다.

As described earlier, a composite score is simply an unweighted average of all the items within a particular scale.

 







  2012 Dec;4(4):407-10. doi: 10.4300/JGME-D-12-00239.1.

You Can't Fix by Analysis What You've Spoiled by DesignDeveloping Survey Instruments and Collecting ValidityEvidence.

PMID:
 
24294413
 
[PubMed] 
PMCID:
 
PMC3546565
 
Free PMC Article



 


 

 

리커트 척도 자료 분석하기

Analyzing and Interpreting Data From Likert-Type Scales

Gail M. Sullivan, MD, MPH, Anthony R. Artino Jr, PhD

 

 



 

1932년 Rensis Likert는 태도를 측정하기 위하여 개발하였고, 5 또는 7점의 ordinal scale로 어떤 statement에 대해서 어느 정도 동의하는지 응답하게 했다. Ordinal scale에서 응답자의 대답은 'rate'혹은 'rank'될 수 있지만, 각 응답 간 거리는 측정가능하지 않다. 따라서 '늘 그렇다' '종종 그렇다' '가끔 그렇다' 등의 응답 사이의 차이가 반드시 같은 것은 아니다.

Developed in 1932 by Rensis Likert1 to measure attitudes, the typical Likert scale is a 5- or 7-point ordinal scale used by respondents to rate the degree to which they agree or disagree with a statement (TABLE). In an ordinal scale, responses can be rated or ranked, but the distance between responses is not measurable. Thus, the differences between ‘‘always,’’ ‘‘often,’’ and ‘‘sometimes’’ on a frequency response Likert scale are not necessarily equal.

 

통증에 관한 여러가지 연속 척도

The various continuous measures for pain are well-known examples of this (FIGURE 1).

 

 

논쟁

The Controversy

 

의학교육 문헌에서 오랫동안 ordinal data에 대한 논란이 있는데, 이러한 순서 척도를 숫자로 변환하였을 때 간격 척도interval data처럼 처리가능하냐는 것이다. 즉, 표준편차, 'normally distributed'한 자료에 대해 쓸 수 있는 모수통계와 같은 것을 사용할 수 있는가?

In the medical education literature, there has been a long- standing controversy regarding whether ordinal data, converted to numbers, can be treated as interval data.2 That is, can means, standard deviations, and parametric statistics, which depend upon data that are normally distributed (FIGURE 2), be used to analyze ordinal data?

 

다행히도 Dr. Geoff Norman이라는 의학교육연구 방법론의 대가가 이 논란을 포괄적으로 정리한 바 있다. 그는 강력한 근거를 제시하면서 실제 자료와 가상 자료를 가지고 모수적 통계가 순서 자료에서 사용 가능할 뿐 아니라 비모수통계보다 더 robust함을 보여주었다. 즉 모수 통계는 심지어 통계적 가정(자료의 정규분포)이 위배된 상황에서조차 비모수적 통계보다 더 '옳은 답'을 줄 가능성이 높았다는 것이다. 따라서 비포수적 통계는 unbiased answer를 얻기에 충분히 robust하며, 이러한 결과는 Likert scale 응답을 분석할 때 '진실'에 가까운 답을 준다.

Fortunately, Dr. Geoff Norman, one of world’s leaders in medical education research methodology, has compre- hensively reviewed this controversy. He provides compel- ling evidence, with actual examples using real and simulated data, that parametric tests not only can be used with ordinal data, such as data from Likert scales, but also that parametric tests are generally more robust than nonparametric tests. That is, parametric tests tend to give ‘‘the right answer’’ even when statistical assumptions— such as a normal distribution of data—are violated, even to an extreme degree.4 Thus, parametric tests are sufficiently robust to yield largely unbiased answers that are acceptably close to ‘‘the truth’’ when analyzing Likert scale responses.4

 

 

 

요점

The Bottom Line

 

많은 전문가들이 이 논란에 참여했고, 결론은 상당히 명확하다. 모수적 통계가 Likert scale응답에 쓰일 수 있다. 그러나 자료를 묘사하는데 있어서 자료가 전형적인 정규분포를 따르지 않는 이상 평균은 그 의미가 제한적이며, 응답 분포를 보여주는 것이 더 도움이 될 것이다.

Now that many experts have weighed in on this debate, the conclusions are fairly clear: parametric tests can be used to analyze Likert scale responses. However, to describe the data, means are often of limited value unless the data follow a classic normal distribution and a frequency distribution of responses will likely be more helpful.

 

 

4 Norman G. Likert scales, levels of measurement and the ‘‘laws’’ of statistics. Adv Health Sci Educ Theory Pract. 2010;15(5):625–632.

 

 

 

 

 



 


  2013 Dec;5(4):541-2. doi: 10.4300/JGME-5-4-18.

Analyzing and interpreting data from likert-type scales.

PMID:
 
24454995
 
[PubMed] 
PMCID:
 
PMC3886444
 
Free PMC Article

 

 

 

 

 

 

 

 

 

 

 

 

 

 

설문에서 응답률 높이기 & 무응답 편향 평가 (AMEE Guide No. 102)

Improving response rates and evaluating nonresponse bias in surveys: AMEE Guide No. 102

 

ANDREW W. PHILLIPS1, SHALINI REDDY2 & STEVEN J. DURNING3

1Stanford University, USA, 2University of Chicago, USA, 3Uniformed Services University (USU), USA




 


도입

Introduction


 

설문은 의학교육연구에서 중심적 역할을 한다. 성공적인 설문은 표본이 전체 연구대상 그룹을 적절하게 대표할 수 있느냐에 따라 좌우된다. 다양한 충분히 넓게, 충분히 많은 응답자가 응답하지 않으면  설문의 결과는 전체 집단의 의견을 반영하지 못할 수도 있다.

Surveys are a central part of medical education research (Artino et al. 2014). Successful surveys depend on adequate representation from the entire group being studied. The survey results may not correctly reflect the group’s opinions if not enough people or a wide enough variety of people respond (Groves 2006).


따라서, 응답하지 않은 사람들의 수와 그들의 특성이 모두 설문결과의 정확성에 영향을 준다. 이러한 맥락에서 우리는 응답률비응답편향을 탐구하고자 하며, 이 두 가지는 관련되어있지만 서로 분리된 개념이다.

Thus, the number of people who do not respond and the characteristics of the people who do not respond can both impact the accuracy of survey results. It is in this context that we explore response rates and nonresponse bias, two related but separate concepts that are important for scholars who use surveys in their investigations.


비응답편향은 응답하지 않은 사람들이 응답한 사람들의 특성과 차이가 클 때 생기며, 이로 인해서 잠재응답자의 전체 그룹을 대표하지 못하게 되는 것이다.

Nonresponse bias occurs when the opinions from people who did not complete the survey are so different from those who did complete the survey that the results do not accurately represent the entire group of potential respondents (Dillman 2000a; Groves et al. 2002).


 

응답률 정의하기

Defining response rate



연구자들은 어떻게 응답률을 계산했는지를 정의해야 한다. 서로 다른 정의가 서로 다른 결과를 낳기 때문이다. 설문연구자들의 국제 커뮤니티에서는 여섯 가지의 AAPOR 정의를 지지한다.

It is important that researchers clearly define how they calculated the response rate since different definitions can yield different results. The international community of survey researchers has endorsed using one of the six American Association of Public Opinion Research (AAPOR) definitions of response rate (Box 1) (Groves et al. 2002; AAPOR 2011; Johnson & Wislar 2012).


이들 여섯개 정의는 다음을 어떻게 다루느냐에 따라 구분된다.

These six definitions differ by how they handle

(1) 부분 응답 partial responses (i.e. surveys with skipped questions (item non- response)) and

(2) 설문자격 여부가 불확실한 비응답자 nonrespondents whose eligibility for participation is unknown (i.e. there is a list of potential respondents but it is unknown if all of the people on the list meet study inclusion criteria).

 

AAPOR RR5와 RR6이 의학교육연구에서는 가장 잘 맞는다.

AAPOR RR5 and RR6 are usually the best-suited definitions for medical education research.


'설문자격여부가 불활실한 비응답자'에 대한 문제는 public opinion 연구에서 중요하나 의학교육에서는 덜 관련된다. 예컨대, 길가에서 '아이가 있는 사람'을 대상으로 설문을 한다고 했을 때, 설문을 받는 사람은 개개인이 부모인지 아닌지를 알지 못한다.

The issue of unknown eligibility for nonrespondents is a significant concern in public opinion research but is less commonly encountered in medical education research. For example, if someone is trying to survey people on a street corner about what it is like to have children, only parents would be eligible to participate. The surveyor does not know, however, if an individual who walks by and parent. ignores him is or is not

 

 


설문과 표집 프레임 정의

Defining survey and sampling frame


'survey'란 의견을 수집하기 위해서 활용되는 일군의 사람들에게 사용되는 도구를 말하며, 'sampling frame'이란 누가 응답대상자인지에 대한 것이다. 예컨대, 연구자는 설문지를 단일 기관의 1학년 의과대학생에게만 보낼 수도 있다. sampling frame은 그 기관 내의 1학년 학생만 해당 된다. 잘 정의된 sampling frame은 잘 정의된 응답률을 계산하는데 필수적이다.

A‘‘survey’’ refers to any tool directed at a select group of people that is used to gather opinions (AAPOR 2011; Artino et al. 2014). The ‘‘sampling frame’’ defines who the potential respondents are. For example, a researcher may send a questionnaire only to the first year medical students at a single institution. The sampling frame is thus only the first year medical students at that institution. A well-defined sampling frame is central to calculating a well-defined response rate


 

파트 1: 응답률 향상시키기

Part one: Improving response rates


 

응답 대상자는 응답을 할 수도 안할 수도 있으며, 모든 문항에 또는 일부 문항에 응답을 안할 수도 있다.

The potential respondents (sampling frame) can respond or not respond to the survey as a whole (unit nonresponse)or to just some of the survey questions (item nonresponse) (Dillman et al. 1993; Groves et al. 2002; Artino et al. 2014).


전체 비응답자

Unit nonresponse


통제가능한 요인들은 다음 중 하나이다.

Controllable factors that contribute to unit nonresponse (an individual not responding to the survey as a whole) generally fall into at least one of the following categories:

    • 설문 전달 survey delivery,

    • 설문 (필요성) 인정 survey acknowledgement, and

    • 응답자의 참여 결정 the potential respond- ent’s decision to participate (Dillman et al. 1993; Groves et al. 2002).



설문 전달

Survey delivery


예를 들어서, email은 주소 오타로 인해서 전달되지 않을 수 있다. 우편도 마찬가지이다. 응답대상자마다 어떤 방법을 사용하였느냐에 따른 선호가 다를 수 있다. 이유 불문하고 설문이 전달되는 방식이 다른 응답률을 가져온다.

For example, an email may not be delivered because of a typographical error in the address; whereas a postal letter may be lost somewhere in the postal mail system. Moreover, potential respondents may have different comfort levels with different survey methods, par- ticularly electronic surveys (Groves et al. 2002; McMahon et al. 2003). Regardless of the reason, the mode of survey transmis- sion can yield a different response rate (McMahon et al. 2003; Beebe et al. 2007).


우편 설문이 웹 설문보다 초기 응답률을 높이기에는 더 낫다. 이는 심지어 컴퓨터에 익숙한 대학생 그룹 사이에서의 연구 결과도 마찬가지이다. 다만, 한 차례 이메일로 reminder를 주는 것은 웹 설문의 응답률을 single-request 종이설문만큼으로 응답률을 높였다.

Postal surveys appear to have better initial response rates than web surveys, even among computer literate college students using the internet for their classes in the USA as recently as 2011 (Millar & Dillman 2011). Of note, a single e-mail reminder raised the response rate of the web option to approximately that of a single-request paper questionnaire (51%) (Millar & Dillman 2011).


혼합된 방법으로 전달되는 설문(이메일+우편)은 정확히 동일한 언어로 쓰여져야 하며 문항 응답시 서로 다른 방식에 따른 차이의 영향을 최소화하게 설계되어야 한다.

Surveys distributed by mixed modalities (e.g. email and postal mail) should be written with the exact same language and format for all survey modalities to minimize the impact of different delivery modality on item response (Dillman & Christian 2005).


설문 시행자는 온라인 설문을 시행하는 것이 컴퓨터/스마트폰/태블릿 등 여러 종류의 기기에서 거의 동일하게 나타날 수 있게 해야함을 유의해야 한다.

Survey administrators must keep in mind that offering an online survey means offering a survey that almost invariably will be accessed by computer, smartphone and tablet, which has extensive design implications discussed in the final section of this Guide (Buskirk & Andrus 2013).


마지막으로, 설문 전달과 관련한 대부분의 연구는 '일반 인구'를 대상으로 했으나, 의학에서는 보다 captive audience를 대상으로 한다.

Finally, most studies on the topic of survey delivery, such as postal mail or door-to-door surveys, use the general popula- tion (Dillman 2011). However, medical trainees represent a more captive audience than found in the general population (Groves et al. 2002).

 

 

자료를 제시할 때 'AAPOR RR6에 따라 100명의 잠재 응답자 중 75%의 응답률을 얻었다'

When presenting the data, we suggest the following: ‘‘We obtained a response rate of 75% for the 100 potential respondents, AAPOR RR 6’’ (AAPOR 2011).



  • 여러 방식을 혼합함 Mixed survey methods (e.g. internet and postal mail) (Beebe et al. 2007) 

  • 설문 요청을 개별적으로 함 Personalized survey invitations (Dillman 2000a; Edwards 2002) 

  • 금전 인센티브 Monetary incentive (Church 1993; Asch et al. 1998) 

  • 예상 설문 응답시간 제공 안함 Not providing an estimated survey time

  • 1000단어 이하로 만듬 Survey less than 1000 words (Edwards 2002) 

  • 초기 응답 거부에 대한 인터뷰어의 구체적 반응 Specific interviewer replies to initial refusals (Dijkstra & Smit 2002) 

  • 응답대상자와 다시 접촉 Repeated contact with potential participants (Lynn et al. 2002) 

  • 사전 예고 Pre-notification (Edwards 2002)



설문 (필요성) 인정

Survey acknowledgement


설문 인정이란, 응답대상자가 이번 설문에 응답률이 높아야 한다는 필요성을 인식하는 것이다. 보통 응답대상자들은 심지어 자신이 설문지를 받았다는 것 조차 인식하지 못한다. 우편으로 설문을 받은 사람 중 10%는 받았다는 기억이 없다. 개개인별로 우편을 전달하고, 구체적으로 목적을 기술함으로써 응답자의 '인정'을 향상시킬 수 있다. 인터넷 설문의 경후

      • '명확한 제목',

      • '응답자가 아는 사람으로부터의 발송',

      • '응답자의 이름을 salutation에 포함시키기',

      • '참여를 요청하는 간략한 초대글 넣기'

등이 필요하다.

Survey acknowledgement – recognition by the potential – respondent that s/he received a survey is essential to achieve high response rates since potential respondents often do not even realize they received a survey. Approximately 10% of those in the general public who receive a postal mail questionnaire do not remember receiving it (Dillman 2000a). Personalizing the delivery and clearly stating the purpose of the mailing may improve acknowledgement by the recipient (Maheux et al. 1989; Dillman 2000b; Edwards 2002). For internet questionnaires delivered by email, for example, the survey should: include a clear subject line, be sent from someone the respondent knows (if possible), address the respondent by name in the salutation, and include a brief invitation to participate.



참여자 협조

Participant cooperation


통제가능요인과 통제불가능 요인이 있음

Factors that may influence potential participants’ decision to cooperate can be conceptualized as controllable or uncontrollable by the researcher.



통제가능요인

Controllable factors


인센티브

Incentives


공공부문과 의사 대상 설문 모두에서 지속적으로 초기 요청을 보낼 당시에 금전적 인센티브를 포함하는 것이 응답률을 유의미하게 높인다는 것을 보여주었다. '돈'이 '비금전 선물(음식 등)'보다 더 효과가 있다.

Studies in both the public sector and among physician respondents consistently demonstrate that monetary incentives included with the initial request significantly improve response rates (Berry & Kanouse 1987; Church 1993; Edwards 2002; Singer 2002; Keating et al. 2008). Money also yielded better response rates than nonmonetary gifts such as food (Church 1993).


응답률을 높이기 위해 필요한 최소 인센티브가 얼마인지는 불확실하다.

The minimum amount of monetary incentive needed to improve survey response rates remains unclear for medical trainees.

 

 

 

일부 연구자들은 인센티브의 의도하지 않은 결과를 우려한다. 예컨데 응답이 더 긍정적이 된다거나, 다른 추가 설문에서도 인센티브를 요구한다거나 하는 것 등이나. 그러나 일부 일반인구대상 연구에서는 응답 결과에 차이가 없음을 보여주기도 했다.

 

It should be noted that some researchers voice concerns about the unintended consequences of incentives, such as providing more optimistic responses or requiring incentives to participate in other, future surveys (James & Bolstein 1990;Shettle & Mooney 1999; Singer et al. 1998). However, several general population studies found no differences in survey answers. 

의학교육연구자에게 현실적인 제언은 (설문을 마칠 때가 아니라) 처음 요청할 당시에 2~5달러 정도의 인센티브를 주는 것이다. 비록 이러한 것이 '설문을 마치지 않았는데도 돈을 준다'라는 점에서 직관에 반할 수도 있지만, 앞서 언급된 연구로부터 처음에 주는 경우에 응답률이 더 높았다. 

A practical recommendation for medical education researchers, who often work on a limited budget, is to consider sending a monetary incentive between $2 and $5 with the initial survey request that does not require completion of the survey to keep the money. Although this may seem counterintuitive to not require survey completion to receive the incentive, the aforementioned research provides evidence that providing the incentive before completion yields signifi- cantly higher response rates.



설문 길이

Length of survey


심지어 설문 길이가 짧은 경우에도 설문 길이에 대한 언급이 없는 편이 길이에 대한 언급이 있는 것보다 낫다.

not mentioning the survey length produced far greater cooperation than even mentioning short survey times


설문 길이는 짧을 수록 좋다.

Several studies of mailed general questionnaires to physicians and the population confirm that shorter is generally better (Edwards 2002; Jepson et al. 2005; McFarlane et al. 2007).

 

더 나아가서, 웹 설문일 경우 설문 길이는 더 중요해진다. 모바일 기기에서 컴퓨터에서보다 약 3배의 시간이 걸리기 때문이다.

Moreover, length may be even more important in electronic surveys since surveys taken on mobile devices take approximately three times longer than surveys taken on computers (Dijkstra & Smit 2002; Mavletova 2013).


심리적 비용

Psychological cost


'참여하고 싶지 않나요?'라고 말하는 것보다 '참 안타깝네요. 당신의 참여가 저에게는 매우 큰 의미거든요'라고 하는 것이 참여를 유도하는데 더 낫다.

For example, rather than the profes- sional repeating, ‘‘You don’t want to participate?’’ a response of ‘‘That’s a shame; your participation means a lot to me,’’ is more successful in getting potential respondents to participate in the survey.



개별화와 권위

Personalization and authority


개인적 관계를 활용하는 것이 스폰서 기관의 권위(대학에서 스폰서함 등)를 강조하는 것보다 통계적으로 유의하게 응답률을 향상시킨다.

Utilizing a personal connection between the researcher and potential respondents also makes a statistically significant improvement (23% absolute response rate increase in one study) in response rates, compared to emphasizing authority from the sponsoring body, such as a university.


이메일의 개별화, 감사인사가 포함된 봉투 등이 잠재적 응답률을 높이는데 도움이 된다. salutation에 대상자의 이름을 쓰고, 제목을 "당신의 교육을 개선시키는데 중요한 연구"라고 쓸 수 있다.

Personalization in emails, addressed envelopes and thank you letters may convince potential respondents to participate (Maheux et al. 1989; Edwards 2002; Lynn et al. 2002). For example, a researcher may write a personalized email to each potential respondent with their names in the salutation and a subject heading such as ‘‘An important study to improve your education.’’



설문 요청 횟수

Number of attempts


비용/효과를 고려했을 때 일반적으로 세 번 정도 시도하는 것이 권고된다. 만약 3번 시도 이후에도 응답이 없으면, 추가적 시도에서 응답을 얻을 가능성은 무척 낮다.

Generally, three attempts are recommended based on cost/benefit analyses and general practices by surveyors (Dillman 2000a; Kellerman & Herold 2001; Willis et al. 2013). If there is no response after three attempts and the contact information is known to be valid, additional attempts will likely have a very low yield (Dillman 2000a; Hamilton 2003).

 

Reminder를 보내는 최적의 타이밍은 연구에 따라 다르다. 약 절반정도의 응답이 설문을 시작한지 1일 이내에 오고, 90%는 2주 이내에 온다. 연구자들은 응답자의 스케쥴(시험 일정 등)을 고려해야 한다. 우리는 1일~2주 사이에, 그 기간 내에 충돌가능성이 있는 일정을 고려해서, reminder를 보낼 것을 권고한다.

The optimal timing for reminders depends on the study. Approximately half of all responses tend to occur within one day of initiating a request and more than 90% tend to occur within two weeks (Hamilton 2003; SurveyMonkey 2011; take Experian 2012; Mailchimp 2014). Researchers should into consideration potential participants’ schedules, such as exams, when planning the study period and sending reminders. We recommend a reminder interval between one day and two weeks, based on other timing conflicts the potential participants may have during that time period.

 

 

설문 시점

Survey timing


 

이상적인 시점을 불분명하다. 구체적인 권고안은 없다.

The optimal time to send email/web surveys is unclear, we have no specific recommendations for email timing for medical educa- tion researchers and offer it as an area ripe for research.


사전 예고 편지와 Reminders

Advance letters and reminders


사전 예고 편지가 도움이 된다. 이러한 사전 예고는 보통 설문 며칠 전 받게 한다.

Advance letters announcing the survey, whether mailed questionnaire or in-person interviewer, are uniformly helpfulin the public survey literature (Heberlein & Baumgartner 1978;Dillman 2000a; Edwards 2002; Groves et al. 2002). The pre-announcement typically arrives a few days before the survey.


Reminder 역시 응답률을 높여준다. 종이 설문이든 웹 설문이든, 편의성이 중요해서 reminder를 보낼 때 한 부의 설문지를 다시 보내거나 설문 링크를 다시보내야 한다.

Reminder communication has also been shown to increase questionnaire rates across the board regardless of modality. Whether paper or web, ease of use is important so the reminder should include another copy of the paper question- naire or another link to the web questionnaire (Dillman 2000a; Johnson et al. 2002).



 

통제불가능한 요인

Uncontrollable factors


성별

Gender


McFarlane 등은 여성이 초반에는 응답 가능성이 더 낮으나, 이러한 차이는 여러 차례 응답을 요청하여 해소된다. 이러한 결과는 다른 집단에서도 확인되었다. 비록 응답대상자의 성별은 통제불가능하지만, 반복해서 요청하는 것은 통제가능하므로 활용해야 한다.

McFarlane and colleagues found females less likely to respond initially, but that discrepancy was resolved with repeated survey attempts. The findings were repeated in other populations as well (Groves & Couper 1996; Groves et al. 2000; McFarlane et al. 2007). Thus, although the gender of each potential respondent is not controllable, the option to make repeated survey attempts is controllable and should be utilized to improve female representation in surveys.


중요점

Salience


주제가 얼마나 중요한 것인지가 전체 혹은 일부 문항 응답에 영향을 준다. Groves의 leverage- saliency theory 에 핵심 부분인데, 주제의 중요성이 응답률에 영향을 준다는 것이다. leverage-saliency theory 에서는 설문에 참여할지를 결정하는 것은 응답대상자와 구체적 주제와의 복잡한 상호작용이라고 했다.

Topic salience (relevance to an individual) can impact both unit and item responses. It is a central part of Groves’ leverage- saliency theory and research supports that a topic’s saliency can influence response rates (Groves & Couper 1996; Groves et al. 2000, 2002; NRC 2013). The leverage-saliency theory proposes that the decision to participate in a survey depends on a complex relationship between each potential respondent (such as likes, dislikes, time constrains, opinions about the survey topic, etc.) and the specific survey topic.


설문을 받는 사람은 이 설문이 교과목의 후반부 개선에 사용될 것이라고 말함으로써 학생과의 관계성을 높일 수 있다.

the instructor may create a personal connec- tion for the student with the survey by pointing out that survey responses will be used to improve the second part of the required course. In this case, the student will be directly impacted by the survey and has incentive to participate.


인터뷰어

Interviewer


공공부문에서의 연구는 인터뷰어에 따라 응답률이 서로 다르게 나타남을 보여주었다. 그 이유는 대화를 끌고 나갈 인터뷰어의 자신감에서부터 응답대상자에 이르기까지 복잡하다. 흥미롭게도, 인터뷰어의 script는 in-person interview에서 응답률에 영향을 주지 않았다.

Research in the public sector has demonstrated a difference in response rates related to interviewers, especially interviewer experience (Groves & Couper 1996, 1998; Groves et al. 2002; NRC 2013). The reasons are complex, varying from interviewer confidence to ability to tailor the conversation to the potential respondent (Groves & Couper 1998; Durrant et al. 2010). Interestingly, interviewer scripts do not alter response rates for in-person interviews.




문항 비응답

Item nonresponse



최소한 한 개 이상의 연구에서 refusal conversions(처음에는 응답하지 않겠다고 했다가, 다시 응답하기로 마음을 바꾼 경우에) 문항을 건너뛰거나 추가 문항에 NO라고 응답한 경우가 더 많음을 보여주었다.

At least one study demonstrated that refusal conversions (potential participants who initially declined participation but eventually participated after further contact) skipped or provided NO for more questions than participants who did not have to be converted from refusal status (Beatty & Herrmann 2002; Mason et al. 2002).



의견 없음

No-opinion (NO) responses


'cognitive hindrance'라는 용어는 응답자가 질문에 대한 답을 몰라서 어떤 질문에 대답할 수 없었을 때를 말한다.

'motivational hindrance'는 그 반대로, 응답자가 답을 알지만 답을 쓰기 싫을 때를 말한다.

The term cognitive hindrance describes when a person cannot respond to a question because he/she simply does not know the answer. A motivational hindrance, in contrast, occurs when the potential respondent knows the answer but does notwant to provide the answer.


모르는 사람에게 드러내기 싫은  개인적 질문에 대해서 motivational hindrance가 나타날 수 있다.

personal question that the respondent would rather not divulge to a stranger, such as a vice (DeMaio 1984; Beatty & Herrmann 2002; Krosnick 2002).


NO 옵션은 응답자가 어떤 질문에 대한 지식이나 의견이 없을 경우에 불가피하게 거짓 정보를 제공해야 하는 오류를 방지하기 위한 것이다. 따라서 NO는 cognitive hindrance를 주의하는 것이며 motivational hindrance에 대한 것이 아니다. 현재의 권고사항은 '태도나 행동 질문에 대해서는 NO옵션을 주지 말라'는 것이다. 이는 왜냐하면 응답자가 의견을 통해서 '학습'하기 때문이며, 자신의 의견에 대해서 자신이 없더라도, 실제 성과를 강하게 예측해주기 때문이다. 수십년의 연구결과를 보면, 응답자가 태도 질문에 NO에 응답한 경우는 대체로 cognitive work를 하기가 싫어서 이거나, 민망한 응답을 드러내기 싫어서인 경우가 대부분이다.

The NO option is intended to prevent forcing errors of commission that result when respondents without knowledge or opinion of a question provide essentially false information(Gilljam & Granberg 1993; Visser et al. 2000; Beatty option &isHerrmann 2002; Krosnick 2002). Thus, the NO intended as a caveat for cognitive hindrances, not motivational hindrances. Current recommendations from most survey researchers are not to provide a NO option for attitude and behavior questions. This is because research demonstrates that respondents’ ‘‘leanings’’ toward opinions – even if they are not confident about those opinions – strongly predict real outcomes (Craig & McCann 1978; Bradburn & Sudman 1991;Gilljam & Granberg 1993; Visser et al. 2000; Krosnick 2002;Beatty & Herrmann 2002; Elliott et al. 2005). Decades of research repeatedly demonstrate that most of the time respondents check NO to attitude questions simply because they do not want to do the required cognitive work for the question or reveal an embarrassing response (Craig & McCann1978; Bradburn & Sudman 1991; Dillman et al. 1993; Beatty &Herrmann 2002; Krosnick 2002; Elliott et al. 2005). 



cognitive question에 대해서는 주제나 응답대상자에 따라 NO 옵션을 주는 것이 필요하지만, NO가 아닌 다른 보기를 선택하는 경우에 그 응답에 대해서 100%의 확신이 없더라도 그것이 편안하게 느껴지게 해야 한다. 명확한 지침이 없을 경우, 어떤 응답자는 약간의 의심이 들 때 NO를 선택할 것이며, 어떤 응답자는 매우 의심이 들 때 NO를 선택할 것이다

Providing a NO option for a cognitive question may be necessary, based on the question topic and potential respond- ent, but the question should define the desired accuracy of judgment so people feel comfortable selecting something other than NO if they are not absolutely certain about the answer (Craig & McCann 1978; Bradburn & Sudman 1991; Dillman et al. 1993; Beatty & Herrmann 2002; Redline & Dillman 2002; Elliott et al. 2005). Without explicit instructions, one respondent may select NO if she has any doubt whereas another may select NO only if she has great doubt about the answer.


문항 건너뛰기

Skipped questions


 

일반적으로, 어떤 방식이든 설문은 가급적 짧게 만들어서 피로감을 덜어주어야 한다. 추가적으로, NO 보기가 주어질 경우 cognitive and motivational hindrance는 문항-비응답을 일으킬 수 있다.

In general, surveys of any modality should be kept as short as possible to avoid survey fatigue and subsequent item nonresponse. In addition, cognitive and motivational hindrances can cause item nonresponse in any survey modality if a NO response is provided.



우편 설문

Postal and paper questionnaires


응답자-친화적 설계가 중요하다.

Respondent-friendly designs are important and improve item response on postal questionnaires. Design points include:

    • (1) providing single-step instructions on a standard size sheet of paper,

    • (2) avoiding extra papers such as inserts,

    • (3) 이름은 한 번만 쓰게 listing name (if necessary) and demographic information only once (rather than on each page),

    • (4) 단면으로 using single sided forms,

    • (5) 아무 필기구나 사용하게 allowing the use of any writing tool,

    • (6) visually emphasizing the areas of the page that have the questions so respondents are not distracted by the optical scanner markings (Hox & de Leeuw 2002; Redline & Dillman 2002; Franko & Tirrell 2012).


종이 설문에서 질문을 branching하는 것은 문항-비응답 가능성을 높인다. 비록 이러한 비응답을 낮추기 위한 시각적 설계가 가능하지만, 가급적 사용하지 않기를 권고한다.

It is well established that branching questions in paper questionnaires are associated with greater item nonresponse rates (Hox & de Leeuw 2002; Redline & Dillman 2002; Franko & Tirrell 2012; Buskirk & Andrus 2013). Although there are visual designs to reduce the nonresponse impact, we recom- mend against any branching questions on paper question- naires.


 

면-대-면 설문, 전화 설문

Face-to-face and telephone surveys



웹/이메일 설문

Web/email surveys


웹 설문은 스마트폰의 활용과 함께 특히 어려워졌다. 스마트폰에서도 잘 보여야 한다.

The web questionnaire visual interface is particularly challenging with the increased use of smartphones (Franko & Tirrell 2012; Buskirk & Andrus 2013; Cullen 2013). A web survey designed for a standard desktop computer will appear jumbled and can even have answer spaces associated with the wrong question. Thus, researchers must choose to:

    • (1) 모바일에서 못 하게 한다. block mobile device users from accessing the desktop- formatted survey 

    • (2) 모바일용을 만든다 create additional surveys specifically designed for various mobile devices 

    • (3) 모든 기기에서 가능하게 만든다 provide an internet version that adjusts to any device (responsive design) 

    • (4) 응답자를 환경에 적응시킨다. force mobile users to adapt to the desktop interface (not recommended) (Franko & Tirrell 2012; Buskirk & Andrus 2013; Cullen 2013).


다양한 인터페이스에서 설문문항이 확실히 잘 보이게 만드는 것이 중요하다.

The overarching principle for reducing question skipping on web surveys is ensuring the questionnaire is clearly visible for various interfaces.


 

이러한 플랫폼을 염두에 두어야 함

Web surveys should be built with these platforms in mind so as to reach as many respondents as possible.


설문 서비스를 활용하라

We recommend using a survey service that offers a web interface that is designed to work well with most platforms and that surveys are tested by the questionnaire writers in all of the platforms. Use simple question layouts to avoid interface issues.


각 페이지에 얼마나 많은 수의 문항을 넣을 것인가도 고려사항이다. 페이지를 늘리는 것이 총 응답시간을 늘리고, 부담을 증대시킨다. 그러나 한 페이지가 너무 길면 그 페이지 중간에 응답자가 떠날 수 있다. 최적의 숫자가 명확하지는 않지만, 페이지당 다수의 문항을 넣는 것이 문항 응답률을 높인다.

Another important consideration for web surveys is how many questions to put on each page. Adding pages increases the total survey time (Dillman 2000a; Couper et al. 2001; Sue & Ritter 2012; Mavletova 2013), which increases survey burden. However, a long page may leave the respondent lost on the page, especially if he is using a mobile device. Optimal page length and number of questions on a page is not clear, but the literature consensus is that multiple questions per page improves item response rates (Dillman 2000a; Couper et al. 2001; Groves 2006; Sue & Ritter 2012).




간략한 도입 설명 Use a brief introduction (Dillman 2000a) 

Respondent already read information about the study in the invitation to participate 



간단하고 흥미로운 첫 질문 Provide an easy, interesting first question (Dillman 2000a). 

Motivates respondent 



개인식별번호를 넣도록 함 Consider a Personal Identification Number (PIN) to enter the questionnaire (Dillman 2000a) 

Prevents people outside of the study from accessing it and makes longitudinal studies easier 



각 질문이 숫자로 시작하게, 응답은 질문에 최대한 가까이 있게 Begin each question with a number and place the response to it as close as possible to the question (Dillman 2000a) 

Questionnaires aligned as blocks tend to be distorted when converted to different sizes 


지나친 색은 지양 Avoid excessive colour. Black on white is adequate (Dillman 2000a). 

Overlay of text on colour can be distorted depending on the user’s device palette 


각각의 질문-보기 짝을 분리시킴 Separate each question/answer pair (Dillman 2000a) 

Reduces wrap-around text and displacement of answer blocks that forces questions on top of one another 


"floating window"고려 Consider a ‘‘floating window’’ accessible by touching or hovering the cursor over a question (Dillman 2000a) 

Reduces propensity for wrap-around text and reduces total screen text. However, may not be viewed by everyone 


drop-down box의 숫자를 한 페이지에 보이게 제한함 Limit the number of drop-down box choices to a number visible at once on any screen (Couper et al. 2001) 

The options first visible may influence respondents to choose those answers over those for which they must scroll to view 


다운로드 시간에 영향을 주는 그래픽은 최소화 Minimize graphics and other features that increase page download time (Couper et al. 2001; Sue & Ritter 2012) 

Longer download times are associated with greater survey abandonment 


progress bar 포함 Include a simple progress bar (Couper et al. 2001; Sue & Ritter 2012) 

Motivates respondents to continue, but not strong evidence. Progress bar may increase download time


closed-ended or short open-ended questions 사용 Use closed-ended or short open-ended questions when possible rather than long, open-ended questions (Couper et al. 2001; Sue & Ritter 2012) 

Longer entry time reduces item response rates 


 

횡스크롤 사용금지 

Do  not require horizontal scrolling to view questions (Sue & Ritter 2012) 

Difficult interface for respondents; confusion over which questions and answers correspond 


‘‘double banking’’ or ‘‘triple banking’’ 고려

Consider ‘‘double banking’’ or ‘‘triple banking’’ (two or three columns of answers, respectively) for lists of answers longer than a single screen view (Dillman 2000a; Sue & Ritter 2012) 

Ensures that all possible answers have similar probability of being seen 


Arial, Times New Roman,or Verdana 사용

Use Arial, Times New Roman,or Verdana fonts at 14 point (Sue & Ritter 2012)

Fastest and most accurate reading fonts




비응답 편향

Part two: nonresponse bias



비응답편향 관련 요인

A. Factors Associated with Nonresponse Bias

   Respondent does not have a relationship with the sponsoring organization.

   Government sponsored surveys.

   Interviewer-administered questionnaires (compared to self- administered).

   General population (compared to specific populations).

   Attitudinal type questions (compared to behavioral and demographic questions). 


비응답편향 무관 요인

B. Factors Not Associated with Nonresponse Bias

   Prenotification of the survey.

   Incentives to participate in the survey.

   Health topic (compared to other topics generally).

   Urban (compared to mixed locations of homes).

   Majority ethnicity (compared to minority ethnicity).

   Topic relevance to the potential respondent (topic salience).

 

 

 

 

 

비응답편향의 이해

Understanding nonresponse bias


비응답 숫자와 비응답 편향의 가능성의 관계는 매우 낮다. 응답률과 비응답편향은 전혀 다른 두 가지 측정이다.

We now know that the number of nonrespondents and the probability of nonresponse bias are very poorly related (r ¼ 0.3) (Groves 2006; Halbesleben & Whitman 2013). Response rate and nonresponse bias are two different measurements, each of which provides different information to readers.


응답률이 비응답편향에 영향을 주려면, 응답하지 않은 사람과 설문의 질문 사이에 반드시 어떤 관계가 있어야 한다.

For example, a study on the professionalism of being tardy is likely to have nonresponse bias from people who arrived late and never turned in a survey. The reason the people did not turn in the survey (they were tardy) was related to the survey’s topic of interest (tardiness). A relationship must exist between the reason people did not respond and the questions being asked on the survey. Therefore, a low response rate does not in itself confer any bias. If the reason for the low response rate has nothing to do with the survey topic, then there should not be any bias. There must be a relationship between the reason for nonresponse and the survey, and the opinions of those who did not respond must differ significantly from those who did respond. This is a very different notion from previous conceptions of nonresponse bias.



 

비응답편향 계산

Calculating nonresponse bias


진정한 의미에서 비응답편향을 계산하는 것은 불가능하다.

It is impossible to calculate a true nonresponse bias since it is a number that does not exist. We must use either proxy data or proxy nonrespondents.


비응답편향 계산법

Ways to calculate nonresponse bias can be conceptualized as either

(1) 비응답자의 proxy를 활용함 measuring the variable of interest for proxy nonrespondents or

(2) 실제 비응답자에 대한 supportive data를 활용함 measuring supportive data (a proxy for the variable of interest) for the real nonrespondents. 


 


관심 변인 평가 방법

Methods evaluating the variable of interest




There are several methods for calculating response bias using proxy nonrespondents; here we explore the more common ones: wave analysis and follow up analysis.



1. wave analysis

늦게 응답을 하는 사람들이 nonrespondents의 proxy이다.

In wave analysis, late respondents (those who require reminders to respond) are proxies for nonrespondents. The responses in the last wave of surveys returned (such as after the final email reminder) are compared to the first wave of responses (such as the initial invitation to participate). This method uses late respondents as nonrespondent proxies and is a commonly used, simple, and well accepted method to evaluate nonresponse bias. Researchers can point to their wave analysis to directly demonstrate whether or not their study suffered from nonresponse bias. See Jutel and Menkes’ article as a published, real data example (Doherty & Ellis- Chadwick 2003; Jutel & Menkes 2009).


 

2. follow up analysis

어떤 시점에서까지 응답하지 않은 사람에게 매우 짧은 설문을 하게 하는 것. 여기에 응답한 사람들이 비응답자의 proxy가 된다.

Follow-up analysis is a common method in which researchers contact potential respondents in the sampling frame (population of interest) who are up to that point still nonrespondents and ask a very shortened survey, such as one or two most important questions, without demographic or other supportive information. The follow up respondents are considered proxies for the nonrespondents. Nonresponse bias is then calculated for the variable(s) asked of the (up to that point) nonrespondents. It is often difficult to obtain a large enough number of follow-up respondents amongst people who were already not responding to the survey. Nor is there a defined minimum number or proportion of follow-up respond- ents to analyse the data. Additionally, this method does not provide any information such as demographics or secondary survey questions to explain why the follow-up respondents are different from the original sample. In the wave analysis, researchers can look through the other supporting information available for all of the respondents, but not in follow-up analysis. A study by Doherty and Ellis-Chadwick is a good practical example of how to conduct a follow-up analysis (Doherty & Ellis-Chadwick 2003).



Supporting data의 평가방법

Methods evaluating supporting data


 

population comparison method

 

예) 1학년 대상 설문을 한다면, 응답자 중 여성응답자의 비율을 1학년 전체 중 여성의 비율과 비교하는 것

The population comparison method uses different sources for information about nonrespondents to compare demographic information between respondents and nonrespondents or between respondents and the entire population. For example, a researcher giving a survey to the entire first year medical student class could compare the proportion of female respondents against the proportion of females in the entire first year class, information that is typically readily available from the dean’s office.


 

중요한 점은, 남성의 응답률과 여성의 응답률을 비교하는 것이 아니다.

It is important to recognize that the population comparison method is NOT comparing the response rate between demo- graphic groups of responders. (e.g. whether the response rate for males was similar to the response rate for females).




 

 




 2016 Mar;38(3):217-28. doi: 10.3109/0142159X.2015.1105945. Epub 2015 Dec 9.

 

Improving response rates and evaluating nonresponse bias in surveysAMEE Guide No. 102.

 

Author information

  • 1a Stanford University , USA .
  • 2b University of Chicago , USA .
  • 3c Uniformed Services University (USU) , USA.

Abstract

Robust response rates are essential for effective survey-based strategies. Researchers can improve survey validity by addressing both responserates and nonresponse bias. In this AMEE Guide, we explain response rate calculations and discuss methods for improving response rates tosurveys as a whole (unit nonresponse) and to questions within a survey (item nonresponse). Finally, we introduce the concept of nonresponse biasand provide simple methods to measure it.

PMID:
 
26648511
 
[PubMed - in process]


교육연구를 위한 설문지 개발(AMEE Guide No.87)

Developing questionnaires for educational research: AMEE Guide No. 87

ANTHONY R. ARTINO, JR.1, JEFFREY S. LA ROCHELLE1, KENT J. DEZEE1 & HUNTER GEHLBACH2

1Uniformed Services University of the Health Sciences, USA, 2Harvard Graduate School of Education, USA


 

 


도입: 의학교육연구에서의 설문

Introduction: Questionnaires in medical education research


2011년과 2012년 Meadical Teacher에 출판된 원저를 분석한 연구에 따르면, 37개(24%)의 논문에서 설문조사를 연구 설계의 한 부분으로 활용하였다. 비슷하게, 설문은 GME 연구에서도 흔히 사용된다. JGME에 2011~2012년에 출판된 논문의 75%가 설문을 사용하였다.

In our recent review of original research articles published in Medical Teacher in 2011 and 2012, we found that 37 articles (24%) included surveys as part of the study design. Similarly, surveys are commonly used in graduate medical education research. Across the same two-year period (2011–2012), 75% of the research articles published in the Journal of Graduate Medical Education used surveys.


의학교육에서 설문이 널리 사용되고 있지만, 어떻게 설문을 설계하는 것이 최선인지에 대한 논문은 별로 없다.

Despite the widespread use of surveys in medical education, the medical education literature provides limited guidance on the best way to design a survey (Gehlbach et al. 2010). Consequently, many surveys fail to use rigorous methodologies or ‘‘best practices’’ in survey design.


설문 척도 설계의 체계적 7단계

A systematic, seven-step process for survey scale design


설문survey라는 용어는 광범위하게 사용되고 있어서, 전화 인터뷰, 포커스 그룹에 사용되는 문항 세트, 자기기입식 환자 설문의 질문 등을 포함한다.

The term ‘‘survey’’ is quite broad and could include the questions used in a phone interview, the set of items employed in a focus group and the questions on a self- administered patient survey (Dillman et al. 2009).


우리는 주로 자기기입식 설문에 초점을 두고자 하며, questionnaire라고 불리기도 한다.

we focus primarily on self-admin- istered surveys, which are often referred to as questionnaires.


questionnaire를 만들기 전에, 우선 설문이 연구질문이나 관심 대상이 되는 construct를 보는데 최선의 방법인지를 결정해야 한다. Construct란 연구자가 평가하고자 하는 모델/아이디어/이론을 말한다.

Before creating a questionnaire, however, it is imperative to first decide if a survey is the best method to address the research question or construct of interest. A construct is the model, idea or theory that the researcher is attempting to assess.


예컨대, 의과대학생의 만족도에 대해서 관심이 있다고 하면, 단순히 '얼마나 만족하나요?'라고 물어볼 수도 있다. 그러나 더 나은 방법은 만족도를 구성하는 여러 측면을 물어보도록 설계하는 것이다 (교육 시설에 대해서 / 교수자에 대해서 / 스케줄에 대해서 얼마나 만족하나요?)

As an example,consider a medical education researcher interested in assess-ing medical student satisfaction. One approach would be to simply ask one question about satisfaction (e.g. How satisfied were you with medical school?). A better approach, however,would be to ask a series of questions designed to capture the different facets of this satisfaction construct (e.g. How satisfied were you with the teaching facilities? How effective were your instructors? and How easy was the scheduling process?). 



단계1: 문헌조사

Step 1: Conduct a literature review


문헌조사의 목적에는 두 가지가 있다. (1)Cosntruct를 명확히 정의함, (2) Construct의 척도(혹은 관련된 construct)가 이미 존재하는지 확인함.

There are two primary purposes for the literature review: (1) to clearly define the construct and (2) to determine if measures of the construct (or related constructs) already exist.


 

모든 타당도 연구에서 construct를 명확히 정의내리는 것은 필수적인 단계이다. Construct에 대한 좋은 정의는 기존 문헌과의 관계 속에서 위치하게 되며, 다른 construct와 어떻게 관계되는지, 관련된 construct들과 어떻게 다른지 등을 필요로 한다. 잘 쓰여진 정의는 그 construct를 어느 수준에서 추상화하여 측정할 것인지를 결정하는데도 도움이 된다 ('입자 크기grain size'라고 불리는 것). 예컨대, 필수 임상술기 수행에 대한 피훈련자의 자신감을 연구할 때, 청진에 얼마나 자신이 있는지를 평가하는 척도를 개발할 수도 있고(small grain), 신체검진을 수행해보게 할 수도 있고(medium grain), 어떤 전공specialty에 관해서 필수 임상술기를 수행하게 할 수도 있다(large grain)

Formulating indispensable how a first clear step definition of the construct is an the in any validity study clarify (Cook & Beckman 2006). A good definition will construct is positioned within the existing literature, how it relates to other constructs and how it is different from related constructs (Gehlbach & Brinkworth 2011). A well-formulated definition also helps to determine the level of abstraction at which to measure a given construct (the so-called ‘‘grain size’’,as defined by Gehlbach & Brinkworth 2011). For example, to examine medical trainees’ confidence to perform essential clinical skills, one could develop scales to assess their confidence to auscultate the heart (at the small-grain end of the spectrum), to conduct a physical exam (at the medium-grain end of the spectrum) or to perform the clinical skills essential to a given medical specialty (at the large-grain end ofthe spectrum).


비록 많은 의학교육연구자들이 설문지를 독립적으로 개발하지만, 기존의 설문지를 활용하는 것이 더 효율적일 수 있다.

Although many medical education researchers prefer to develop their own surveys independently, it may be more efficient to adapt an existing questionnaire


SEPT에서 묘사된 것과 같기, '타당도'란 그 척도의 의도한 목적을 지지하는 근거의 정도degree이다.

As described in the Standards for Educational and Psychological Testing, validity refers to the degree to which evidence and theory support a measure’s intended use (AERA, APA, & NCME 1999).


더 나아가서, 신뢰도/타당도는 설문도구의 특성이 아니라, 설문에서 얻은 점수와 그 해석에 대한 것이다. 

Furthermore, it is important to acknowledge that reliability and validity are not properties of the survey instrument, per se, but of the survey’s scores and their interpretations (AERA, APA, & NCME 1999). 


 

단계2: 인터뷰/포커스 그룹 수행

Step 2: Conduct interviews and/or focus groups
 

또 다른 말로는, 인터뷰 응답자들은 construct에 대하여 문헌에서 나온 것과 동일한 특성을 포함(또는 배제)시켰는가? 인터뷰 응답자들이 construct를 묘사할 때 어떤 단어를 사용하였는가?

 

In other words, do respondents include and exclude the same features of the construct as those described in the literature? What language do respondents use when describing the construct?


비유를 들자면 의사와 환자는 둘 다에게 받아들여질 수 있는 새로운 계획을 개발해야 한다. 많은 의사들은 환자를 대하는데 어려움을 겪곤 한다. construct도 마찬가지인데, 연구자는 construct를 정의내릴 때 불가피하게 연구자 자신의 관점과 편견을 반영시키게 되므로, 타인의 관점이 필요하다.

The clinician and patient then must develop a new plan that is acceptable to both. Many clinicians have also experienced difficulty treating a patient, A construct is no different. the researcher unavoidably brings his/her perspectives and biases to this definition, Thus, other perspectives are needed.


설계 프로세스의 2단계를 완수하기 위해서, 설문 개발자는 응답자의 관점에서의 input을 필요로 한다. 인터뷰와 포커스 그룹은 그러한 input을 얻는데 합당한 방법이다.

In order to accomplish Step 2 of the design process, the survey designer will need input from prospective respondents. Interviews and/or focus groups provide a sensible way to get this input.


단계 3: 문헌리뷰와 인터뷰 결과를 합하기

Step 3: Synthesize the literature review and interviews/focus groups


 

3단계를 수행하는 합당한 방식 중 하나는, 문헌조사와 인터뷰 결과를 합해서 construct를 위한 지표의 포괄적 목록을 만드는 것이다.

One suitable way to conduct Step 3 is to develop a comprehensive list of indicators for the construct by merging the results of the literature review and interviews/focus groups (Gehlbach & Brinkworth 2011).


이들 자료가 개념적으로 유사하지만 문헌과 인터뷰 응답자가 서로 다른 용어로 construct를 묘사하고 있다면, 인터뷰 응답자의 용어를 활용하는 것이 보다 합당하다. 예컨대, 교사의 자신감('자기효능감')을 평가하 때, '새로운 테크닉을 시도할 때의 자신감'을 물어보는 것이 '신교수법 활용의 효과성'이라고 물어보는 것보다 낫다.

When these data are similar conceptually, but the literature and potential respondents describe the construct using different terminology, it makes sense to use the vocabulary of the potential respondents. For example, when assessing teacher confidence (sometimes referred to as teacher self-efficacy), it is probably more appropriate to ask teachers about their ‘‘confidence in trying out new teaching techniques’’ than to ask them about their ‘‘efficaciousness in experimenting with novel pedagogies’’ (Gehlbach et al. 2010).


최종적으로 문헌에서 찾은 것과 다른 식의 construct definition을 내리기 위해서는 합당한 이유가 있어야 한다.

It is worth noting that scholars may have good reasons to settle on a final construct definition that differs from what is found in the literature.



 

단계 4: 문항 개발

Step 4: Develop items


일반적으로, 궁극적으로 최종 스케일에 활용될 문항의 숫자보다 더 많은 수의 문항을 만드는 것이 낫다(8개 문항 설문을 만들기 위해서는 15개 문항 개발). 왜냐하면 일부 문항을 제거되거나 수정될 가능성이 높기 때문이다. 궁극적으로, 문항의 숫자를 결정하는 것은 professional judgment의 문제이긴 하나, 가장 협소하게 정의된 construct에 대해서 6~10개 정도의 문항으로 이뤄진 스케일이면 현상의 본질을 신뢰성있게 보여줄 수 있다.

In general, it is good practice to develop more items than will ultimately be needed in the final scale (e.g. developing 15 potential items in the hopes of ultimately creating an eight-item scale), because some items will likely be deleted or revised later in the design process (Gehlbach & Brinkworth 2011). Ultimately, deciding on the number of items is a matter of professional judgment, but for most narrowly defined constructs, scales containing from 6 to 10 items will usually suffice in reliably capturing the essence of the phenomenon in question.



Table 2 presents several item-writing pitfalls and offers solutions.


 

Table 2 and Figure 1 present several common mistakes designers commit when writing and formatting their response options.

 


Table 3 provides several examples of five- and seven-point response scales that can be used when developing Likert- scaled survey instruments.

 


 


단계 5: 전문가 확인validation

Step 5: Conduct expert validation


 

전문가 패널을 선정하기 전에, 누가 '전문가'로서의 자격을 갖췄는지에 대한 구체적 기준을 정해야 한다.

First, before selecting a panel of experts to evaluate the content of a new question- naire, specific criteria should be developed to determine who qualifies as an expert.


한 가지 유용한 접근법은 레퍼런스 목록에 등장하는 저자들을 찾는 것이다. 

 

One useful approach to finding experts is to identify authors from the reference lists of the articles reviewed during the literature search.


Rubio 등은 6~10명의 전문가를 권장했으며, 더 많은 전문가가 동원될수록 construct에 대한 더 명확한 합의가 생성될 수 있으며, 항목의 퀄리티와 관련성도 더 향상될 것이라고 했다.

Rubio et al. (2003) recommends using 6–10 experts, while acknowledging that more experts (up to 20) may generate a clearer consensus about the construct being assessed, as well as the quality and relevance of the proposed scale items.


일반적으로, 전문가 검토를 통해서 확인하려는 것은 대표성/명확성/관련성/분포 등이다.

In general, the key domains to assess through an expert validation process are representativeness, clarity, relevance and distribution.

  • 대표성: 문항들이 얼마나 전체 construct를 나타내는가 Representativeness is defined as how com-pletely the items (as a whole) encompass the construct,

  • 명확성: 문항의 기술된 형태가 얼마나 명확한가 clarity is how clearly the items are worded and

  • 관련성: 각 문항이 construct의 구체적 측면과 얼마나 연관되어있는가 relevance refers to the extent each item actually relates to specific aspects of the construct.

  • 분포: 분포는 늘 전문가 검토를 통해서 측정되는 것은 아니다. 왜냐하면 응답자가 특정 문항에서 '높은 점수를 선택하기에' 문항이 '얼마나 어려운가'와 같은 보다 미묘한 측면에 대한 것이기 때문이다. 다른 말로 하면, 평균적인 의과대학생 설문은 자신감 관련 문항에서 '해부학 시험에서 100점을 맞을 것으로 얼마나 자신합니까?'와 같이 물었을 때 높은 점수를 선택하기 매우 어렵다. 대신 이러한 문항을 '해부학 시험을 통과할 자신이 얼마나 있습니까'라고 물으면 학생들은 대답하기 더 수월할 것이다. 
    The distribution of an item is not always measured during expert validation as it refers to the more subtle aspect of how ‘‘difficult’’ it would be for a respondent to select a high score on a particular item. In other words, an average medical student may find it very difficult to endorse the self-confidence item, ‘‘How confident are you that you can get a 100% on your anatomy exam’’, but that same student may find it easier to strongly endorse the item, ‘‘How confident are you that youcan pass the anatomy exam’’. 


 

양적 자료 수집에 더하여, 설문 개발자들은 서술형 응답도 받아야 한다.

In addition to collecting quantitative data, questionnaire designers should provide their experts with an opportunity to provide free-text comments.


 

단계 6: 인지 인터뷰cognitive interviews 시행

Step 6: Conduct cognitive interviews

 


 

response process validity의 근거를 수집하는 것이 중요하다.

it is important to collect evidence of response process validity


이러한 근거를 수집하는 한 가지 방법은 cognitive interview 혹은 cognitive pre-testing 이라고 불리는 단계를 밟는 것이다.

One means of collecting such evidence is achieved through a process known as cognitive interviewing or cognitive pre-testing (Willis 2005).


cognitive interviews 의 결과는 응답자들이 문항 또는 보기를 어떻게 해석함에 있어서 어떠한 실수를 하는지 알아보기에 좋다. 질적 테크닉으로서, 이 단계의 분석은 수치자료에 대한 통계적 분석이 아니라, 인터뷰의 코딩과 해석에 의존한다. 따라서 표본 크기는 작은 편이며 10~30명의 대상자만 포함한다.

Results from cognitive interviews can be helpful in identifying mistakes respondents make in their interpretation of the item or response options (Napoles-Springer et al. 2006; Karabenick et al. 2007). As a qualitative technique, analysis does not rely on statistical tests of numeric data but rather on coding and interpretation of written notes from the interview. Thus, the sample sizes used for cognitive interviewing are normally small and may involve just 10–30 participants (Willis & Artino 2013).


Cognitive interviewing 은 심리학에서 테크닉을 가져왔으며, 통상적으로 응답자가 설문에 응답할 때 일련의 cognitive process를 거친다고 가정한다. 이 단계에는...

Cognitive interviewing employs techniques from psych- ology and has traditionally assumed that respondents go through a series of cognitive processes when responding to a survey. These steps include

  • comprehension of an item stem and answer choices,

  • retrieval of appropriate information from long-term memory,

  • judgment based on comprehension of the item and

  • their memory and finally selection of a response (Tourangeau et al. 2000).

 

응답자가 각 단계에서 difficulty를 겪을 수 있기 때문에, cognitive interview 는 모든 잠재적 문제에 대응할 수 있게 설계 및 기술script되어야 한다. 중요한 첫 번째 단계는 각 문항에 대하여 설문 개발자가 애초에 의도한 의미를 반영할 수 있는 코딩 기준을 만드는 것이다. 이것은 cognitive interview 과정에서 수집되는 응답의 해석을 도와준다.

Because respondents can have any cognitive interview difficulty at stage, a should be designed and scripted to address any and all of these potential problems. An important first step in the cognitive interview process is to create coding criteria that reflects the survey creator’s intended meaning for each item (Karabenick et al. 2007), which can then be used to help interpret the responses gathered during the cognitive interview.


cognitive interview 를 수행하는 두 가지 주요 테크닉은 think-aloud technique verbal probing이다.

The two major techniques for conducting a cognitive interview are the think-aloud technique and verbal probing.

 

  • 응답하면서 떠오르는 모든 생각을 말로 표현하게 함. 인터뷰어는 지속적으로 말을 하도록 장려함으로써 이 과정을 지지해주며, 말한 내용을 기록한다. 그러나 대부분의 응답자에게 이 과정은 부자연스럽거나 어려우며, 방대한 양의 free-response data를 생성한다는 단점이 있다.
    The think-aloud technique requires respondents to verbalize every thought that they have while answering each item. Here, the interviewer simply supports this activity by encouraging the respondent to keep talking and to record what is said for later analysis (Willis & Artino 2013). This technique can provide valuable information, but it tends to be unnatural and difficult for most respondents, and it can result in reams of free-response data that the survey designer then needs to cull through.

  • 보다 능동적인 형태의 자료 수집으로서, 인터뷰어가 일련의 probe 질문을 던져서 구체적인 정보를 얻는 것이다. 보통 동시적 probing과 후향적 probing으로 나눠진다.
    A complementary procedure, verbal probing, is a more active form of data collection where the interviewer adminis- ters a series of probe questions designed to elicit specific information (Willis & Artino 2013; see Table 4 for a list of commonly used verbal probes). Verbal probing is classically divided into concurrent and retrospective probing.

    • 동시적 프로빙: 응답을 하는 중간에 물어봄. 최근의 생각을 응답할 수 있음.
      In concur- rent probing, the interviewer asks the respondent specific questions about their thought processes as the respondent answers each question. Although disruptive, concurrent probing has the advantage of allowing participants to respond to questions while their thoughts are recent.

    • 후향적 프로빙: 모든 설문을 마친 이후에 하게 되며, 덜 disruptive함. 단점은 recall bias와 hindsight effect.
      Retrospective probing
      , on the other hand, occurs after the participant has completed the entire survey (or section of the survey) and is generally less disruptive than concurrent probing. The down- side of retrospective probing is the risk of recall bias and hindsight effects (Drennan 2003).

    • 즉각적 후향적 프로빙: 두 가지를 변형한 것으로서, 인터뷰어가 설문 중간에 자연스럽게 break를 포함히켜 두는 것이다. 각 항목 사이에 interruption이 없다. recall bias나 hindsight effect를 줄여준다.
      A modification to the two verbal probing techniques is defined as immediate retrospect- ive probing, which allows the interviewer to find natural break points in the survey. Immediate retrospective probing allows the interviewer to probe the respondent without interrupting between each item (Watt et al. 2008). This approach has the potential benefit of reducing the recall bias and hindsight effects while limiting the interviewer interruptions and decreasing the artificiality of the process.

 

실제로는 많은 cognitive interview는 think-aloud와 verbal probing을 모두 사용한다.

In practice, many cognitive interviews will actually use a mixture of think-aloud and verbal probing techniques to better identify potential errors.



 

일단 cognitive interview 가 완료되면, 몇 가지 분석법이 있다.

Once a cognitive interview has been completed, there are several methods for analyzing the qualitative data obtained.

 

한 가지 방법은 coding을 하는 것이다. 사전에 결정된 코드에 따라서 자주 발생하는 에러/각 에러의 빈도/에러의 심각성 등을 코딩한다.

One way to quantitatively analyze results from a cognitive interview is through coding. With this method, pre-determined codes are established for common respondent errors (e.g. respondent requests clarification), and the frequency of each type of error is tabulated for each item(Napoles-Springer et al. 2006). In addition, codes may be ranked according to the pre-determined severity of the error.

 

양적 결과가 해석을 하기에는 용이하나, 예측하지 못한 에러를 놓치거나 왜 그러한 에러가 발생하는지에 대한 설명은 해주지 못한다. 따라서 질적 접근법이 활용되기도 한다. interaction analysis는 사람들이 대화를 하는 도중에 해석하고 상호작용하는 방식을 묘사하고 설명할 때 사용되는 전형적인 방법이며, cognitive interview에도 적용되어서 응답의 의미를 해석하는데 사용할 수 있다.

Although the quantitative results of this analysis are often easily interpretable, this method may miss errors not readily predicted and may not fully explain why the error is occurring (Napoles-Springer et al. 2006). As such, a qualitative approach to the cognitive an interaction interview can also be employed through analysis. Typically, an interaction analysis attempts to describe and explain the ways in which people interpret and interact during a conversation, and this method can be applied during the administration of a cognitive interview to determine the meaning of responses (Napoles-Springer et al. 2006).

 

coding과 interaction analysis가 상당히 효과적이며, 새로운 설문지에 대한 cognitive validity를 제공한다.

Studies have demonstrated that the combination of coding and interaction analysis can be quite effective, providing more information about the ‘‘cognitive validity’’ of a new question- naire (Napoles-Springer et al. 2006).


 

단계7: 파일럿 테스트

Step 7: Conduct pilot testing

 

 

 

설문의 내적 구조를 확인하고 어떤 문항이 single underlying construct를 측정하는지 평가하기 위해서는 (척도의 단차원성), 설문 개발자는 factor analysis 등을 활용해야 한다. 요인분석은 ‘‘the number of distinct constructs needed to account for the pattern of correlations among a set of measures’’

To ascertain the internal structure of the questionnaire and to evaluate the extent to which items within a particular scale measure a single underlying construct (i.e. the scale’s uni- dimensionality), survey designers should consider using advanced statistical techniques such as factor analysis. Factor analysis is a statistical procedure designed to evaluate ‘‘the number of distinct constructs needed to account for the pattern of correlations among a set of measures’’ (Fabrigar & Wegener 2012, p. 3).

 

단일한 construct를 평가하기 위해 개발된 설문 스케일의 차원성dimensionality를 평가하기 위해서는 우리는 CFA를 활용하기를 권고한다. 다른 학자들은 새로운 척도의 분석에는 EFA가 더 적절하다고 주장하기도 한다. 구체적인 분석 방법과 무관하게, 연구자들은 요인분석이 종종 잘못 이해되고 잘못 수행된다는 것을 알아야 한다. 가이드가 있다.

To assess the dimensionality of a survey scale that has been deliberately constructed to assess a single construct (e.g. using the processes described in this study), we recom- mend using confirmatory factor analysis techniques; that said, other scholars have argued that exploratory factor analysis is more appropriate when analyzing new scales (McCoach et al. 2013). Regardless of the specific analysis employed, research- ers should know that factor analysis techniques are often poorly understood and poorly implemented; fortunately, the literature is replete with many helpful guides (see, for example, Pett et al. 2003; McCoach et al. 2013).


가장 흔한 신뢰도 평가 척도는 Cronbach's alpha이다. 그러나 흔히 생각하는 것처럼 Cronbach's alpha는 척도의 단-차원성의 좋은 척도는 아니다. 따라서 대부분의 경우에 설문 개발자는 먼저 요인분석을 수행하여 척도의 단차원성을 평가한 다음, 신뢰도 분석을 진행해서 internal consistency를 평가해야 한다. Cronbach's alpha가 척도의 길이에 민감하기 때문에, 다른 모든 조건이 동등하다면 더 긴 척도가 더 높은 점수를 얻게 해준다. 당연히 척도의 길이와 이에 따른 내적 일관성의 향상은 응답자에게 과도한 부담이 되지 않도록 균형을 이뤄야 한다. 설문지가 너무 길거나 응답자가 피로해지면 응답의 오류가 수반되기 마련이다.

The most common means of assessing scale reliability is by calculating a Cronbach’s alpha coefficient. It is important to note that Cronbach’s alpha is not a good measure of a scale’s uni-dimensionality (measuring a single concept) as is often assumed (Schmitt 1996). Thus, in most cases, survey designers should first run a factor analysis, to assess the scale’s uni-dimensionality and then proceed with a reliability analysis, to assess the internal consistency of the item scores on the scale (Schmitt 1996). Because Cronbach’s alpha is sensitive to scale length, all other things being equal, a longer scale will generally have a higher Cronbach’s alpha. Of course, scale length and the associated increase in internal consistency reliability must be balanced with over-burdening respondents and the concomitant response errors that can occur when questionnaires become too long and respondents become fatigued.


척도의 단-차원성과 내적 일관성이 평가되고 난 다음에는, 설문 개발자는 각 척도를 종합한 점수composite score를 생성한다. 연구질문에 따라 다르겠지만, 이러한 종합점수는 독립/종속 변인으로 사용된다. 종합점수는 단순히 평균을 낸 점수가 될 수 있다(가중치가 있거나 없거나). 평균점수를 사용하는 것이 점수 합을 내는 것보다 장점이 있다.

Once a scale’s uni-dimensionality and internal consistency have been assessed, survey designers often create composite scores for each scale. Depending on the research question being addressed, these composite scores can then be used as independent or dependent variables. A composite score is simply a mean score (either weighted or unweighted) of all the items within a particular scale. Using mean scores has several distinct advantages over summing the items within a particular scale or subscale.

  • 점수를 anchor에 따라 해석하기가 더 직관적
    First, mean scores are usually reported using the same response scale as the individual items; this approach facilitates more direct interpretation of the mean scores in terms of the response anchors.

  • 개인이나 집단 수준에서 차이를 비교하기 좋음. Colliver는 "점수의 합계는 척도와 문항 수를 모두 반영하게 되는데, 이는 점수 간 차이를 더 과장시키며, 실제보다 그 차이가 가지는 의미를 더 과장시킨다"
    Second, the use of mean scores makes it clear how big (or small) measured differences really are when comparing individuals or groups. As Colliver et al. (2010) warned, ‘‘the sums of ratings reflect both the ratings and the number of items, which magnifies differences between scores and makes differences appear more important than they are’’ (p. 591).




Christian LM, Parsons NL, Dillman DA. 2009. Designing scalar questions for web surveys. Sociol Method Res 37:393–425.


Sullivan G. 2011. A primer on the validity of assessment instruments. J Grad Med Educ 3(2):119–120.


Sullivan GM, Artino AR. 2013. Analyzing and interpreting data from Likert- type scales. J Grad Med Educ 5(4):541–542.


Rickards G, Magee C, Artino AR. 2012. You can’t fix by analysis what you’ve spoiled by design: developing survey instruments and collecting validity evidence. J Grad Med Educ 4(4):407–410.



 



 

 


 





 2014 Jun;36(6):463-74. doi: 10.3109/0142159X.2014.889814. Epub 2014 Mar 24.

Developing questionnaires for educational researchAMEE Guide No. 87.

Author information

  • 1Uniformed Services University of the Health Sciences , USA .

Abstract

In this AMEE Guide, we consider the design and development of self-administered surveys, commonly called questionnairesQuestionnaires are widely employed in medical education research. Unfortunately, the processes used to develop such questionnaires vary in quality and lack consistent, rigorous standards. Consequently, the quality of the questionnaires used in medical education research is highly variable. To address this problem, this AMEE Guide presents a systematic, seven-step process for designing high-quality questionnaires, with particular emphasis ondeveloping survey scales. These seven steps do not address all aspects of survey design, nor do they represent the only way to develop a high-quality questionnaire. Instead, these steps synthesize multiple survey design techniques and organize them into a cohesive process for questionnaire developers of all levels. Addressing each of these steps systematically will improve the probabilities that survey designers will accurately measure what they intend to measure.

PMID:
 
24661014
 
[PubMed - indexed for MEDLINE] 
PMCID:
 
PMC4059192
 
Free PMC Article


 

 

의학교육에서 질적연구방법 (Understanding Medical Education ch22)

Qualitative research methods in medical education (Understanding Medical Education ch22)

Lorelei Lingard and Tara J Kennedy








질적연구의 패러다임과 목적

The Paradigm and Purpose of Qualitative Research


의학교육에서 질적연구는 무엇인가?

What is qualitative research in medical education?


질적연구를 통한 탐구에는 'how'와 'what'질문이 적합하다.

How and what questions are particularly suited for exploration through qualitative research ( see Box 22.1 ).

 

 


 

'질적연구'라는 용어는 넓은 범위의 접근법과 방법론을 포함한다.

The term ‘ qualitative research ’ encompasses a broad range of approaches and methods,


그러나 이들 특수성에도 일부 generic 원칙들이 적용된다. 질적연구는 natural environment에서 연구의 목적을 탐구하는 것이며, 어떤 현상을 경험하는 사람들을 관찰하거나 그들과 상호작용하게 된다. 질적연구는 복잡성complexity에 대한 이해를 추구하며, 사회나 인류의 현상에 대해 풍부한 textured account (질감을 살린 설명)을 더해준다. 또한 질적연구는 맥락의 역할이 무엇인지에 관심을 갖으며, 시간과 공간에 연결된 상황적 설명situated account를 제공한다. 이들 원칙의 결과로서, 질적연구의 목적은 어떤 상황의 세심한 이해이다. 질적연구는 '일반화가능성'을 주장하고자 하는 것이 아니며, 오히려 상황에 따른 이해와 이론의 설립situated understanding and theory building에 가치를 둔다.

However, some generic principles maintain across these particulari- ties. Qualitative research explores the object of study within its natural environment, by observing and interacting with the people experiencing the phenom- enon. Qualitative research seeks to understand com- plexity, to offer a richly textured account of social or human phenomena. Also, qualitative research attends carefully to the role of context, to produce situated accounts that are anchored in space and time. As a consequence of these principles, the goal of qualitative research is the careful understanding of instances. It does not make claims to generalisability; rather, it values situated understanding and theory building.


의학교육에서 질적연구의 기원은?

What are the origins of qualitative research in medical education? 


의학교육에서 질적연구는 사회과학과 인문학 등의 분야로부터 도입되었으며, 인류학, 사회학, 교육학, 역사학 등이다.

Qualitative research comes to medical education from the social sciences and humanities, from disciplines such as anthropology, sociology, education and history.


Harris에 따르면, 이들 학문분야에서 의학교육으로 방법론이 들어오게 된 것은 1980년대부터 시작되었으며, 이 당시는 '통제된 실험'이라는 우세적 패러다임을 보완하기 위하여, 보다 규범적인prescriptive 이론의 설립을 요구하던 시대였다. 흥미롭게도, 이러한 요구는 의학교육연구의 review에서 지속적으로 이론 설립을 요구하고 복잡한 사회적 의문을 탐구하는 질적 전략을 요구하면서 지속되었다.

According to Harris, (1) the importation of methods from these disciplines into medical education began in the 1980s amid calls for more prescriptive theory building to complement the dominant paradigm of controlled experiments. Interestingly, these calls persist as reviews of the medical education research fi eld continue to identify a need for increased theory building and qualitative strategies of inquiry to grapple with complex social questions. (2)


질적연구 패러다임이란?

What is the qualitative paradigm?


 

질적연구에 대한 논의는 종종 '질적 패러다임'에 대한 것으로부터 시작한다. Denzin and Lincoln이 설명했던 바와 같이 패러다임이란 '행동을 가이드해주는 신념의 기본 집합 basic sets of beliefs that guide action'이다. Harris는 이것을 ‘학자 집단으로부터 당연하게 여겨지는 가정, 인지적 로드맵 cognitive road maps, taken - for - granted assumptions within communities of scholars ’ 라고 설명하였으며, 연구자에게 의미와 노력의 방향을 제시해주는 것이라 하였다. Denzin and Lincoln에 따르면 패러다임의 개념은 세 가지 요소를 포함한다. 인식론epistemology, 존재론ontology, 방법론methodology이다. 인식론은 세계관을, 존재론은 현실에 대한 신념을, 방법론은 자료의 수집과 분석 도구를 의미한다.

Discussions on qualitative research often begin with reference to ‘ the qualitative paradigm ’ As Denzin and Lincoln (3) explain, paradigms are basic sets of beliefs that guide action; Harris describes them as ‘ cognitive road maps, taken - for - granted assumptions within communities of scholars ’ (1) that orient researchers towards meaning and the research endeavour. The concept of paradigm includes three elements accord- ing to Denzin and Lincoln: epistemology, ontology and methodology. (3) Epistemology refers to world view, ontology to beliefs about reality, and methodol- ogy to tools for data collection and analysis.


질적 패러다임qualitative paradigm 이란 용어는, 사실 부적절한 명칭인데, 왜냐하면 질적연구는 다양한 스펙트럼의 패러다임 안에서 이뤄지기 때문이다. 실증주의, 후기실증주의, 구성주의, 비판이론critical theory, 포스트모더니즘 등이다. 현재 의학교육에서 질적연구를 framing하는 우세적인 패러다임은 후기실증주의와 구성주의이다.

The qualitative paradigm is, in fact, a misnomer, for qualitative research takes place within a vast spectrum of paradigms: positivism, post - positivism, constructiv- ism, critical theory and post - modernism. In medical education, the dominant paradigms currently framing qualitative research tend to be post - positivism and constructivism.

 

  • 후기실증주의는 옳은 연구 절차가 있다면 발견가능한 '객관적인 현실'이 존재한다고 보는 점에서 실증주의와 공유하는 점이 있다. 그러나 후기실증주의를 실증주의와 구분짓는 것인 인간의 복잡한 행동이 개개인의 motivation과 문화적 환경에 따라 만들어진다는 점을 인정한다는 것이다. 또한 연구를 할 때 이러한 복잡성을 생략elide하기 보다는 맥락적 '본질' contextual essence로 반영해야 한다.
    Post - positivism shares with positivism the belief that there is an objective reality that can be discovered if the correct research procedures are in place. What distinguishes post - positivism is the acknowledgement that complex human behaviour is shaped by individual motivations and cultural envi- ronments, and research must represent these complex- ities rather than elide them in search of a contextual ‘ essence ’ or truth.
    • 사례: Irby ’ s account of how clinical teach- ers make decisions about what to prioritise in their round exchanges with students represents the post - positivist paradigm in his seeking for the essence of teachers ’ decision making while paying attention to the contextual and individual features that shape this process. (4)
  • 구성주의는 현실reality를 받아들인다는 점에서 후기실증주의로부터 줄발하며, 의미meaning은 상대적인 것이고, 연구자와 연구대상의 상호작용에 의해서 생성되는 것이라고 본다. 구성주의적 패러다임에서의 연구는 연구자의 주관성을 인정하며, 사회적 현상을 설명함에 있어서 연구자와 현상의 상호작용을 반영한다.
    Constructivism departs from post - positivism in its acceptance of reality and meaning as relative, pro- duced through the interaction between researcher and researched. Research in the constructivism paradigm acknowledges the subjectivity of the researcher, pro- ducing accounts of a social phenomenon that refl ect the researcher ’ s interaction with the phenomenon.

의학교육연구에서 점차 두드러지는 한 가지는 critical theory paradigm인데, 연구하려는 현상에 존재하는 power dynamics를 드러내려는 목적을 가지며, 세심한 묘사와 이러한 역학dynamics의 분석을 통해서 empowerment를 촉진하려는 목적을 지닌다.

Also becoming apparent in medical education research is work within the critical theory paradigm, which is identifi able by its goal of revealing power dynamics in studied phenomena and fostering empow- erment through the careful description and analysis of these dynamics.


연구자의 패러다임이 반드시 연구 접근법이나 방법론을 예측해주는 것은 아니다. 왜냐하면 연구 접근법이나 방법론을 선택하는데 유연성이 존재하기 때문에, 'best fit' 원칙이 연구질문에 대한 접근법이나 프레임을 결정하는데 사용되기 때문이다. 최적의 접근법은 연구질문, 연구환경의 특성, 연구의 목적에 따라 달라진다. 이들 요인이 최적의 방법이 무엇인지를 결정한다. 이러한 접근의 유연성은 양적 패러다임과의 핵심적 차이가 되는데, 양적 패러다임에서는 RCT가 'gold standard'로 받아들여진다.

The researcher ’ s paradigm does not necessarily predict his or her research approach or methods. Because of this flexibility in the selection of an approach and a method, the principle of  ‘ best fit ’  is used to decide how best to approach or frame a research question.The best approach depends on the research question, the nature of the research setting and the objective of the research. These factors also determine what the best methods are. This flexibility of approaches and methods is a key difference from the quantitative par-adigm, where the randomised controlled trial is widely accepted as the  ‘ gold standard ’ 


질적연구와 양적연구의 관계는?

What is the relationship between qualitative and quantitative research?


신념 체계가 다르고, 현상의 본질을 바라보기 위하여 변인을 통제하려는 의도에서 차이가 난다. 또한 통계적 분석의 활용을 통해서 지식을 드러내고 대표하려는 것에서 차이가 난다.

belief system, thus the intent to control variables in order to see the essence of a phenomenon, and the use of statistical analyses to reveal and represent knowl- edge.


이러한 이분법적인 접근이 왜곡적이며 도움이 안된다는 인식이 늘어나고 있다. Irby부터 Norman에 이르기까지, 'best fit' 주의doctrine이 질적연구와 양적연구의 관계에 대한 논의를 이끌어가고 있다. 특정 연구질문은 특정 패러다임, 특정 접근법, 특정 방법론에 잘 맞는다.

There has been a gradual recognition that such dichotomising is distorting and unhelpful. From Irby ’ s invited address in 1990 (cited in Reference 1) to Norman ’ s editorial in 1998, (10) the doctrine of best fi t increasingly governs discussions about the uses and relationships of qualitative and quantitative research. Certain kinds of research question are suited to certain paradigms, certain approaches and certain methods,


Qualitative Research Approaches



민족지

Ethnography 

 

The tradition of ethnography originates in the field of anthropology, in which a researcher would travel to study an ‘ exotic ’ tribe. (12,13) Current - day ethnogra- phy often rejects the traditional notion of a privileged researcher, and ethnographic studies are now more likely to occur in local subcultures (such as a medical school or an operating room) than in far - fl ung loca- tions. However, ethnographic studies carry on the practice of long - term engagement in a study setting, and the collection, through observation and conversa- tional interviews, of data that are analysed to under- stand the meaning inherent in the everyday activities of a particular social group. (14)

 

There are a number of classic ethnographies in the domain of medical educa- tion, including Becker ’ s The Boys in White (15) a study of the nature of student culture in medical school, and Bosk ’ s Forgive and Remember (16) a study of the treat- ment of medical error in postgraduate surgical education.


근거이론

Grounded theory 

 

연구 참여자의 현실적 경험으로부터 유도된derived from, grounded in 이론적 설명을 개발함으로써 사회적 현상을 탐구하고자 하는 것. 근거이론은 1960년대 두 명의 사회학자 Glaser and Strauss로부터 개발되었으며, 질적 자료의 분석을 보다 systematic하게 하고자 했다. 이들은 양적 패러다임에서 부과된 standard of rigor에 부응하고자 하였으며, 이론의 검증보다는 이론의 생성에 초점을 두었다. 핵심 요소는 다음과 같다.

Grounded theory research explores social phenomena through the development of theoretical explanations that are ‘ grounded ’ in (i.e. derived from) the practical experience of study participants. (17) Grounded theory was developed by two sociologists, Glaser and Strauss, in the 1960s, to provide a systematic approach to the analysis of qualitative data that would live up to the standards of ‘ rigour ’ imposed by the quantitative par- adigm and that would focus on theory generation rather than theory testing. (17) Key elements of grounded theory methodology include:


    • 반복적 연구 설계: 지속적, 반복적으로 진행되는 자료 수집과 자료 분석
         iterative study design (cycles of simultaneous data collection and analysis, in which the results of the ongoing data analysis inform the subsequent data collection)
    • 의도적 표집: emerging theory를 확인/도전/확장하는 자료를 제공할 수 있는 능력에 따라 자료 출처를 선택
       
         purposeful sampling (purposeful selection of data sources for their ability to provide data that would confi rm, challenge or expand an emerging theory)
    • (자료 분석 접근법에 대한) 지속적 비교: 자료에서 관심의 대상이 되는 사건이나 이슈가 다른 사례들과의 유사점이나 차이점에 대해서 비교함.
         constant comparison approach to data analysis (through which incidents or issues of interest in the data are compared against other examples for simi- larities and differences). (18 – 20)



사례연구

Case study 


Case study research involves an in - depth analysis of a ‘ bounded system ’ (a programme, an event, an activity, a process, a group, etc.). (27) The case study can have intrinsic value or can be used as a means of gaining understanding of a larger process. (28) Case study research has roots in sociological tradition as well as in the medical case report. (27) One hallmark of case study methods is triangulation, which is the use of multiple data collection tools or data sources to gain rich insight into the study phenomenon from multiple perspectives ( see Principles of rigour, below).

 

An example of a qualitative case study in medical educa- tion is Perley ’ s study of a group of primary care physi- cians to explore their use of the ‘ curbside consultation ’ with colleagues as a continuing education tool. (29)



현상학

Phenomenology 


어떤 것을 경험한 사람의 관점에서 사회적 현상의 본질을 이해하고자 하는 목표

연구자 자신의 선입견preconception은 옆으로 치워둠(bracketing)

소수의 개인의 경험만을 심층적으로 탐구하기도 함.

Phenomenology arose early in the 20th century from philosophical reflections on consciousness and perception. Phenomenological research aims to under- stand the essence of a social phenomenon from the perspective of those who have experienced it. (30) Phenomenology involves the ‘ bracketing ’ (or putting aside) of the researcher ’ s own preconceptions and per- spectives in order to understand the ‘ lived experience ’ of the research participants. (30) Phenomenological studies often involve an in - depth exploration of the experiences of a small number of individuals.

 

Bearman has used phenomenology to explore the experiences of medical students during interactions with virtual patients. (31)


해석학

Hermeneutics 


역사적으로는 성서문구의 해석을 의미했음. Hermeneutic circle이라는 순환적 프로세스를 포함함.

The term hermeneutics historically refers to the inter- pretation of biblical texts. In the domain of qualitative research, hermeneutics uses the lived experience of participants as a means of understanding their political, historical and sociocultural contexts. (32) Hermeneutic analysis involves a cyclical process called the ‘ hermeneutic circle ’ movement back and forth between the consideration of the meaning of individ- ual parts of a data set and the meaning of the whole text. (33)

 

Addison has explored how medical residents cope with their training through a hermeneutic approach in his chapter ‘ Grounded interpretive research: an investigation of physician socialization ’ (34)


서사 연구

Narrative research 

 

스토리텔링의 고전적 실천ancient practice에 기원을 둠. 개인적 account를 스토리로서 간청solicit하고 분석하는 것.

Narrative research stems from the ancient practice of storytelling as a method of communicating, arranging and interpreting human experience. Narrative inquiry is a qualitative approach that ‘ solicits and analyzes personal accounts as stories ’ (35) using these stories as a means of understanding or making sense of a par- ticular experience or situation. Narrative analysis seeks meaning in the content, the structure, the context and the relational aspects of a story. (36)


행동 연구

Action research 

 

20세기 중반의 사회 행동 운동에 기원을 둠

Action research has its roots in the social activism movements of the mid - 20th century.

 

핵심 원칙: 연구 프로세스를 통한 사회 변화 유도, 연구 참여자가 연구 프로세스에 직접 참여

Key principles of action research are

    • the explicit aim of producing social change through the research process and
    • the direct engagement of research participants in the research process. (39)

 

순차적 사이클

Action research classically occurs through sequential cycles of

    • planning a change,
    • implementing the change while observing the process and
    • reflection on the consequences of the change. (40)

 

참여자는 연구자와 협동해서 연구 결과를 구성하여 사회 변화를 도입함

Participants collaborate with researchers to construct the results of the research and implement social change.

 

An action research approach was employed successfully in the design and implementation of a new general practice curriculum in Dundee, Scotland. (41)



질적연구 도구

Qualitative Research Tools


자료의 수집을 분석과 분리시키는 것은 질적연구에서는 두 가지 이유에서 약간 인위적이다.

This separation of data collection from analysis is somewhat artificial in qualitative research for two reasons.

 

  • 첫째, 많은 질적연구는 iterative study design을 도입한다. 즉, 자료의 수집과 분석이 동시에 이뤄진다. iterative 연구 프로세스에서 초기에 수집된 자료의 예비적 분석을 통해서 더 명확하게 해야 할 질문이 드러나거나 더 탐구가 필요한 새로운 아이디어가 나타나기 때문에 어떻게 그 다음 자료수집과 분석 phase를 수행할지의 결정에 영향을 준다.
    First, many qualitative studies employ an iterative study design, (1) in which cycles of data col- lection and analysis occur simultaneously. In an itera- tive research process, preliminary analysis of data collected early in the study process affects decisions about how to go about the next phase of data collection by revealing questions that require clarifi cation or new ideas that require further exploration in subsequent data collection and analysis cycles. (17)
  • 자료 수집과 분석이 연결되는 두 번째 방식은 자료수집방법의 선택이 분석방법에 영향을 주고, 마찬가지로 분석방법도 자료수집방법에 영향을 주는 형태이다.
    The second way in which data collection and analysis are linked in qualitative research practice is the way in which the choice of data collection methods necessarily informs the choice of the analytical approach and vice versa.


질적자료의 수집과 분석에서 특정 윤리적 이슈가 제기될 때도 있다.

particular ethical issues arise in the collection and analysis of qualitative data. These include both

  • 절차적 윤리: 어떻게 연구 참여자를 해harm으로부터 보호하면서 수행할 수 있을 것인가.
    procedural ethics (how the research is conducted to protect research participants from harm) and
  • 상황적 윤리: 연구자 자신이 '윤리적으로 중요한 순간'에서 어떻게 행동할 것인가
    situational ethics (how the researcher conducts himself or herself in what Guillemin and Gillam call ‘ ethically important moments ’ ). (42)

 

Reflexivity 는 연구자가 필드에 있는 연구참여자와의 상호작용 과정에서 나타날 수 있는 윤리적 긴장을 협상negotiate할 때 사용하는 sensitising concept이다.

Reflexivity is asserted as a sensitising concept researchers can use as they negotiate ethical tensions that may arise in their interactions with participants in the field ( see Box 22.3 )


 


자료 수집 도구

Data collection tools

 


면접

Interviews


질적연구 인터뷰에서 스탠다드는 'depth interview'(심층인터뷰)로서 연구질문에 대한 풍부하고 세세한 탐색을 진행하게 되며, 보통 45분부터 몇 시간에 걸쳐 진행된다. 형태는 반구조화 인터뷰 포멧.

Individual interviews are probably the most familiar and the most often used form of data collection in qualitative medical education research. (1,43) Interviews provide access to participants ’ personal perspectives and relevant experiences on an unlimited number of topics. (44) The qualitative interview stand- ard is the ‘ depth interview ’ (44) which provides a rich and detailed exploration of a research question and generally lasts between 45 minutes and a few hours. (45) Qualitative research interviews often follow a ‘ semi - structured ’ format. (43) The semi - structured interview is guided by a predetermined set of open - ended ques- tions, but the researcher and participant are free to pursue additional relevant topics as they arise ( see  Box  22.5  for a sample interview script). Qualitative inter-views are usually audiotaped and later transcribed to facilitate analysis,


가장 큰 단점은 기억을 통해 걸러진 정보만 수집가능하다는 것이며, 인터뷰의 사회적 맥락에 영향을 받는다. 인터뷰어는 유도질문을 하지 말아야 하며(멘토십 프로세스에서의 장애요인은?(X), 멘토십 프로세스에서의 경험은 어떠했나요?(O)), 면접에서의 권력관계에도 신경써야 함

The main disadvantage of the interview method of data collection is the fact that the information provided is filtered through the memory of the participant and is influenced by the social context of the interview. (46) Interview researchers must be careful to avoid leading questions (consider, for example, the potential differ- ence in responses to the questions ‘ What barriers to the mentorship process have you encountered? ’ and ‘ What have your experiences with the mentorship process been like? ’ ). Researchers must also attend to the power dynamics of the interview.



포커스 그룹

Focus groups

 

사회과학 연구에서 오랜 역사.
4~12명의 참여자와 moderator/facilitator

다양한 경험과 다양한 이야기를 효율적으로 수집가능하다. 역동적이며, 상호작용이 있는 교환을 통해서 상반되는 의견을 자극하고,  집단의 규범이나 일반적 수행common practice를 성찰하게 하고 당연하게 여겨졌던 가치를 드러내게 해준다.

moderator는 그룹역학이나 상호작용도 기록한다

Focus groups have recently become well known as a marketing research tool, but they have a long history in the domain of social sciences research. Focus groups are sessions involving 4 – 12 participants and a modera- tor or facilitator who guides the group discussion of a topic relevant to the research question. (47) Focus groups provide access to multiple stories and diverse experiences in an efficient manner. More importantly, focus groups provide a dynamic and interactive exchange that can stimulate exploration of contrary opinions, reflection on group norms and common practices and exposure of taken - for - granted values. (48) Like individual interviews, focus group discussions often follow a semi - structured format and are audiore- corded and transcribed for analysis. The focus group moderator also records notes on group dynamics and interactions.


포커스그룹을 통해서 탐구하기 적합한지 고려해보아야 함(매우 개인적인 주제는 개별 면접이 더 나을 수도 있음)

권력 관계power dynamics가 중요하다. 한 명의 영향력있는 개인이 전체 프로세스를 탈선시킬 수도 있음.

Researchers using focus groups must consider whether their topic would benefit from exploration in the synergistic and spontaneous focus group format (for example, some deeply personal topics might be more safely or productively explored in an individual interview). Issues of power dynamics are also critical in focus group methodology: one infl uential, opinion- ated group member can derail the entire process. (47)


 



 



관찰

Observation


Researchers conducting observa-tions have access to data on what participants do and not just on what they say they do. (50)  Qualitative researchers conducting observations make recordscalled  field notes( see  Box  22.6  for an illustrative example)


Observations are sometimes accompanied by audio recording of ‘ naturalistic ’ conversations, which are later transcribed for analysis.


'관측 효과'가 있으며, 다음과 같은 대응책이 있다.

Observational researchers must deal with ‘ observer effect ’ which is the fact that the presence of the observer has an impact on the behaviours of study participants. There are a number of ways to deal with observer effect. (50)

 

  • Some researchers will spend long periods of time in the field to allow participants to become accustomed to their presence.
  • Others will not reveal the specific focus of their observations to prevent participants from altering specific behaviours (for example, a researcher might get consent to observe all clinical teaching in an intensive care unit without revealing to participants that the research question related specifi cally to the teaching of technical skills). (52)
  • Still, others will take care to document evi- dence of the impact of their presence and then reflect on and write about the significance of this impact on their results.


 

참여적 관찰자와 비참여적 관찰자

Observational research has a long tradition in medical education. Observational researchers in medical education, as in other fi elds, must decide to what degree they will participate in the activities around them.

    • The term ‘ non - participant observation ’ has been used to signify an observer who remains uninvolved in the activities of their study participants, taking the role of a passive observer.
    • Observational research in the ethnographic tradition takes the form of ‘ partici- pant observation ’ in which the researcher becomes fully engaged in the daily activities of the study par- ticipants:



 

문헌 자료의 수집

Assembly of textual documents


빠르고 저렴하나 iterative inquiry는 어렵다.

Analysis of pre - existing documents can be a quick and inexpensive data collec- tion method, and because they were created for pur- poses other than research, the content of these data is not influenced by the research process. (56) Assembly of textual documents, however, does not allow the researcher to take advantage of the powerful qualita- tive process of iterative inquiry (see above), in which ongoing analysis informs the data collection process because the data collection occurs one step prior to the analysis.


학생이 제출한 과제 분석 

Perhaps the most common use of textual documents for qualitative analysis in medical education is the analysis of documents produced as course assign- ments by students.


자료 분석 도구

Data analysis tools


질적자료의 분석은 수백페이지의 문헌을 보는게 아니라 데이터를 수집하는 과정에서 지속적으로 읽고, 성찰하고, 의미에 대해 질문하는 과정이다.

As previously empha- sised, qualitative data analysis does not often mean sifting through hundreds of pages of text in one sitting but is rather an ongoing process of reading, refl ecting on and questioning the meaning of the data as they are collected.


 

기본적인 프로세스가 있다. 가장 흔한 것 중 하나는 coding이다. coding은 데이터를 비슷한 경향을 대표하는 것들끼리 분류하고 조직화하는 프로세스이다. 

there are some basic processes that are common to most qualitative analyses. The most common of these is coding. Coding is a process of sorting or organising the data into categories representing similar trends. (17)


 

코딩 프로세스의 첫 단계는 분석의 단위를 선택하는 것이다. 예를 들어서, 프로페셔널리즘에 대한 의과대학생 인터뷰를 분석할 때의 코딩은 프로페셔널리즘과 관련된 실수lapse가 발생한 상황에 대한 것일 수도 있고, 구체적인 프로페셔널한 행동에 대한 것일 수도 있고, 비-프로페셔널한 행동을 묘사하기 위해서 참여자가 사용한 문구나 측정 단어가 될 수도 있다. 하나 이상의 분석단위에 대한 코딩이 시간에 걸쳐 진행될 수도 있다. 자료가 카테고리 혹은 코드로 분류되어가면서, 각각의 코드에 대해서 카테고리의 본질을 잡아내는 라벨이나 이름이 붙을 수 있다. 분석 과정에서 메모나 성찰노트를 기록하며, 성찰과 분석 아이디어가 떠오를 때 기록한다. 질적연구 소프트웨어가 도움이 될 수 있지만, 자료의 카테고리화, 경향성 파악, 의미 해석은 여전히 연구자의 몫이다.

The first step in the coding process is the selection of the unit of analysis. For example, analysis of medical student interviews about professionalism might involve coding for the settings in which professional lapses occurred, or for types of professional behaviour or for specifi c words or phrases used by participants to describe unprofessional acts. Coding for more than one of these different units of analysis might occur over time. As the data are being sorted into categories or codes, names or labels are created for the codes that describe the essence of the category, and memos or reflective notes are written to document the process of the analysis and record reflections and analytical ideas as they arise. Qualitative software can be used as a data management tool to keep track of the coding process as it proceeds, but the cognitive work of cat- egorising data, identifying trends and interpreting meaning is still done by the researcher.



주제 분석

Thematic analysis


주제Theme을 조직화하는 것

The most commonly used qualitative analysis approach in the domain of medical education is the organisation of data according to topics, ideas or concepts, often called themes.

 

주제분석의 변형된 형태들

Variations of thematic analysis are used in many of the qualitative approaches, and a number of different systems of thematic analysis have been developed (for example, content analysis (58) and con- stant comparative analysis). (17,19)

 

기본적 프로세스

The basic process of thematic analysis is

    • 비슷한 개념을 밝히고 to identify in the data set instances that are similar in concept. As further related examples are identified, a
    • 점차 개념이 발전하며 이해가 깊어지고 progressively rich under- standing of the concept is developed, and
    • 다른 중요한 개념이 드러나고 as other important concepts are identified in the data,
    • 개념 혹은 주제간 관계를 밝힌다. the rela- tionships between concepts or themes are explored.

 

주제의 집합은 묘사, 이론 개발, 해석에 활용될 수 있다.

The set of themes can then be used for description, theory development or interpretation ( see Interpretation, below).


담론 분석

Discourse analysis


언어의 수준에서의 자료 분석

Discourse analysis is an approach to qualitative research that analyses data at the level of language. Discourse is a term meaning ‘ socially situated lan- guage ’ (60)

 

목적: 언어의 활용에서 일반적으로 당연하게 여거지는 것을 명확하게 드러내고, 특정 사회적 맥락에서 talking이 달성하는 것이 무엇인지 보여주는 것.

The aim of discourse analysis is to make explicit what is normally taken for granted about lan- guage use or to show what talking accomplishes in a particular social context.

 

여러 접근법을 아우르는 unbrella term이다

Discourse analysis is an umbrella term that references a number of different approaches to the analysis of socially situated lan- guage use.

    • Some discourse analysts, often in the domains of linguistics or conversation analysis, work to understand the complex mechanisms and structures of social language.
    • Others, in fields like sociolinguis- tics or critical discourse analysis, use talk as a source of evidence about social processes.


해석

Interpretation


마지막 단계는 해석으로, 데이터에 핵심 의미를 찾는 것

The final stage of qualitative analysis is the process of interpretation, or fi nding the central meaning in a data set.

 

해석이 없이는 단순한 아이디어나 주제의 카탈로그에 불과함. 아이디어가 중요하긴 하지만, 해석적 혹은 이론적 수준에서의 의미를 탐구하는 단계 없이는 질적연구의 파워를 온전히 활용했다고 볼 수 없다.

Without interpretive work, qualitative research produces merely a catalogue of ideas or themes. Important as those ideas may be, qualitative studies that do not take the next step of exploring the meaning at an interpretive or theoretical level have not fully exploited the power of qualitative research.


질적연구의 해석에 대한 다양한 접근이 있다.

There are different approaches to interpretation in qualitative research.

    • 사회적 현상에 대한 두껍고 풍부한 묘사가 목적일 수 있다(현상학)
      In some qualitative approaches, the production of a thick, rich description of a social phenomenon is the goal of the research process (e.g. phenomenology).
    • 사회적 프로세스에 대한 새로운 이론적 설명이 목적일 수 있다(근거이론)
      In other approaches, the develop- ment of a novel theoretical explanation of a social process is the aim (e.g. grounded theory).
    • 데이터의 의미는 기존에 존재하는 이론을 통해서 볼 수도 있다.
      In still other qualitative approaches, the meaning of a data set is considered through the lens of pre - existing theory,



Rigour의 원칙

Principles of Rigour


체크리스트를 출판한 저널들도 있다. 신뢰성trustworthiness, 유용성utility, 진실성authenticity 등의 개념.

Journals have published papers with checklists, (64 – 67)  and qualitative leaders have offered overarching con-cepts  such  as  ‘ trustworthiness ’ , (68)    ‘ utility ’  (69,70)  and authenticity. (71) . 


아래의 원칙들은 질적연구를 비판적으로 평가하는 프레임워크가 될 수도 있고, 어떻게 질적프로젝트를 설계할 것인지를 고려하는 시작점이 될 수도 있다. 

These principles are drawn from an extensive literature outlining guidelines for excellence in qualitative research. They can serve either as a framework for critical appraisal of qualitative research studies in the literature or as a starting point for con- sidering how to design a qualitative project ( see Box 22.7 ).


 


샘플링: 적절성

Sampling: adequacy and appropriateness


 

질적연구에서의 표집은 '얼마나 많은 수의' 대상자를 포함시켰느냐가 중요한 것이 아니다. 질적연구가 사회적, 경험적 현상을 탐구하는 것이기 때문에, 누구를 포함시키고 누구를 제외할지 결정하는 것은 표집의 논리에 있어서 중요하다. 사회적 현상에는 종종 다양한 참여자들이 관여하게 되므로, 연구자는 어떤 사람이 관측/면담을 하기에 가장 적절하며, 누구를 제외해야 하는지에 대한 결정을 정당화할 수 있어야 한다. 개개인의 경험에 대한 연구를 하기 위해서 개인에게 물어보고 개인을 관측해야 하는 것은 맞지만, 고립된 상태로 기능을 하는 개인은 거의 없기 때문에 연구자는 어떤 추가적 맥락이 연구질문의 완전한 탐구를 위해서 가장 적절한지 결정해야 한다.

Sampling in qualitative research is not just about ‘ how many ’ subjects to include in the study. Because quali- tative research explores social and experiential phe- nomena, deciding whom to include and exclude is a critical step in the sampling logic. A social phenome- non often engages a wide variety of participants, and the researcher must justify their decisions about who best to observe/interview and who to leave out of their study boundaries. While studies of individual experience clearly direct the researcher to observe/ask the individual, individuals rarely function in isolation, so the researcher must determine what additional con- texts are appropriate to a full exploration of the study questions.


 

  • 누구? Who? 
    • 이 표본이 연구질문에 대한 답을 주는 자료를 제공해주는가?
      Can this sample provide data that answer the 
      research question? 
    • 연구 세팅에서 모든 관련자들에게 다가가tap into는가?
      Does the sample tap into all relevant participants in the research setting?   

 

  • 왜? Why? 
    • 연구대상자 선택이 정당화되어야 하며, 특히 모든 관련 그룹을 대표하지 못할 경우에 그러하다.
      The choice of subjects must be justifi ed, particu-
      larly if it does not represent all potentially rele- vant groups.   

 

  • 얼마나? How much? 
    • 표본 크기는 숫자의 문제가 아니며, 문화나 현상의 탐구를 빈틈없이thorough할 수 있느냐의 문제이다. 종종 이러한 '빈틈없음'은 '포화'라는 용어로 나타나는데, 이는 우세적인 주제/경향이 반복적으로 나타나서 자료의 수집이 완결되는 것이며, 추가적인 자료 수집으로 새로운 이슈가 제기되지 않는 상태이다.
      Sample size is not a matter of mere numbers: it is a matter of a thorough exploration of a culture or phenomenon. 
      Often, such thoroughness is referred to as ‘ saturation ’ which means that data collection was considered complete when domi- nant themes/trends were recurrent and no new issues were arising from subsequent data collec- tion.


 

표본 추정은 다음을 근거로 정당화된다.

Sample estimations may be justifi ed by reference to:

  • 방법론-기반 추정   method - based estimates (e.g. in - depth interviews) (45)
  • 표집 전략    sampling strategy (e.g. theoretical, confi rming/dis- confi rming, snowball) (75)
  • 과거 연구결과    past research fi ndings.


Box 22.8

 


 

표본의 특성이 구체화되면, 표집한 참여자들의 특성에 대한 정당화가 있어야 한다. 표집 전략이 잘 설명되어야 한다. '포화'에 대한 명확한 레퍼런스는 없으며, 우세적 주제dominant theme이 이를 함축한다고 볼 수 있다. 교수와 학생의 다양한 관점을 탐구하고자 할 때는 삼각측량이 적절할 것을 시사한다.

The nature of the sample is specifi ed, and justifi cation is provided for the types of participant sampled, which include various kinds of problem - based learning (PBL) tutors and students who may perceive confl ict resolution from different perspectives. Sampling strategies are well articulated. There is no explicit reference to satu- ration, although reference to the dominant themes implies this. A range of perspectives in faculty and students appears to be explored, suggesting that trian- gulation is adequate.



자료 수집: 진실성과 성찰성

Data collection: authenticity and reflexivity


교육 세팅에서 연구자들간의 위계적 관계(연구자가 교수이고 참여자가 피훈련자인 경우 등)는 자료수집의 진실성을 왜곡시키는 효과가 있을 수 있다. 취약한 입장의 참여자는 관측되는 행동을 변화시키거나 인터뷰에 대한 응답을 자기를 지키거나 연구자의 비위를 맞추거나 자신의 충성도를 보여주려는 목적으로 맞출 수 있다. 자료 수집 프로세스는 그러한 연구참여자의 동기나 행동을 고려해야 하며, 연구자는 자료의 진실성을 최대화하려고 노력해야 한다. 또한 그러한 위계적 상황에서 자료가 구성된다는 점을 성찰reflect해야 한다.

In educa- tional settings, hierarchical relationships between researchers, who may be medical faculty members, and participants, who may be trainees, can have a distorting effect on the authenticity of the data collec- tion. Participants in vulnerable positions may alter their observed behaviour or tailor their interview responses to safeguard themselves, to please the researcher or to advertise their membership in a group. Data collection processes must take such participant motives and actions into account, and researchers must both strategise to maximise the authenticity of their data and reflect on the ways in which the data are a construction of a research relationship in a hier- archical situation.


자료의 퀄리티를 최대화하기 위해서 질적연구자가 활용하는 흔한 전략 중 하나는 '삼각측량'이다. '삼각측량'은 지도 제작에서 온 용어로서, 지도에서 한 사람의 위치를 지도 위 다수의 다른 위치를 기준삼아 찾는 과정을 말한다. 질적연구에서 삼각측량의 프로세스는 다양한 '위치'의 사람들로부터 자료를 수집하여서, 연구자가 연구 현상을 다양한 관점에서 바라볼 수 있게 하는 것이며, 이를 통해 더 정제되고 포괄적인 이해를 할 수 있게 된다. 삼각측량은 가장 관련성이 있는 자료출처를 선택하고, 그것을 통합적으로 분석하며, 그 출처들이 서로를 어떻게 confirm하고 disconform하는지를 참구하는 것이다.

A common strategy used by qualitative researchers to maximise the quality of their data set is ‘ triangula- tion ’ Triangulation is a term from cartography, which refers to the process of fi nding one ’ s position on a map with reference to multiple other mapped positions. In a qualitative research study, the process of triangula- tion involves collecting data from multiple ‘ positions ’ so that the researcher can gain insight on the studied phenomenon from multiple perspectives, thus realis- ing a more refi ned and comprehensive understanding by the end of the research. Triangulation requires the selection of most relevant data sources and their inte- grated analysis, exploring how they confi rm or discon- fi rm one another.


 

  • Has the researcher considered his or her relation to the study setting and subjects?
  • Are the interview script and processes non - leading
    • How was the script developed?
    • Was it piloted?   
    • Were questions appropriate to capture relevant insights?   

 

  • Has the Hawthorne effect been considered? The Hawthorne, or observer effect, is seen when observed participants act differently from how they would act if the observer were not present. (76)
    • Were mechanisms to minimise the Hawthorne effect used, for example, prolonged engagement in the fi eld, time taken to establish trust and rapport, and observer comportment (e.g. dressing like an insider)? 
    • Was there a process for recording/refl ecting on the Hawthorne effect; for example, fi eld notes should record any references to observer presence, such as jokes made about being observed.

 

  • Are data triangulated for maximal richness?   
  • Are complementary data sets collected?   

  • Are different forms of data/subject populations accessed?


자료분석: 명확성과 감사 추적

Data analysis: clarity and audit trails 

 

질적연구에서의 분석 프로세스는 연구자가 기록transcript의 더미에서 어떻게 주제 카테고리를 뽑아냈는지에 대한 '의문mystique'이 없게 해야 한다. 그러나 이것이 질적연구에 '예술art'적 부분이 없음을 의미하는 것은 아니다.

The analysis process in qualitative research should be described such that there is little or no ‘ mystique ’ sur- rounding how the researchers went from a pile of tran- scripts to a list of thematic categories. This is not to suggest that there is no ‘ art ’ to qualitative analysis;


그러나 전체적으로 분석 프로세스의 단계는 명확하게 설명될 수 있으며, 출판되는 논문과 연구자의 연구노트 모두에 그렇게 기술되어야 한다. 이 기록은 자신의 분석과정을 검토하는 'audit trail'의 기초가 된다.

However, on the whole, the steps involved in the analysis process can be made explicit, and they should be both in a published manuscript and in the researchers ’ own journals, which can form the basis of an ‘ audit trail ’ to review their analytical journey.


고려할 질문들

Questions to consider include the following:

  • 분석 프로세스가 잘 기술되었는가? Is the analysis process well described? 
    • 무엇을, 누가, 어떻게? Can you tell what was done, by whom and how?   
    • 내부 전문가가 코딩을 확인verify해 주었는가? Were insider experts used to verify coding samples?   
  • 다음의 핵심 측면이 분명하게 나와있는가? Were the following key aspects of analysis evident? 
    • '지속적 비교'가 명확한가? Is ‘ constant comparison ’ evident?   
    • 이견discrepancies은 어떻게 해소되었는가? How were discrepancies resolved?     
  • 연구참여자를 분석의 결과를 성찰하기 위하여 참여시키려는 시도가 있었는가? Was an attempt made to engage participants in reflecting on the results of the analysis? 
    • '관측결과로의 회귀'가 이뤄졌는가? 어떻게? Was ‘ return of findings ’ conducted? How?     
    • 소프트웨어를 사용하였는가? 적절한 방법으로? Was a software program used? Was its use appropriately described?  



 

어떤 질적연구자들은 이들 절차적 원칙을 질적연구의 퀄리티를 측정하는 용도로 사용할 수 있다. Eakin이 주장한 바와 같이, 이러한 접근법은 질적연구의 복잡하고 non-formulaic 한 특성을 지나치게 단순화시키거나 왜곡하는 것일 수 있다. 대신, 논문의 'so what' factor, 즉 사회적 현상을 이해하는데 기여하는 능력이 가장 중요한 기준이 되기도 한다. 비슷하게 Sandelowski는 연구의 '유용성', 연구가 세상에서 '사용될' 힘이 또 다른 총체적 원칙이라고 하였다.

some qualitative researchers would argue with the broad application of any of these proceduralist principles as a way of measuring quality. As Eakin argues, this approach can oversimplify and distort the complex and non - formulaic nature of qualitative inquiry. Instead, the notion of a paper ’ s ‘ so what ’ factor – its ability to contribute to the understanding of a social phenomenon – is offered as the most important criterion. (77) Similarly, Sandelowski (70) has proposed a study ’ s ‘ utility ’ its power to ‘ be of use ’ in the world, as another holistic principle for consideration when evaluating qualita- tive research.


 


 

 


 







Chapter 22. Qualitative Research Methods in Medical Education

  1. Tim Swanwick
  1. Lorelei Lingard Professor Director1and
  2. Tara J Kennedy Assistant Professor2

Published Online: 28 JUN 2010

DOI: 10.1002/9781444320282.ch22

Understanding Medical Education: Evidence, Theory and Practice

Understanding Medical Education: Evidence, Theory and Practice


질적연구결과를 보고하는 스탠다드: 권고사항 통합 (Acad Med, 2014)

Standards for Reporting Qualitative Research: A Synthesis of Recommendations

Bridget C. O’Brien, PhD, Ilene B. Harris, PhD, Thomas J. Beckman, MD,

Darcy A. Reed, MD, MPH, and David A. Cook, MD, MHPE





질적연구는 여러 분야의 논문에서 실험적 상황이 아닌 자연발생적 상황, 즉 사회적 상호작용과 개인의 경험을 묘사하고 해석하고 그에 대하여 이론을 생성하기 위한 수단으로 널리 사용된다. 질적연구의 목적은 개인 또는 집단의 관점/경험을 이해하는 것이며, 이러한 관점과 경험이 놓여진 상황의 맥락을 이해하는 것이다.

Qualitative research contributes to the literature in many disciplines by describ- ing, interpreting, and generating theories about social interactions and individual experiences as they occur in natural, rather than experimental, situations.1–3 The purpose of qualitative research is to un- derstand the perspectives/experiences of individuals or groups and the contexts in which these perspectives or experiences are situated.1,2,10


질적연구는 점차 의학과 의학교육문헌에서 널리 사용되어지고 있다. 그러나 그러한 연구의 퀄리티를 평가하는 것은 어려운데, 왜냐하면 핵심 요소들이 불완전하게 기술report되고 있기 때문이다. 퀄리티는 다양한 측면을 고려해야 평가할 수 있고, 여기에는 연구질문의 중요성, 연구방법의 rigor, 추론의 적절성과 요점, 그리고 보고의 완전성 등이 포함된다.

Qualitative research is increasingly common and valued in the medical and medical education literature.1,10–13 However, the quality of such research can be difficult to evaluate because of incomplete reporting of key elements.14,15 Quality is multifaceted and includes consideration of the importance of the research question, the rigor of the research methods, the appropriateness and salience of the inferences, and the clarity and completeness of reporting.16,17 


방법

Method


우리는 40개의 출처를 모두 고려하였다.

We report the full set of the 40 sources reviewed in Supplemental Digital Appendix 1, found at http://links.lww. com/ACADMED/A218.


두 명의 연구자가 초기 샘플을 리뷰하여 질적연구를 보고할 때 중요한 항목들의 포괄적 리스트를 정리하였다(초안 A). 이후 모든 연구진이 짝을 이뤄서 모든 원문을 리뷰하고, 각각에 대해서 항목의 존재 여부를 체크해였다. 초안 A로부터 우리는 보다 짧아진 리스트 (초안 B)를 추출하였다. 이 때는 핵심 개념을 identify하고 관련된 항목을 묶고, 논문 출처들에 몇 차례나 존재했는지 등을 고려하였다. 그리고나서 초안 B를 original source와 비교하여 놓친 개념이 있는지 체크하고, 그에 따라 수정하고, 최종 리스트인 초안 C와 항목의 설명을 추가하였다.

Two of us (B.O., I.H.) reviewed an initial sample of sources to generate a comprehensive list of items that were potentially important in reporting qualitative research (Draft A). All of us then worked in pairs to review all sources and code the presence or absence of each item in a given source. From Draft A, we then distilled a shorter list (Draft B) by identifying core concepts and combining related items, taking into account the number of times each item appeared in these sources. We then compared the items in Draft B with material in the original sources to check for missing concepts, modify accordingly, and add explanatory definitions to create a prefinal list of items (Draft C).



결과

Results


제목, 초록, 도입부

Titles, abstracts, and introductory material.


질적연구에서의 제목, 초록, 도입부(문제 서술, 연구 질문)는 양적연구와 매우 유사한데, 다만 초록에서 제시하는 결과가 수치가 아니라 서사적narrative하다는 점이 다르고, 저자들이 특정한 가설을 제시하는 경우가 거의 드물다는 점이 다르다.

Reporting standards for titles, abstracts, and introductory material (problem formulation, research question) in qualitative research are very similar to those for quantitative research, except that the results reported in the abstract are narrative rather than numerical, and authors rarely present a specific hypothesis.29,30


연구 설계와 방법

Research design and methods.


연구 설계와 자료수집 방법과 분석에서는 질적연구의 몇 가지 특징이 두드러진다. 많은 준거들이 방법의 모든 측면을 밝히고 묘사했을 뿐만 아니라(접근법, 연구자 특성과 역할, 표집 전략, 맥락, 자료 수집, 자료 분석) 각 방법을 정당화하는 기술이 포함되어 있었다. 이는 저자들이 자신들이 세운 가정과 내린 결론을 독자들에게 명확하게 밝히는 것이다. 이러한 기준은 양적연구에서는 보다 덜 흔한데, 아마 이는 대부분의 양적 연구에서는 실증주의적 가정을 하고 있고, 일반적으로 다양한 연구설계의 방법이나 표집 테크닉의 기준standard에 대해 동의하고 있기 때문일 것으로 생각된다.

Reporting on research design and methods of data collection and analysis highlights several distinctive features of qualitative research. Many of the criteria we reviewed focus not only on identifying and describing all aspects of the methods (e.g., approach, researcher characteristics and role, sampling strategy, context, data collection and analysis) but also on justifying each choice.13,14 This ensures that authors make their assumptions and decisions transparent to readers. This standard is less commonly expected in quantitative research, perhaps because most quantitative researchers share positivist assumptions and generally agree about standards for rigor of various study designs and sampling techniques.14

 

양적연구를 보고하는 기준standard에서도 저자들에게 어떤 방법(무작위, 타당도 측정)을 사용하였는지 기술하게끔 하는 것과 같이, 여러 질적연구를 평가하는 준거에서도 저자들에게 어떻게 그 연구에 있어서 단순히 연구 테크닉을 언급하기보다, 짐작건대 익숙한 방법을 사용하였는지 설명하게끔 권고하고 있다. 예를 들어 저자들은 종종 자료가 'saturation'에 도달할 때까지 수집하였다고 묘사하곤 하나, 어떻게 'saturation'을 정의하고 인지하였는지에 대한 언급은 적다. 유사하게, 저자들은 종종 '반복적 과정iterative process'라고 언급하곤 하나, 그 '반복'이 어떤 식이었는지에 대한 묘사는 매우 적다. SRQR에서는 이러한 중요한 프로세스를 자세히 설명하는 것이 중요함을 강조한다. 또한 많은 문헌에서 연구자의 특성과 역할(reflexivit)을 기술하게끔 권고하였다. 연구팀의 구성원들은 종종 참여자와 관계를 맺곤 하는데, 대부분의 질적연구에서 분석프로세스는 고도로 해석적interpretive이다. 따라서 리뷰어와 독자는 반드시 어떻게 연구자와 연구대상과의 관계, 연구자의 관점, 연구자의 가정이 자료 수집과 해석에 영향을 주었는지 이해할 수 있어야 한다.

Just as quantitative reporting standards encourage authors to describe how they implemented methods such as randomization and measurement validity, several qualitative reporting criteria recommend that authors describe how they implemented a presumably familiar technique in their study rather than simply mentioning the technique.10,14,32 For example, authors often state that data collection occurred until saturation, with no mention of how they defined and recognized saturation. Similarly, authors often mention an “iterative process,” with minimal description of the nature of the iterations. The SRQR emphasizes the importance of explaining and elaborating on these important processes. Nearly all of the original sources recommended describing the characteristics and role of the researcher (i.e., reflexivity). Members of the research team often form relationships with participants, and analytic processes are highly interpretive in most qualitative research. Therefore, reviewers and readers must understand how these relationships and the researchers’ perspectives and assumptions influenced data collection and interpretation.15,23,26,34



결과

Results.


질적연구의 결과를 보고할 때는 주요 분석 결과를 밝혀야 한다. 종종, 이 findings는 해석과 맥락화interpretation and contextualization을 포하하게 되며, 이는 전통적인 양적연구에서 '객관적으로 결과를 기술한다'와는 다른 것이다. 결과를 보고하는 것은 종종 구체적인 질적연구의 접근법이나 방법론에 따라 다양할 수 있다. 따라서 질적연구 보고에 관한 엄격한 규칙rigid rule은 부적절하다. 그러나 연구자들은 반드시 근거(사례, 인용문, 발췌문)를 사용하여 주요 분석 결과를 입증해야 한다.

Reporting of qualitative research results should identify the main analytic findings. Often, these findings involve in- terpretation and contextualization, which represent a departure from the tradition in quantitative studies of objectively reporting results. The presentation of results often varies with the specific quali- tative approach and methodology; thus, rigid rules for reporting qualitative find- ings are inappropriate. However, authors should provide evidence (e.g., examples, quotes, or text excerpts) to substantiate the main analytic findings.20,29



고찰

Discussion.


질적연구의 고찰 부분은 일반적으로 기존 연구와의 연관성, 기존의 이론 혹은 개념 프레임워크와의 관련성을 설명하게 되며, 연구결과의 범위와 경계(transferability)를 포함하고 연구 한계점을 기술한다. 일부 질적연구의 전통에서는 결론과 고찰이 명확한 경계를 가지지 않기도 한다. 우리는 저자들에게 어느 파트에서 언급하는지와 무관하게 각 항목item의 내용substance를 다룰 것을 권고한다.

The discussion of quali- tative results will generally include connections to existing literature and/ or theoretical or conceptual frame- works, the scope and boundaries of the results (transferability), and study limitations.10–12,28 In some qualitative traditions, the results and discussion may not have distinct boundaries; we recommend that authors include the substance of each item regardless of the section in which it appears.



고찰

Discussion


질적연구는 사회적 혹은 인간적 문제와 현상에 대해서 '어떻게?', '왜?'질문에 대한 탐색을 하는 것이다. 질적연구의 목적은

Qualitative studies explore “how?” and “why?” questions related to social or hu- man problems or phenomena.10,38 Pur- poses of qualitative studies include

  • 참가자의 관점에서 의미를 이해 (어떻게 그들은 사건/상황/행동을 해석하고 이해하는가?)
    un- derstanding meaning from participants’ perspectives (How do they interpret or make sense of an event, situation, or action?);
  • 사건이나 행동을 둘러싼 맥락의 특성과 영향을 이해
    understanding the nature and influence of the context surrounding events or actions;
  • 잘 이해되어있지 않은 사건/상황/행동에 대한 이론 형성
    generating theories about new or poorly understood events, situations, or actions; and
  • 바람직한(바람직하지 않은) 결과가 도출된 프로세스의 이해
    understand- ing the processes that led to a desired (or undesired) outcome.38

 

여러가지 서로 다른 접근법들(e.g., ethnography, phenomenology, discourse analysis, case study, grounded theory)과 방법론들(e.g., interviews, focus groups, observation, analysis of documents) 이 사용될 수 있으며, 각각은 나름의 가정과 전통이 있다. 질적연구 접근법 또는 방법론의 강점은 자료 수집과 자료 분석 프로세스에 걸쳐 flexibility와 adaptability가 있다는 것이다. 우리는 의도적으로 항목을 정의할 때 한 가지 접근법이나 방법론이 다른 접근법이나 방법론에 비해 우위가 있다는 식을 지양하기 위해서 flexibility를 유지하였다. 마찬가지로 우리는 SRQR이 질적연구의 보고방식을 보다 explicit하고 투명하게 만들어서 모든 접근법과 방법론을 지지해줄 것이라고 생각하며, 동시에 연구자들이 연구 설계와 보고 형식을 각자의 연구에 맞게 할 수 있는 flexibility를 제공해줄 것이라고 믿는다 미래에 SRQR의 접근법-특이적 확장편을 만드는데 도움이 될 수도 이을 것이다.

Many dif- ferent approaches (e.g., ethnography, phenomenology, discourse analysis, case study, grounded theory) and method- ologies (e.g., interviews, focus groups, observation, analysis of documents) may be used in qualitative research, each with its own assumptions and traditions.1,2 A strength of many quali- tative approaches and methodolo- gies is the opportunity for flexibility and adaptability throughout the data collection and analysis process. We endeavored to maintain that flexibility by intentionally defining items to avoid favoring one approach or method over others. As such, we trust that the SRQR will support all approaches and meth- ods of qualitative research by making reports more explicit and transparent, while still allowing investigators the flexibility to use the study design and reporting format most appropriate to their study. It may be helpful, in the future, to develop approach-specific ex- tensions of the SRQR, as has been done for guidelines in quantitative research (e.g., the CONSORT extensions).37



한계, 강점, 경계

Limitations, strengths, and boundaries


종종 우리는 문헌에서 상충하는 권고를 보았다 (예: 구체적인 테크닉을 권하는 경우(다수의 coder, 혹은 신뢰성trustworthiness를 위한 member checking)) 우리는 이러한 상충하는 권고를 가장 흔히 권고되는 것을 채택하거나 연구진 사이의 컨센서스를 이룸으로서 정리하였다.

Occasionally, we found conflicting recommendations in the literature (e.g., recommending specific techniques such as multiple coders or member checking to demonstrate trustworthiness); we resolved these conflicting recommen- dations through selection of the most frequent recommendations and by consensus among ourselves.



함의와 적용

Implications and application


Supplemental Digital Appendix 2

The elaborations offered in Supplemental Digital Appendix 2 (seehttp://links.lww.com/ACADMED/ A218) should provide sufficient  description and examples to enable both novice and experienced researchersto use these standards


논문의 단어 제한은 각 항목을 완전히 다 제시하는데 한계로 작용할 수 있고, 그럴 경우 각 항목간 상대적 중요도가 연구마다 다를 것이다. 따라서 모든 21개의 기준이 이상적으로는 모두 반영되어야 하겠지만, 저자는  그 중 어떤 것을 우선시할 것인지 연구/결과/맥락/독자에 따라 달리할 수 있다.

Journal word restrictions may prevent a full exposition of each item, and the relative importance of a given item will vary by study. Thus, although all 21 standards would ideally be reflected in any given report, authors should prioritize attention to those items that are most relevant to the given study, findings, context, and readership.


이러한 권고를 초반에 고려함으로써, 연구자들은 패러다임을 identify할 가능성이 높아지며, 가장 적절한 연구방법을 찾을 가능성도 높아진다. 또한 연구의 trustworthiness를 높여줄 수 있고, 절차와 결과를 keep track할 수 있다.

By considering these recom- mendations early on, researchers may be more likely to identify the paradigm and approach most appropriate to their research, consider and use strategies for ensuring trustworthiness, and keep track of procedures and decisions.



1 Lingard L, Kennedy TJ. Qualitative research in medical education. In: Swanwick T, ed. Understanding Medical Education: Evidence, Theory and Practice. Oxford, UK: Wiley- Blackwell; 2010:323–335.


2 Harris IB. Qualitative methods. In: Norman GR, van der Vleuten CPM, Newble DI, eds. International Handbook of Research in Medical Education. Dordrecht, Netherlands: Kluwer Academic Publishers; 2002:45–95.








 2014 Sep;89(9):1245-51. doi: 10.1097/ACM.0000000000000388.

Standards for reporting qualitative research: a synthesis of recommendations.

Author information

  • 1Dr. O'Brien is assistant professor, Department of Medicine and Office of Research and Development in Medical Education, University of California, San Francisco, School of Medicine, San Francisco, California. Dr. Harris is professor and head, Department of Medical Education, University of Illinois at Chicago College of Medicine, Chicago, Illinois. Dr. Beckman is professor of medicine and medical education, Department of Medicine, Mayo Clinic College of Medicine, Rochester, Minnesota. Dr. Reed is associate professor of medicine and medical education, Department of Medicine, Mayo Clinic College of Medicine, Rochester, Minnesota. Dr. Cook is associate director, Mayo Clinic Online Learning, research chair, Mayo Multidisciplinary Simulation Center, and professor of medicine and medical education, Mayo Clinic College of Medicine, Rochester, Minnesota.

Abstract

PURPOSE:

Standards for reporting exist for many types of quantitative research, but currently none exist for the broad spectrum of qualitative research. The purpose of the present study was to formulate and define standards for reporting qualitative research while preserving the requisite flexibility to accommodate various paradigms, approaches, and methods.

METHOD:

The authors identified guidelines, reporting standards, and critical appraisal criteria for qualitative research by searching PubMed, Web of Science, and Google through July 2013; reviewing the reference lists of retrieved sources; and contacting experts. Specifically, two authors reviewed a sample of sources to generate an initial set of items that were potentially important in reporting qualitative research. Through an iterative process of reviewing sources, modifying the set of items, and coding all sources for items, the authors prepared a near-final list of items and descriptions and sent this list to five external reviewers for feedback. The final items and descriptions included in the reporting standards reflect this feedback.

RESULTS:

The Standards for Reporting Qualitative Research (SRQR) consists of 21 items. The authors define and explain key elements of each item and provide examples from recently published articles to illustrate ways in which the standards can be met.

CONCLUSIONS:

The SRQR aims to improve the transparency of all aspects of qualitative research by providing clear standards for reportingqualitative research. These standards will assist authors during manuscript preparation, editors and reviewers in evaluating a manuscript for potential publication, and readers when critically appraising, applying, and synthesizing study findings.

PMID:
 
24979285
 
[PubMed - indexed for MEDLINE] 
Free full text


의학교육연구의 패러다임 (Med Educ, 2010)

Research paradigms in medical education research

Suzanne Bunniss & Diane R Kelly







최근 몇 년간, 의학교육연구가 의학연구로서 인식되지 않는 것에 대한 논쟁이 있어왔다.

In recent years, there has been much debate about how to ensure that medical education research is not perceived as the poor relation of medical research.1–4


이 논쟁의 한 부분으로서, 일부는 의학교육연구가 사회과학이며(그리고 그래야 하며), 따라서 사회과학 전통의 핵심이 되는 연구 철학적 질문에 비판적으로 관계해야engage critically 한다고 주장한다. 의학교육은 복잡하고 다양한 분야로서 효과적인 교육행위란 그 맥락에 따라 정의된다. 유사하게, 개인적 관계의 강한 네트워크에 의존한다. 그렇다면 다수의 연구자들이 실증주의적 관점이 의학교육연구를 지배하고 있으며, 실험적 방법이 널리 사용된다는 것에 노골적으로 혹은 은밀히 반대하는 것은 놀라운 것도 아니다.

As part of this debate, Some of these have argued that medical education research is (and should be) constructed as a social science7 and therefore must engage critically with the questions of research philosophy that are central to that tradition.4 Medical education is a complex, diverse field and effective practice is often defined by contextual factors; similarly, it relies on powerful networks of personal relationships. Unsur- prisingly then, a number of writers have expressed an explicit or implicit challenge to the dominant posi- tivist paradigm within medical education research and the prevailing use of experimental methods.12,13


그러나  의학교육 전문 학술지에 출판된 논문에 이러한 논의는 널리 퍼져있지 않다. 이론적 프레임워크를 명확하게 언급하는 것이 점점 더 늘어나고 있으나, 대부분의 의학교육 연구(양적이든 질적이든)는 연구 패러다임이나 인식론적 가정을 언급하지 않고 있다. '방법론methodology'은 종종 특정 문제에 대한 applied approach를 지칭함, 의학교육학술지에서는 research methodology를 설명하거나 관련된 인식론적, 존재론적 관점을 설명하는데 사용되지 않는다.

As yet, this discussion has not widely influenced the studies published in dedicated medical education journals. Explicit references to theoretical frame- works are becoming more common;16 however, most peer-reviewed medical education studies (both quantitative and qualitative) still make no mention of the research paradigm or epistemological assump- tions underpinning the work. The term ‘methodol- ogy’ is most often used to refer to an applied approach to a particular issue(e.g. 17,18) and is rarely used within medical education journals to describe research methodology and the related epistemological and ontological perspectives.


여기서는 그것이 반드시 의학교육의 전 영역에서 사실이 아님을 밝히고자 한다. 사회과학 저널에 출판된 교육연구와 특히 간호학 저널에 실린 연구는 보다 비-실증주의적 가정에 기반을 두고 있으며, 그 가정을 명확히 독자들에게 밝히고 있다. 예컨대, 한 최근의 예외는 McNamee 등의 귀납적 현상론적 접근(inductive phenomenological approach)으로, 연구의 결과를 맥락화하기 위하여(contextualise the findings) 연구 패러다임을 묘사하고 있으며, 독자들에게 연구에 깔린 가정을 설명하고자 한다. 더 흔하게, 의학교육 저널에서 경험적 연구empirical studies는 데이터 수집과 분석의 테크닉에 지나치게 초점을 두고 있다.

It is important to note here that this is not necessarily true of the entire field of medical education; educational research published in social science journals and notably in nursing journals is more likely to be underpinned by non-positivist research assumptions and to make those assumptions explicit to the reader. For example, one recent exception is McNamee et al.’s19 inductive phenomenological approach, which describes the research paradigm to contextualise the findings and inform the reader of the underlying assumptions of the work. Most commonly, however, empirical studies in medical education journals continue to focus overwhelmingly on the techniques used for data collection and analysis.20


이는 여러가지 이유에서 문제가 되는데, Lingard는 이렇게 말했다. '우리가 질적연구에 대해서 가르칠 때 도구를 강조하고 있지만, 도구 그 자체는 질적연구 패러다임의 핵심이 아니다' 대신 그녀는 연구의 '지향orientation'의 중요성을 말한다. 

This is problematic for a number of reasons. Lingard4 argues that: ‘…while we emphasise the tools when we teach qualitative research, the tools themselves are not the essence of the qualitative paradigm.’ Instead, she outlines the importance of the research ‘orientation’:


'연구자가 어떤 종류의 지식을 만들고자 하는가? 지식과 인식론에 대한 관점은 어떠한가? 민족지적 관점에서 연구를 하는가, critical theory를 사용하는가, 아니면 사례연구 접근법을 사용하는가? 이러한 차원dimension들은 연구질문을 던지는 방식을 형성한다는 점에서 방법론적 도구보다 더 중요하다.'

‘What kind of knowledge are the researchers setting out to make? What are their views on knowledge, their epistemology? Are they conducting the study from an ethnographic, a critical theory, or a case study approach? These dimensions matter much more than the methodological tools, because they shape the way the research question is asked.’4


 

philosophical tradition of systematic knowledge development, the underlying premise of which is that any knowledge claim 로부터 시작한 학술적 연구만이 a wider set of assumptions about the nature of reality로부터 방어가능하다. Bordage는 한 연구의 conceptual framework가 '연구자가 그것을 의식하고 있든 그렇지 않든, 무엇을 하기로 결정하고 결과를 어떻게 해석하는지를 결정지을 것이다'.라고 했다. 비슷한 것이 연구 패러다임에 대해서도 마찬가지이다. 의학교육연구가 더 넓은 범위로 확장되기를 원하고 그 영향력을 넓히고자 한다면 연구 가정research assumption을 더 넓은 학계 구성원에게 설명하고, 그 분야 내에서 지식의 특성을 비판적으로 고려해야 할 것이다.

Academic research stems from a philosophical tradition of systematic knowledge development, the underlying premise of which is that any knowledge claim is only defensible within a wider set of assumptions about the nature of reality.21 Bordage6 observes that the conceptual framework within a study ‘will dictate, whether you are conscious of it or not, what you choose to do and how you interpret your outcomes and results’. This is similarly true for the research paradigm, which is itself a grand theory.22 As medical education research hopes to extend into wider scope and influence, it will be important to articulate these research assumptions to the wider academic community so that it can critically consider the nature of the knowledge claims within the discipline.


2005년 의학교육의 질적연구방법에 대한 시리즈를 내면서 Britten은 '질적연구에 관해서 참고할 수 있는 책은 매우 많으며, 다양한 독자층을 대상으로 나와 있다. 그러나 질적연구의 주요 방법에 대한 간결하고 접근가능한 accessible 설명은 빠져 있고, 의사practitioner가 연구하고자 하는 연구질문의 유형에 따른 적용법에 대한 것도 빠져 있다'

When introducing the 2005 series on qualitative research methods in medical education, Britten23 observed: ‘…there is an overwhelming choice of textbooks on qualitative research, aimed at a wide variety of audiences. What are missing are succinct and accessible explanations of the major methods in qualitative research, and their potential application to the kinds of research questions that practitioners would like to investigate.’

 

 


본 저자들의 연구 관점

The authors’ research perspective



다음으로 넘어가기 전에, 이 연구의 전반적 관점은 구성주의자적인 것임을 밝히며, 광범위하게는 주석주의interpretivism이라고 할 수 있다. 두 가지 핵심 요소

Before continuing, it is important to note that the overall position of this paper is a constructionist one, which can be broadly characterised as interpretivism. This perspective has two central elements:


  • 주관적 인식론. 현실에 관한 다수의 다양한 해석을 추구
    1 it uses a subjective epistemology which antici- pates multiple, diverse interpretations of reality rather than seeking to reveal an overarching ‘truth’,24–26 and
  • 광범위한 심도있는 설명을 수집하며, 특정 현상이 그것을 경험한 개인의 차원에서 어떻게 이해되는지에 대한 자세한 묘사를 추구함.
    2
     it is associated with an interpretive effort to gather a range of in-depth accounts with the aim of building a detailed picture of how a particular phenomenon is understood by those who have personal experience of it.


어떤 연구 패러다임이 더 우월하다는 것은 없다. 적절한 연구질문에 답하기 위해서 세심하게 사용되기만  한다면 모두 타당하다. 그러나 이 논문은 주석주의적 철학의 관점에서 쓰여졌으며 이 접근이 의학의 실증주의적 전통에 익숙한 교육자와 연구자에게 가장 낯선 것이기 때문이다.

We assert that there is no one superior research approach within the research paradigms outlined here; all are valid and informative when used sensi- tively in context to answer an appropriate research question. However, this paper describes the underly- ing research philosophy of interpretivism in particu- lar depth because this approach is often the least familiar to those who have trained as educators and researchers in the positivist medical tradition.




의학교육에서 연구 패러다임

RESEARCH PARADIGMS IN MEDICAL EDUCATION


'패러다임은 신념과 실천의 집합으로서, 연구 공동체communities에 의해서 공유되는 것이고, 그 학문 내에서 질문inquiry를 조절하는 것이다'. 다양한 패러다임이 연구를 개념화하고 수행하는 접근법에 있어서, 그리고 지식의 구성에 기여하는 방식에 있어서 존재론적, 인식론적, 방법론적 차이로 구분된다.

‘Paradigms are sets of beliefs and practices, shared by communities of researchers, which regulate inquiry within disciplines. The various paradigms are characterised by ontological, epistemological and methodological differences in their approaches to conceptualising and conducting research, and in their contribution towards disciplinary knowledge construction.’27


Table 1. ontology (the nature of 현실), epistemology (the nature of 지식), methodology (the nature of 연구)

Table 1 outlines four major paradigms currently in use within medical education research and describes the assumptions about ontology (the nature of reality), epistemology (the nature of knowledge), methodology (the nature of research) and the related research methods for eachof these perspectives.21,25–30 The term‘paradigm’ is used within this paper to refer to what Morgan describes as an epistemological stance.31 (See Morgan31 for a full critique of this position.)


그러나 의학교육연구에서, 그리고 의학 연구에서 거의 실증주의적 철학이 지배해왔다.

However, medical education re- search, and indeed medical research, has historically been dominated by positivistic philosophies of knowledge, whereas interpretive and critical meth- odologies have enjoyed less popularity.


물론 실증주의적 패러다임이 특정 질문에 대해서는 매우 유용한프레임워크이지만, 이러한 연구방법(RCT)이 '복잡하고, 불안정학, 비선형적 사회 변화를 연구하는데는 부적절하다'라는 지적이 점차 늘고 있다.

Although positivist paradigms are invaluable frame- works within which to answer certain questions, the literature increasingly recognises that the related experimental design research methods (e.g. rando- mised controlled trials) ‘are inadequate tools for studying complex, unstable, non-linear social change’.34


반면, 다른 패러다임(주석주의, 비평critical research)이 복잡하고 불안정하고 비선형적 변화에 매우 좋은 방법이다.

By contrast, research underpinned by other paradigms, such as interpretivism or critical research, provides very good ways to study complex, unstable, non-linear change.



관찰 사례: 방법론적 가정

AN OBSERVATIONAL EXAMPLE: METHODOLOGICAL ASSUMPTIONS AT WORK


이 연구에서는 ‘How do collective learning and change happen in primary care teams?’ 를 질문으로 하였다. 관찰적 연구방법을 도입하고, 질적연구로서, 핵심 관계자들의 인터뷰를 토대로 하였다. 이 방법들은 민족지적으로 활용되었고, 1년의 기간에 걸쳐 자료수집을 위한 방문visits가 이뤄졌다. SB는 명시적 관찰자였으며, 자료 수집은 'naturalistic'했다 즉, 자료 수집은 연구 참가자들과 함께 자연적인 근무환경에서 일상이 진행되면서 이뤄진 것이다.

This research asked: ‘How do collective learning and change happen in primary care teams?’ The study adopted observational research methods, used qualitatively, and supporting interviews with key participants. These methods were used ethnograph- ically36 and extended data gathering visits took place over a 1-year period. (See Bunniss and Kelly34 for a more detailed description of the stages of data collection and analysis.) In this study, SB was an overt observer and the data gathering methods were ‘naturalistic’;27,37,38 that is, data were gathered with participants in their natural working environment as they went about their everyday work.


이러한 연구는 종종 생성적generative (가설 검증적이 아닌)인 것으로 불리며, 왜냐하면 특정 현상이 나타나는 것에 관한 다양한 해석을 가능하게 하기 때문이다. Figure 2는 몇 가지 가능한 해석이다.

Research of this nature is often referred to as generative (rather than hypotheses testing) because it allows different interpretations of a particular phenomenon to emerge. Figure 2 provides some examples of possible interpretations highlighted by this particular observation extract,



연구 패러다임의 다른 해석

Alternative interpretations within research paradigms


현장작업 중 무수한 노이즈와 활동에 둘러쌓이게 될 것이다. 무엇을 포함시키고 어떻게 해석할지를 결정함에 따라서 다른 대안에 대한 마음의 문이 닫힌다mental doors slam shut on the alternatives.

‘During fieldwork you are surrounded by a multitude of noises and activities. As you choose what to attend to and how to interpret it, mental doors slam shut on the alternatives.’ (Agar39)



해석주의적 패러다임에서, 지식의 생성은 ‘relevant insights emerge naturally through researcher–participant discourse’.로부터 나타난다. 따라서, 연구자의 관점이 연구의 결과와 불가분의 관계에 있다는 것이 기본적 가정이며, 왜냐하면 '의미meaning은 자연적 환경에서 연구자-참여자의 상호작용에 따라 구성된다'고 보기 때문이다. 이는 해석주의적 패러다임에서 지식의 형성building에 관한 자연적 특성natural characteristic 으로서, 지식의 형성을 본질적으로 사회적 활동으로 보기 때문이다. 해석주의자들은 연구는 절대로 편향에서 자유로울 수 없다고 가정한다. 따라서 편향을 제거하는 것이 연구의 목적이 아니다. 대신, 연구의 한 가지 목적은 어떻게 연구자의 생각/감정/의견/경험이 그가 관찰하고 기록하는 대상에 영향을 주는가에 관심을 두는 것이다.

Within the interpretivist paradigm, knowledge generation happens when ‘relevant insights emerge naturally through researcher–participant discourse’.40 Therefore, it is a basic assumption that the researcher’s perspective is inextricably bound up within the findings of a study because ‘meaning is constructed in the researcher–participant interaction in the natural environment’.27 This is a natural characteristic of knowledge building within this paradigm (the hermeneutic cycle), which is seen as an inherently social act. Interpretivism assumes that a study can never be bias-free; therefore eliminating bias would not be a research intention. Instead, one of the aims of a study conducted from an interpre- tivist perspective would be to attend to how the researcher’s thoughts, feelings, opinions and experi- ences might influence what he or she observes and records.

 

 

이 연구에서 자료 수집 시트는 관찰한 것과 그 관찰로부터 추론한 것, 연구자의 반응과 대답, 관찰대상이 되는 커뮤니티에 대해 연구자가 가지고 있던 가정이나 기대 등을 구분하여 기록하게 한다. 연구자가 어떻게 참가자와 함께 지식을 구성하는가에 관하여 유연성을 갖는 것이 자료의 비판적 해석에 대단히 중요하다. 주관적 인식론을 가정하는 패러다임이 어떻게 다양한 유형의 지식을 생성하는지를 보여주는데, 왜냐하면 참가자 경험이 참가자가 강조하는 뉘앙스와 새로운 이슈에 따라 검토되기 때문이다. 임상세팅에서 사례연구가 중요한 의미를 가질 수 있는 것과 마찬가지로, 개개인이 세상을 바라보는 관점을 설명하는 것은 독특성idiosyncrasies 의 측면에서 가치가 있다.

Within this particular study, the data capture sheet distinguished between what was observed, the inferences drawn from those observations, the reactions and responses of the researcher, and any pre-existing assumptions or expectations the researcher had about the community he or she was preparing to observe. This reflexivity regarding how the researcher jointly constructs knowledge with participants is crucial to the critical interpretation of the data. This demonstrates how paradigms that assume a subjective ontology create a different type of knowledge because participant experiences are con- sidered for the new issues and nuances they high- light.41 Individual accounts of the world are valuable for their idiosyncrasies in much the same way that case studies would be in a clinical setting.


이는 실증주의적 관점과 대단히 다르다.

This approach contrasts sharply with that of a positivist perspective,


실증주의적 패러다임에서의 연구는 자연주의적naturalistic 세팅에서의 자료 수집을 거부하며, 왜냐하면 이것은 변인variables를 추가하기 때문이다. 유사하게, 실증주의적 패러다임에서의 연구는 특정 현상에 대해서 사전에 정의된 특성을 측정함, 자료 수집에 있어서 참여자에게 즉각 반응responsive할 필요가 없다.

Research within this different paradigm would avoid data collection in naturalistic settings because this introduces further ‘variables’. Similarly, given that research from a positivist paradigm aims to measure predetermined characteristics of a particular phenomenon, there is no methodological need to be responsive to participants in the same way during data collection.


이 가정은 연구자가 던지는 질문과도 관계된다. 어떤 질문들은 현실은관적 설명할 수 있으며, 그에 대해서 정보를 수집하고 그 수집된 정보로부텉 진실의 가치truth value를 판단할 수 있다고 본다.

  • What hypothesis is being tested?
  • How do we know the participant is telling the truth?
  • How do we know the researcher hasn’t biased the data?
  • How can one person’s experience be representative of that of the wider population?

These assumptions are further illustrated by the questions researchers ask of a study. Some questions (e.g. What hypothesis is being tested? How do we know the participant is telling the truth? How do we know the researcher hasn’t biased the data? How can one person’s experience be representative of that of the wider population?) reflect the assumptions that there is an objective account of reality that we can gather information about and that we can judge the truth value of that reported information.

 

그러나 다른 질문은 의미meaning란, 삶의 경험을 이해하는 다양한 - 종종 대립하는 - 방법에 의해 매개된다라고 본다.

  • What is the nature of the experience described by the participant and how has he come to understand it in this way?
  • What aspects of the researcher’s own experience has she brought to the data gathering and interpretation?
  • To what extent does this description of reality resonate with others?
  • What new hypotheses and concepts are being generated?

However, other questions (e.g. What is the nature of the experience described by the participant and how has he come to understand it in this way? What aspects of the researcher’s own experience has she brought to the data gathering and interpretation? To what extent does this description of reality resonate with others? What new hypotheses and concepts are being generated?) reflect the assumption that meaning is mediated through multiple (and often competing) ways to understand lived experience.



서로 다른 연구 관점을 가지고 있는 사람들은 연구 근거의 기준으로 서로 다른 것을 찾는다. 여기에는 신뢰도, 일반화가능도, reflexivity, resonance 등이 있다. 그러나, 모든 패러다임에 있어서 연구의 엄격함rigour에는 다음의 것들이 중요하다는 것은 공통적이다.

Those who hold different research perspectives look for different criteria of quality in research evidence; these may include criteria pertaining to reliability, generalisability, reflexivity or resonance. However, it is common to all paradigms that rigour itself is a product of

  • the soundness of the theory,
  • the transparency of the research assumptions and
  • the integrity of the research processes for data gathering and analysis.

 

실제로 연구의 가정과 무관하게, 연구자의 신뢰성에 핵심 이슈는 연구의 한계를 밝히고, 연구결과의 해석에 영향을 줄 수 있는 정보를 공개하는 것이다.

Indeed, regardless of the research assumptions, the central issue concerns the trustworthiness of the researchers in identifying the limitations of the work and disclosing information that could influence the interpretation of the findings.




CONCLUSIONS



연구방법론이란 단순히 자료 수집 전략에 관한 것이 아니며, 더 중요하게는 그 연구설계의 특성을 결정하는 철학적 신념을 설명한다.

The paper argues that research methodology is not simply about data collection strategies, but, more importantly, that it addresses the philosophical beliefs that determine the nature of the research design.




31 Morgan DL. Paradigms lost and pragmatism regained: methodological implications of combining qualitative and quantitative methods. J Mix Methods Res 2007;1 (1):48–76.



Britten, N. (2005). Making sense of qualitative research: a new series. Medical Education, 39(1), 5-6.












 2010 Apr;44(4):358-66. doi: 10.1111/j.1365-2923.2009.03611.x.

Research paradigms in medical education research.

Author information

  • 1Department of General Practice Section, NHS Education for Scotland, Glasgow, UK. Suzanne.bunniss@nes.scot.nhs.uk

Abstract

CONTEXT:

The growing popularity of less familiar methodologies in medical education research, and the use of related data collection methods, has made it timely to revisit some basic assumptions regarding knowledge and evidence.

METHODS:

This paper outlines four major research paradigms and examines the methodological questions that underpin the development of knowledge through medical education research.

DISCUSSION:

This paper explores the rationale behind different research designs, and shows how the underlying research philosophy of a study can directly influence what is captured and reported. It also explores the interpretivist perspective in some depth to show how less familiar paradigm perspectives can provide useful insights to the complex questions generated by modern healthcare practice.

CONCLUSIONS:

This paper concludes that the quality of research is defined by the integrity and transparency of the research philosophy and methods, rather than the superiority of any one paradigm. By demonstrating that different methodological approaches deliberately include and exclude different types of data, this paper highlights how competing knowledge philosophies have practical implications for the findings of a study.

Comment in

PMID:
 
20444071
 
[PubMed - indexed for MEDLINE]


의학교육연구의 질에 관한 논의 확대(Med Educ, 2009)

Broadening the debate about quality in medical education research

Kevin W Eva






두 사람 모두 Todres의 2007년 논문을 인용하며 의학교육연구의 2/3은 observational 연구이며, 3%이하만이 RCT를 활용했다고 지적했다. 이번 호에서 Jones 등은 2007년 논문이 RCT를 지지하기 위한 것은 아니었다고 밝혔다. 그들이 전하고자 했던 메시지는, 연구 디자인이 어떻든 그 설계에 관한 최고의 스탠다드를 적용해야 한다는 것이었다고 한다. 이는 중요한 해명이다. 의학교육연구가 대부분 관찰연구라는 사실을 바탕으로 의학교육연구가 정체되어있다고 주장하는 것으로부터 관찰연구가 다른 방법론에 비해서 열등한 것이라는 추론을 내리는 함정에 빠져서는 안된다고 Dornan은 말한다.

Both used Todres, et al.’s1 2007 paper to point out that a full two thirds of medical education re- search studies were observational in nature while less than three per cent utilised randomised controlled trial (RCT) designs. In a letter published in this issue Jones, et al.2 clarify that they did not intend to advocate for RCTs (or quantitative methods more gener- ally) in that 2007 article, but rather, that their message was that what- ever research design is used it should be used to the highest standards of practice for that design. This is an important clarifi- cation. One could easily be forgiven for inferring that claims of stagnation within medical educa- tion research accompanied by the observation that the majority of studies in the field are observa- tional implies that observational studies (and the qualitative research encompassed in that broad label) are less desirable than other methods, as indicated by Dornan, et al.,3 in their reply.



이 editorial은 이 토론을 반복하기 위한 것이 아니라 우리가 이 연구를 어떻게 전개시킬까에 대해 성찰하기 위함이다. 

This edito- rial is not intended to simply rehash that discussion, but rather, is aimed at prompting reflection on how we might move the dis- cussion forward by changing the terms of the debate.



생의학계의 '근거의 위계'는 교육적 맥락에서는 불충분하며, 수행된 연구가 진전을 가져왔는가에 대한 평가를 위해서는 대안적 모델이 필요하다. 만약 우리의 연구가 다른 기준에 따라 평가되어야 한다면 그 기준이 무엇이 되어야 하는가를 정하는 책임은 우리에게 있다.

It was then that I realized, however, that it is one thing to say that the biomedical community’s hierarchy of evidence is insufficient in educational contexts, but quite another to offer an alternative model that provides guidance regarding how to judge whether or not the research being performed is enabling progress to be made. If we think our work in the field needs to be held to a different standard, the onus falls upon us to determine what that standard should be.



이 때 근본적 문제는 다양성이다.

A fundamental problem in this regard is diversity.


이에 대해서 너무 이상적인 모습만 그려서는 안된다. Brain Hodges가 우리에게 우아하게 가르쳐 준 바와 같이 서로 다른 담화(세상을 바라보는 관점)가 서로 (암묵적이든 명시적이든) 충돌할 수 있으며 , 두 분야는 물론 학생에게도 부정적 결과를 가져올 수 있다. 그러나 전체적으로는 내 경험에 따르면 의학교육연구에 종사하는 대부분의 사람들은 우리 중 그 누구의 가정/방법/세계관도 교육의 모든 이슈를 설명하기엔 부족하다는 것을 안다. 전세계적으로 통용되는 기준을 정의하는 데 있어서 이것이 야기하는 문제는 엄청나다.

One should not paint too Utopian a view in thisregard as it is undoubtedly true, asBrian Hodges has so eloquently taught us, that different discourses (ways of seeing the world) can conflict with one another, either explicitly or implicitly, with poten- tially negative repercussions for both the field and individual stu- dents.7 On the whole, however, myexperience has led me to believe that most people working within the field of medical education research recognize that the assumptions, methods, and world- views that any of us hold as indi- viduals are insufficient to address every issue of relevance to educa- tors in the health professions. The challenge this creates in terms of defining universal standards for rigour are substantial. 



우리 스스로 발전을 이뤘다고 생각하는 것을 더 잘 보여주는 준거의 집합을 어떻게 제안할 수 있을까?

How then can we put forward a set of criteria that will enable the next set of authors who choose to conduct a review of the quality of research in medical education to better represent the goals of the field and the progress that we think is being made? It is a critically important question be- cause, quite frankly, it would not bother me in the least if the Todres, et al. study were repeated 10 years from now only to bemoan that the distribution of research methods was unchanged.


 

Isaac Asimov는 '과학계에서 들을 수 있는 말 중 가장 흥분되는 말은 '유레카!'라는 새로운 발견의 도래를 알리는 말이 아니라, '그거 흥미로운데요...' 라는 말이다' 라고 한 적이 있다. 연구자로서 우리의 목표는 관심이 되는 현상을 밝혀내고, 이 현상에 대한 호기심이 기존의 경험적 발견을 탐색하게끔 하고, 그 특정 현상을 더 잘 이해하기 위한 연구방법 뿐 아니라 이론을 만들어내는 것이다. 현상이 복잡하다면 어떤 방법도 독자적으로는 불충분하다.

Isaac Asimov once said ‘The most exciting phrase to hear in science, the one that heralds discoveries, is not ‘‘Eureka!’’ (I found it!) but ‘‘That’s funny…’’’. As researchers our goal should be to identify phenomena of interest (and prac- tical relevance) and to let curiosity about those phenomena drive an exploration of existing empirical findings and theories as well as driving the generation of research methods tailored to the purpose of better understanding that particu- lar phenomenon. Any one method is likely to be insufficient if the phenomenon is complex (as is typically the case if the phenome- non is related to education).


실제로  Richard Boyd 와 다른 과학철학자들은 이론이 방법에 의해서 만들어지는 것 만큼이나 방법이 이론에 의해서 만들어진다고 했다.

In fact, Richard Boyd and other phi- losophers of science considered realists go so far as to argue that methods in science are produced by scientific theory just as much as theory is driven by method.



이 editorial에 있어서 나는 고의적으로 'evidence'라는 단어를 사용하지 않았다. 이는 이 단어의 의미가 '활용가능한 정보의 총체'라는 의미가 아니라 '뭔가 효과가 있었던 것'이라는 협소한 의미로 갈취되었기 때문이다. 의학교육연구와 같이 복잡한 영역에서 나는 더 광범위한 정의에 초점을 맞춰야 한다고 생각한다. 우리의 실제 목표와 관련된 경험적(empirical) 정보의 축적을 통한 발전을 위해 고군분투하는 것이며, 다양한 종류의 정보에 순위를 매겨 고정시키거나, evidence의 위계를 협소하게 정의하지 말아야 한다.

Throughout this editorial I have deliberately avoided using the word ‘evidence’ when discussing research in medical education. That is because the word has been hijacked to narrowly come to mean proof that something works rather than the broader definition of an available body of information.10 In complex domains like medical education research I think we are better served by focusing on the broader definition, striving for progress through the accumulation of empirical (i.e., based on verifi- able observations) information that is relevant to our practical aims than we are by getting locked into placing different types of informa- tion into a static and inevitably narrowly defined hierarchy of evidence.


바로 그 최고의 RCT라는 것조차 '효과적'이라고 밝혀질 수 있지만, 그 조차도 특정 워크숍이나 과정에 대한 것을 넘어서는 더 일반적인 현상의 이해에 도움이 되지 않는다면, 더 폭넓은 커뮤니티 차원에서는 충분히 활용가능한 것이 아닐 수 있다. Scholarship란 문헌에 존재하는, 특정 맥락으로 제한되는 경험적 결과를 적용할 수 있는 최선의 방법을 찾는 것이다. 이는 가장 효과적인 교육 처방을 공식에 따라서 주문하는 것과 같이 단순화 될 것이 아니다.

The very best RCT may prove that a specific educational intervention was effective, but if it does not advance understanding of a more general phenomenon than that particular course or workshop then it will not be of substantial use to the broader community.11 Scholarship is about determining how to best adapt the empirical findings present in the literature to the needs and constraints of one’s local context (and engaging in continuous quality improvement exercises to ensure that one’s adaptations are meeting their mark). It is not about simply ordering the most effective educa- tional therapy off the formulary. That pill doesn’t exist.


의학교육 연구의 질에 대해 판단할 때 이것이 의미하는 바는, 어떤 '객관적' 체크리스트도 불충분하다는 것이다.

What this means in terms of judg- ing the quality of research being performed in medical education is that any ‘objective’ checklist, such as those advocated by the users’ guides, will be insufficient.



의학교육 연구는 성장하고 있다.

The field of medical education research continues to grow



이 모든것이 많은 사람들이 이미 수행된 연구의 가치를 찾고 있음을 보여주는 간접적 증거이다. 우리는 Todre의 근본적 메시지에 관심을 기울여야 한다. 즉 우리 분야의 지속적 발전을 위해서는 다양한 재정지원 기관에 우리가 하는 것을 팔(sell) 방법을 생각해야 한다.

This all provides indirect evidence that a large body of people are finding value in the research that is being done. That said, we do need to heed Todres, et al.’s fundamen- tal message that to continue our progress we need to find better ways to sell what we do to various funding agencies and government organizations.



그렇게 함으로써, 나의 진정한 바람은 의학교육연구의 질을 평가할 때, 특정 방법론이 적용되었는지 아닌지를 가지고 평가하기보다는, 문제를 이해하는 데에 있어 우리가 얼마나 정교한지를 생각해볼 때, 과연 그 연구를 통해서 그러한 진전이 이루어졌는지를 기준으로 평가하는 것이다.

In doing so, however, my sincere hope is that we will define the quality of medical education research based on judgments of whether or not progress is being made with regard to how sophisti- cated our understanding of the problems becomes, rather than on whether or not a particular research methodology has been adopted.










 2009 Apr;43(4):294-6. doi: 10.1111/j.1365-2923.2009.03342.x.

Broadening the debate about quality in medical education research.

PMID:
 
19335567
 
[PubMed - indexed for MEDLINE]


좋은 의학교육연구의 가치는 무엇인가? (Med Educ, 2008)

What is the value of good medical education research?

John Bligh & Julie Brice






속담에도 나와 있듯, 비용을 부담한 사람이 결정권을 가진다. 연구가 공공의 자금에서 지원되는 대부분의 국가에는 연구 성과를 평가하는 국가 시스템이 있다.

As the saying goes, those who pay the piper call the tune. In most countries where research is pub- licly funded there are national systems for assessing research outputs. Governments, research councils, charitable bodies and other investors all want value for money.



영국은 2008년부터 모든 건강 관련 연구를 평가하는 metrics를 사용할 것이며, 문서에서 드러난 것은 lighter-touch 접근법이라 불리는 방식이 사회과학 연구를 위해 개발될 것이라는 점이다.

the UK government will use metrics to assess all health-related research from 2008, and what the consultation document describes as a lighter-touch approach will be developed for those disciplines within the social sciences.3


의학교육 연구자들은 연구 평가를 위한 양적 접근법을 불신할 만한 이유가 있다. 비록 많은 의학교육 편집자와 연구자가 그들의 연구 대부분이 - 연구방법론이 어떻든 - 더 과학적이고 이론적으로 튼튼해지면 도움일 될 것이라는 점에는 동의하나, 의학교육계 내에서는 어떻게 의학교육연구의 질과 가치를 평가할 것인가에 대한 분노만큼이나 방어적 태도가 나오고 있다.

Medical education researchers have reason to mistrust quantitative approaches to assessing their work. Although many medical education editors and researchers would agree that much of our published research, whatever the methodol- ogy, would benefit from being more scientifically and theoretically rigorous,5–7 there is a sense of defensiveness amounting almost to indignation among the medical education community regarding how the quality and value of medical education research are assessed.


의학교육연구는 전통적으로 무자비하게 실용성만 강조하는 영향력있는 사람들의 손에서 번창해왔다. 이러한 의학교육연구는 비록 생의학 분야의 한 부분으로 여겨졌지만, 점차 양적 방법론을 더 폭넓게 사용하고 있으며, 전통적인 의학 연구와는 다르다. RCT가 황금률로 여겨지는 분위기에서 의학교육은 지속적으로 인정받기 위해 노력해왔다 .실제로, 대부분의 방법론적 접근법의 soft nature로 인해서 의학연구와의 관계가 취약하다고 묘사되어왔다. 이는 적은 연구비 지원으로 이어졌고, 대규모의 empirical research project 발전의 장애로 작용했다.

Medical education research has not traditionally prospered at the hands of those in positions of influence where the emphasis is ruthlessly practical. Although medical educa- tion research is typically considered part of the biomedical sciences family, and it continues to make extensive use of quantitative meth- ods, it is not typical of classical medical research. In a climate where the randomised controlled trial is seen as the gold standard for research, medical education constantly has to struggle for rec- ognition.8 Indeed, it has been unflatteringly described as the poor relation of medical research 9 because of the soft nature of many of its methodological approaches. These factors contribute to low levels of funding for medical education research, which in turn represents a serious barrier to the development of large-scale empirical research projects.


영국의 의학교육연구는 사회과학보다는 의과학으로 구분될 가능성이 높다.

It appears probable that medical education research in the UK will continue to be viewed as a medical science rather than a social science.


이러한 의학교육연구에 대한 관점은 널리 받아들여지고 있는데, 저널들은 SSCI보다는 Thomson ISI Citation Index에 더 등장하고 있다.

This view of medical education research as more repre- sentative of a science than a social science is widely accepted. For example, all the main medical education journals appear in the Science listings in the Thomson ISI Citation Index, rather than in the Social Science categories; pub- lished work is listed in the main scientific and medical indices.


무엇보다 의학교육연구의 가장 가혹한 비평가들은 그들의 독자이다. 의과학 패러다임에 익숙한 기초의학자와 임상가들이다. 이들은 우리의 연구비 제안서를 평가하는 사람들이며, 우리의 연구 성과를 판단하는 독자이고, 이것을 실제로 활용할 사람들이다. 따라서 의학교육연구의 매체(medium)과 메시지가 이들에게 적절해야 한다.

After all, medical education research s harshest crit- ics are also its target audience: clinicians and scientists familiar with the medical science para- digm. These are the funders who assess our grant applications and the journal readers who judge the products of our research and eventually apply them in their practice. It is therefore vital that the medium and the message of medical education research are appropriate for this audience.9–11


복잡하고 빠르게 변화하는 의과대학과 의료환경에서 의학교육연구를 수행할 때 실제적/이론적 어려움과 씨름해 본 사람이라면 반대하기 어려울 것이다. 그러나 우리의 개인적 신념이 무엇이든, 한 집단으로서 우리는 우리앞에 놓은 과제를 인정해야 한다.

anyone who has wrestled with the practical and theoretical difficulties of undertaking medical education research in a complex and rapidly changing medical school or clinical environment would find it hard to disagree. Yet whatever our individual beliefs about the nature of medical edu- cation research, as a community we nevertheless have to accept the challenge that lies before us.2


 

우리의 주된 관심은 의학교육연구의 가치를 우리의 연구를 사용하고 인정해줄 사람에게 보여주는 것이다. 이는 다른 사람이 연구 의제를 설정하게 두는 것이 아니다. 우리는 bibliometric analysis 만으로 어떻게 우리 연구가 평가되고 지원받을지에 대한 최종적 판단이 이뤄지는 것을 원하지 않는다. 그렇다면 우리가 의학교육연구를 평가할 새로운 평가법을 개발해야 한다. 우리는 근본적 질문에 답해야 한다. 의학교육이 변화를 가져오는가? 만약 그렇다면 누구에게, 어떻게? 그리고 교육의 성과와 효과를 측정할 때 어떻게 정의할 것인가?

Our primary concern must be to demonstrate the value of medical education research to those who commission and use our work, in ways that they can understand.12 This does not necessarily mean allowing others to set the agenda; but if we do not wish bibliometric analysis alone to have the final say on how our work is evaluated and funded, then we ourselves must develop new measurement indica- tors for medical education research that are credible and acceptable to our critics. We must address the fundamental questions. Does med- ical education make a difference? And if so, to whom and why? How do we define and, importantly, measure educational outcomes and impact? We must, as a matter of urgency, research, assess and dem- onstrate clearly how what we do is important for the improvement of patient care.







9 Todres M, Stephenson A, Jones R. Medical education research remains the poor relation. BMJ 2007;335:333–5.








 2008 Jul;42(7):652-3. doi: 10.1111/j.1365-2923.2008.03036.x.

What is the value of good medical education research?

Author information

  • 1Plymouth, UK.
PMID:
 
18588645
 
[PubMed - indexed for MEDLINE]


의학교육 분야에서 50년간의 논문 출판 분석(Med Teach, 2013)

50 years of publication in the field of medical education

KYUNGJOON LEE1, JULIA S. WHELAN1, NANCY H. TANNERY2, STEVEN L. KANTER2 & ANTOINETTE S. PETERS1

1Harvard Medical School, USA, 2University of Pittsburgh, USA







의학교육 분야의 논문 출판은 1950년에 Journal of the Association of American Medical Colleges가 Journal of Medical Education으로 바뀌면서 시작되었다. 그러나 의학교육이 학문의 한 분야로 자리잡은 초기에는 매우 느릿느릿했다. 이는 1966년 의학교육을 전문으로 다루는 두 번째 저널 British Journal of Medical Education 이 생길 때까지는 그러했다. 이후 일부 다른 저널들도 그 사이에 생기긴 했으나, 5개의 온라인 그리고 인쇄판 의학교육 저널들이 갑자기 등장하였다( Journal of Graduate Medical Education, International Journal of Medical Education, Education in Care). 이제 의학교육 분야는 주요한 출판분야로 성장하고 있다. 이러한 성장을 특징짓는 것은 무엇일까?

Published scholarship in ME began in 1950 when the Journal of the Association of American Medical Colleges transformed itself into the Journal of Medical Education. Yet, the early history of ME as a scholarly field was almost languid. It was not until 1966 that a second journal dedicated to ME appeared, the British Journal of Medical Education (Kuper et al. 2010). A few others appeared in the intervening years, but recently 5 new online and print ME journals have suddenly appeared (e.g. Journal of Graduate Medical Education, International Journal of Medical Education, Education in Care). Now, the field of ME is abloom with Primary publications. What characterizes this growth?


방법

Method


검색

The search


의학교육의 출판 패턴을 따라가기 위하여 MeSH를 가지고 MEDLINE의 multi-faceted indexing을 활용였고, 트렌드를 Medvane으로 분석하였다.

To follow publication patterns of ME, we took advantage of the multi-faceted indexing of MEDLINE with the Medical (MeSH) Subject Headings taxonomy, and analyzed trends using Medvane (Lee 2011).



분석

Analyses


우리는 50년간의 출판물, 저널, 주제를 분석하였다.

We tracked publications, journals and topics over 50 years (1960–2010).



결과

Results


1960년과 2010년 사이의 의학교육 관련 출판물

Evolution of ME publications from 1960 to 2010


그림 1(a)는 MEDLINE에 색인된 의학교육 논문을 MeSH 주제어로 1960년부터 2010년까지 본 것이다. 1960년 279개에서 2010년 3760개까지 증가하였다. 그러나 이 50년간 폭발적 증가, 축소, 변화없는 상태가 모두 있었다. 일반적으로 1983년까지는 작은 증가/감소가 있다가 이후로는 꾸준한 증가세를 보이고 있다.

Figure 1(a) illustrates the pattern of articles indexed in MEDLINE with ME as a major MeSH heading from 1960 to 2010. The number of ME articles indexed in MEDLINE increased 13-fold from 279 articles in 1960 to 3760 in 2010. However, within this 50 year period, there were several periods of expansion, contraction and steady state. In general, there were small increases and decreases in publications until 1983 after which there was an almost steady rise in the number of annual ME publications.


그림 1(b)는 MEDLINE에 ME로 색인된 모든 논문의 비율이다. 1960년에는 0.3%였으나, 빠르게 증가하였고 (아마도 artifact로 보이며), 이후 1982년까지 감소하다가, 1982년부터 2001년까지는 0.33%에서 0.41%로 증가하였고, 21세기에는 14%포인트 증가하였다. 따라서 ME 출판 뿐 아니라 - 생의학분야의 전반적 성장에도 불구하고 - 의학교육은 MEDLINE 색인 출판에서 더 많은 비중을 차지하게 되었다.

Figure 1(b) illustrates the percent of all articles indexed in MEDLINE indexed as ME. In 1960, ME articles accounted for 0.3%of MEDLINE’s citations and the percentage rose markedly in that decade, possibly an artifact of the inception of MEDLINE and retrospective indexing. Thereafter, it declineduntil 1982. From 1982 to 2001, the percent of ME articles rose8% points (from 0.33% to 0.41%) and the last decade (2000s)has seen an increase of 14% points (from 0.41% to 0.55%).Therefore, not only has the number of ME publications grown,but, despite growth in other biomedical fields, ME represents an increasingly larger proportion of all MEDLINE indexed publications. 

 

 

 

 


 


저널들의 의학교육 분야 출판

Journals’ publication of ME


1960년 이후, ME에 특화된 저널의 수와, ME관련 논문을 가끔이라도 게재하는 저널의 수가 증가하였다. 더 나아가 ME 저널은 색인된 저널 전체에서 더 많은 비중을 차지하게 되었다. 전체적으로 4208개의 서로 다른 저널이 최소한 하나 이상의 ME 관련 논문을 출판하였으며, 이는 1960년 104개의 저널에서(5.5%), 2010년 855개(14.2%)로 늘어난 것이다.

Since 1960, the number of journals dedicated to ME and the number of journals occasionally publishing an article about ME have increased. Moreover, ME journals began to account for a larger percent of the overall corpus of indexed journals. general Overall, 4208 different journals (e.g. specialty or medical journals, as well as ME journals) published at least one article in which ME was indexed as a major topic. In 1960, 104(5.5%) journals published ME articles, whereas in 2010, 855(14.2%) did so (Figure 2a and b). 



1960년대부터 1980년대 중반까지 ME를 전문으로 다루는 저널은 1~3개에 불과했다. 1985년부터 1990년대 후반까지 그 수는 두 배가 되었고, 2000년부터 2010년까지 세 배가 되었다. 2010년 MEDLINE에 ME 특화 저널이 11개 있었으며, 비록 13개의 저널이 1960년과 2010년 사이에 존재한 적이 있고, 일부 새로운 저널 중에서 아직 색인되지 않은 것도 있긴 하다. 모든 분야의 저널이 증가했음에도 ME저널은 1960년대에 비해 MEDLINE에 색인된 모든 저널 중 더 많은 비중을 차지하고 있다. 2001년까지 ME저널의 퍼센트는 0.04%에서 0.11% 사이였다. 새로운 ME저널의 등장으로 이제는 0.24%까지 증가하였다.

From 1960 until as recently as the mid-1980s, there were only 1–3 journals dedicated to ME (data not tabled). From 1985 through the late 1990s the numbers doubled (ranging from 3–6) and then tripled between 2000 and 2010. As of 2010, MEDLINE lists 11 journals dedicated to ME, although 13 journals existed at some time between 1960 and 2010 (Figure 3 starred journals) and some new journals are not yet indexed (i.e. International Journal of Medical Education,). (When journals changed their names over time – e.g. Journal of Medical Education, now Academic Medicine – we counted them only once (Figure 3)). Despite an increase in journals in all fields, ME journals now account for a larger proportion of all journals indexed in MEDLINE than they did in 1960. Until 2001, the percent of ME journals ranged between 0.04% and 0.11%. With the introduction of new ME journals, the percent of ME journals now represents 0.24% of all journals (data not tabled).



그러나, 중요한 것은 80%의 의학교육 논문들이 ME저널이 아닌 저널에 출판된다는 것이다. 13개의 ME저널은 지난 50년간 출판된 전체 ME논문 중 약 18%만을 차지하고 있다.

However, importantly, more than 80% of all ME articles were not published in ME journals. The 13 ME journals that existed, even briefly, during the 50 year period published only 18% of all ME articles (n¼14 753).


 


 

ME가 주 영역으로 자리잡으며 진화한 공동-주제(co-topic)

Evolution of co-topics with ME as a major topic


ME아래 네 가지 주요 주제가 있다고 포함했다. MeSH에서 GME와 인턴/레지던트 에 대한 정의

Subsumed under the term ME are four major sub-topics:

  • undergraduate ME;
  • graduate ME (GME);
  • internship and residency and
  • continuing ME (CME, first row of Figure 4).
    • (The MeSH definition of GME is
      • 의과대학 졸업생이 전공의 교육을 받는 교육 프로그램. 여기에는 임상과 기초의과학의 학술적인 교육훈련 뿐 아니라 공식적인 전공의 수련도 포함되며, advanced medical degree 혹은 보드 자격증을 취득하는 과정이다.
        ‘‘Educational programs for medical graduates entering a specialty. They include formal specialty training as well as academic work in the clinical and basic medical sciences, and may lead to board certification or an advanced medical degree.’’
    • The MeSH definition of internship and residency is
      • 의과대학 졸업생이 인증기구가 설립한 요구조건을 달성하기 위하여 병원에서 제공하는 의학과 전공과목 수련을 위한 프로그램
        ‘‘Programs of training in medicine and medical specialties offered by hospitals for graduates of medicine to meet the requirements established by accredit-ing authorities.) (US National Library of Medicine 2012)


위에서 언급된 sub-topic에 더하여 우리는 co-topic을 분석하여, 1960년과 2010년 사이에 모든 ME출판물 중 10% 이상을 차지한 co-topic을 분석하였다. (curriculum, teaching, clinical competence, medical students and educational measurement)

In addition to the sub-topics listed above, we analyzed co-topics that occurred most frequently with ME between 1960and 2010 and accounted for more than 10% of all ME publications: curriculum, teaching, clinical competence, medical students and educational measurement


각 토픽의 상대적인 중요성은 해마다 달라졌다.

Within this time, the relative importance of topics changed, sometimes from year to year.


 



저널별 co-topic

Co-topics by journal


Table 1에 나타난 바와 같이 5개의 저널은 서로 서로 다르다.

As displayed in Table 1, the five journals differed both from one another and from all others.


자주 출판되는 주제

Frequently published topics.



저널별로 독특한 주제

Unique topics by journal.


추가로, 각 저널은 의학교육에서 평균적으로 나타나는 비율보다 그 자신을 더 잘 나타낼 수 있는 주제를 더 출판하여 스스로의 특징을 드러내었다.

Additionally, each journal distin- guished itself by publishing more than the overall proportion of ME articles with less frequently indexed co-topics.

 


 

 


Discussion


지난 50년간 ME의 연간 출판은 13배가 증가하였고, 총 8만개 이상의 논문이 MEDLINE에 색인되었다. 이 증가세는 꾸준한 것도 아니었고 언제나 증가해온 것 만도 아니었다.

In the past 50 years, annual publications in ME increased 13- fold, with a total of over 80 000 articles indexed in MEDLINE. The rate of increase was neither steady nor constantly positive.


 

이번 연구에서는 위대한 성장의 시대 동안의 ME출판의 포괄적 역사를 다뤘다. 우리는 ME가 주요 주제로 색인된 모든 저널의 모든 출판물을 분석하였다. 대조적으로 Rotgans는 이중 일부를 분석하였는데, 6개의 ME저널에서 1988년과 2010년 사이에 출판된 연구 논문을 분석하였다. 이 연구에서도 ME가 학문분야로서 성장했다는 것 외에도 ME가 연구의 한 분야로 성장했음을 확실히 보여준다. Rotgans와 마찬가지로 우리도 시간에 따라 주제가 변하고, IF가 높은 저널 사이에서도 명확한 차이가 존재함을 확인했다. 4개의 주제(curriculum and teaching issues, professionalism, characteristics of medical students and assessment )에서 우리 연구결과를 보다 입증해준다.

This article provides a comprehensive history of ME publications during an era of great growth. We analyzed all publications in all journals in which ME was indexed as a major topic. In contrast, Rotgans (2011) examined a subset of these, namely research articles published in six ME journals between 1988 and 2010. His work not only underscores the growth of a scholarly field, but clarifies that ME has grown as a field of research. Like Rotgans, we also found changes in topics over time and distinct differences among high impact journals in publishing those topics. Similarly, Regehr (2004) conducted a thematic analysis of articles published since 2000 in four ME journals. The four identified themes – curriculum and teaching issues, professionalism, characteristics of medical students and assessment – generally corroborate our findings.


또 다른 bibliometric 연구는 1966년부터 1994년 사이에 ME출판의 성장이 매우 작았음을 보여준다. 그러나 그날 이후 많은 것들이 변화하였고, ME학문이 글로벌화되었다. 6개의 ME저널과 2개의 일반 의학 분야의 저널에서 1997년과 2001년 사이에 국제적인 기여 정도를 비교한 연구에서 의학교육 분야의 저널들이 국제적인 독자층, 저자층, 리뷰어층을 확보하기 위한 노력을 확인하였다. 비슷한 연구가 1995년과 2000년 사이를 대상으로 이뤄졌고, 두 개의 대표적 저널(Acad Med, Med Educ)에서 ME출판에 대한 국가적 생산성을 연구하여, 영어를 쓰는 저자와 네덜란드 저자가 지배적임을 보여주었다.

Another prior bibliometric study showed very little growth in ME publication from 1966 to 1993 (Wartman 1994). However, much has changed since then, including a global- ization of ME scholarship (Pereira 2001; Brice & Bligh 2004). In comparing international contributions to six ME and two and Brice general medical journals between 1997 2001, one identified an effort, especially by journal, Medical to recruit international readers, authors and Education, reviewers. In a similar study covering 1995–2000, Tutarel (2002) investigated the national productivity in ME publica- tions in two leading journals, Academic Medicine and Medical Education. He found that English speaking authors and authors from the Netherlands dominated both journals.



ME분야의 성장이 언제나 지속적이지 않았다는 것을 무시할 수 없다. ME논문의 숫자와 비율 모두가 1980년대에 감소하였다. 한 저자는 이 결과는 대학의학이 분자생물학에 관심을 돌리던 시기라고 지적하는 연구자도 있다. 분자생물학 연구와 대조적으로 - 이 분야는 재정지원이 많았고, 그 가치를 높게 평가받았다 - 1994년 Wartman이 지적한 바와 같이 ME연구에는 재정 지원도 적고 크게 존중받지도 않았다. 그러나 1990년대와 현재까지 사이를 보면 MEDLINE 색인된 저널의 10%이상에서 ME논문을 출판한 바 있으며, 현재의 새로운 ME저널의 발전은 이 분야 학문의 양적, 질적 변화를 보여준다. 그렇다면 왜 거의 재정지원이 없던 이 분야가 갑자기 성장했을까? 향후 연구가 필요하다.

We cannot ignore the fact that the field of ME did not grow steadily. Both the number and the proportion of ME articles relative to all publications fell during the 1980s. One author suggested that this resulted when academic medicine turned its attention to molecular biology (Ludmerer 1999). In contrast to molecular biology research, which was heavily funded and highly valued, as Wartman pointed out in 1994, ME research has been largely unfunded and disrespected. Yet, between 1990 and the present, more than 10% of all journals indexed in MEDLINE published a ME article, and the recent advent of new ME journals suggests quantitative and qualitative changes in scholarship in this field. Why would a largely unfunded field of research suddenly blossom? That question begs further study.


세 개의 ME저널과 두 개의 일반의학 저널의 주된 초점을 비교하여 우리는 각각의 저널이 다른 저널들과 차별화되는 지점을 발견하였다. 이들 자료는 이 분야의 성장에 대한 다른 자료와 함께 편집자, 저자, 리뷰어, 독자에게 주는 함의가 있다.

In comparing three ME journals’ and two generic medical journals’ topic foci, we discovered areas in which each distinguished itself from all others. These data, along with other information on the growth of publication in the field, have implications for editors, authors, reviewers and readers.


첫째, 편집자와 편집진은 저널의 scope을 정하고 그 한계를 뛰어넘을 책임이 있다. 이 scope은 저널의 미션을 반영해야 할 뿐만 아니라, 지나치게 제한적이어서 그 분야의 경계 확장시킬 수 있는 새로운 아이디어와 연구를 한 저자의 투고를 억제할 정도여서는 안된다.

First, editors and their editorial boards share a responsibility for defining and delimiting the scope of a journal. The scope should reflect the journal’s mission, but should not be so restrictive as to inhibit the submission of author-initiated manuscripts that extend the boundaries of a field or present novel and divergent ideas.


둘째로, 저자들은 논문 출판을 할 수 있는 선택지가 넓다는 것을 즐겨야 한다. 독자층을 유심히 고려해야 한다.

Second, authors enjoy a wide choice of venues for publication, allowing them to target their audience carefully.


셋째로, 출판물의 범위를 살펴보면, 투고의 숫자가 더 늘어날 필요가 있음을 보여준다(비록 이들 중 일부는 reject될 것이지만). 개개인의 흥미와 가장 잘 맞는 저널을 살펴볼 기회를 얻음으로써 의학교육자들이 더 배워나갈 수 있다.

Third, the extent of publication suggests an even larger number of submissions (some of which will have been rejected) that provides closely aligned opportunities to review for journals most with one’s interests – an activity that helps medical educators learn. 


마지막으로, 한 프로젝트를 시작할 때 연구자는 ME저널 외에도 더 많은 저널을 살펴볼 필요가 있다.

Last, when initiating a project, investigators should read the literature far beyond the ME journals since a large proportion of authors chose to place their articles in specialty, rather than education, journals.





 


 


 


 





 2013 Jul;35(7):591-8. doi: 10.3109/0142159X.2013.786168. Epub 2013 Apr 22.

50 years of publication in the field of medical education.

Author information

  • 1Department of Population Medicine, Harvard Medical School, Boston, MA 02215, USA.

Abstract

BACKGROUND:

The advent of new medical education (ME) journals makes evident the growth of the field of ME. However, the nature and context of growth is undefined.

AIM:

To analyze the evolution of publication in ME.

METHODS:

MEDLINE retrieval using medical subject headings was used to analyze patterns of ME publications from 1960-2010: changes in number of ME publications; number of journals publishing ME articles; co-topics occurring frequently in ME articles; differences among journals'publication of co-topics.

RESULTS:

Annual publication of ME articles increased from 279 in 1960 to 3760 in 2010. 81,531 articles were published in 4208 different journals. 104 journals published ME articles in 1960, 855 in 2010. Despite an increase in journals in all fields, ME journals now account for a larger proportion of all journals indexed in MEDLINE than in 1960. One-quarter of all ME articles were indexed as internship/residency; 16% as graduate ME; 15% as undergraduate ME; and 14% as continuing ME. The five journals that published the most ME articles distinguished themselves by publishing some topics with greater or less frequency.

CONCLUSIONS:

The increase in the number of ME publications and in the number of journals publishing ME articles suggests a supportive environment for a growing field; but variation in journals' foci has implications for readers, editors and authors.

PMID:
 
23607497
 
[PubMed - indexed for MEDLINE]


 

간호학 연구에서의 질적내용분석 : 개념, 절차, 결과의 신뢰성을 높이기 위한 방법

Qualitative content analysis in nursing research: concepts, procedures and measures to achieve trustworthiness

U.H. Graneheim*, B. Lundman

Department of Nursing, Umea University, Umea 90187, Sweden



Introduction

내용분석은 처음에는 ‘the objective, systematic and quantitative description of the manifest content of communication’으로 시작되었으나 시간이 지남에 따라서 잠재적 내용(latent content)의 분석까지 포함하기 시작했다. 많은 저자들이 내용분석에 대해 다룬 바가 있으며, 1950년대에에는 주로 정량적 측면을 다루고 있었다. 현재로서 두 가지 방법으로 주로 활용되는데 하나는 정량적 접근법이고, 다른 하나는 정성적 접근법이다. 간호학에서의 질적내용분석은 다양한 자료와 다양한 해석의 깊이로 활용되어왔다.

Initially content analysis dealt with ‘the objective, systematic and quantitative description of the manifest content of communication’ (Berelson, 1952, p. 18) but, over time, it has expanded to also include interpretations of latent content. Many authors, from a variety of research traditions, have addressed content analysis (for example, Berelson, 1952; Krippendorff, 1980; Findahl and Höijer, 1981; Woods and Catanzaro, 1988; Downe-Wamboldt, 1992; Burnard, 1991 and Burnard, 1996; Polit and Hungler, 1999). The first descriptions date from the 1950s and are predominately quantitative. Currently, two principal uses of content analysis are evident. One is a quantitative approach often used in, for example, media research, and the other is a qualitative approach often used in, for example, nursing research and education. Qualitative content analysis in nursing research and education has been applied to a variety of data and to various depths of interpretation (for example, O’Brien et al., 1997; Latter et al., 2000; Berg and Welander Hansson, 2000; Söderberg and Lundman, 2001).


질적내용분석의 의미, 개념의 활용, 절차, 해석에 있어서 아직 여러 의견과 풀리지 않은 이슈들이 있다. 이러한 다양성은 다양한 역사적 관점에서 비롯되곤 한다.

A review of literature based on common databases (Cinahl, Medline and Sociological Abstracts) as well as references from articles and books shows different opinions and unsolved issues regarding meaning and use of concepts, procedures and interpretation in qualitative content analysis. The diversities can be understood partly from a historical point of view and partly from various beliefs of the nature of reality among researchers.


이 논문은 '진실은 다양한 방식으로 해석가능하며, 진실을 어떻게 이해하는가는 주관적인 해석에 달려있다'라는 것을 전제로 한다. 질적연구는 담론과 관찰에서 얻은 자료를 바탕으로 하며, 연구자와 참가자의 이해와 협력을 필요로 한다. 왜냐하면 면담이나 관찰에서 얻은 텍스트는 상호적이며, 맥락적이고, 가치의존적이기 때문이다. 따라서 텍스트가 항상 다양한 의미를 가진다는 가정과, 텍스트에는 항상 어느 정도의 해석의 여지가 있다는 것이 우리의 기본 가정이다. 이는 질적내용분석 결과의 신뢰성을 논의할 때에 중요한 부분이다.

An assumption underlying our paper is that reality can be interpreted in various ways and the understanding is dependent on subjective interpretation. Qualitative research, based on data from narratives and observations, requires understanding and co-operation between the researcher and the participants, such that texts based on interviews and observations are mutual, contextual and value bound (Lincoln and Guba, 1985; Mishler, 1986). Thus, our presumption is that a text always involves multiple meanings and there is always some degree of interpretation when approaching a text. This is an essential issue when discussing trustworthiness of findings in qualitative content analysis.


또 다른 이슈는 양적연구의 전통이 여전히 질적내용분석에도 주요하게 작용하고 있다는 점이다. 특히 '신뢰성'을 다루는 개념에 대해서 저자와 독자 사이에 혼란과 불확실성을 야기하는 원인이 된다.

Another issue is that concepts within the quantitative research tradition still predominate when describing qualitative content analysis (for example, Krippendorff, 1980; Burnard, 1991; Downe-Wamboldt, 1992), especially the use of concepts describing trustworthiness. This causes confusion and paradigmatic uncertainty among authors and readers of scientific papers.


이 논문의 목적은 세 가지이다.

The purpose of this paper was threefold: 

first, to provide an overview of concepts of importance related to qualitative content analysis in nursing research; 

second, to illustrate the use of concepts related to the research procedure; and 

third, to address measures to achieve trustworthiness.



전반적 개념 Overview of concepts

우리는 먼저 문헌에서 다양한 개념이 어떤 식으로 활용되는가를 보고, 우리의 입장을 이후에 밝히고자 한다. 

The following provides an overview of concepts related to qualitative content analysis and is to be seen as a contribution to a debate rather than an endeavour to find consensus. First, we present various uses of concepts found in the literature, and then we give reasons for our stance. The concepts are manifest and latent content, unit of analysis, meaning unit, condensing, abstracting, content area, code, category and theme.


질적내용분석을 수행할 때 가장 기본적인 이슈는 manifest content에 집중할 것이냐 latent content에 집중할 것이냐 하는 것이다. manifest content와 latent content 모두 해석과 관련된 것이지만, 그 해석은 깊이나 추상화 정도에 있어서 차이가 있다.

A basic issue when performing qualitative content analysis is to decide whether the analysis should focus on manifest or latent content. 

    • Analysis of what the text says deals with the content aspect and describes the visible, obvious components, referred to as the manifest content ( Downe-Wamboldt, 1992; Kondracki et al., 2002). 
    • In contrast, analysis of what the text talks about deals with the relationship aspect and involves an interpretation of the underlying meaning of the text, referred to as the latent content ( Downe-Wamboldt, 1992; Kondracki et al., 2002). 

Both manifest and latent content deal with interpretation but the interpretations vary in depth and level of abstraction.


내용분석을 할 때 가장 기본적인 결정 중 다른 하나는 '분석의 단위'를 고르는 것이다. 문헌에서 '분석의 단위'란 연구의 대상이 될 수 있는 다양한 것들을 말한다. 어떤 저자들은 분석의 단위를 인터뷰나 일기라고 보기도 하며, 연구 또는 주제에 할당된 '공간'을 보는 사람도 있다. 텍스트의 일부는 추상화되고 코딩되며, 모든 단어와 구문은 transcript로 기록되어 분석의 단위가 될 수 있다. 우리는 가장 적절한 분석의 단위는 '인터뷰 전체' 또는 '관찰 프로토콜'로서 '분석 과정에서 전체라 부르기에 충분하면서, 의미단위라는 맥락으로서 마음에 담아둘 수 있을 만큼 작은 것'이라고 제안하고자 한다.

One of the most basic decisions when using content analysis is selecting the unit of analysis. In the literature, unit of analysis refers to a great variety of objects of study, for example, a person, a program, an organisation, a classroom or a clinic ( Mertens, 1998), or a community, state or nation ( Patton, 1987). Other authors have considered the unit of analysis as interviews or diaries in their entity, and the amount of space allocated to a topic or an interaction under study ( Downe-Wamboldt, 1992). Parts of the text that are abstracted and coded ( Weber, 1990), or every word or phrase written in the transcript ( Feeley and Gottlieb, 1998), have also been considered as units of analysis. We suggest that the most suitable unit of analysis is whole interviews or observational protocols that are large enough to be considered a whole and small enough to be possible to keep in mind as a context for the meaning unit, during the analysis process.


의미단위란, 단어 또는 문구의 무리(constellation)로서, 같은 핵심적 의미로 연관되는 것이며 content unit 또는 coding unit, idea unit, textual unit, a keyword and phrase, unit of analysis, theme 이라 불리기도 한다. 우리는 의미단위를 내용과 맥락을 통해서 다른 것들과 서로 연결될 수 있는 측면을 가지는 단어/문장/문단으로 본다.

A meaning unit, that is, the constellation of words or statements that relate to the same central meaning, has been referred to as a content unit or coding unit ( Baxter, 1991), an idea unit ( Kovach, 1991), a textual unit ( Krippendorff, 1980), a keyword and phrase ( Lichstein and Young, 1996), a unit of analysis ( Downe-Wamboldt, 1992), and a theme ( Polit and Hungler, 1991). We consider a meaning unit as words, sentences or paragraphs containing aspects related to each other through their content and context.


문헌연구에서 텍스트를 짧게 줄이고자 할 때에는 '환원', '추출', '응축' 등의 개념이 필요하다. 우리는 '응축'이라는 단어를 선호하며, 이는 핵심은 유지하면서 내용은 줄이는 것을 의미한다.

In the literature, shortening the text includes the concepts of reduction (Findahl and Höijer, 1981), distillation (Cavanagh, 1997) and condensation (Coffey and Atkinson, 1996). 

    • Reduction refers to decreasing the size, but it indicates nothing about the quality of what remains. 
    • Distillation deals with the abstracted quality of a text, which we see as a further step in the analysis process. 
    • We prefer condensation, as it refers to a process of shortening while still preserving the core.


응축된 텍스트가 추상화되는 단계를 'aggregation' 또는 '상위 제목 아래로 그룹핑'이라고 한다. 우리는 '추상화'라는 단어를 권고하는데 왜냐하면 이 단어는 논리적 상위단계의 해석과 묘사를 강조하기 때문이다.

The process whereby condensed text is abstracted has been called aggregation (Barrosso, 1997) and ‘grouping together under higher order headings’ (Burnard, 1991, p. 462). We suggest abstraction, since it emphasises descriptions and interpretations on a higher logical level. Examples of abstraction include the creations of codes, categories and themes on varying levels.


특정 이슈만을 다루는 텍스트의 일부분을 '도메인' 또는 '개략적 구조', '클러스터', '내용영역' 이라고 한다. 우리는 content area라는 단어를 선호하는데, 이는 해석을 최소화한 내용의 특정 부분을 강조하기 때문이다. content area는 그 문헌의 이론적 가정을 토대로 하고 있는 텍스트의 한 부분, 또는 인터뷰나 관찰가이드 안에서 특정 주제를 다루는 텍스트 부분을 의미한다.

Parts of a text dealing with a specific issue have been referred to as a domain or rough structure (Patton, 1990), a cluster (Barrosso, 1997) and a content area (Baxter, 1991). We prefer content area since it sheds light on a specific explicit area of content identified with little interpretation. A content area can be parts of the text based on theoretical assumptions from the literature, or parts of the text that address a specific topic in an interview or observation guide.


의미단위에 붙이는 라벨을 'code'라고 한다. '코드'의 의미와 활용에 대해서는 일정 정도의 일치를 보인다. 

The label of a meaning unit has been referred to as a code. There seems to be agreement in the literature about the use and the meaning of a code. 

    • According to Coffey and Atkinson (1996, p. 32) ‘codes are tools to think with’ and ‘heuristic devices’ since labelling a condensed meaning unit with a code allows the data to be thought about in new and different ways. 
    • A code can be assigned to, for example, discrete objects, events and other phenomena, and should be understood in relation to the context.

카테고리를 만드는 것은 질적내용분석의 핵심 특징 중 하나이다. 카테고리는 공통성을 가지는 컨텐츠들의 그룹이라고 할 수 있다. Pattron은 카테고리를 내적으로 동질적이고 외적으로 이질적인 것 으로 묘사한 바 있다. Krippendorff는 카테고리는 완결성을 가지면서 상호베타적이어야 한다고 강조했다. 이는 연구목적과 관련된 어떤 자료도 카테고리 부족으로 배제되어서는 안된다는 뜻이다. 더 나아가서 어떤 데이터두 두 개의 카테고리에 포함되거나 하나 이상의 카테고리에 들어갈 수 있으면 안된다. 그러나 인간경험의 복잡성으로 인해서 언제나 상호배타적인 카테고리를 만드는 것이 가능한 것은 아니다. 카테고리는 '무엇?(what?)'이라는 질문에 대답할 수 있어야 하며, 코드 전체에 걸쳐 어떤 thread로서 발견되어야 한다. 카테고리는 내용의 묘사적 수준(descriptive level)을 주로 다루기 때문에, manifest content를 주로 다룬다고 할 수 있다. 카테고리는 종종 다수의 하위카테고리, 하위하위카테고리를 가지기도 한다. 하위카테고리는 분류와 추상화단계를 거쳐서 카테고리를 만들 수 있고, 카테고리가 하위카테고리로 분류될 수도있다.

Creating categories is the core feature of qualitative content analysis. A category is a group of content that shares a commonality ( Krippendorff, 1980). Patton (1987) describes categories as internally homogeneous and externally heterogeneous. Krippendorff (1980) emphasises that categories must be exhaustive and mutually exclusive. This means that no data related to the purpose should be excluded due to lack of a suitable category. Furthermore, no data should fall between two categories or fit into more than one category. However, owing to the intertwined nature of human experiences, it is not always possible to create mutually exclusive categories when a text deals with experiences. A category answers the question ‘What?’ ( Krippendorff, 1980) and can be identified as a thread throughout the codes. As we see it, a category refers mainly to a descriptive level of content and can thus be seen as an expression of the manifest content of the text. A category often includes a number of sub-categories or sub-subcategories at varying levels of abstraction. The sub-categories can be sorted and abstracted into a category or a category can be divided into sub-categories.


'주제'라는 개념은 다양한 의미를 가지며, 주제를 형성하는 것은 여러 카테고리에 깔린 의미들을 연결시키는 방법이기도 하다. Polt와 Hungler는 '주제'를 카테고리내 혹은 여러 카테고리 사이에서 규칙적으로 반복되는 것이라고 정의하였다. Baxter는 '주제'를 여러 도메인에 걸쳐 나타나는 의미의 가닥(thread)이라고 했다. '주제'의 개념은 다른 질적연구방법에서도 드러난다. van Manen은 주제를 '어떻게?'라는 질문에 답을 하는 것이라고 했다. 우리는 '주제'를 의미단위, 코드와 카테고리를 해석적 수준에서 응축하여 만들어낸 기저에 깔린 의미의 가닥이라고 본다. 주제를 텍스트 아래 함축된 latent content의 표현이라고 볼 수도 있다. 모든 데이터가 다양한 의미를 가질 수 있으므로 주제는 반드시 상호베타적일 필요는 없다. 함축된 의미단위, 코드, 카테고리는 하나 이상의 주제에 들어맞을 수 있다. 주제는 하위주제를 통해서 구성될 수도 있고, 주제가 하위주제로 나뉘어질 수도 있다.

The concept of theme has multiple meanings and creating themes is a way to link the underlying meanings together in categories. Polit and Hungler (1999) describe a theme as a recurring regularity developed within categories or cutting across categories. Baxter (1991) defines themes as threads of meaning that recur in domain after domain. The concept of theme is also used in literature in other qualitative methods. van Manen (1990, p. 87) considers a theme to ‘describe an aspect of the structure of experience’ and emphasises that a theme can not be an object or a thing. A theme answers the question ‘How?’ We consider a theme to be a thread of an underlying meaning through, condensed meaning units, codes or categories, on an interpretative level. A theme can be seen as an expression of the latent content of the text. Since all data have multiple meanings ( Krippendorff, 1980; Downe-Wamboldt, 1992), themes are not necessarily mutually exclusive. A condensed meaning unit, a code or a category can fit into more than one theme. A theme can be constructed by sub-themes or divided into sub-themes.



개념들의 사용예시 Illustrations of the use of concepts

In the following we illustrate the use of concepts and analysis procedures for two texts based on interviews and observations respectively. One rationale behind giving two examples is to show various ways to develop themes. The processes of analysis are described and shown in Figure 1, Figure 2 and Figure 3. Even if these descriptions point to a linear process, it is important to bear in mind that the process of analysis involves a back and forth movement between the whole and parts of the text.


Qualitative content analysis of an interview text

The unit of analysis in this example is interview text about experiences of having hypoglycaemia. The context consists of a larger study aimed at describing coping strategies related to the everyday strains of living with diabetes ( Lundman and Norberg, 1993). Twenty adults with Type 1-diabetes, aged 25–59 years, participated in the study. Interviews were performed addressing various aspects of living with Type 1-diabetes. The interview text was sorted into seven content areas: experiences related to the onset of the disease; management of the disease in daily living; experiences related to hypoglycaemia; experiences related to hyperglycaemia; self-monitoring of blood glucose; and ideas about complications and the future. Experiences related to hypoglycaemia were evoked by asking: ‘Please tell me about your experiences of having hypoglycaemia.’


The interviews were read through several times to obtain a sense of the whole. Then the text about the participants’ experiences of having hypoglycaemia was extracted and brought together into one text, which constituted the unit of analysis. The text was divided into meaning units that were condensed. The condensed meaning units were abstracted and labelled with a code. Examples of meaning units, condensed meaning units and codes are shown in Fig. 1. The whole context was considered when condensing and labelling meaning units with codes. The various codes were compared based on differences and similarities and sorted into six sub-categories and three categories, which constitute the manifest content. The tentative categories were discussed by two researchers and revised. What differed between the two researchers was their judgement about what comprised familiar and unfamiliar sensations and actions. A process of reflection and discussion resulted in agreement about how to sort the codes. Finally, the underlying meaning, that is, the latent content, of the categories, was formulated into a theme. Examples of codes, sub-categories, categories and a theme are given in Fig. 2.





Qualitative content analysis of a text based on observations

The unit of analysis in this example is text based on 14 observational notes and six reflective dialogues. The context was a study aiming to illuminate how one woman with dementia and ‘behavioural disturbances’ acted in relation to her care providers, and how the care providers acted in relation to her ( Graneheim et al., 2001). The study was performed at a residential home for people with dementia and so called ‘behavioural disturbances’. The care providers were asked to select a person whose ‘behavioural disturbances’ caused severe difficulties in daily care. Two observers participated on six occasions during morning toilet and breakfast. One observer was familiar to the setting and the participants and represented an insider perspective. The other observer was unfamiliar with these conditions and represented an outsider perspective. The participant observations focused on the interaction going on between the woman with dementia and her care providers. To further illuminate various aspects of the ongoing interaction, a reflective dialogue between the observers and the care providers followed each observation occasion. The observational notes and reflective dialogues were tape-recorded and transcribed verbatim.


The text was read through several times to obtain a sense of the whole. Six observational notes, one from each occasion, were divided into meaning units. Considering the context, the meaning units were condensed into a description close to the text, the manifest content, and, where possible, into an interpretation of the underlying meaning, the latent content. Since parts of the text were much more concentrated than an interview text, further condensation was difficult. The condensed meaning units were seen as a whole and abstracted into sub-themes. Examples of meaning units, condensed meaning units, sub-themes and theme are shown in Fig. 3. Sub-themes were threads of meaning running through the condensed text. The sub-themes were presented to the care providers and revised with consideration to their opinion. The remaining eight observational notes were analysed. A co-researcher read one-third of the observational notes and the thematisation. A process of reflection and discussion resulted in agreement on a set of sub-themes. Lastly, reflection on the sub-themes and a review of literature related to the sub-themes provided phenomena that seemed to serve as relevant headings to unify the sub-themes into themes. To reveal meaning units that rejected interpretations of the observational text the reflective dialogues were analysed and nothing that contradicted the themes could be found.




신뢰성을 높이기 위한 방법 Measures for achieving trustworthiness


Research findings should be as trustworthy as possible and every research study must be evaluated in relation to the procedures used to generate the findings. The use of concepts for describing trustworthiness differs between the qualitative and the quantitative research traditions. Within the tradition of qualitative content analysis, use of concepts related to the quantitative tradition, such as validity, reliability and generalisability, is still common (for example, Downe-Wamboldt, 1992; Olson et al., 1998; Shields and King, 2001). In qualitative research the concepts credibility, dependability and transferability have been used to describe various aspects of trustworthiness (for example, Guba, 1981; Lincoln and Guba, 1985; Patton, 1987; Polit and Hungler, 1999; Berg and Welander Hansson, 2000). However, Long and Johnson (2000, p. 31) propose that validity and reliability have ‘the same essential meaning’ irrespective of research tradition and nothing is gained by changing labels. In our paper, we suggest application of concepts linked to the qualitative tradition when reporting findings of studies using qualitative content analysis. Even though we separate the aspects of trustworthiness, they should be viewed as intertwined and interrelated.


Credibility는 연구의 초점에 대한 것이며, 얼마나 데이터와 분석과정이 목표한 초점을 잘 달성하고 있는가에 대한 자신감이라고 할 수 있다. 처음 연구의 초점이 무엇인지 결정할 때, 컨텍스트를 정할 때, 참가자와 데이터수집법을 정할 때 credibility에 대한 질문을 처음 하게 된다. 다양한 경험을 가진 참가자를 고르는 것은 다양한 관점에서 연구질문을 보게 할 가능성을 높여준다. 피면접자가 성별, 연령 등이 다양하고 관찰자의 관점이 다양하면 연구하고자 하는 현상을 더욱 풍요롭게 해주는 장점이 이삳. 가장 적합한 데이터수집 방법을 선택하고, 적절한 양의 데이터를 얻는 것도 credibility에 중요하다.

Credibility deals with the focus of the research and refers to confidence in how well data and processes of analysis address the intended focus ( Polit and Hungler, 1999). The first question concerning credibility arises when making a decision about the focus of the study, selection of context, participants and approach to gathering data. Choosing participants with various experiences increases the possibility of shedding light on the research question from a variety of aspects ( Patton, 1987; Adler and Adler, 1988). In our illustrations, interviewees’ various genders and ages, and observers with various perspectives, contributed to a richer variation of the phenomena under study. Selecting the most appropriate method for data collection and the amount of data are also important in establishing credibility. The amount of data necessary to answer a research question in a credible way varies depending on the complexity of the phenomena under study and the data quality.


Credibility와 관련하여 또 다른 중요한 이슈는 가장 적절한 '의미단위'를 선택하는 것이다. '의미단위'가 너무 포괄적이라면, 예컨대 문단 수준이라면, 너무 여러가지 의미를 포함하기 때문에 다루기가 어렵다. 너무 의미단위가 좁으면 (한 단어 수준이라면) 결과가 분절화될 수 있다. 이것의 예외적 상황은 하나 또는 여러개의 단어가 심볼이나 메타포를 이룰 때이다. 두 가지 모두 응축과 추상화 단계에서 텍스트의 의미를 상실해버릴 가능성이 있다. 어떻게 의미단위, 응축, 추상화가 되었는지를 설명하는 것이 credibility를 높여준다.

Another critical issue for achieving credibility is to select the most suitable meaning unit. Meaning units that are too broad, for example, several paragraphs, will be difficult to manage since they are likely to contain various meanings. Too narrow meaning units, for example, a single word, may result in fragmentation. An exception to this is when one or several words represent a symbol or metaphor. In both cases there is a risk of losing meaning of the text during the condensation and abstraction process. Illustrating how meaning units, condensations and abstractions are made facilitates judging credibility of the findings (see Figure 1, Figure 2 and Figure 3).


연구의 Credibility는 카테고리와 주제가 얼마나 데이터를 잘 포괄하느냐에 달렸으며, 이는 관련된 데이터가 부주의하여 혹은 시스템적인 결함으로 제외되거나, 무관한 데이터가 포함되면 안된다는 의미이다. Credibility는 어떻게 카테고리간의 차이점과 카테고리내의 유사성을 판단할 것인가에 대한 질문이기도 하다. 이에 대한 한 가지 접근법은 transcribed된 텍스트로부터 대표적인 인용문구를 보여주는 것이고, 다른 방법은 공동연구자와의 일치를 보는 것이다.

Credibility of research findings also deals with how well categories and themes cover data, that is, no relevant data have been inadvertently or systematically excluded or irrelevant data included. Credibility is also a question of how to judge the similarities within and differences between categories. One way to approach this is to show representative quotations from the transcribed text. Another way is to seek agreement among co-researchers, experts and participants.


일치도를 확인하는 것이 적절한가에 대해서는 다양한 의견이 있다. 어떤 연구자는 해석의 주관적인 측면에 의해서 다양한 현실이 존재할 수 있기 때문에 공동연구자간의 validation에 대한 의문을 갖는 사람도 있다. 비록 우리가 현실이 다면적이고 주관적이라고 하더라도 우리는 공동연구자들간의 대화의 가치를 중요시한다. 여기서의 목적은 단순히 라벨되고 분류된 데이터가 같은 방식으로 되었느냐를 확인하는 것이 아니라, 다양한 전문가가 데이터가 라벨되고 분류된 방식에 동의하는가에 대한 것이다. 관찰결과에 대한 참가자의 인식도 credibility 의 한 측면이지만 verification에 대한 것이라기보다는 confirmability에 대한 것이라고 할 수 있다.

There are various opinions about the appropriateness of seeking agreement. Sandelowski, 1993 and Sandelowski, 1998 argues that, since multiple realities exist that are dependent on subjective interpretations, validation among co-researchers, experts and participants is questionable. Even though we agree that reality is multiple and subjective, we defend the value of dialogue among co-researchers. The intent here is not merely to verify that data are labelled and sorted in exactly the same way, but to determine whether or not various researchers and experts would agree with the way those data were labelled and sorted (Woods and Catanzaro, 1988). Participants’ recognition of the findings can also be an aspect of credibility. It is not, however, a question of verification but rather a question of confirmability.


신뢰성의 다른 측면은 dependability이다. dependability는 분석과정에 걸쳐서 시간에 따라 데이터가 변하는 정도, 또는 연구자의 결정이 바뀌는 것을 의미한다.

Another aspect of trustworthiness is dependability. According to Lincoln and Guba (1985, p. 299), dependability ‘seeks means for taking into account both factors of instability and factors of phenomenal or design induced changes’, that is, the degree to which data change over time and alterations made in the researcher’s decisions during the analysis process.


데이터가 방대하고 아주 오랜 기간에 걸쳐서 수집되었다면, 데이터 수집과정에서 일관성을 상실할 가능성이 있다. 한편 모든 참가자에 대해서 같은 영역에 대한 질문을 하는 것이 중요하다. 그러나 면접과 관찰은 면접자와 관찰자가 연구를 진행하는 동안 현상에 대한 새로운 통찰력을 얻는 과정에서 진화할 수 있고, 이것 때문에 이후 면담이나 관찰에 영향을 줄 수 있다. 내용의 유사성과 차이점에 대한 판단이 긴 시간에 걸쳐서 얼마나 일관적인지는 연구팀 내에서 개방적 대화를 통해 확인될 수 있다.

When data are extensive and the collection extends over time, there is a risk of inconsistency during data collection. On one hand, it is important to question the same areas for all the participants. On the other hand, interviewing and observing is an evolving process during which interviewers and observers acquire new insights into the phenomenon of study that can subsequently influence follow-up questions or narrow the focus for observation. The extent to which judgements about similarities and differences of content are consistent over time can, as in our illustrations, be addressed by an open dialogue within the research team.


또한 transferability에 대한 질문도 있다. 이는 관찰결과가 다른 세팅이나 다른 그룹에 적용가능한 정도를 말한다. 저자는 transferability에 대한 의견을 기술할 수 있지만, 이는 독자의 판단에 따라 달라지기도 한다.

Trustworthiness also includes the question of transferability, which refers to ‘the extent to which the findings can be transferred to other settings or groups’ ( Polit and Hungler, 1999, p. 717). The authors can give suggestions about transferability, but it is the reader’s decision whether or not the findings are transferable to another context.


transferability를 향상시키기 위해서는 문화와 맥락, 참가자의 선택과정과 특성, 데이터수집과 분석과정을 분명하게 기술하는 것이 중요하다. 관찰결과를 풍요로우면서도 철저하게 제시하는 것도 중요하다.

To facilitate transferability, it is valuable to give a clear and distinct description of culture and context, selection and characteristics of participants, data collection and process of analysis. A rich and vigorous presentation of the findings together with appropriate quotations will also enhance transferability.


관찰결과에 대해서 단 하나의 옳은 의미 또는 모든 상황에 적용가능한 것은 없다. 특정 관점에서 가장 그럴듯한 의미가 있을 뿐이다. 질적연구에서 해석의 신뢰성은 가장 그럴듯한 해석에 대한 근거를 수립하는 것에 대한 것이라고 할 수 있다. 독자가 또 다른 해석방법을 찾아내도록 하는 방식으로 관찰결과가 제시된다면 신뢰성이 더욱 높아질 것이다.

There is no single correct meaning or universal application of research findings, but only the most probable meaning from a particular perspective. In qualitative research, trustworthiness of interpretations deals with establishing arguments for the most probable interpretations. Trustworthiness will increase if the findings are presented in a way that allows the reader to look for alternative interpretations.


Reflections

어떤 연구방법이 너무 부정확하여 다른 연구분야에 잘 들어맞는다면, 방법론적 접근과 자료는 단순히 도구로 보일 수도 있다. 반면, 질적내용분석은 구체적인 특징이 있고, 그 아래 깔린 가정이 있다.

When discussing meaning and use of concepts, procedures and interpretation related to qualitative content analysis, it is valuable to consider whether qualitative content analysis is a separate method or tool used within different forms of qualitative analysis. On one hand, a method that is so inexact that it fits into different research fields, methodological approaches and data can be seen as merely a tool. On the other hand, it can be assumed that qualitative content analysis has specific characteristics and underlying theoretical assumptions which need to be further illuminated.


질적내용분석의 한 특징은 이 방법이 주제와 맥락에 초점을 맞추면서 코드와 카테고리 내의 차이와 유사성을 강조한다는 것이다. 또 다른 특징은 manifest content와 latent content를 모두 다룬다는 것이다. 

One characteristic of qualitative content analysis is that the method, to a great extent, focuses on the subject and context, and emphasises differences between and similarities within codes and categories. Another characteristic is that the method deals with manifest as well as latent content in a text. The manifest content, that is, what the text says, is often presented in categories, while themes are seen as expressions of the latent content, that is, what the text is talking about.


질적내용분석에 깔려 있는 이론적 가정을 이해는 한 가지 방법은 이 연구방법을 의사소통이론과 연관시키는 것이다. 인간의 의사소통을 바탕으로 해석에 대한 이슈를 제기한 바 있는데,

    • 한 가지 axiom은 '혼자서 의사소통한다는 것은 불가능하다'이다. 인터뷰와 관찰에 기반한 텍스트는 연구자와 참가자의 상호작용속에서 만들어지며, 이것은 의사소통의 하나이다. 모든 텍스트에는 해석의 여지가 있는 메시지가 잇다. 분석과정이 시작되는 순간 연구자와 텍스트 사이의 끊임없는 의사소통이 시작되는 것이다. 
    • 또 다른 axiom은 '모든 의사소통은 내용적 측면과 관계적 측면이 있어서, 관계적 측면이 내용적 측면을 분류하게 되고, 따라서 관계적 측면은 일종의 meta-communication이다' 이다. 우리가 설명한 것을 대입시켜보면 카테고리는 manifest content를 나타내는 것으로 내용적 측면이라 할 수 있고, 주제는 latent content를 나타내는 것으로 관계적 측면이라 할 수 있다.

One way to understand the theoretical assumptions underlying qualitative content analysis is to relate the method to communication theory as described by Watzlawick et al. (1967). They state axioms concerning human communication that could shed light on the issue of interpretation. One axiom is that ‘one cannot not communicate’ (Watzlawick et al., 1967, p. 51). Texts based on interviews and observations are shaped within an interaction between the researcher and the participants and can be seen as a communication act. In every text there are messages to be interpreted and described. As soon as the analysis procedure begins, ongoing communication between the researcher and the text is present. Another axiom is that ‘every communication has a content aspect and a relationship aspect such that the latter classifies the former and is therefore a meta-communication’ (Watzlawick et al., 1967, p. 54). In our illustrations, categories are seen as representing the manifest content, that is, the content aspect, and themes are representing the latent content, which can be seen as the relationship aspect.


    • 또 다른 axiom은 '인간은 디지털과 아날로그 방식 둘 다를 활용하여 의사소통한다'이다. 언어적 의사소통은 주로 디지털적인 측면이 강하며, 쉽게 텍스트로 transcribe될 수 있다. 그러나 비언어적 의사소통은 주로 아날로그적(analogical)이며, transcription process를 어렵게 만든다. 하지만 의미는 메시지가 전달되는 방식에 의해서 생성되며, 여기에는 음성뿐만 아니라 거기에 포함된 감정도 들어간다. 따라서 인터뷰와 관찰을 텍스트로 옮길 때에는 침묵/한숨/웃음/자세/제스쳐 등을 같이 넣는 것이 좋다. 
    • 마지막 axiom은 '관계의 성격은 의사소통을 하는 사람들간의 구두점(punctuation)에 달려있다'로서 텍스트를 의미단위로 나누는 것은 끊임없이 이어지는 의사소통을 구분(punctuating)하는 것이고, 의미단위를 시작할 때와 끝낼 때 모두에 manifest content와 latent content가 중요하다. 

‘Human beings communicate both digitally and analogically’ is another axiom of Watzlawick et al. (1967, p. 66). Verbal communication is mainly digital and easily transcribed into a text while non-verbal communication is mainly analogical and often put at a disadvantage in the transcription process. However, meaning is partly created by how a message is communicated, that is, the voice or implied feeling that emerges from the reading of the text (Downe-Wamboldt, 1992). Therefore, when transcribing interviews and observations into text, it is valuable to notice silence, sighs, laughter, posture, gestures etc., as these may influence the underlying meaning. Watzlawick et al. (1967, p. 59) have also formulated the axiom that ‘the nature of a relationship is contingent upon the punctuation of the communicational sequences between the communicants’. Dividing the text into meaning units is a way of punctuating the ongoing communication in a text and is important for both manifest and latent content when beginning and ending a meaning unit.


해석의 또 다른 측면은 텍스트는 언제나 다양한 의미를 가지며, 연구자의 해석은 본인이 어떠한 경험을 했느냐에 달려있다는 것이다. 연구자는 보통 데이터를 수집하는 사람일수도 있고, 분석하는 사람일수도 있기 때문에 연구자의 자질,훈련,경험 등이 중요하다. 질적내용분석에서는 균형을 잡는 것이 중요한데, 한편으로는 연구자가 특정한 관점을 발휘하지 못하게 하는 것이 불가능하거나 바람직하지 못할 수도 있지만 다른 한편으로는 존재하지 않는 의미를 주입하지 않고 '텍스트가 스스로 말하도록(let the text talk)' 해야 한다.

Another aspect of interpretation is that a text always involves multiple meanings and the researcher’s interpretation is influenced by his or her personal history. Since the researcher is often the one who collects the data as well as the one who performs the analysis, the question of the researcher’s qualifications, training and experiences is important (Patton, 1990). In qualitative content analysis interpretation involves a balancing act. On one hand, it is impossible and undesirable for the researcher not to add a particular perspective to the phenomena under study. On the other hand, the researcher must ‘let the text talk’ and not impute meaning that is not there.



Learning and teaching how to analyse texts is a delicate matter in nursing education. Qualitative content analysis can be a valuable method for students when attending a research class for the first time due to the opportunity to perform the analysis at various degrees of difficulty. Analysing content close to the text, that is, the manifest content, can be a suitable starting point. With increasing knowledge and ability students may advance to interpret the underlying meaning, that is, the latent content, on various levels of abstraction.


In conclusion, our paper is intended to be used in nursing research and education and to contribute to a debate on qualitative content analysis. In order to clarify the underlying assumptions of qualitative content analysis, we suggest using concepts related to qualitative research when describing the research procedure and measures to achieve trustworthiness. Moreover, we apply communication theory as a way to address the issue of interpretation and clarify the underlying assumptions of qualitative content analysis.








 2004 Feb;24(2):105-12.

Qualitative content analysis in nursing research: concepts, procedures and measures to achieve trustworthiness.

Abstract

Qualitative content analysis as described in published literature shows conflicting opinions and unsolved issues regarding meaning and use of concepts, procedures and interpretation. This paper provides an overview of important concepts (manifest and latent content, unit of analysis, meaning unit, condensation, abstraction, content area, code, category and theme) related to qualitative content analysis; illustrates the use of concepts related to the research procedure; and proposes measures to achieve trustworthiness (credibility, dependability and transferability) throughout the steps of the research procedure. Interpretation in qualitative content analysis is discussed in light of Watzlawick et al.'s [Pragmatics of Human Communication. A Study of Interactional Patterns, Pathologies and Paradoxes. W.W. Norton & Company, New York, London] theory of communication.

PMID:

 

14769454

 

[PubMed - indexed for MEDLINE]


내용분석의 개괄

An Overview of Content Analysis

Steve Stemler

Yale University



내용분석은 코딩규칙을 바탕으로 텍스트의 많은 단어를 적은 수의 카테고리로 줄이는 체계적, 재현가능한 테크닉이다. Holsti는 내용분석을 "any technique for making inferences by objectively and systematically identifying specified characteristics of messages"라고 정의하였다. Holsti의 정의에 따르면, 내용분석에 사용되는 테크닉은 텍스트분석 뿐만 아니라 그림, 비디오녹화된 행동 등에도 적용가능하다. 그러나 재현가능성을 위해서는 자연상태에서 'durable'한 데이터를 활용해야 한다.

Content analysis has been defined as a systematic, replicable technique for compressing many words of text into fewer content categories based on explicit rules of coding (Berelson, 1952; GAO, 1996; Krippendorff, 1980; and Weber, 1990). Holsti (1969) offers a broad definition of content analysis as, "any technique for making inferences by objectively and systematically identifying specified characteristics of messages" (p. 14). Under Holsti뭩 definition, the technique of content analysis is not restricted to the domain of textual analysis, but may be applied to other areas such as coding student drawings (Wheelock, Haney, & Bebell, 2000), or coding of actions observed in videotaped studies (Stigler, Gonzales, Kawanaka, Knoll, & Serrano, 1999). In order to allow for replication, however, the technique can only be applied to data that are durable in nature.


내용분석을 통해서 많은 양의 자료를 체계적인 형태로 꼼꼼하게 추릴 수 있다. 개인/단체/기관 등이 어디에 초점을 두고 있는지 찾아내어 묘사하기에 유요한 방법이다. 또한 다른 자료수집방법을 통해서 확증될 수 있는 추론을 할 수도 있다. Krippendorff는 "내용분석연구 중 많은 수가 다른 테크닉을 활용하기에는 너무 비용이많이 들거나, 더 이상 불가능하거나, 지나치게 두드러지는(obtrusive) 상징성 데이터로부터의 추론을 위해서 사용되어왔다" 라고 한다.

Content analysis enables researchers to sift through large volumes of data with relative ease in a systematic fashion (GAO, 1996). It can be a useful technique for allowing us to discover and describe the focus of individual, group, institutional, or social attention (Weber, 1990). It also allows inferences to be made which can then be corroborated using other methods of data collection. Krippendorff (1980) notes that "[m]uch content analysis research is motivated by the search for techniques to infer from symbolic data what would be either too costly, no longer possible, or too obtrusive by the use of other techniques" (p. 51).



내용분석의 적용 Practical Applications of Content Analysis


내용분석은 authorship을 결정하기 위해서 효과적인 방법이다. 예를 들어서, authorship을 결정하는 한 가지 방법은 잠정적인 author의 리스트를 만들고, 그들의 이전 저작물을 분석하고, 각 author가 관심자료를 작성했을 가능성을 추측하기 위하여 명사와 기능어의 빈도와의 상관관계를 구하는 것이다. Mosteller와 Wallace는 단어빈도에 기반한 Bayesian technique를 활용하여 Madison이 Federalist papers의 저자임을 밝혀낸 바 있다. Forster는 1992년에 쓰인 Primary Colors라는 저자가 알려지지 않은 책의 정체를 밝히기 위해서 더 총체적(holistic)인 접근법을 사용한 바 있다.

Content analysis can be a powerful tool for determining authorship. For instance, one technique for determining authorship is to compile a list of suspected authors, examine their prior writings, and correlate the frequency of nouns or function words to help build a case for the probability of each person's authorship of the data of interest. Mosteller and Wallace (1964) used Bayesian techniques based on word frequency to show that Madison was indeed the author of the Federalist papers; recently, Foster (1996) used a more holistic approach in order to determine the identity of the anonymous author of the 1992 book Primary Colors.


내용분석은 문서의 트렌드와 패턴을 파악하기 위한 용도로도 유용하다. Stemler와 Bebell은 학교의 mission statement에 대한 분석을 수행하였는데, 이를 통해 학교들이 어떤 존재이유를 표방하는지에 대한 추론을 하였다. 주요 연구질문 중 하나는, 교육과정(program)효과성을 측정하기 위한 준거들이 전체적인 교육과정목표 또는 학교의 존재이유와 잘 연계되어있는지(aligned)에 대한 것이었다.

Content analysis is also useful for examining trends and patterns in documents. For example, Stemler and Bebell (1998) conducted a content analysis of school mission statements to make some inferences about what schools hold as their primary reasons for existence. One of the major research questions was whether the criteria being used to measure program effectiveness (e.g., academic test scores) were aligned with the overall program objectives or reason for existence.


추가적으로, 내용분석은 대중의 의견이 어떻게 변하는가를 보는 목적으로도 활용가능하다. 1990년대 후반의 Mission statement로부터 얻어낸 데이터는 미래의 어떤 시점에서 수집된 자료와 객관적으로 비교할 수 있다.

Additionally, content analysis provides an empirical basis for monitoring shifts in public opinion. Data collected from the mission statements project in the late 1990s can be objectively compared to data collected at some point in the future to determine if policy changes related to standards-based reform have manifested themselves in school mission statements.


내용분석의 시행 Conducting a Content Analysis


Krippendorff에 따르면 다음의 여섯 가지 질문을 던져야 한다.

According to Krippendorff (1980), six questions must be addressed in every content analysis:


1) Which data are analyzed? : 어떤 자료를 분석하는가?

2) How are they defined? : 자료는 어떻게 정의되었는가?

3) What is the population from which they are drawn? : 어떤 모집단으로부터 수집되었는가?

4) What is the context relative to which the data are analyzed? : 분석하려는 자료와 관계된 맥락은?

5) What are the boundaries of the analysis? : 분석의 경계는?

6) What is the target of the inferences? : 추론의 대상은?


내용분석을 위한 문서를 수집할 때 최소한 세 가지의 문제가 생길 수 있다. 첫 번째로 모집단에서 다수의 문헌이 포함되지 않았다면, 그 내용분석은 버려져야 한다. 두 번째로, 부적절한 기록 역시 버려져야 한다. 그러나 다른 이유로 기록을 보존할 수도 있다. 마지막으로, 일부 문헌들은 분석에 필요한 요구조건을 다 만족시켰더라도 코딩이 불가능할 수 있다.

At least three problems can occur when documents are being assembled for content analysis. First, when a substantial number of documents from the population are missing, the content analysis must be abandoned. Second, inappropriate records (e.g., ones that do not match the definition of the document required for analysis) should be discarded, but a record should be kept of the reasons. Finally, some documents might match the requirements for analysis but just be uncodable because they contain missing passages or ambiguous content (GAO, 1996).



자료분석 Analyzing the Data


질적연구에 대한 가장 흔한 생각 중 하나는, 내용분석이 단순히 단어의 빈도를 세는 것이라는 생각이다. 가장 많이 언급된 단어가 가장 중요한 단어라는 가정을 가지기 때문인데, 일부 경우에서는 사실일 수도 있지만 그렇지 않을 수도 있다.

Perhaps the most common notion in qualitative research is that a content analysis simply means doing a word-frequency count. The assumption made is that the words that are mentioned most often are the words that reflect the greatest concerns. While this may be true in some cases, there are several counterpoints to consider when using simple word frequency counts to make inferences about matters of importance.


또 다른 고려사항은 동의어가 문서 전체에 걸쳐 어떤 스타일적 이유로 반복되어 사용될 수 있어서, '개념'의 중요성을 과소평가할 수도 있다. 그러나 각 단어가 그 단어가 속해있는 카테고리를 동일하게 대변하지 않는다는 것을 염두에 두어야 한다. 불행하게도, 가중치를 주는 것에 대해 정해진 절차는 없으며, 단어의 수를 셀 때는 이런 점을 염두에 두어야 한다. 더 나아가 Weber는 "이슈를 제기하고자 할 때, 모든 이슈가 거론하기 쉬운 것은 아니다. 정당이 정치적 이슈를 제기하기는 쉽지만 역사나 미국 원주민의 문제를 제기하기는 어렵다. 마지막으로 단어 숫자를 셀 때에 일부 단어는 다양한 의미를 가질 수 있음을 고려해야 한다.

One thing to consider is that synonyms may be used for stylistic reasons throughout a document and thus may lead the researchers to underestimate the importance of a concept (Weber, 1990). Also bear in mind that each word may not represent a category equally well. Unfortunately, there are no well-developed weighting procedures, so for now, using word counts requires the researcher to be aware of this limitation. Furthermore, Weber reminds us that, "not all issues are equally difficult to raise. In contemporary America it may well be easier for political parties to address economic issues such as trade and deficits than the history and current plight of Native American living precariously on reservations" (1990, p. 73). Finally, in performing word frequency counts, one should bear in mind that some words may have multiple meanings. For instance the word "state" could mean a political body, a situation, or a verb meaning "to speak."


단어의 빈도를 셀 때 유용한 방법 중 하나는, 관심이 있는 단어의 빈도를 세고 KWIC검색을 통해서 그 단어의 용법이 일관된지 확인하는 것이다. 대부분의 질적연구소프트웨어는 특정 단어가 사용된 문장만 끌어올 수 있다. 이런 과정이 추론의 타당도를 더욱 강화시켜줄 것이다. 어떤 소프트웨어는 인공지능을 활용하여 맥락에 근거하여 단어가 동일하게 사용된 문장을 구분할 수 있다. 

A good rule of thumb to follow in the analysis is to use word frequency counts to identify words of potential interest, and then to use a Key Word In Context (KWIC) search to test for the consistency of usage of words. Most qualitative research software (e.g., NUD*IST, HyperRESEARCH) allows the researcher to pull up the sentence in which that word was used so that he or she can see the word in some context. This procedure will help to strengthen the validity of the inferences that are being made from the data. Certain software packages (e.g., the revised General Inquirer) are able to incorporate artificial intelligence systems that can differentiate between the same word used with two different meanings based on context (Rosenberg, Schnurr, & Oxman, 1990). There are a number of different software packages available that will help to facilitate content analyses (see further information at the end of this paper).


내용분석은 단순한 단어 빈도를 세는 것 이상이다. 이 기술을 풍요롭게 의미있게 만드는 것은 데이터에 코딩과 카테고리화를 의존한다는 것이다. 카테고리에 대한 기본은 다음을 보면 좋다. "카테고리는 유사한 함의를 가진 단어의 그룹이다". "카테고리는 상호배타적이면서 완결성(exhaustive)이 있어야 한다" 상호배타적인 카테고리는 두 데이터 포인트 사이에 어떤 unit도 포함되지 않는 다는 것을 의미하며, 각 유닛은 단 하나의 데이터포인트에 의해서 대표된다. 완결적 카테고리는 예외를 두지 않고 모든 기록물에 나와있는 언어를 다 포괄해야 한다.

Content analysis extends far beyond simple word counts, however. What makes the technique particularly rich and meaningful is its reliance on coding and categorizing of the data. The basics of categorizing can be summed up in these quotes: "A category is a group of words with similar meaning or connotations" (Weber, 1990, p. 37). "Categories must be mutually exclusive and exhaustive" (GAO, 1996, p. 20). Mutually exclusive categories exist when no unit falls between two data points, and each unit is represented by only one data point. The requirement of exhaustive categories is met when the data language represents all recording units without exception.


Emergent vs. a priori coding

자료를 코딩하는 두 가지 방법이 있다. Emergent coding은 자료의 예비조사를 통해서 카테고리를 형성한 이후에 코딩하는 것이다. 그 단계는 다음과 같다.

There are two approaches to coding data that operate with slightly different rules. With emergent coding, categories are established following some preliminary examination of the data. The steps to follow are outlined in Haney, Russell, Gulek, & Fierros (1998) and will be summarized here. 

      1. First, two people independently review the material and come up with a set of features that form a checklist. 
      2. Second, the researchers compare notes and reconcile any differences that show up on their initial checklists. 
      3. Third, the researchers use a consolidated checklist to independently apply coding. 
      4. Fourth, the researchers check the reliability of the coding (a 95% agreement is suggested; .8 for Cohen's kappa). If the level of reliability is not acceptable, then the researchers repeat the previous steps. Once the reliability has been established, the coding is applied on a large-scale basis. 
      5. The final stage is a periodic quality control check.

a priori coding을 할 때는 분석에 앞서서 이론에 따라 카테고리를 만들게 된다. 전문가집단이 카테고리에 합의를 이루면 자료의 코딩을 하게 되고, 필요에 따라 상호베타성과 완결성을 최대화하기 위해서 교정을 할 수 있다.

When dealing with a priori coding, the categories are established prior to the analysis based upon some theory. Professional colleagues agree on the categories, and the coding is applied to the data. Revisions are made as necessary, and the categories are tightened up to the point that maximizes mutual exclusivity and exhaustiveness (Weber, 1990).


Coding units

코딩유닛을 정의하는 몇 가지 방법이 있다. (물리적/구문론적/참조적/명제적)

There are several different ways of defining coding units. 

      • The first way is to define them physically in terms of their natural or intuitive borders. 
        • For instance, newspaper articles, letters, or poems all have natural boundaries. 
      • The second way to define the recording units syntactically, that is, to use the separations created by the author
        • such as words, sentences, or paragraphs. 
      • A third way to define them is to use referential units. Referential units refer to the way a unit is represented. 
        • For example a paper might refer to George W. Bush as "President Bush," "the 43rd president of the United States," or "W." Referential units are useful when we are interested in making inferences about attitudes, values, or preferences. 
      • A fourth method of defining coding units is by using propositional units. Propositional units are perhaps the most complex method of defining coding units because they work by breaking down the text in order to examine underlying assumptions. 
        • For example, in a sentence that would read, "Investors took another hit as the stock market continued its descent," we would break it down to: The stock market has been performing poorly recently/Investors have been losing money (Krippendorff, 1980).


일반적으로 세 종류의 유닛이 활용된다. 표본수집단위, 맥락단위, 기록단위가 그것이다.

Typically, three kinds of units are employed in content analysis: sampling units, context units, and recording units.


      • Sampling units will vary depending on how the researcher makes meaning; they could be words, sentences, or paragraphs. In the mission statements project, the sampling unit was the mission statement.
        • Mission statement분석에서 표본수집단위는 Mission statement이다.
      • Context units neither need be independent or separately describable. They may overlap and contain many recording units. Context units do, however, set physical limits on what kind of data you are trying to record. In the mission statements project, the context units are sentences. This was an arbitrary decision, and the context unit could just as easily have been paragraphs or entire statements of purpose. 
        • Mission statement연구에서 맥락단위는 문장이다. 이것은 연구자가 임의로 내린 결정이었으며, 목적에 따라 맥락단위는 문단 또는 전체 mission statement가 될 수도 있다.
      • Recording units, by contrast, are rarely defined in terms of physical boundaries. In the mission statements project, the recording unit was the idea(s) regarding the purpose of school found in the mission statements (e.g., develop responsible citizens or promote student self-worth). Thus a sentence that reads "The mission of Jason Lee school is to enhance students' social skills, develop responsible citizens, and foster emotional growth" could be coded in three separate recording units, with each idea belonging to only one category (Krippendorff, 1980).
        • 기록단위는 물리적 경계에 의해서 결정되는 경우가 거의 없다. Mission statement에서 기록단위는 각 학교가 MS에서 나타내는 목표이다. A학교의 목적은 학생들로 하여금 1, 2, 3을 배양하는 것이다. 라고 했다면 기록단위는 1, 2, 3의 세 가지가 된다. 


Reliability

웨버는 "텍스트로부터 추론을 하기 위해서는 분류 작업이 일관되어야 한다. 서로 다른 사람들이 같은 텍스트를 같은 방법으로 코딩해야 한다"라고 말했다. 또한 "신뢰도의 문제는 단어의 의미/카테고리의 정의/코딩규칙 등이 불분명할 때 생긴다" 라고 하였다. 따라서 코딩스킴을 개발한 사람이 그 코딩의 숨겨진 의미를 공유하는 것이 중요하다. 보고되는 신뢰도계수가 과장되는 경우가 많다는 보고가 있는데, 이를 피해기 위해서 가장 중요한 단계는 확실한 기록지침을 마련하는 것이다. 이러한 지침은 외부의 코딩자가 충분한 신뢰도를 확보할 수 있을 때까지 훈련이 가능하게 해준다.

Weber (1990) notes: "To make valid inferences from the text, it is important that the classification procedure be reliable in the sense of being consistent: Different people should code the same text in the same way" (p. 12). As Weber further notes, "reliability problems usually grow out of the ambiguity of word meanings, category definitions, or other coding rules" (p. 15). Yet, it is important to recognize that the people who have developed the coding scheme have often been working so closely on the project that they have established shared and hidden meanings of the coding. The obvious result is that the reliability coefficient they report is artificially inflated (Krippendorff, 1980). In order to avoid this, one of the most critical steps in content analysis involves developing a set of explicit recording instructions. These instructions then allow outside coders to be trained until reliability requirements are met.


신뢰도는 다음과 같은 맥락에서 논의될 수 있다.

Reliability may be discussed in the following terms:

    • Stability, or intra-rater reliability. Can the same coder get the same results try after try?
    • Reproducibility, or inter-rater reliability. Do coding schemes lead to the same text being coded in the same category by different people?

신뢰도를 측정하는 한 가지 방법은 평가자들간의 일치도를 확인하는 것이다. 이는 일치한 사례를 전체 사례로 나누는 단순한 방법도 가능하지만, 이러한 식의 접근은 '우연해 의해서 일치한 정도'를 고려하지 못한다는 한계가 있다. 이러한 한계를 극복하기 위해서 신뢰도는 Cohen's Kappa를 사용하여 계산하는 것이 좋으며, 1은 완벽한 신뢰성을, 0은 모든 일치된 경우가 우연에 의한 것임을 의미한다.

One way to measure reliability is to measure the percent of agreement between raters. This involves simply adding up the number of cases that were coded the same way by the two raters and dividing by the total number of cases. The problem with a percent agreement approach, however, is that it does not account for the fact that raters are expected to agree with each other a certain percentage of the time simply based on chance (Cohen, 1960). In order to combat this shortfall, reliability may be calculated by using Cohen's Kappa, which approaches 1 as coding is perfectly reliable and goes to 0 when there is no agreement other than what would be expected by chance (Haney et al., 1998). Kappa is computed as:




실제로 이 값은 우연에 의한 일치를 배제한 후, 평가자간의 일치한 비율을 해석하는데 사용될 수 있다. Crocker&Algina는 Kappa가 0이라는 것은 일치한 수준이 우연에 의한 일치 그 이상도 아니라는 것을 의미하며, Kappa가 0보다 작다는 것은 일치한 결과가 우연에 의한 일치에도 못 미친다는 것을 의미한다. Kvalseth는 Kappa가 0.61이상이면 충분히 괜찮은 일치도라고 말했다. 

In practice, this value may be interpreted as the proportion of agreement between raters after accounting for chance (Cohen, 1960). Crocker & Algina (1986) point out that a value of κ = 0 does not mean that the coding decisions are so inconsistent as to be worthless, rather, κ = 0 may be interpreted to mean that the decisions are no more consistent than we would expect based on chance, and a negative value of kappa reveals that the observed agreement is worse than expected on the basis of chance alone. "In his methodological note on kappa in Psychological Reports, Kvalseth (1989) suggests that a kappa coefficient of 0.61 represents reasonably good overall agreement." (Wheelock et al., 2000). In addition, Landis & Koch (1977, p.165) have suggested the following benchmarks for interpreting kappa:





Cohen은 이 방법을 사용하기 위해서는 세 가지 가정이 충족되어야 한다고 말했다.

Cohen (1960) notes that there are three assumptions to attend to in using this measure. 

      • First, the units of analysis must be independent. 분석의 단위들이 독립적이어야 한다.
        • For example, each mission statement that was coded was independent of all others. This assumption would be violated if in attempting to look at school mission statements, the same district level mission statement was coded for two different schools within the same district in the sample.
      • Second, the categories of the nominal scale must be independent, mutually exclusive, and exhaustive. 카테고리가 독립적이고, 상호배타적이며, 완결성을 지녀야 한다.
        • Suppose the goal of an analysis was to code the kinds of courses offered at a particular school. Now suppose that a coding scheme was devised that had five classification groups: mathematics, science, literature, biology, and calculus. The categories on the scale would no longer be independent or mutually exclusive because whenever a biology course is encountered it also would be coded as a science course. Similarly, a calculus would always be coded into two categories as well, calculus and mathematics. Finally, the five categories listed are not mutually exhaustive of all of the different types of courses that are likely to be offered at a school. For example, a foreign language course could not be adequately described by any of the five categories.
      • The third assumption when using kappa is that the raters are operating independently. 평가자들이 독립적으로 평가를 해야 한다.
        • In other words, two raters should not be working together to come to a consensus about what rating they will give.


Validity

연구방법론은 연구질문에 따라서 선택되어져야 한다. 따라서 한 분석적 접근법에 기반하여 어떤 자료를 분석한 결과가 타당한가에 대해서 논할 때는 여러 정보를 함께 사용해야 한다. 이것이 가능하지 않다면 연구자는 타당성을 검증할 수 있는 방법을 연구에 같이 설계해야 한다. 질적연구에서 타당성 검증은 '삼각측량'의 형태로 이뤄진다. 삼각측량은 다양한 자료원, 방법, 연구자, 이론을 통해서 관찰결과에 타당성을 부여한다. 

It is important to recognize that a methodology is always employed in the service of a research question. As such, validation of the inferences made on the basis of data from one analytic approach demands the use of multiple sources of information. If at all possible, the researcher should try to have some sort of validation study built into the design. In qualitative research, validation takes the form of triangulation. Triangulation lends credibility to the findings by incorporating multiple sources of data, methods, investigators, or theories (Erlandson, Harris, Skipper, & Allen, 1993).


예컨대, 이 Mission statement 연구에서 연구질문은 각 기관의 관점에서 학교의 목적을 밝히려는 것이었다. 내용분석을 통한 결과를 cross-validate (교차검증)하기 위해서 교장과 의사결정자를 인터뷰하여 mission statement에서 중점을 두는 가치를 이후 선생님을 추가로 고용할 때 얼마나 중요시하는가를 물어볼 수 있다. 또 다른 방법은 학생들과 교사들을 대상으로 mission statement에 대한 설문조사를 하여, 학교의 목표에 대한 인지도를 확인해볼 수 있다. 세 번째 옵션은 Mission statement에서 언급된 이상향들이 실제 교실 현장에 반영되는지 확인할 필요가 있다.

For example, in the mission statements project, the research question was aimed at discovering the purpose of school from the perspective of the institution. In order to cross-validate the findings from a content analysis, schoolmasters and those making hiring decisions could be interviewed about the emphasis placed upon the school's mission statement when hiring prospective teachers to get a sense of the extent to which a school뭩 values are truly reflected by mission statements. Another way to validate the inferences would be to survey students and teachers regarding the mission statement to see the level of awareness of the aims of the school. A third option would be to take a look at the degree to which the ideals mentioned in the mission statement are being implemented in the classrooms.


Shapiro와 Markoff는 내용분석 이 자체는 그 결과가 다른 측정치와 관계가 있을 때에만 의미가 있다고 주장하기도 한다. 이러한 관점에서 평균적인 학생의 학업성취도와 학업적 성과를 얼마나 강조하는지에 대한 관계가 연구의 타당성을 더 높요질 수 있다. 

Shapiro & Markoff (1997) assert that content analysis itself is only valid and meaningful to the extent that the results are related to other measures. From this perspective, an exploration of the relationship between average student achievement on cognitive measures and the emphasis on cognitive outcomes stated across school mission statements would enhance the validity of the findings. For further discussions related to the validity of content analysis see Roberts (1997), Erlandson et al. (1993), and Denzin & Lincoln (1994).


Conclusion


When used properly, content analysis is a powerful data reduction technique. Its major benefit comes from the fact that it is a systematic, replicable technique for compressing many words of text into fewer content categories based on explicit rules of coding. It has the attractive features of being unobtrusive, and being useful in dealing with large volumes of data. The technique of content analysis extends far beyond simple word frequency counts. Many limitations of word counts have been discussed and methods of extending content analysis to enhance the utility of the analysis have been addressed. Two fatal flaws that destroy the utility of a content analysis are faulty definitions of categories and non-mutually exclusive and exhaustive categories.





Stemler, Steve (2001). An overview of content analysis. Practical Assessment, Research & Evaluation, 7(17). Retrieved November 11, 2014 from http://PAREonline.net/getvn.asp?v=7&n=17 . This paper has been viewed 384,239 times since 6/7/2001.

An Overview of Content Analysis

Steve Stemler

Yale University

내용분석과 주제분석 : 질적연구 수행 차원에서의 함의

Content analysis and thematic analysis: Implications for conducting a qualitative descriptive study

Mojtaba Vaismoradi, PhD, MScN, BScN,1,3 Hannele Turunen, PhD, RN2 and Terese Bondas, PhD, RN2,3

1College of Human and Health Sciences, Swansea University, Swansea, UK, 2Department of Nursing Science, Kuopio

Campus, University of Eastern Finland, Kuopio, Finland and 3Faculty of Professional Studies, University of Nordland,

Bodø, Norway





Introduction

In health care, qualitative methodologies 

    • aim to explore complex phenomena encountered by nurses, other providers, policy makers, and patients (Denzin & Lincoln, 2000; Sandelowski & Barroso, 2003a; Tong et al., 2007). 
    • The philosophy and the basic principles of methodologies, study aims and questions, and designs and data gathering criteria provide key differences between qualitative and quantitative methodologies (Ayres, 2007a). 
    • A belief in multiple realities, a commitment to identifying an approach to in-depth understanding of the phenomena, a commitment to participants' viewpoints, conducting inquiries with the minimum disruption to the natural context of the phenomenon, and reporting findings in a literary style rich in participant commentaries are the main characteristics of qualitative methodologies (Streubert Speziale & Carpenter, 2007).


Qualitative methodologies consist of the philosophical perspectives, assumptions, postulates, and approaches that researchers employ to render their work open to analysis, critique, replication, repetition, and/or adaptation and to choose research methods. In this respect, qualitative methodologies refer to research approaches as the tools with which researchers design their studies, and collect and analyse their data (Given, 2008). Qualitative methodologies are not a single research approach, but different epistemological perspectives and pluralism have created a range of “approaches” such as grounded theory, phenomenology, ethnography, action research, narrative analysis, and discourse analysis.


Qualitative research in the field of health has, at times, been undertaken without identification of the specific methodology used. The term “approach” is used in this article to differentiate it from the narrower term “methods.” This indicates a coherent epistemological viewpoint about the nature of enquiry, the kind of knowledge discovered or produced, and the kind of strategies that are consistent with this (Giorgi, 1970; Holloway & Todres, 2005).


Qualitative approaches share a similar goal in that they seek to arrive at an understanding of a particular phenomenon from the perspective of those experiencing it. Therefore, the researcher needs to determine which research approach can answer their research questions (Streubert Speziale & Carpenter, 2007). There is a considerable overlap among available qualitative approaches in terms of methods, procedures, and techniques. Such an overlap of epistemological, aesthetic, ethical, and procedural concerns can encourage a generic view of qualitative research, considering it a “family” approach in which the similarities are more important than the differences, and where the notion of flexibility becomes an important value and quest. However, there is another point of view, concerned with how such flexibility can lead to inconsistency and a lack of coherence (Holloway & Todres, 2003). It should not be forgotten that consumers of research assess the quality of evidence offered in a study by evaluating the conceptual and methodological decisions the researchers have made. Therefore, the researcher needs to make good decisions to produce evidence of the highest possible quality (Polit & Beck, 2003; Høye & Severinsson, 2007).




Definition of content analysis and thematic analysis

Content analysis is a general term for a number of different strategies used to analyse text (Powers & Knapp, 2006). It is a systematic coding and categorizing approach used for exploring large amounts of textual information unobtrusively to determine trends and patterns of words used, their frequency, their relationships, and the structures and discourses of communication (Mayring, 2000; Pope et al., 2006; Gbrich, 2007). The purpose of content analysis is to describe the characteristics of the document's content by examining who says what, to whom, and with what effect (Bloor & Wood, 2006). 


On the other hand, thematic analysis often is seen as a poorly branded method, in that it does not appear to exist as a named method of analysis in the same way that content analysis does. Thematic analysis as an independent qualitative descriptive approach is mainly described as “a method for identifying, analysing and reporting patterns (themes) within data” (Braun & Clarke, 2006: 79). It has also been introduced as a qualitative descriptive method that provides core skills to researchers for conducting many other forms of qualitative analysis. In this respect, qualitative researchers should become more familiar with thematic analysis as an independent and a reliable qualitative approach to analysis.



Aim and focus of data analysis

It seems that both content analysis and thematic analysis share the same aim of analytically examining narrative materials from life stories by breaking the text into relatively small units of content and submitting them to descriptive treatment (Sparker, 2005). 

    • Both content and thematic analysis approaches are suitable for answering questions such as: what are the concerns of people about an event? What reasons do people have for using or not using a service or procedure? (Ayres, 2007b). 
    • Content analysis is well-suited to analyse the multifaceted, important, and sensitive phenomena of nursing (Elo & Kyngäs, 2008; Vaismoradi et al., 2011). If conducting exploratory work in an area where not much is known, content analysis may be suitable for the simple reporting of common issues mentioned in data (Green & Thorogood, 2004). 
    • It has been suggested that thematic analysis, as a flexible and useful research tool, provides a rich and detailed, yet complex, account of the data (Braun & Clarke, 2006). Clearly, thematic analysis involves the search for and identification of common threads that extend across an entire interview or set of interviews (DeSantis & Noel Ugarriza, 2000).


It should be noted that both approaches allow for a qualitative analysis of data. 

    • By using content analysis, it is possible to analyse data qualitatively and at the same time quantify the data (Gbrich, 2007). Content analysis uses a descriptive approach in both coding of the data and its interpretation of quantitative counts of the codes (Downe-Wamboldt, 1992; Morgan, 1993). 
    • Conversely, thematic analysis provides a purely qualitative, detailed, and nuanced account of data (Braun & Clarke, 2006).



Exploration of the data analysis process

Both content analysis and thematic analysis are used in nursing studies. Nevertheless, a scarcity of information about the process of data analysis in nursing literature has resulted in a diversity of perspectives on how the approaches are used in research practice (Braun & Clarke, 2006; Elo & Kyngäs, 2008). A unified and standard data analysis protocol is preferred to be implemented by all researchers, because different results may be produced if different protocols are followed (Gbrich, 2007).


Regarding the data analysis process, different research approaches can be compared based on aspects such as “description and interpretation,” “modalities of approaches,” “consideration of context of data,” “data analysis process,” and “evaluation of the analysis process.”


Description and interpretation

      • When using content analysis, the primary aim is to describe the phenomenon in a conceptual form (Elo & Kyngäs, 2008). The content analyst views data as representations not of physical events but of texts, images, and expressions created to be seen, read, interpreted, and acted on for their meanings, and must therefore be analyzed with such uses in mind (Krippendorff, 2004). However, it has been claimed that content analysis in nursing research can be applied to various levels of interpretation (Graneheim & Lundman, 2004). 
      • In contrast, thematic analysis applies minimal description to data sets, and interprets various aspects of the research topic (Braun & Clarke, 2006).


Modalities of approaches

The current application of both content analysis and thematic analysis similarly, is associated with two modalities: inductive and deductive

      • Inductive content analysis and thematic analysis is used in cases where there are no previous studies dealing with the phenomenon, and therefore the coded categories are derived directly from the text data (Hsieh & Shannon, 2005). 
      • A deductive approach is useful if the general aim of thematic analysis and content analysis is to test a previous theory in a different situation, or to compare categories at different periods (Hsieh & Shannon, 2005; Elo & Kyngäs, 2008). This form tends to provide a less rich description of the data overall, and a more detailed analysis of some aspect of the data (Braun & Clarke, 2006). 
      • It should be noted that both the approaches may begin with a theory about the target phenomenon or a framework for collecting or analysing data, but that does not mean there is a commitment to stay within this theory or framework (Sandelowski, 2010). The question of whether a study needs to use an inductive or directed approach can be answered in both methods by matching the specific research purpose and the state of science in the area of interest to the appropriate analysis technique (Hsieh & Shannon, 2005).


Consideration of context of data

Every analysis requires a context within which the available texts are examined. The researcher must construct a world in which the texts make sense allowing them to answer research questions (Krippendorff, 2004). The researcher, who has a broader understanding of the context influencing the stories of the study participants, may develop a wider understanding of what is going on, in addition to the understanding that she or he may share with those participating in the research (Downe-Wamboldt, 1992). Both approaches provide researchers with a framework of analysis within which the context of data is apparent. 

      • Certainly, content analysis makes sense of what is mediated between people including textual matter, symbols, messages, information, mass-media content, and technology supported social interactions (Krippendorff, 2004; Hsieh & Shannon, 2005). 
      • On the other hand, thematic analysis is able to offer the systematic element characteristic of content analysis, and also permits the researcher to combine analysis of their meaning within their particular context (Loffe & Yardley, 2004).


If in content analysis only the frequency of codes is counted to find significant meanings in the text, there is the danger of missing the context (Morgan, 1993). Therefore, researchers employing content analysis are sometimes accused of removing meaning from its context. The problem is that a word or coding category may occur more frequently in the speech of one person or group of people than another for different reasons. Frequent occurrence could indicate greater importance, but it might simply reflect greater willingness or ability to talk at length about the topic (Loffe & Yardley, 2004; Shields & Twycross, 2008).


Data analysis process

Like other qualitative methods, gathering and analysing data are conducted concurrently in descriptive qualitative approaches, thus adding to the depth and quality of data analysis. However, it is also common to collect all the data before examining it to determine what it reveals (Chamberlain et al., 2004).


The process of data analysis in content analysis according to Elo and Kyngäs (2008), and in thematic analysis according to Braun and Clarke (2006) is shown in Table 1. According to the table,...

      • the preparation phase in content analysis and the phase of familiarizing with data in thematic analysis are equivalent. In both phases, the researcher is expected to transcribe the interview, and obtain the sense of the whole through reading the transcripts several times. While the thematic analysis researcher is mainly advised to consider both latent and manifest content in data analysis, the content analyst can choose between manifest (developing categories) and latent contents (developing themes) before proceeding to the next stage of data analysis. 
      • Open coding, collecting codes under potential subcategories/subthemes or categories/themes, and comparing the emerged coding's clusters together and in relation to the entire data set conprise the next stage of data analysis, which is named the organizing phase in content analysis. 
      • The same set of analytical interventions used in content analysis is applied in thematic analysis under the classifications of generating initial codes, defining and naming themes, reviewing themes, and searching for themes. 
      • The final stage of data analysis in both approaches is related to reporting the result of the previous stages. This stage is especially highlighted as the final opportunity of data analysis in thematic analysis. In addition, in both approaches, the creativity of the researcher for presenting the result in terms of a story line, a map, or model is encouraged.





It is noted that in both approaches, high quality data analysis depends on gathering high quality data. It is the responsibility of researchers to conduct data gathering in such a way that any complex data would be suitable to present interesting findings. After data gathering and transcribing and paying particular attention to respondents' emotions besides their behaviours, it is recommended that the data analyst immerses himself/herself in data in order to obtain the sense of the whole through reading and rereading (Polit & Beck, 2003).


As mentioned previously, there are many similarities between the processes of data analysis presented at the different stages. The terminology used during the data analysis process in the approaches is comparable and equivalent to each other (Table 1). Data corpus, data item, data extract, code, and theme in thematic analysis are equivalent in content analysis to the unit of analysis, meaning unit, condensed meaning unit, code, and category/theme, respectively (Graneheim & Lundman, 2004; Braun & Clarke, 2006; Elo & Kyngäs, 2008).


The final product of analysis, namely the tool for presenting findings, is much debated in both content and thematic analyses. At the most abstract level, emergence of the theme/themes can be considered to be the result or final product of data analysis. The term theme has been associated with many definitions and is used interchangeably with a vast number of other terms such as category, domain, unit of analysis, phase, process, consequence, and strategy (DeSantis & Noel Ugarriza, 2000). In this respect, there is considerable diversity in nursing and qualitative research literature associated with the identification of themes, the interpretation of the concept, and its function in data analysis (DeSantis & Noel Ugarriza, 2000). 

      • A theme is defined as a coherent integration of the disparate pieces of data that constitute the findings (Sandelowski & Leeman, 2012). It captures something important about data in relation to the research question, and represents some level of response pattern or meaning within the data set (Braun & Clarke, 2006). 
      • A pragmatic way to state the difference between a theme and a category is that 
        • the latter refers mainly to a descriptive level of content and can thus be seen as an expression of the manifest content of the text
        • whilst the former is the expression of the latent content (Graneheim & Lundman, 2004). Especially in thematic analysis, themes are usually quite abstract, and therefore difficult to identify (DeSantis & Noel Ugarriza, 2000; Spencer et al., 2003). 
      • Furthermore, in thematic analysis the importance of a theme is not necessarily dependent on quantifiable measures, but rather on whether it captures something important in relation to the overall research question (Spencer et al., 2003; Braun & Clarke, 2006). The latter perspective is different from the current idea in content analysis, where it is possible to reach a theme based on the frequency of its occurrence in the text. This approach is objective, systematic, and concerned with the surface meaning of the document rather than hidden agenda (Bloor & Wood, 2006).


    • One of the first decisions that should be taken when conducting content analysis is whether to concentrate analysis on the manifest or latent content of data. It is said that both manifest and latent content deal with interpretation, but the interpretation varies in depth and level of abstraction (Graneheim & Lundman, 2004; Powers & Knapp, 2006). 
    • In contrast, thematic analysis incorporates both manifest and latent aspects. It means that the analysis of latent content of data is an inseparable part of the manifest analysis approach (Braun & Clarke, 2006).


Another characteristic of data analysis in thematic analysis is drawing a thematic map. This refers to the visual presentation of themes, codes, and their relationships, involving a detailed account and description of each theme, their criteria, exemplars and counter examples, and other similar details. As one part of data analysis, it helps with reviewing themes and achieving the aim of identifying coherent but distinctive themes (Ryan & Bernard, 2000; Braun & Clarke, 2006). It should not be forgotten that data analysis processes in both approaches are not linear, simply moving from one phase to another phase, but should be recursive with frequent reviews. In addition, the result should be the identification of a story, which the researcher tells about the data in relation to the research question or questions.


Evaluation of the analysis process

Evaluating the validity or rigour of a qualitative study requires reviewers to distinguish between researchers' errors during data analysis (Sandelowski & Barroso, 2003a). 

      • One criticism that has been leveled in all qualitative approaches is that they lack the scientific rigour and credibility associated with traditionally accepted quantitative methods. It means that the quantitative inquiry is assumed to occur within a value-free framework and which rely on the measurement and analysis of causal relationships between variables (Horsburgh, 2003). 
      • Scientific qualitative research must yield valid results, in the sense that the research effort is open for careful scrutiny and it should be possible for any resulting claims to be upheld in the face of independently available evidence (Krippendorff, 2004). As an unavoidable part of all qualitative approaches, both researchers and readers should be helped to look for alternative interpretations. 
      • Credibility, dependability, confirmability, and transferability are the most common measures to achieve rigour in qualitative studies (Lincoln & Guba, 1985). 


Although the assessment of rigour in content and thematic analysis shares many similarities, some differences emphasize the separate and unique identities of each approach. 

      • For instance, intercoder reliability (analogous to interrater reliability) refers to the extent to which more than one coder independently classifies material in the same way as peer researchers. It is commonly used in content analysis and has been introduced as a measure for improving the approach's reliability (Cavanagh, 1997). However, because of the pure qualitative nature of thematic analysis, peer checking of intercoder reliability is not always possible since there is scepticism about the value of such testing. It has been discussed that one researcher merely trains another to think as she or he does when looking at a fragment of text. Thus, the reliability check does not establish that codes are objective, and merely two people can apply the same subjective perspective to the text (Loffe & Yardley, 2004). 


As a practical way to improve rigour in both approaches, researchers are encouraged to maintain a personal research diary. As a word of caution, the status of these additional materials in relation to raw data or field notes is sometimes unclear, as is the way in which they are expected to contribute to any interpretation. A conscious decision is made to include and code personal memoranda alongside field notes, and the same coding scheme is used for both types of data (Ballinger et al., 2004; Rolfe, 2006). 


Finally, one of the best ways for judging the quality of findings is whether new insights into the studied phenomenon have been provided; if so, the study should have increased the understanding of particular phenomena or informed practical actions (Krippendorff, 2004).









Content analysis and thematic analysis: Implications for conducting a qualitative descriptive study

  1. Mojtaba Vaismoradi PhD, MScN, BScN1,3,
  2. Hannele Turunen PhD, RN2,* and
  3. Terese Bondas PhD, RN2,3

Article first published online: 11 MAR 2013

DOI: 10.1111/nhs.12048









Keywords:

  • content analysis;
  • nursing;
  • qualitative descriptive research;
  • thematic analysis

Abstract

Qualitative content analysis and thematic analysis are two commonly used approaches in data analysis of nursing research, but boundaries between the two have not been clearly specified. In other words, they are being used interchangeably and it seems difficult for the researcher to choose between them. In this respect, this paper describes and discusses the boundaries between qualitative content analysis and thematic analysis and presents implications to improve the consistency between the purpose of related studies and the method of data analyses. This is a discussion paper, comprising an analytical overview and discussion of the definitions, aims, philosophical background, data gathering, and analysis of content analysis and thematic analysis, and addressing their methodological subtleties. It is concluded that in spite of many similarities between the approaches, including cutting across data and searching for patterns and themes, their main difference lies in the opportunity for quantification of data. It means that measuring the frequency of different categories and themes is possible in content analysis with caution as a proxy for significance.


Grounded Theory와 Qualitative Content Analysis의 유사점과 차이점 분석을 통한 혼동 줄이기

Reducing Confusion about Grounded Theory and Qualitative Content Analysis: Similarities and Differences

Ji Young Cho Kent State University, Kent, Ohio, USA

Eun-Hee Lee Hanyang University, Seoul, South Korea





Introduction


Using an appropriate research method for inquiry is critical to successful research. Grounded theory and qualitative content analysis share similarities. Both are based on naturalistic inquiry that entails identifying themes and patterns and involves rigorous coding. They are both used to analyze and interpret qualitative data; however, the similarities and differences in grounded theory and qualitative content analysis have not been clarified in the literature (Priest, Roberts, & Woods, 2002), nor have they been consistently considered.


To illustrate, both have been considered equivalent approaches to interpret qualitative data (e.g., Priest et al., 2002). 

    • Grounded theory was treated as a research methodology, and content analysis as a method (e.g., Crotty, 2003); 
    • furthermore, grounded theory was considered a theoretical framework and content analysis a research method of textual data analysis (e.g., Patton, 2002). 
    • Qualitative content analysis was considered a strategy for the analysis of qualitative descriptive studies (Sandelowski, 2000) and a technique with overtones(함축) of other research methods, such as ethnographic and grounded theory (Altheide, 1987). 
    • Qualitative content analysis was unknown as a research method until recently, especially in English-speaking countries, because of the dominance of quantitative content analysis (Schreier, 2012).


Moreover, a researcher’s approach purportedly following grounded theory actually seems closer to qualitative content analysis or other methods (Sandelowski & Barroso, 2003; Suddaby, 2006). Sandelowski and Barroso (2003) cited the discrepancy between “method claims and the actual use of methods” (p. 905) in research papers. Novice researchers, especially students who want to conduct qualitative research, are often confused by the characteristics of the two as result of the lack of comparative references. Some researchers who stated they had used grounded theory actually used qualitative content analysis, which incorporates some procedures of grounded theory, such as open coding or memoing (Sandelowski & Barroso, 2003).


Thus, the purpose of this paper is to clarify ambiguities about the characteristics of grounded theory and qualitative content analysis. Using our own research as examples, we have discussed the similarities and differences in the two in the following six areas:

    • a) background and philosophical basis,
    • b) unique characteristics of each method,
    • c) goals and rationale of each method,
    • d) data analysis process,
    • e) outcomes of the research, and
    • f) evaluation of trustworthiness of research.

We have also discussed the strengths and weaknesses of each. Through this paper, we expect to provide knowledge that can assist novice researchers in the selection of appropriate research methods for their inquiries.


Research Goals and Rationale for Using a Specific Method

A researcher who uses grounded theory aims to generate a substantive theory that will explain a phenomenon in a specific context and suited to its supposed use. The emphasis in grounded theory is theory development (Strauss & Corbin, 1994). Thus, grounded theory is appropriate when no theory exists or when a theory exists that is too abstract to be tested, but it is not appropriate for the test of a theory or generation of knowledge from objective reality (Martin & Turner, 1986; Suddaby, 2006).


In contrast, a researcher who uses qualitative content analysis aims to “systematically describe the meaning” of materials in a certain respect that the researcher specified from research questions (Schreier, 2012, p. 3). Although both grounded theory and qualitative content analysis follow coding processes, content analysis does not focus on finding relationships among categories or theory building; instead, it focuses on extracting categories from the data.


Two research examples appear below in order to explain and demonstrate the rationale of using one or the other of the methods. The examples are from the dissertations written by the authors of this paper.



Data Analysis Process

Data analysis in grounded theory and data analysis in qualitative content analysis share similarities in that both involve a systematic coding process. They entail coding, finding categories and theme(s); however, the procedure is different. Specifically, data collection and analysis are parallel in grounded theory, and the procedure is neither linear nor sequential. The amount of data for analysis is based not on availability but on saturation. Moreover, in grounded theory, because of the nature of theoretical sampling, theory generated from the data actually guides the decision about what kinds of data are appropriate for subsequent data collection.





Another difference is that qualitative content analysis entails a data reduction process by focusing on selected aspects of data. Data reduction is achieved by limiting “analysis to those aspects that are relevant with a view to your research question” (Schreier, 2012, p. 7). This difference relates to the nature of grounded theory, which requires a high degree of interpretation and transformation of data. Sandelowski (2000) argued that qualitative content analysis entails analyzing qualitative descriptive studies that are data-derived and the least interpretative compared to other approaches to qualitative analysis because “there is no mandate to re-present the data in any other terms but their own” (Sandelowski, 2000, p. 338). Sandelowski also argued that qualitative descriptive studies require researchers to “stay closer to their data and to the surface of words and events” than grounded theory (p. 336).


In a brief explanation, the analysis process in..

    • grounded theory involves 
      • concept labelling, 
      • categorizing, 
      • identifying core categories, 
      • finding relations among categories, and 
      • generating a theory from such relationship. 

The analysis process in 

    • qualitative content analysis comprises 
      • selecting the unit of analysis, 
      • categorizing and 
      • finding themes from categories.








Research Outcomes

The research outcome of grounded theory is a substantive theory that is “suited to its supposed uses” (Glaser & Strauss, 1967, p. 3). Substantive theory is developed and generated through interplay with data collected in actual research. It is different from higher level general theory because general theory is achieved from deductive approaches (Strauss & Corbin, 1994). It consists of plausible and conceptually dense relationships among concepts and sets of concepts. The nature of a substantial theory is provisional and has the potential to be extended “to a more elaborative substantive theory or to formal theories” (Strauss & Corbin, 1994, p. 282).



The research outcome of qualitative content analysis is the meaning of qualitative material formatted as categories or themes that answer the research questions. The use of qualitative content analysis yields a set of priority categories that cover the data instead of developing a new theory by identifying the relationships among codes and categories.


In research on classifying the findings in qualitative studies, Sandelowski and Barroso (2003) argued that the findings of grounded theory require a greater transformation of the data and that qualitative content analysis is less transformative. They argued that qualitative descriptive study, which uses qualitative content analysis strategy, has lowest level of abstraction as a topical survey and that grounded theory has one with highest levels of transformation of the thematic description of the original data. They defined the main characteristics of topical survey as “the reduction of qualitative data in ways that remained close to those data as given” (pp. 910–911); but in thematic description, authors “imported concepts or themes to reframe a phenomenon, event, or case” (p. 911).




Summary of Comparison of Grounded Theory and Qualitative Content Analysis

In terms of similarities in grounded theory and qualitative content analysis, both methods are based on naturalistic inquiry. Data can be collected from multiple channels, such as interviews, observations, documents, and visual materials. In addition, both methods follow the systematic procedure of data analysis. By means of the coding process, the researcher seeks codes and categories. Especially in inductive content analysis and grounded theory, researchers seek themes from data analysis; moreover, to enhance the trustworthiness of research, criteria for measuring the quality of qualitative research methods can be used in addition to specific criteria for each method.


In terms of differences, grounded theory emerged from the field of sociology, but qualitative content analysis originated in communication and linguistics. The philosophical basis of grounded theory lies in social interactionism and a reaction to positivistic view of science, but qualitative content analysis is the result of a reaction to quantitative content analysis to understand the meaning of the context. Their characteristics and data analysis procedures differ. The final result of a grounded theory study is a substantive theory, and that of qualitative content analysis is a list of categories and themes. In grounded theory, a substantive theory that surpasses a list of codes is highly important. Grounded theory analysis yields more than data reduction, abstraction, and core categories; it generates a substantive theory that can explain the phenomenon. Use of qualitative content analysis yields a set of priority categories that cover the data instead of a new theory developed by identifying the relations among codes.


Evaluation of Trustworthiness and Quality of Research

Grounded Theory

Corbin and Strauss (1990) suggested the following as evaluation criteria for grounded theory: 

        • rigor in the coding and research process, 
        • quality of concepts, 
        • systematic relatedness among concepts, 
        • conceptual density, 
        • range of variations and specificity, 
        • significance of theoretical findings, and 
        • theoretical sensitivity (pp. 18–19).


Findings using grounded theory should have conceptual density; that is, categories should be theoretically dense, richly dimensional, and tightly linked with one another (Corbin & Strauss, 1990). Developed theory from research using grounded theory should be judged in terms of “the range of variations and the specificity with which they are analyzed in relation to the phenomena that are their source” (p. 18). Theoretical sensitivity denotes the researcher’s sensitivity to the theory and to “the subtleties of actions/interactions” (Corbin & Strauss, 1990, p. 19).


In addition to these criteria specific to grounded theory, criteria for overall qualitative research methodology can be also used for enhancing the quality and trustworthiness of the research. Triangulation via the use of multiple and different data sources, perspectives, sites, and theories is one of the basic strategies. In Study 1, Cho employed data triangulation, theory triangulation, and methodological triangulation. She used a variety of data sources from observation, interviews, and visual material evidence. Because of the lack of an established theory on the pedagogy of aesthetics, she brought multiple theories from architectural history and theory, philosophy, psychology, and education to interpret the observed phenomena. She also used multiple case studies with the grounded theory approach.


From among Maxwell’s (1996) proposed methods for validity testing, Cho used intensive, long-term involvement in the research site, thick and rich description of phenomena, presentation of negative or discrepant information, and use of peer debriefing. Long-term participants help researchers “rule out spurious associations and premature theories” (Maxwell, 1996, p. 110). Her research involved one year of data collection, consisting of weekly observations of the research site; and as a result, a thick and rich description was achieved. She also reported the reality without distortion, including conflicting views ascertained through interviews of students and instructors.


Qualitative Content Analysis

No evaluation criteria have been specifically designed for qualitative content analysis, but overall qualitative research criteria can be applicable. Credibility (truth value), transferability (applicability), and dependability (consistency) have been used to evaluate the trustworthiness of the qualitative inquiry (Guba, 1981) and are applicable for both grounded theory and qualitative content analysis. To measure trustworthiness of qualitative content analysis, these concepts are still validly used (Graneheim & Lundman, 2004).


In order to increase the credibility of the findings of a study, several strategies can be used, such as triangulation, member checking, showing representative quotations, and peer debriefing. In Study 2, Lee employed multiple methods for triangulation, such as interviews with residents, family members, and staff members as well as observation, document reviews, and drawings. The objective of triangulation is to diminish researcher bias in the data and the likelihood of misinterpretation when checking the findings against various data sources and perspectives. Graneheim and Lundman (2004) suggested the selection of “the most suitable meaning unit” (p. 110) and the capacity of categories and themes to cover data as the other strategies for credibility.


To facilitate transferability, researchers provide “background data to establish [the] context of [the] study and detailed description of [the] phenomenon in question to allow comparisons to be made” (Shenton, 2004, p. 73). Dependability can be enhanced via an audit trail that includes all records, notes on methodology, and documents produced and corrected during the research procedure.


Strengths and Weaknesses of Grounded Theory and Qualitative Content Analysis

Several strengths and weaknesses in the use of grounded theory and qualitative content analysis were identified from literature and critical reflection of the authors' research processes.


The strengths of utilizing grounded theory are as follows:

      • (1) When the researcher makes an inquiry when no relevant theory exists, grounded theory gives the researcher a creative approach without confining him or her to an already existing realm of theory (Suddaby, 2006).
      • (2) It allows the researcher to look at phenomena with new eyes and from new perspectives without restriction within already existing hypotheses.
      • (3) It allows the researcher to understand phenomena holistically.
      • (4) Compared to other qualitative research method, it has a better defined procedure in the coding process.

The weaknesses of grounded theory are as follows:

      • (1) Because of the number of variations in the original grounded theory text, novice researchers experience confusion in conducting their research. Researchers need to conduct their research with understanding of different coding processes from different versions.
      • (2) It does not provide a predefined research sampling process. In order to achieve saturation in theoretical sampling, the researcher must exercise stringent theoretical sensitivity in the data analysis process.
      • (3) It is not an effective process in terms of time and energy because of the labor-intensive coding process. Although the researcher follows a rigorous coding process, he or she may not find any substantial theory.
      • (4) Because of theoretical sampling and saturation, anticipating the length of the research period is difficult (Goulding, 2002).


The strengths of qualitative content analysis are as follows:

      • (1) It leads to understanding of social reality or phenomena through interpretation of a variety of verbal or written recorded communication materials.
      • (2) It allows the researcher to process large quantities of data.
      • (3) It is flexible in that the data can be verbal or visual and sampled from other sources as well as collected by the researcher (Schreier, 2012)
      • (4) If the main sources of data are written text, it is an unobtrusive method because no unwanted interaction effects occur between participants and researchers (Kondracki et al., 2002).

The weaknesses of qualitative content analysis are as follows:

      • (1) It may not be appropriate for open explorative research (Ehnert, 2008).
      • (2) It can be a labor-intensive and time-consuming process, and the coding scheme becomes quite complex (Kondracki et al., 2002).
      • (3) Because of a lack of established analysis procedure, novice researchers experience confusion in conducting their research.








Abstract

Although grounded theory and qualitative content analysis are similar in some respects, they differ as well; yet the differences between the two have rarely been made clear in the literature. The purpose of this article was to clarify ambiguities and reduce confusion about grounded theory and qualitative content analysis by identifying similarities and differences in the two based on a literature review and critical reflection on the authors’ own research. Six areas of difference emerged: (a) background and philosophical base, (b) unique characteristics of each method, (c) goals and rationale of each method, (d) data analysis process, (e) outcomes of the research, and (f) evaluation of trustworthiness. This article provides knowledge that can assist researchers and students in the selection of appropriate research methods for their inquiries.

Keywords

Data Analysis, Grounded Theory, Qualitative Content Analysis, Qualitative Research, Research Method

Cho, J. Y., & Lee, E. (2014). Reducing Confusion about Grounded Theory and Qualitative Content Analysis: Similarities and Differences. The Qualitative Report, 19(32), 1-20. Retrieved from http://nsuworks.nova.edu/tqr/vol19/iss32/2

질적내용분석의 세 가지 접근법

Three Approaches to Qualitative Content Analysis

Hsiu-Fang Hsieh

Sarah E. Shannon





내용분석은 최근들어 널리 활용되기 시작한 연구 방법이다. CIN이나 AHL검색을 해보면 1991년과 2002년 사이 4000개의 논문이 나온 것을 확인할 수 있다.

Content analysis is a research method that has come into wide use in health studies in recent years.A search of content analysis as a subject heading term in the Cumulative Index to Nursing and Allied Health Literature produced more than 4,000 articles published between 1991 and 2002. The number of studies reporting the use of content analysis grew from only 97 in 1991 to 332 in 1997 and 601 in 2002.


내용분석의 분류는 질적내용분석과 양적내용분석으로 주로 나뉘어왔다. 질적내용분석이 사용되는 방식에 대한 더 자세한 분석을 통해서 내용분석을 활용하고자 하는 연구자들에게 중요한 이슈를 집어주고, 그러한 연구에서 사용되는 분석 과정을 다룸으로서 방법적 혼란을 피할 수 있게 하고자 한다. 

The differentiation of content analysis is usually limited to classifying it as primarily a qualitative versus quantitative research method. A more thorough analysis of the ways in which qualitative content analysis can be used would potentially illuminate key issues for researchers to consider in the design of studies purporting to use content analysis and the analytic procedures employed in such studies, thus avoiding a muddling of methods (Morse, 1991).



배경 BACKGROUND ON THE DEVELOPMENT OF CONTENT ANALYSIS

내용분석의 역사는 18세기 스칸디나비아로 거슬러 올라간다. 연구자들은 점차 내용분석은 주로 질적연구방법으로서 사용되게 되는데, 어떤 카테고리에 데이터를 입력하고, 통계적으로 기술하는 방법이 그것이다. 이러한 접근법은 질적자료의 양적분석이라고도 불리며, 이 논문의 초점은 아니다. 더 최근으로 오면 내용분석을 보건분야 연구자들이 질적분석의 방법으로 사용가능하다는 것을 깨닫고 적용과 인기가 많아졌다.

Content analysis has a long history in research, dating back to the 18th century in Scandinavia (Rosengren, 1981). In the United States, content analysis was first used as an analytic technique at the beginning of the 20th century (Barcus, 1959). Initially, researchers used content analysis as either a qualitative or quantitative method in their studies (Berelson, 1952). Later, content analysis was used primarily as a quantitative research method, with text data coded into explicit categories and then described using statistics. This approach is sometimes referred to as quantitative analysis of qualitative data (Morgan, 1993) and is not our primary focus in this article. More recently, the potential of content analysis as a method of qualitative analysis for health researchers has been recognized, leading to its increased application and popularity (Nandy & Sarvela, 1997).


질적내용분석은 텍스트 자료를 분석하는 여러 연구방법 중 하나이다. 질적내용분석은 단순히 방대한 텍스트를 유사한 의미를 나타내는 더 적은 수의 카테고리로 효율적으로 분류고자 하는 목적으로 단순히 단어를 세는 작업이 아니다. 이러한 카테고리는 겉으로 드러나는 의사소통을 나타낼 수도 있고(explicit), 내재된 의사소통을 나타낼 수도 있다(inferred). 내용분석의 목표는 "연구하고자 하는 현상을 이해하고 지식을 만드는 것"이다. 

Qualitative content analysis is one of numerous research methods used to analyze text data. (...) Qualitative content analysis goes beyond merely counting words to examining language intensely for the purpose of classifying large amounts of text into an efficient number of categories that represent similar meanings(Weber, 1990). These categories can represent either explicit communication or inferred communication. The goal of content analysis is “to provide knowledge and understanding of the phenomenon under study” (Downe-Wamboldt, 1992, p. 314).



전통적 내용분석

CONVENTIONAL CONTENT ANALYSIS


전통적 내용분석은 일반적으로 현상을 묘사하기 위한 목적을 가지며, Table 1의 경우에는 호스피스 환자의 감정이 그것이다. 이러한 종류의 연구설계는 기존의 이론이나 연구문헌이 제한적일 때 사용한다. 연구자들은 사전에 형성되어 있는 카테고리를 활용하지 않으며, 대신 데이터로부터 카테고리와 그 이름을 끄집어낸다. 연구자들은 데이터에 완전히 빠져서 새로운 통찰력을 찾아내야 하며 이 과정을 귀납적카테고리개발 이라고 묘사하기도 한다. 많은 질적연구방법이 이러한 공통된 초기 접근법을 갖는다.

Researcher X used a conventional approach to content analysis in her study (Table 1). Conventional content analysis is generally used with a study design whose aim is to describe a phenomenon, in this case the emotional reactions of hospice patients. This type of design is usually appropriate when existing theory or research literature on a phenomenon is limited. Researchers avoid using preconceived categories (Kondracki & Wellman, 2002), instead allowing the categories and names for categories to flow from the data. Researchers immerse themselves in the data to allow new insights to emerge (Kondracki & Wellman, 2002), also described as inductive category development (Mayring, 2000). Many qualitative methods share this initial approach to study design and analysis.


만약 데이터가 주로 면담을 통해 수집된다면 개방형 질문이 주로 사용될 것이다. 탐색 질문은 기존의 이론에 대한 것이기보다는 개방형이거나, 더 자세한 답을 얻기 위해 사용한다. 데이터분석은 모든 자료를 반복적으로 읽고, 전체에 대한 감을 잡는 것에서 시작한다. 그리고나서 자료의 개별 단어들을 코딩하는데, 처음에는 텍스트에 원래 사용된 단어를 강조함으로써 핵심 사고와 개념을 찾아낸다. 그 다음으로 연구자들은 첫인상, 생각, 최초분석에 대한 노트를 작성해간다. 이러한 과정이 지속되면서 하나 이상의 핵심 생각을 반영하는 라벨이 드러난다. 이것은 종종 텍스트에서 곧바로 나오기도 하고, 이것이 초기의 코딩 스킴이 될 수도 있다. 그리고 나서 코딩된 자료는 얼마나 서로 관련되는지, 차별되는지에 따라서 각 가케고리에 분류된다. 이렇게 드러난 카테고리는 코딩된 자료를 의미있는 묶음으로 정리하고 그룹화하는 작업에 사용된다. 이상적으로 클러스터의 수는 10~15개 정도가 좋으며, 다수의 코딩자료를 포함할만큼 넓어야 한다.

If data are collected primarily through interviews, open-ended questions will be used. Probes also tend to be open-ended or specific to the participant’s comments rather than to a preexisting theory, such as “Can you tell me more about that?” Data analysis starts with reading all data repeatedly to achieve immersion and obtain a sense of the whole (Tesch, 1990) as one would read a novel. Then, data are read word by word to derive codes (Miles & Huberman, 1994; Morgan, 1993; Morse & Field, 1995) by first highlighting the exact words from the text that appear to capture key thoughts or concepts. Next, the researcher approaches the text by making notes of his or her first impressions, thoughts, and initial analysis. As this process continues, labels for codes emerge that are reflective of more than one key thought. These often come directly from the text and are then become the initial coding scheme. Codes then are sorted into categories based on how different codes are related and linked. These emergent categories are used to organize and group codes into meaningful clusters (Coffey&Atkinson, 1996; Patton, 2002). Ideally, the numbers of clusters are between 10 and 15 to keep clusters broad enough to sort a large number of codes (Morse & Field, 1995).


(...)


전통적 내용분석 방법을 활용한 경우, 관련된 이론이나 다른 연구결과가 연구의 고찰부분에서 다뤄진다. 연구자X의 연구를 보면, 그녀의 연구결과를 Kübler-Ross’s 의 이론에 맞춰서 비교하게 된다. 이러한 고찰은 그녀의 연구에서 나타난 결과가 관심분야의 지식에 기여할 수 있고, 진료/교육/미래 연구가 어떻게 되어야 하는지를 제안할 수 있다.

With a conventional approach to content analysis, relevant theories or other research findings are addressed in the discussion section of the study. In Researcher X’s study, she might compare and contrast her findings to Kübler-Ross’s (1969) theory. The discussion would include a summary of how the findings from her study contribute to knowledge in the area of interest and suggestions for practice, teaching, and future research.


전통적인 접근법의 장점은 연구참여자의 자료에 어떤 기존의 카테고리나 이론적 관점을 대입시키지 않고 직접적으로 결과를 얻어낸다는 것이다. 연구자X의 연구에서와 같이, 그녀의 내용분석에서 얻어진 지식은 환자의 특정한 관점에 대한 것이며, 실제 자료에 의존하고 있다. 샘플링기법은 최대한 다양한 정서적 반응을 포괄할 수 있게 설계되었고 분석방법은 그러한 복잡성을 잘 구조화한다.

The advantage of the conventional approach to content analysis is gaining direct information from study participants without imposing preconceived categories or theoretical perspectives. Researcher X’s study depicts a research question appropriate for this approach. Knowledge generated from her content analysis is based on participants’ unique perspectives and grounded in the actual data. Her sampling technique was designed to maximize diversity of emotional reactions, and the analysis techniques were structured to capture that complexity. 


이러한 분석의 한 가지 문제는 컨택스트에 대한 완벽한 이해에 실패할 수 있어서, 결국 핵심 카테고리를 놓칠 수 있다는 점이다. 이로 인해서 연구결과가 자료를 정확히 반영하지 못할 수 있다. Lincoln and Guba는 이러한 신뢰성(Credibility)를 신뢰도와 타당도 측면에서의 '내적타당도'라고 설명하고 있다. 신뢰성은 peer debriefing, prolonged engagement, persistent observation, triangulation, negative case analysis, referential adequacy, and member checks  등을 통해섷 향상될 수 있다.

One challenge of this type of analysis is failing to develop a complete understanding of the context, thus failing to identify key categories. This can result in findings that do not accurately represent the data. Lincoln and Guba (1985) described this as credibility within the naturalistic paradigm of trustworthiness or internal validity within a paradigm of reliability and validity. Credibility can be established through activities such as peer debriefing, prolonged engagement, persistent observation, triangulation, negative case analysis, referential adequacy, and member checks (Lincoln & Guba, 1985; Manning, 1997).


또 다른 한계는 GTM이나 현상론(phenomenology)과 같은 다른 질적연구방법과 혼동스러울 수 있다는 점이다. 이들 연구방법은 분석적 접근법이 내용분석과 유사하나, 내용분석을 넘어서서 이론을 개발하거나 실제 경험에 대한 미묘한 차이까지를 찾아내고자 한다. 전통정접근법은 이론적 개발과 실제 경험을 묘사하는 것 모두에서 한계점이 있는데, 이는 샘플링과 분석절차가 개념간 이론적 관계를 어렵게 만들어서, 관찰결과로부터의 추론이 어려워지기 때문이다. 전통적 내용분석을 통해서 얻을 수 있는 최대치는 개념개발 또는 모델개발 정도이다.

Another challenge of the conventional approach to content analysis is that it can easily be confused with other qualitative methods such as grounded theory method (GTM) or phenomenology. These methods share a similar initial analytical approach but go beyond content analysis to develop theory or a nuanced understanding of the lived experience. The conventional approach to content analysis is limited in both theory development and description of the lived experience, because both sampling and analysis procedures make the theoretical relationship between concepts difficult to infer from findings. At most, the result of a conventional content analysis is concept development or model building (Lindkvist, 1981).



DIRECTED CONTENT ANALYSIS

종종 기존의 이론이나 앞선 연구가 존재할 수도 있고, 추가적인 기술을 통해서 이들 이론이 발전할 수도 있다. 질적연구자는 directed approach를 사용할 수 있다(연구자 Y). directed approach의 목표는 이론틀이나 이론을 개념적으로 확장하거나 그 타당성을 검증하는 것이다. 연구질문에 대한 기존의 이론이나 연구가 있을 수 있다. 관심을 갖고 있는 변수에 대한 예측을 가능하게 하거나 변수간 관계를 보여주기도 한다. 따라서 초기의 코딩틀이나 코드간의 관계를 결정하는데 도움을 줄 수 있다. 이는 연역적 카테고리 적용법이라고 불려지기도 한다.

Sometimes, existing theory or prior research exists about a phenomenon that is incomplete or would benefit from further description. The qualitative researcher might choose to use a directed approach to content analysis, as Researcher Y did (Table 2). Potter and Levine-Donnerstein (1999) might categorize this as a deductive use of theory based on their distinctions on the role of theory. However the key tenets of the naturalistic paradigm form the foundation of Researcher Y’s general approach to the study design and analysis. The goal of a directed approach to content analysis is to validate or extend conceptually a theoretical framework or theory. Existing theory or research can help focus the research question. It can provide predictions about the variables of interest or about the relationships among variables, thus helping to determine the initial coding scheme or relationships between codes. This has been referred to as deductive category application (Mayring, 2000).


Directed내용분석은 전통적접근법보다 조금 더 구조화된 과정이다. 기존의 이론이나 연구로부터 도출된 핵심 개념이나 변수를 초기 코딩 카테고리로 사용한다. 그 다음 각 카테고리에 대한 조작적 정의를 내리게 된다. 연구자Y의 연구에서는 기존에 알려진 슬픔의 다섯 단계가 말기환자들의 감정상태에 대한 연구에 사용되었다.

Content analysis using a directed approach is guided by a more structured process than in a conventional approach (Hickey & Kipping, 1996). Using existing theory or prior research, researchers begin by identifying key concepts or variables as initial coding categories (Potter & Levine-Donnerstein, 1999). Next, operational definitions for each category are determined using the theory. In Researcher Y’s study, Kübler-Ross’s (1969) five stages of grief served as an initial framework to identify emotional stages of terminally ill patients. 


자료가 면담을 통해서 주로 수집된다고 할 때, 개방형 질문이 사용되게 되며, 여기에 기존의 카테고리에 기반한 질문이 뒤따르게 된다. 개방형 질문 다음에 연구자Y는 부정-분노-협상-우울-수용에 대한 참가자의 경험을 물었다. 연구질문에 따라 두 가지 종류의 코딩 전략이 가능하다. (1) 만약 연구의 목적이 특정 현상에 대한 모든 상황에 대해서 찾아내고 그것을 카테고리화 하는 것이라면 (감정적 반응과 같이), 모든 텍스트를 읽고 감정적 반응을 나타낸 내용을 모두 형광펜으로 표시한다. 그 다음 단계는 모든 형광펜으로 표시된 구절을 미리 정해진 코드에 입력하는 것이다. 기존 코드에 카테고리화되지 않은 텍스트는 새로운 코드를 형성할 수 있다.

If data are collected primarily through interviews, an open-ended question might be used, followed by targeted questions about the predetermined categories. After an open-ended question, Researcher Y used probes specifically to explore participants’ experiences of denial, anger, bargaining, depression, and acceptance. Coding can begin with one of two strategies, depending on the research question. If the goal of the research is to identify and categorize all instances of a particular phenomenon, such as emotional reactions, then it might be helpful to read the transcript and highlight all text that on first impression appears to represent an emotional reaction. The next step in analysis would be to code all highlighted passages using the predetermined codes. Any text that could not be categorized with the initial coding scheme would be given a new code.


두 번째 전략은 곧바로 미리 정해진 코드에 자료를 입력하는 것이다. 코딩이 될 수 없는 자료는 나중에 그것들이 새로운 카테고리나 하위카테고리를 만들 수 있는지 다시 검토한다. 이 두 가지 중 어떤 방법을 사용할 것인가는 자료와 연구자의 목표가 무엇인가에 따라 달려있다. 만약 연구자가 현상의 모든 가능한 형태를 잡아내고 싶다면, 코딩하지 않고 거기에 맞는 텍스트를 모두 형광펜표시하는 것이 신뢰성을 높일 수 있다(1번방법). 만약 연구자가 초기의 코딩 이후 관련 텍스트 분석을 편향되지 않게 할 것이라는 확신이 있다면 바로 코딩이 시작될 수 있다(2번방법).카테고리의 종류와 폭이 얼마나 되는가에 따라서 연구자들은 하위카테고리를 찾아낼 필요가 있을수도 있다. 예컨대 연구자Y가 '분노'에 대해서 '누구를 향한 분노'인지 하위카테고리를 만들고 싶을 수 있다.

The second strategy that can be used in directed content analysis is to begin coding immediately with the predetermined codes. Data that cannot be coded are identified and analyzed later to determine if they represent a new category or a subcategory of an existing code. The choice of which of these approaches to use depends on the data and the researcher’s goals. If the researcher wants to be sure to capture all possible occurrences of a phenomenon, such as an emotional reaction, highlighting identified text without coding might increase trustworthiness. If the researcher feels confident that initial coding will not bias the identification of relevant text, then coding can begin immediately. Depending on the type and breadth of a category, researchers might need to identify subcategories with subsequent analysis. For example, Researcher Y might decide to separate anger into subcategories depending on whom the anger was directed toward.


Directed내용분석을 통한 연구결과는 이론을 뒷받침하는 것일 수도 있고 그렇지 않는 것일수도 있다. 예시를 함께 제시함으로서 그 근거를 댈 수 잇다. 연구설계와 분석의 결과가 차이를 통계적으로 검정하기 어려운 형태일 수 있으므로 빈도에 대한 순위비교가 활용될 수 있다. 연구자Y는 다섯 개의 주요 카테고리에 대한 빈도를 보고하고, 새롭게 찾아낸 감정반응에 대한 빈도를 함께 보고할 수 있다. 또한 전체 샘플에서 코드를 지지하는 비율과 지지하지 않는 비율을 비교할 수도 있다.

The findings from a directed content analysis offer supporting and nonsupporting evidence for a theory. This evidence can be presented by showing codes with exemplars and by offering descriptive evidence. Because the study design and analysis are unlikely to result in coded data that can be compared meaningfully using statistical tests of difference, the use of rank order comparisons of frequency of codes can be used (Curtis et al., 2001). Researcher Y might choose to describe his study findings by reporting the incidence of codes that represented the five main categories derived from Kübler-Ross (1969) and the incidence of newly identified emotional reactions. He also could descriptively report the percent of supporting versus nonsupporting codes for each participant and for the total sample. 


이론이나 기존의 연구는 관찰결과의 고찰에서 도움이 될 것이다. 새롭게 찾아낸 카테고리는 현상에 대해서 반대되는 견해를 제시할 수도 있고, 혹은 더 정제됨으로서 기존의 이론을 확장시키거나 더 풍부하게 만들어 줄 수도 있다. Y의 연구에서 고찰은 어떤 참여자가 Kübler-Ross’s (1969) model 에 더 부합하는지, 그리고 참여자들로부터 새롭게 찾아낸 감정반응이나 단계는 어떤 것인지에 초점을 둘 수 있다.

The theory or prior research used will guide the discussion of findings. Newly identified categories either offer a contradictory view of the phenomenon or might further refine, extend, and enrich the theory. In Researcher Y’s study, the discussion might focus on the extent to which participants’ emotional journeys paralleled Kübler-Ross’s (1969) model and the newly identified emotional reactions or stages that were experienced by participants in the study.


Directed접근법의 대표적 장점은 기존의 이론이 지지되거나 확장될 수 있다는 것이다. 추가적으로 연구분야가 넓어지면서 directed접근법을 통해서 naturalistic designs에서 흔히 드러나는 naive perspective가 아닌 명백한 현실에 대해 연구자들이 생각할 수 있게 된다는 것이다.

The main strength of a directed approach to content analysis is that existing theory can be supported and extended. In addition, as research in an area grows, a directed approach makes explicit the reality that researchers are unlikely to be working from the naive perspective that is often viewed as the hallmark of naturalistic designs.


이러한 directed접근법은 naturalistic paradigm에 대한 도전이기도 하다. 

    • 이론을 활용하는 것은 강하게 편향되어 있는 정보를 활용하는 것일 수 있다는 내재적 한계가 있다. 따라서 연구자는 그 이론을 지지하는 근거보다는 반대하는 근거를 찾을 가능성이 더 높다. 
    • 두 번째로, 탐색질문에 대답할 때 일부 참가자들은 연구자의 기분을 상하지 않게 하기 위해서 질문에 동의하는 방식으로 대답할 수 있다. 예컨대 Y의 연구에서 일부 환자들은 연구자가 말하는 감정적 단계를 경험한 바가 없음에도 거기에 동의한다고 말할 수 있다.
    • 세 번째로, 이론을 지나치게 강조하는 것은 현상의 맥락적 측면을 놓치게 만들 수도 있다. Y의 연구에서 Kübler-Ross’s 의 단계를 강조하다보면 감정에 영향을 미치는 맥락적 특성을 놓칠 수도 있다. 이러한 한계점은 '객관성'이라고도 할수 있는 신뢰성의 중립성(neutrality or confirmability)과도 연결된다. 중립적이거나 편향되지 않은 결과를 얻기 위해서는 audit trail이나 audit process가 활용될 수도 있다. Y의 연구에서 Kübler-Ross’s가 활용한 불분명한 용어들이 연구자가 새롭지만 유용한 조작적 정의를 만드는데 방해가 될 수 있다. auditor로 하여금 이러한 정의를 살펴보게 하는 것은 사전에 정의된 카테고리의 정확성을 더 높여줄 수 있다.


The directed approach does present challenges to the naturalistic paradigm. Using theory has some inherent limitations in that researchers approach the data with an informed but, nonetheless, strong bias. Hence, researchers might be more likely to find evidence that is supportive rather than nonsupportive of a theory. Second, in answering the probe questions, some participants might get cues to answer in a certain way or agree with the questions to please researchers. In Researcher Y’s study, some patients might agree with the suggested emotional stages even though they did not experience the emotion. Third, an overemphasis on the theory can blind researchers to contextual aspects of the phenomenon. In Researcher Y’s study, the emphasis on Kübler-Ross’s (1969) stages of emotional response to loss might have clouded his ability to recognize contextual features that influence emotions. For example, the cross-sectional design of the study might have overemphasized current emotional reactions. These limitations are related to neutrality or confirmability of trustworthiness as the parallel concept to objectivity (Lincoln & Guba, 1985). To achieve neutral or unbiased results, an audit trail and audit process can be used. In Researcher Y’s study, the vague terminology used in Kübler-Ross’s description of the model would be a challenge for the researcher in creating useful operational definitions. Having an auditor review and examine these definitions before the study could greatly increase the accuracy of predetermined categories.





SUMMATIVE CONTENT ANALYSIS

전형적으로, summative접근법을 사용한 분석은 특정 단어나 내용이 맥락상 어떻게 사용되었는가를 이해하기 위하여 그 단어들을 찾고, 수량화하는 작업으로부터 시작된다. 이러한 수량화는 의미를 추론하기 위한 것이라기보다는 용법을 찾아내기 위한 것이다. 특정 단어나 내용이 텍스트상에서 어떻게 나타나는가를 보는 것은 'manifest content analysis'라고 할 수 있다. 만약 분석단계가 이 지점에서 멈춘다면, 이 분석은 정량적이고, 단어나 내용에 빈도에 초점을 두는 연구라고 할 수 있다. 질적내용분석의 summative접근법은 단순히 단어 숫자를 세는데서 그치는 것이 아니다. 'latent content analysis'는 내용의 해석과정을 의미한다. 이 분석을 통해서 단어나 내용이 함축하고 있는 의미에 초점을 두게 된다. Z의 연구에서 초반의 분석은 사망/죽음/죽기 등과 같은 단어의 빈도를 세는 것이며, 정량적 접근법에 가깝다. 그러나 Z는 직접적 혹은 완곡한 어법으로 사용되는 식의 죽음'을 나타내는 다른 형태를 찾아내었다. Z는 질적내용분석의 summative접근법을 활용했다고 할 수 있다.

Typically, a study using a summative approach to qualitative content analysis starts with identifying and quantifying certain words or content in text with the purpose of understanding the contextual use of the words or content (Table 3). This quantification is an attempt not to infer meaning but, rather, to explore usage. Analyzing for the appearance of a particular word or content in textual material is referred to as manifest content analysis (Potter & Levine-Donnerstein, 1999). If the analysis stopped at this point, the analysis would be quantitative, focusing on counting the frequency of specific words or content (Kondracki &Wellman, 2002). A summative approach to qualitative content analysis goes beyond mere word counts to include latent content analysis. Latent content analysis refers to the process of interpretation of content (Holsti, 1969). In this analysis, the focus is on discovering underlying meanings of the words or the content (Babbie, 1992; Catanzaro, 1988; Morse&Field, 1995). In Researcher Z’s study, the initial part of the analysis technique, to count the frequency of death, die, and dying is more accurately viewed as a quantitative approach. However, Researcher Z went on to identify alternative terms for death and to examine the contexts within which direct versus euphemistic terms were used. Hence, Researcher Z used a summative approach to qualitative content analysis.


특정 저널이나 교과서의 특정 내용이 어떤 종류가 있는가를 분석하는 논문 등에서 이러한 내용분석 접근법을 활용한 연구가 진행되곤 한다. 예를 들면, 의학서적에서 EOL(End-Of-Life)케어에 대한 내용을 다룬다고 하자.중환자간호학의 EOL케어, 완화의료의 EOL케어, 죽음과 사별에서의 EOL케어 등등이 있다. 이러한 연구자들은 특정 토픽을 다루고 있는 페이지가 몇 쪽인지 센 다음 내용을 분석하여 그 내용의 질을 평가한다. 같은 연구프로젝트 내에서 내용분석의 결과를 서로 비교할 수도 있어서, 예를 들면 참여자의 사회경제적 지표에 따른 다양한 텔레비전 프로그램 선호도를 비교할 수도 있다.

Researchers report using content analysis from this approach in studies that analyze manuscript types in a particular journal or specific content in textbooks. Examples include studies examining content related to EOL care in medical textbooks (Rabow, Hardie, Fair, & McPhee, 2000), EOL care in critical care nursing textbooks (Kirchhoff, Beckstrand, & Anumandla, 2003), palliative care in nursing textbooks (Ferrell, Virani, Grant, & Juarez, 2000), death and bereavement in nursing textbooks (Ferrell, Virani, Grant, & Borneman, 1999), and spirituality in nursing textbooks (McEwen, 2004). These researchers started with counting the pages that covered specific topics followed by descriptions and interpretations of the content, including evaluating the quality of the content. Others have compared the results of a content analysis with other data collected within the same research project, such as comparing preferences for various types of television programming with socioeconomic indicators of participants (Krippendorff, 1980).


질적내용분석을 summative하게 접근할 때, 자료분석은 특정 단어가 얼마나 자주 등장하는지를 먼저 세게 된다. 단어의 빈도를 계산할 때에는 그 출처도 같이 기록한다. Z는 '죽음'을 의미하는 단어의 빈도를 알고 싶었지만, 명시적으로 또는 완곡하게 그 단어를 사용할 때 그 아래 깔린 맥락도 알고 싶었다. 그래서 화자(환자 또는 의사)에 따라서 그러한 용례가 어떻게 다른지, 의사의 전공과목에 따라서 어떻게 다른지, 환자의 연력에 따라 어떻게 다른가를 보았다. 데이터의 패턴을 찾아내고 코드를 contextualize하기 위해서 counting이 활용될 수 있다. Context를 그 단어가 사용된 상황과 연관시켜서 해석할 수 있게 해준다. 단어의 사용에 대해서 찾아내고 일상적 상황에서 한 단어가 가질 수 있는 의미의 범위를 찾고자 이러한 접근법을 시도한다.

In a summative approach to qualitative content analysis, data analysis begins with searches for occurrences of the identified words by hand or by computer.Word frequency counts for each identified term are calculated, with source or speaker also identified. Researcher Z wanted to know the frequency of words that were used to refer to death but also to understand the underlying contexts for the use of explicit versus euphemistic terms. He or she illuminated the context of euphemistic versus explicit terms by reporting how their usage differed by variables such as the speaker (patient versus clinician), the clinician’s specialization, and the age of the patient. Counting is used to identify patterns in the data and to contextualize the codes (Morgan, 1993). It allows for interpretation of the context associated with the use of the word or phrase. Researchers try to explore word usage or discover the range of meanings that a word can have in normal use.


summative접근법은 몇 가지 장점을 가진다. 우선 이것은 현상을 연구하는 unobtrusive and nonreactive way이다. 어떻게 단어가 실제로 사용되는가에 대한 기본적 통찰을 제공해줄 수 있다. 그러나 이러한 방법에서 얻어진 결과는 자료에서 나타나는 더 넓은 의미에 신경을 덜 쓴다는 점에서 한계를 갖는다. 신뢰성의 근거 차원에서 이런 종류의 연구는 credibility에 의존하게 된다. credibility 또는 내적일관성을 갖기 위해서는 일관된 해석을 하였다는 텍스트적 근거를 보여줘야 한다. Z의 연구에서는 내용 전문가가 어떤 단어가 '죽음'이란 단어를 대체했는지를 validation하는 과정을 활용하였다. 혹은 연구자들은 참가자들로 하여금 의도한 의미가 잘 나타나는지 검토하게 할 수도 있다.

A summative approach to qualitative content analysis has certain advantages. It is an unobtrusive and nonreactive way to study the phenomenon of interest (Babbie, 1992). It can provide basic insights into how words are actually used. However, the findings from this approach are limited by their inattention to the broader meanings present in the data. As evidence of trustworthiness, this type of study relies on credibility.A mechanism to demonstrate credibility or internal consistency is to show that the textual evidence is consistent with the interpretation (Weber, 1990). For Researcher Z’s study, validation by content experts on what terms are used to replace the death terms would be essential. Alternatively, researchers can check with their participants as to their intended meaning through the process of member check (Lincoln & Guba, 1985).



SUMMARY OF KEY ASPECTS

질적내용분석의 모든 접근법은 분석의 전통적 일곱 단계를 필요로 한다. 

All approaches to qualitative content analysis require a similar analytical process of seven classic steps, including 

    • formulating the research questions to be answered, 
    • selecting the sample to be analyzed, 
    • defining the categories to be applied, 
    • outlining the coding process and the coder training, 
    • implementing the coding process, 
    • determining trustworthiness, and 
    • analyzing the results of the coding process (Kaid, 1989).

우리는 어떻게 이러한 절차가 특정 내용분석 접근법에 따라 다를 수 있는가를 살펴보았다. 성공적인 내용분석을 위해서는 코딩과정이 매우 중요하다. 내용분석에서의 기본적인 코딩절차는 방대한 텍스트를 훨씬 적은 내용 카테고리로 줄이는 것이다. 카테고리는 텍스트에서 직접적으로 드러나거나 분석을 통해서 나타나는 패턴이나 주제이다. 이후에 카테고리간 관계를 찾게 된다. 코딩 과정에서 연구자들은 코딩작업자들이 내용을 분석할 때 판단을 내릴 수 있게 코딩스킴을 개발하게 된다. 코딩스킴은 데이터를 카테고리로 정리하기 위한 '변역도구'라고 할 수 있다. 코딩스킴은 총체적/논리적/과학적으로 데이터분석의 절차와 법칙을 담고 있어야 한다. 좋은 코딩스킴을 개발하는 것은 내용분석연구의 신뢰성을 높이는데 있어서 핵심이라고 할 수 있다.

We have outlined how this process differs depending on the specific content analysis approach used. The success of a content analysis depends greatly on the coding process. The basic coding process in content analysis is to organize large quantities of text into much fewer content categories (Weber, 1990). Categories are patterns or themes that are directly expressed in the text or are derived from them through analysis. Then, relationships among categories are identified. In the coding process, researchers using content analysis create or develop a coding scheme to guide coders to make decisions in the analysis of content. A coding scheme is a translation device that organizes data into categories (Poole & Folger, 1981). A coding scheme includes the process and rules of data analysis that are systematic, logical, and scientific. The development of a good coding scheme is central to trustworthiness in research using content analysis (Folger, Hewes, & Poole, 1984).



세 가지 방법의 핵심 차이점은 어떻게 초기 코드가 개발되는가이다. 

    • Conventional에서는 카테고리는 데이터분석과정을 통해서 만들어진다. 이러한 접근을 통해서 연구자는 현상에 대한 더 풍요로운 이해가 가능하다. 
    • Directed에서는 연구자는 데이터분석에 앞서서 기존의 이론이나 이전 연구를 통해서 초기코딩스킴을 개발한다. 분석이 진행되면서 추가적인 코드가 개발될 수도 있고, 기존의 코딩스킴이 개정되거나 정교화될 수도 잇다. Directed를 사용하는 연구자들은 기존의 이론을 효과적으로 확장하거나 정제할 수 있다. 
    • Summative에서는 내용분석은 기본적으로 앞선 두 방법과 다른데, 자료를 전체로서 분석하기보다는 특정 내용과의 관계속에서 하나의 단어로서 텍스트를 바라본다. 패턴의 분석을 통해서 특정 단어나 내용의 맥락적 의미를 해석해내는 것이다. 

Key differences among conventional, directed, and summative approaches to content analysis center on how initial codes are developed. In a conventional content analysis, categories are derived from data during data analysis. The researcher is usually able to gain a richer understanding of a phenomenon with this approach. With a directed content analysis, the researcher uses existing theory or prior research to develop the initial coding scheme prior to beginning to analyze the data (Kyngas &Vanhanen, 1999). As analysis proceeds, additional codes are developed, and the initial coding scheme is revised and refined. Researchers employing a directed approach can efficiently extend or refine existing theory. The summative approach to content analysis is fundamentally different from the prior two approaches. Rather than analyzing the data as a whole, the text is often approached as single words or in relation to particular content. An analysis of the patterns leads to an interpretation of the contextual meaning of specific terms or content (Table 4).





 2005 Nov;15(9):1277-88.

Three approaches to qualitative content analysis.

Abstract

Content analysis is a widely used qualitative research technique. Rather than being a single method, current applications of content analysis show three distinct approaches: conventional, directed, or summative. All three approaches are used to interpret meaning from the content of text data and, hence, adhere to the naturalistic paradigm. The major differences among the approaches are coding schemes, origins of codes, and threats to trustworthiness. In conventional content analysis, coding categories are derived directly from the text data. With a directed approach, analysis starts with a theory or relevant research findings as guidance for initial codes. A summative content analysis involves counting and comparisons, usually of keywords or content, followed by the interpretation of the underlying context. The authors delineate analytic procedures specific to each approach and techniques addressing trustworthiness with hypothetical examples drawn from the area of end-of-life care.

PMID:

 

16204405

 

[PubMed - indexed for MEDLINE]




질적내용분석

Qualitative Content Analysis

Philipp Mayring

Forum Qualitative Sozialforschung / Forum: Qualitative Social Research, Vol 1, No 2 (2000)



1. Introduction

여기서 다루고자 하는 질적내용분석은 우리가 약 20년전 실직자들의 정신사회적 영향에 대한 종단연구를 개발하면서 활용한 여러가지 총합적 텍스트분석 기술을 다루고 있다. 약 600개의 개방형 인터뷰를 수행하면서, 2만페이지 이상의 기록물을 가지고 질적 분석을 했다.

The qualitative content analysis (MAYRING 1983; 7th edition 2000), as it is presented here, consists in a bundle of techniques for systematic text analysis which we developed ca. 20 years ago in a longitudinal study about psycho-social consequences of unemployment (ULICH, HAUSSER, MAYRING et al. 1985). Conducting about 600 open-ended interviews we received more than 20.000 pages of transcripts which had to be analyzed in a qualitative oriented way. [1]


이 분석과정의 핵심 아이디어는 의사소통과학 분야에서 개발된 양적내용분석의 장점을 보존하면서, 질적-해석적 분석단계로 끌고가는 것이다.

The main idea of the procedure of analysis is thereby, to preserve the advantages of quantitative content analysis as developed within communication science and to transfer and further develop them to qualitative-interpretative steps of analysis. [2]


양석내용분석에 대한 더 많은 정보는 아래의 사이트를 참조하라

Further information to quantitative content analysis are available via the Internet at http://www.gsu.edu/~wwwcom/content.html [Broken link, FQS, December 2004], http://www.zuma-mannheim.de/research/en/methods/textanalysis/ [broken link, September 2002, FQS] or http://www.aber.ac.uk/media/Sections/textan01.html. [3]



모든 기록된 의사소통의 내용물은 질적내용분석의 대상이 될 수 있다. 내용분석은 드러난 내용만을 분석하는 것이 아니다. BECKER & LISSMANN은 내용을 다양한 수준으로 구분했는데, 주제와 핵심 아이디어를 주요내용(primary content)로, 컨택스트 정보를 잠재내용(latent content)로 구분하였다. 형식에 대한 분석도 내용분석의 목적이 될 수 있다. 아래에서 설명하는 것과 같이, 내용분석은 텍스트를 의사소통모델에 대입시키게 된다. KRIPPENDORFF의 표현을 빌리자면 내용분석은 "텍스트로부터 구체적인 추론을 하기 위한 재현가능하고 타당한 방법"이다.

The object of (qualitative) content analysis can be all sort of recorded communication (transcripts of interviews, discourses, protocols of observations, video tapes, documents ...). Content analysis analyzes not only the manifest content of the material—as its name may suggest. BECKER & LISSMANN (1973) have differentiated levels of content: themes and main ideas of the text as primary content; context information as latent content. The analysis of formal aspects of the material belongs to its aims as well. As outlined below content analysis embeds the text into a model of communication within which it defines the aims of analysis. This is expressed by KRIPPENDORFF, who defines "content analysis as the use of replicable and valid method for making specific inferences from text to other states or properties of its source" (KRIPPENDORFF 1969, p.103). [4]


이러한 점에서 질적내용분석은 무분별한 정량화를 하지 않고 내용분석의 규칙과 단계별 모델을 따라가는 잘 통제된 실질적/방법론적 텍스트 분석 접근법이다.

Qualitative content analysis defines itself within this framework as an approach of empirical, methodological controlled analysis of texts within their context of communication, following content analytical rules and step by step models, without rash quantification. [5]



2. History of Content Analysis

역사적 배경은 다음과 같다.

We can distinguish different phases in the historical background of content analysis (cf. MERTEN 1983; KRIPPENDORFF 1980; MAYRING 1994a): 


  • Precursors: We find different approaches to analysis and comparison of texts in hermeneutic contexts (e.g. bible interpretations) early newspaper analysis, graphological procedures, up to the dream analysis by Sigmund FREUD.
  • Communication theoretical foundation: The basis of quantitative content analysis had been laid by Paul F. LAZARSFELD and Harold D. LASSWELL in USA during he 20ies and 30ies of 20th century. The first textbook about this method had been published (BERELSON 1952).
  • Interdisciplinary broadening and differentiation: In the sixties of 20th century the methodological approach found its way into linguistics, psychology (cf. RUST 1983), sociology, history, arts etc. The procedures had been refined (fitting into different models of communication; analysis of non-verbal aspects, contingency analysis, computer applications) (cf. POOL 1959; GERBNER,HOLSTI, KRIPPENDORFF, PAISLEY & STONE 1969).
  • Phase of qualitative critics: Since the middle of 20th century objections were raised against a superficial analysis without respecting latent contents and contexts, working with simplifying and distorting quantification (KRACAUER 1952). In the following qualitative approaches to content analysis had been developed (RITSERT 1972; MOSTYN 1985; WITTKOWSKI 1994; ALTHEIDE 1996). [6]



3. Basic Ideas of Content Analysis

질적내용분석이 양적내용분석의 장점을 보존하면서 좀 더 질적인 텍스트에 대한 분석을 하고자 하는 것이라면, 양적내용분석의 장점은 무엇일까?

If we say, qualitative content analysis wants to preserve the advantages of quantitative content analysis for a more qualitative text interpretation, so what are those advantages? I want to emphasize four points:


  • Fitting the material into a model of communication: It should be determined on what part of the communication inferences shall be made, to aspects of the communicator (his experiences, opinions feelings), to the situation of text production, to the socio-cultural background, to the text itself or to the effect of the message.
  • Rules of analysis: The material is to be analyzed step by step, following rules of procedure, devising the material into content analytical units.
  • Categories in the center of analysis: The aspects of text interpretation, following the research questions, are putted into categories, which were carefully founded and revised within the process of analysis (feedback loops).
  • Criteria of reliability and validity: The procedure has the pretension to be intersubjectively comprehensible, to compare he results with other studies in the sense of triangulation and to carry out checks for reliability. For estimating the inter-coder reliability we use in qualitative content analysis (in contrary to quantitative content analysis) only trained members of the project team and we reduce the standard of coder agreement (COHENS Kappa over .7 would be sufficient). [7]


4. Procedures of Qualitative Content Analysis

전술된 양적내용분석의 요소들은 질적내용분석의 근본에 그대로 보존될 것이다. 우리는 여러가지의 질적내용분석 절차를 개발했는데, 아래의 두 가지가 핵심이라고 할 수 있다.

The above listed components of quantitative content analysis will be preserved to be the fundament for a qualitative oriented procedure of text interpretation. We developed a number of procedures of qualitative content analysis (cf. MAYRING 2000) amongst which two approaches are central: inductive category development and deductive category application. [8]


4.1 Inductive category development

전통적인 양적내용분석은, 카테고리가 어디서부터 만들어졌고 어떻게 카테고리 시스템이 만들어졌는지에 대한 답을 거의 주지 못했다. "어떻게 카테고리가 정의되는지는 사실상 '예술'의 영역이다. 이에 대해 알려진 바는 거의 없다"

Classical quantitative content analysis has few answers to the question from where the categories come, how the system of categories is developed: "How categories are defined ... is an art. Little is written about it" (KRIPPENDORF 1980, p.76). [9] 


그러나 질적내용분석에서는 이 것이 핵심이며, 카테고리가 되는 가장 원자료에 근접한 분석의 측면을 개발하고, 원자료를 기반으로 이것을 만드는 것이다. 이러한 관점에서 질적내용분석은 '귀납적카테고리개발'단계를 만들게 되었는데, 텍스트가공 절차를 통한 환원적 과정이라고 할 수 있다.

But within the framework of qualitative approaches it would be of central interest, to develop the aspects of interpretation, the categories, as near as possible to the material, to formulate them in terms of the material. For that scope qualitative content analysis has developed procedures of inductive category development, which are oriented to the reductive processes formulated within the psychology of text processing (cf. BALLSTAEDT, MANDL, SCHNOTZ & TERGAN 1981; van DIJK 1980). [10]





구체적인 단계들이 이 짧은 그림에 다 담길 수는 없다. 핵심 아이디어는 기존의 이론과 연구질문을 바탕으로 특정한 정의에 대한 준거를 만들고, 이를 통해서 원자료의 여러 측면을 고려하는 것이다. 카테고리는 잠정적인 것이며, 각 단계를 밟으면서 추론을 하게 된다. 피드백과정을 통해서 카테고리를 검토하고, 궁극적으로 주 카테고리의 신뢰도를 확인하게 된다. 만약 연구질문이 양적 측면을 다루고자 한다면(빈도) 이를 분석할 수도 있다.

The specific steps cannot be explained largely within this short overview. The main idea of the procedure is, to formulate a criterion of definition, derived from theoretical background and research question, which determines the aspects of the textual material taken into account. Following this criterion the material is worked through and categories are tentative and step by step deduced. Within a feedback loop those categories are revised, eventually reduced to main categories and checked in respect to their reliability. If the research question suggests quantitative aspects (e.g. frequencies of coded categories) can be analyzed. [12]


4.2 Deductive category application

연역적 카테고리 적용은 기존에 만들어진 이론을 가지고 하게 된다. 이 분석 방법은 각 카테고리를 텍스트의 어떤 구절에 대입시키는 방법론적으로 통제된 절차를 밟게 된다. 

Deductive category application works with prior formulated, theoretical derived aspects of analysis, bringing them in connection with the text. The qualitative step of analysis consists in a methodological controlled assignment of the category to a passage of text. Even if several procedures of text analysis are processing that step, it is poorly described. Here the step model within qualitative content analysis: [13]





여기서의 핵심은 각각의 카테고리에 대해서 분명한 정의, 예시, 코딩규칙을 정하는 것이다. 이를 통해서 정확히 어떤 텍스트가 그 카테고리로 분류될 수 있는지를 결정할 수 있다. 이렇게 정의된 카테고리가 coding agenda에 같이 기록된다.

Then main idea here is to give explicit definitions, examples and coding rules for each deductive category, determining exactly under what circumstances a text passage can be coded with a category. Those category definitions are putted together within a coding agenda. [15]





카테고리 정의, 전형적 문구, 각 카테고리를 구분하는 법 등이 이론과 자료에 따라 만들어져야 하며, 분석 과정에서 계속 교정되게 된다.

Category definitions, prototypical text passages, and rules for distinguishing different categories were formulated in respect to theory and material, are completed step by step, and are revised with the process of analysis. [17]


5. Computer Programs for Support of Qualitative Content Analysis

몇 가지 컴퓨터 프로그램들이 개발되었다.

Especially within the last years several computer programs had been developed within the framework of qualitative analysis to support (not to replace) steps of text interpretation (cf. HUBER 1992; WEITZMAN & MILES 1995; MAYRING 1996; FIELDING & LEE 1998). The computer plays here a triple role:

    • He works as assistant, supporting and making easier the steps of text analysis on screen (working through the material, underlining, writing marginal notes, defining category definitions and coding rules, recording comments on the material ...). He offers helpful tools handling the text (searching, jumping to different passages, collecting and editing passages ...).
    • He works as documentation center, recording all steps of analysis of all interpreters, making the analysis comprehensible and replicable (e.g. to trace back in the material causes of non-reliabilities between two coders).
    • He offers links to quantitative analysis (often already implemented within the program), e.g. to compare frequencies of categories, without the dangers of errors in data transfer by hand to another computer program. [18]


Working with qualitative content analysis two computer programs had especially proved it's worth, ATLAS/ti and winMAX, which both are available in free demo-versions (http://www.atlasti.de and http://www.winmax.de). [19]


6. Examples of Projects Working with Qualitative Content Analysis

To demonstrate the possibilities of qualitative content analysis we want to give some short examples of research projects working with the above explicated procedures:


7. Discussion

Communication science의 장점을 보존하면서 질적인 절차를 개발했다.

With the qualitative content analysis we wanted to describe procedures of systematic text analysis, which try to preserve the strengths of content analysis in communication science (theory reference, step models, model of communication, category leaded, criteria of validity and reliability) to develop qualitative procedures (inductive category development, summarizing, context analysis, deductive category application) which are methodological controlled. Those procedures allow a connection to quantitative steps of analysis if it seems meaningful for the analyst. [26]


질적내용분석은 다음과 같은 경우에 적절하지 않을 수 있다.

The procedures of qualitative content analysis seem less appropriate,

  • 연구질문이 지나치게 개방적이거나, 탐색적이거나, 다양하거나, 카테고리를 두고 작업하는 것이 제한이 될 때
  • 계획에 따른 단계별 분석절차보다는 holistic한 분석을 하고자 할 때
  • if the research question is highly open-ended, explorative, variable and working with categories would be a restriction, or
  • if a more holistic, not step-by-step ongoing of analysis is planned. [27]

질적내용분석은 다른 질적 연구방법과 함께 이용될 수도 있다. 연구질문이 어떤 연구방법을 주로 사용할 것인가의 판단근거가 될 수 있으며, 구체적인 내용 측면에 관해서 질문에 대한 논의가 필요하다.

On the other hand qualitative content analysis can be combined with other qualitative procedures. The research question and the characteristics of the material should have the priority in the decision about adapted methods. So it would be in my opinion better to discuss questions about methods in respect to specific content areas (cf. coping of illness MAYRING 1994b; emotion research SCHMITT & MAYRING 2000) and then to compare different methodological approaches (quantitative approaches as well). [28]




Qualitative Content Analysis

Philipp Mayring

Abstract: The article describes an approach of systematic, rule guided qualitative text analysis, which tries to preserve some methodological strengths of quantitative content analysis and widen them to a concept of qualitative procedure.

First the development of content analysis is delineated and the basic principles are explained (units of analysis, step models, working with categories, validity and reliability). Then the central procedures of qualitative content analysis, inductive development of categories and deductive application of categories, are worked out. The possibilities of computer programs in supporting those qualitative steps of analysis are shown and the possibilities and limits of the approach are discussed.

Key wordsqualitative content analysis, content analysis, category, induction, intercoder-reliability

질적내용분석의 연구절차

The qualitative content analysis process

Satu Elo & Helvi Kyngas



What is already known about this topic

    • 내용분석은 간호학의 많은 연구분야에서 사용되고 있으며, 긴 역사를 가지고 있다. 그러나 그 활용에 대해서는 별로 논의된 바가 없다.
    • 내용분석은 질적 혹은 양적 데이터 모두에서 활용 가능하고, 귀납적 또는 연역적 방법으로 활용 가능하다.
    • 내용분석은 유연성이 높으며, 데이터분석을 위한 단순한 가이드라인이 존재하지 않다는 점이 연구자들을 어렵게 하는 부분이다.

• Content analysis is used in many studies in nursing and it has a long history, but there has been little discussion of its use.

• Content analysis may be used with either qualitative or quantitative data and in an inductive or deductive way.

• Content analysis is a flexible method and there are no simple guidelines for data analysis, which makes it challenging for the researcher.



What this paper adds

  • 내용분석은 간호학의 다양한 측면과 민감한 현상을 분석하기에 매우 적합한 도우이다.
  • 귀납적 내용분석은 기존에 해당 현상에 대해 연구된 바가 없거나, 지식이 분절되어 있는 경우에 유용하다.
  • 연역적 내용분석은 기존의 이론을 다양한 상황에서 검토해보기 위한 목적 또는 서로 다른 시점에서 카테고리를 비교해보기 위한 목적으로 적절하다.

• Content analysis is extremely well-suited to analysing data on the multifaceted, sensitive phenomena characteristic of nursing.

• The use of inductive content analysis is recommended when there are no previous studies dealing with the phenomenon or when knowledge is fragmented.

• A deductive approach is useful if the aim is to test an earlier theory in a different situation or to compare categories at different time periods.




Introduction

질적자료를 분석하는 접근방법은 다양하다. 내용분석은 간호학의 다양한 연구에서 사용된 바 있으며 그 역사가 길다. 비록 질적내용분석이 간호학에서 많이 사용되어왔지만, 어떻게 이 방법을 적용할 것인가에 대한 연구는 거의 없다. CINAHL이나 Ovid Medline에서 자료를 검색해본 결과 '내용분석'이 제목에 포함된 경우는 별로 없었다.

There are numerous approaches for analysing qualitative data. Content analysis is used in many studies in nursing and it has a long history. Even if qualitative content analysis is generally used in nursing studies little has been published on how to apply the method. Information retrieval on the CINAHL and Ovid Medline(r) databases showed that content analysis was often presented as a keyword but not so often in the title. Table 1 shows how the number of papers for which content analysis is given as a keyword has increased, and most of these (70%) have been published in the 21st century. The total number of methodological papers concerning content analysis [CINAHL and Ovid Medline(r) published from 1988 to 2005 was only 15 (Table 2)].





이 연구의 목적은 귀납적 그리고 연역적 내용분석 방법에 대해 묘사하고, 몇 가지 예시를 제시해보고자한다.

The aim of this paper was to describe inductive and deductive content analysis based on theoretical knowledge and to highlight some examples from studies using content analysis, mainly based on content analysis of the methodological papers listed in Table 1.






Background

내용분석은 글, 말, 시각적 의사소통 메시지 등을 분석하는 방법이다. 처음에는 찬송가, 신문, 잡지기사, 광고 등을 분석하기 위한 목적으로 19세기에 많이 사용되었다. 이후에는 의사소통, 저널리즘, 사회학, 심리학, 경영학 등에서도 많이 사용되어왔으며, 지난 20년간 지속적인 증가가 있어왔다. 간호학에서는 주로 정신과학, 노인의학, 공공보건 연구에서 많이 사용된다.

Content analysis is a method of analysing written, verbal or visual communication messages (Cole 1988). It was first used as a method for analysing hymns, newspaper and magazine articles, advertisements and political speeches in the 19th century (Harwood & Garry 2003). Today, content analysis has a long history of use in communication, journalism, sociology, psychology and business, and during the last few decades its use has shown steady growth (Neundorf 2002). In nursing it is mostly used in psychiatry, gerontological and public health studies (Table 1).





연구방법으로서의 내용분석은 현상을 수량화하는 데 있어서 총체적이면서 객관적인 방법이다. 문서를 분석하는 방법이기도 하다. 내용분석을 통해 연구자들은 이론적인 이슈들을 검증하고, 자료에 대한 이해를 높을 수 있다. 내용분석을 통해서 단어들을 더 적은 수의 카테고리로 묶을 수 있다. 질적연구에서는 같은 카테고리로 분류된 단어, 구 등은 같은 의미를 같는다고 가정한다.

Content analysis as a research method is a systematic and objective means of describing and quantifying phenomena (Krippendorff 1980, Downe-Wamboldt 1992, Sandelowski 1995). It is also known as a method of analysing documents. Content analysis allows the researcher to test theoretical issues to enhance understanding of the data. Through content analysis, it is possible to distil words into fewer content-related categories. It is assumed that when classified into the same categories, words, phrases and the like share the same meaning (Cavanagh 1997).


내용분석은 자료로부터 재현가능하고 타당한 추론을 이끌어내는 연구방법이며, 지식과 통찰력을 주고 사실을 새로운 관점에서 보여주고 실질적인 행동지침을 준다. 현상에 대한 고밀도의 광범위한 묘사를 얻어내기 위한 목적이 있으며, 분석의 결과는 그 현상을 묘사하는 개념 또는 카테고리가 된다. 이러한 개념 또는 카테고리의 목적은 모델이나, 개념틀, 개념지도, 카테고리를 만들기 위함이다. 연구자들은 '개념'또는 '카테고리' 중 한 가지를 선택하게 되는데, 예를 들어서 어떤 연구가 이론을 개발하기 위한 것이라면 이 때는 '개념'이란 단어가 더 선호된다. 그러나 여기서는 우리는 '카테고리'라는 단어를사용하고자 한다.

Content analysis is a research method for making replicable and valid inferences from data to their context, with the purpose of providing knowledge, new insights, a representation of facts and a practical guide to action (Krippendorff 1980). The aim is to attain a condensed and broad description of the phenomenon, and the outcome of the analysis is concepts or categories describing the phenomenon. Usually the purpose of those concepts or categories is to build up a model, conceptual system, conceptual map or categories. The researcher makes a choice between the terms ‘concept’ and ‘category’ and uses one or the other (Kyngäs & Vanhanen 1999). For example, if the purpose of the study is to develop a theory, it is recommended that the term ‘concept’ be used as a proxy for ‘category’. However, in this paper, when describing the analysis process, we use the term ‘category’ because this is mostly used in literature.


양적연구에 종사하는 연구자들로부터 비판을 받는 지점은, 이 방법이 복잡한 통계적 분석을 피해가는 단순화 기술이라는 점이다. 또한 어떤 연구자들은 내용분석이 충분히 '질적(qualitative)'이지 못한다고 지적하기도 한다. 초창기에는 내용분석에 대한 논쟁이 이것이 양적연구방법이냐 질적연구방법이냐에 머물렀다. Weber는 분석의 기술이 충분치 못하다면 어떤 방법을 쓰더라도 단순화된 결과만을 얻을 것이라고 지적한다. 사실상 이 방법은 연구자들이 얼만큼 복잡하게 분석을 수행할 것인가에 그 복잡성 수준이 달려있다고 봐도 과언이 아니다.

The method found its critics in the quantitative field, who considered it to be a simplistic technique that did not lend itself to detailed statistical analysis, while others considered that content analysis was not sufficiently qualitative in nature (Morgan 1993). In the early days, the differentiation of content analysis was limited to classifying it primarily as a qualitative vs. quantitative research method (Hsieh & Shannon 2005). According to Weber (1990), it is possible to attain simplistic results by using any method whatsoever if skills of analysis are lacking. The truth is that this method is as easy or as difficult as the researcher determines it to be (Neundorf 2002).


그러나 이러한 비판에도 불구하고, 내용분석은 간호학 연구를 비롯한 다른 연구분야에서 몇 가지 주요한 장점을 바탕으로 확고히 자리를 잡아가기 시작했다. 그 장점 중 하나는 이것이 내용-민감한(content sensitive) 방법이라는 것이며, 다른 하나는 연구설계 측면에서 유연성이 높다는 것이다. 데이터의 단순한 묘사나 숫자세기에 불과한 수준의 결과만을 얻을 수 있는 별거 아닌 기술이 아니다. 내용분석은 의사소통의 의미를 이해하기 위하여 사용될 수도 있고, 결정적 절차가 무엇인지 알아내기 위해서 사용될 수도 있다. 의미, 의도, 결과, 맥락이 중요한 방법이기도 하다.

Despite criticism, content analysis has an established position in nursing research and offers researchers several major benefits. One of these is that it is a content-sensitive method (Krippendorff 1980), and another is its flexibility in terms of research design (Harwood & Garry 2003). It is also much more than a naive technique that results in a simplistic description of data (Cavanagh 1997) or a counting game (Downe-Wamboldt 1992). Concept analysis can be used to develop an understanding of the meaning of communication (Cavanagh 1997) and to identify critical processes (Lederman 1991). It is concerned with meanings, intentions, consequences and context (Downe-Wamboldt 1992).



Process of analysis

두 가지 방법 Two approaches

내용분석은 질적, 양적 자료 모두를 가지고 사용할 수 있다. 또한 연역적 방법과 귀납적 방법이 모두 가능하다. 기존의 지식이 충분치 않거나, 기존의 지식이 분절화되어있다면 귀납적 방법이 권장된다. 귀납적 방법에서는 카테고리를 만들어낸다. 연역적 방법은 분석의 구조가 조작화되어있을 때 사용할 수 있으며, 기존의 지식을 바탕으로 하거나 기존의 이론을 검증하는 방법이 될 수 있다. 귀납적 접근법은 구체적인 것에서 일반적인 것으로 자료를 만들어나가는 것이며, 연역적 접근법은 기존의 모델로부터 출발하므로 일반적인 것에서 구체적인 것으로 진행하게 된다. 이 두 가지는 모두 비슷한 준비과정을 거친다.

Content analysis is a method that may be used with either qualitative or quantitative data; furthermore, it may be used in an inductive or deductive way. Which of these is used is determined by the purpose of the study. If there is not enough former knowledge about the phenomenon or if this knowledge is fragmented, the inductive approach is recommended (Lauri & Kyngäs 2005). The categories are derived from the data in inductive content analysis. Deductive content analysis is used when the structure of analysis is operationalized on the basis of previous knowledge and the purpose of the study is theory testing (Kyngäs & Vanhanen 1999). An approach based on inductive data moves from the specific to the general, so that particular instances are observed and then combined into a larger whole or general statement (Chinn & Kramer 1999). A deductive approach is based on an earlier theory or model and therefore it moves from the general to the specific (Burns & Grove 2005). These approaches have similar preparation phases.


준비과정 Preparation phase

귀납적 방법과 연역적 방법 모두 준비-조직화-보고의 세 단계를 거친다. 그럼에도 불구하고, 분석에 대해서는 어떤 총체적인 규칙이 있지는 않다. 모든 내용분석의 핵심 특징은 기존의 모든 단어들이 훨신 작은 내용카테고리로 분류가능하다는 것이다. 준비단계는 분석의 '단위'를 정하는 것부터 시작된다. 이것은 '단어' 또는 '주제'가 될 수 있다. 분석의 단위를 결정하기에 앞서서, 어떤 것을 분석할지를 결정하고 표본 수집시에 고려해야 할 사항을 결정하는 것이 중요하다. 표본은 모집단을 대표할 수 있어야 한다. 분석해야 할 문헌이 너무 방대하다면 확률표집 또는 판단표집이 필요하다.(probability or judgement sampling) 하나의 문장에 여러 개의 '의미 단위'가 있을 수도 있다. 따라서 '의미 단위'를 분석의 단위로 삼는 것은 분석과정을 더 어렵게 만들 수도 있다. 반대로 만약 분석의 단위가 너무 작아서, 예컨대 하나의 단어 단위라면, 분절화를 유발할 수도 있다. 연구질문에 따라서 분석의 단위는 글자, 단어, 문장, 한 페이지 내의 어떤 부분, 논의에 참여한 사람의 수, 논의가 진행된 시간 등등이 될 수 있다.

Both inductive and deductive analysis processes are represented as three main phases: preparation, organizing and reporting (Figure 1). Despite this, there are no systematic rules for analysing data; the key feature of all content analysis is that the many words of the text are classified into much smaller content categories (Weber 1990, Burnard 1996). The preparation phase starts with selecting the unit of analysis (McCain 1988, Cavanagh 1997, Guthrie et al. 2004). This can be a word or a theme (Polit & Beck 2004). Deciding on what to analyse in what detail and sampling considerations are important factors before selecting the unit of analysis (Cavanagh 1997). The sample must be representative of the universe from which it is drawn (Duncan 1989). Probability or judgement sampling is necessary when a document is too large to be analysed in its entirety (GAO 1996). A unit of meaning can consist of more than one sentence and contain several meanings. On that account, using it as a unit of analysis makes the analysis process difficult and challenging (Catanzaro 1988, Graneheim & Lundman 2004). On the other hand, an analysis unit that is too narrow, for example one word, may result in fragmentation (Graneheim & Lundman 2004). Depending on the research question, the unit of analysis can also be a letter, word, sentence, portion of pages or words, the number of participants in discussion or the time used for discussion (Robson 1993, Polit & Beck 2004).





Graneheim과 Lundman은 분석에 적합한 단위는 '그 자체로 온전하면서, 분석과정에서 하나의 의미단위로 기억할 수 있을 만큼 작은 것' 이 되어야 한다고 지적한다. 분석을 시작할 때, 연구자는 드러난 내용(manifest content)를 분석할 것인지 함축된 내용(latent content)를 분석할 것인지도 정해야 한다. 함축된 내용을 분석하는 목적은 침묵, 한숨, 웃음, 자세 등의 의미를 분석하는 것에 있다. 문서의 숨겨진 의미를 분석하는 것이 가능한가에 대한 논쟁이 있는데, 왜냐하면 그 과정에서 대개 '해석'이 개입되기 때문이다. Robson에 따르면 연구자들은 어떤 것을 분석할지 결정하는데 있어서 연구의 목적과 연구질문을 기준으로 판단해야 한다.

Graneheim and Lundman (2004) pointed out that the most suitable unit of analysis is whole interviews or observational protocols that are large enough to be considered as a whole and small enough to be kept in mind as a context for meaning unit during the analysis process. When starting the analysis, the researcher must also decide whether to analyse only the manifest content or the latent content as well. The aim with latent content is also to notice silence, sighs, laughter, posture etc. (Catanzaro 1988, Robson 1993, Morse 1994, Burns & Grove 2005). There has been some debate as to whether hidden meanings found in documents can be analysed, because their analysis usually involves interpretation. According to Robson (1993), researchers are guided by the aim and research question of the study in choosing the contents they analyse.


그 다음 분석 단계에서, 연구자들은 데이터를 살펴봄으로써(make sense of the data) 분석하려는 자료가 대략 어떤지 그 전체적인 감을 잡아야 한다. Dey에 따르면 자료를 읽을 때는 다음의 것을 고려해야 한다.

Next in the analytic process, the researcher strives to make sense of the data and to learn ‘what is going on’ (Morse & Field 1995) and obtain a sense of whole (Tesch 1990, Burnard 1991). According to Dey (1993), when reading the data the questions are:

      • who is telling?
      • where is this happening?
      • when did it happen?
      • what is happening?
      • why?

이 과정의 목적은 자료에 푹 빠지는 것이고(immersed), 이것이 자료를 수 차례 읽어야 하는 이유이기도 하다. 연구자가 자료에 완전히 익숙해지기 전에는 어떤 이론이나 통찰력도 생길 수 없다. 이러한 감을 잡은 뒤에 귀납적/연역적 분석이 진행된다.

 The aim is to become immersed in the data, which is why the written material is read through several times (Burnard 1991, Polit & Beck 2004). No insights or theories can spring forth from the data without the researcher becoming completely familiar with them (Polit & Beck 2004). After making sense of the data, analysis is conducted using an inductive or deductive approach (Kyngäs & Vanhanen 1999).



귀납적 내용분석 Inductive content analysis

귀납적 내용분석을 하기로 정하였다면, 그 다음단계는 질적 연구 자료를 정리하는 것이다. 이 과정은 개방코딩, 카테고리형성, 추상화 의 단계를 거친다. 개방코딩은 자료를 읽는 과정에서 노트를 하거나 제목을 다는 것이다. 자료를 반복해서 읽으면서 가능한 많은 제목과 필수항목을 메모하여 가능한 내용의 모든 부분을 묘사할 수 있어야 한다. 코딩시트의 메모로부터 제목을 끌어내고, 이 단계에서 카테고리를 자유럽게 생성한다.

If the researcher has chosen to use inductive content analysis, the next step is to organize the qualitative data. This process includes open coding, creating categories and abstraction. Open coding means that notes and headings are written in the text while reading it. The written material is read through again, and as many headings as necessary are written down in the margins to describe all aspects of the content (Burnard 1991, 1996, Hsieh & Shannon 2005). The headings are collected from the margins on to coding sheets (Cole 1988, Downe-Wamboldt 1992, Dey 1993) and categories are freely generated at this stage (Burnard 1991).


개방 코딩이 마무리되면, 카테고리의 목록을 더 높은 수준의 제목으로 그룹화한다. 이 그룹화의 목적은 유사하거나 서로 다른 카테고리들을 더 높은 차원의 카테고리로 묶어내는 것이다. 그러나 Dey는 카테고리를 만드는 것이 연관되어 보이는 관찰한 결과를 단순히 모아놓는 작업이 아니며, 이 과정은 자료를 특정 그룹의 '소유물'로 분류함으로서 이 그룹에 속한 것과 그렇지 않은 자료를 서로 비교하는 것이라 지적한다. 카테고리를 만드는 목적은 현상을 묘사할 수 있는 의미를 부여하고, 지식을 생성하기 위해 이해를 높이는 것이다. 귀납적 과정을 통해서 카테고리를 만들었다면 연구자는 그 결과를 해석해서 어떤 것들을 같은 카테고리로 묶을지 결정을 내려야 한다.

After this open coding, the lists of categories are grouped under higher order headings (McCain 1988, Burnard 1991). The aim of grouping data was to reduce the number of categories by collapsing those that are similar or dissimilar into broader higher order categories (Burnard 1991, Downe-Wamboldt 1992, Dey 1993). However, Dey (1993) points out that creating categories is not simply bringing together observations that are similar or related; instead, data are being classified as ‘belonging’ to a particular group and this implies a comparison between these data and other observations that do not belong to the same category. The purpose of creating categories is to provide a means of describing the phenomenon, to increase understanding and to generate knowledge (Cavanagh 1997). When formulating categories by inductive content analysis, the researcher comes to a decision, through interpretation, as to which things to put in the same category (Dey 1993).


'추상화'과정이란 카테고리를 형성해감으로써 연구주제의 일반적 기술을 만들어가는 것이다. 각각의 카테고리는 내용-특징을 나타내는 단어를 활용하여 이름을 붙일 수 있다. 비슷한 사건에 대한 하위 카테고리를 묶고 하위 카테고리를 묶어 주 카테고리로 만든다. 이 추상화 과정은 논리적인 절차를 거쳐 이 과정이 수행가능한 한 계속 진행된다. 

Abstraction means formulating a general description of the research topic through generating categories (Robson 1993, Burnard 1996, Polit & Beck 2004). Each category is named using content-characteristic words. Subcategories with similar events and incidents are grouped together as categories and categories are grouped as main categories (Dey 1993, Robson 1993, Kyngäs & Vanhanen 1999). The abstraction process continues as far as is reasonable and possible. An example of the abstraction process is shown in Figure 2. Inductive content analysis has been used, for example, in studies of the environment that supports well-being in older people (Juvani et al. 2005), support networks of adolescents with chronic disease (Kyngäs 2004) and men’s experiences of heart failure (Europe & Tyni-Lenne 2004).




연역적 내용분석 Deductive content analysis

연역적 내용분석은 기존의 이론을 새로운 맥락에서 검증해보고 싶을 때 활용할 수 있다. 카테고리에 대한 검증, 개념에 대한 검증, 모델이나 가설에 대한 검증 등이 모두 가능하다. 만약 연역적 내용분석을 하기로 결정하였다면, 그 다음 단계는 카테고리화 메트릭스를 만들고, 데이터를 이러한 카테고리에 맞게 코딩해넣는 것이다. 연역적 내용분석은 연구의 목적에 따라 구조화된 매트릭스를 사용할 수도 있고, 제한이 없는(unconstrained) 매트랙스를 사용할 수도 있다. 연역적 내용분석은 대개 그 내용에 대한 이론, 모델, 마인드맵, 리뷰문헌 등에 바탕을 둔다.

Deductive content analysis is often used in cases where the researcher wishes to retest existing data in a new context (Catanzaro 1988). This may also involve testing categories, concepts, models or hypotheses (Marshall & Rossman 1995). If a deductive content analysis is chosen, the next step is to develop a categorization matrix (Table 3) and to code the data according to the categories (Table 4). In deductive content analysis, either a structured or unconstrained matrix of analysis can be used, depending on the aim of the study (Kyngäs & Vanhanen 1999). It is generally based on earlier work such as theories, models, mind maps and literature reviews (Sandelowski 1995, Polit & Beck 2004, Hsieh & Shannon 2005).






카테고리화를 위한 메트릭스를 만들었다면, 모든 내용을 해당 카테고리에 코딩해야 한다. 비구조화(unconstrained)매트릭스의 경우, 귀납적 내용분석의 원칙을 따라서 서로 다른 카테고리들의 경계를 만들어낼 수 있다. 만약 매트릭스가 구조화되어 있다면, 분석매트릭스에 맞는 자료만 선택해서 넣는다. 구조화된 매트릭스를 사용할 경우 카테고리틀에 맞는 자료만 사용할 수도 있고 또는 그렇지 않은 자료까지도 사용할 수도 있다. 카테고리 프레임에 맞지 않는 것들은 귀납적 내용분석 방법을 통해 그 자체의 고유한 개념을 형성할 수도 있다.

After a categorization matrix has been developed, all the data are reviewed for content and coded for correspondence with or exemplification of the identified categories (Polit & Beck 2004). When using an unconstrained matrix, different categories are created within its bounds, following the principles of inductive content analysis. If the matrix is structured, only aspects that fit the matrix of analysis are chosen from the data (Patton 1990, Sandelowski 1993, 1995). This can also be called testing categories, concepts, models or hypotheses (Marshall & Rossman 1995). When using a structured matrix of analysis, it is possible to choose either only the aspects from the data that fit the categorization frame or, alternatively, to choose those that do not. In this way, aspects that do not fit the categorization frame can be used to create their own concepts, based on the principles of inductive content analysis.


어떤 방법을 선택할지는 연구의 목적에 따라 다르며, 만약 십대에서 당뇨라는 질환이 가지는 서로 다른 의미를 묘사하기 위한 연구라면 이를 류마티스 관절염을 가진 십대에 대한 연구틀로 활용해 볼 수 있다. 이러한 경우에 목적은 과연 당뇨병과 류마티스 관절염을 가진 10대에게 질병이 서로 동일한 의미를 갖는가를 검증하는 것이 될 수 있다. 

The choice of method depends on the aim of the study (Catanzaro 1988, Robson 1993, Marshall & Rossman 1995). For example, categories used to describe the different meanings that the concept of illness has for teenagers with diabetes could be used as a frame of categorization when analysing interviews with teenagers suffering from rheumatoid arthritis. In this case, the aim would be to test whether illness has the same meaning for teenagers suffering from rheumatoid arthritis as for those with diabetes (Kyngäs & Vanhanen 1999). Deductive content analysis has been used for example in studies of patients’ readiness for dietary change (Kasila et al. 2003), self-care of older people (Backman & Hentinen 2001) and mental health care (Latvala et al. 2000).



신뢰성 Trustworthiness

분석단계와 그 결과는 충분히 자세히 묘사되어야 하며, 이를 통해 독자들이 어떻게 분석이 행해졌고 그 장점과 한계점이 무엇인지 인식할 수 있게 해줘야 한다. 이를 위해서는 분석과정을 분석해야하며 결과의 타당도를 보장할 수 있다. 내용분석의 '타당도'는 다른 질적연구와 마찬가지로 분석 절차와 결과를 보고할 때 고려해야 할 다른 요소들이 있다.

The analysis process and the results should be described in sufficient detail so that readers have a clear understanding of how the analysis was carried out and its strengths and limitations (GAO 1996). This means dissection of the analysis process and the validity of results. Elements of validity in content analysis are universal to any qualitative research design there are additional factors to take into consideration when reporting the process of analysis and the results.


결과에서는 각 카테고리의 컨텐츠가 무엇인지 설명해야 한다. 즉, 각 카테고리의 의미와도 같다. 각 카테고리에 속하는 컨텐츠는 하위 카테고리를 묘사함으로써 가능하다. 카테고리를 만드는 것음 실질적이면서도 개념적인 과정으로서 카테고리는 개념적으로, 그리고 실질적으로(empirically) 근거가 있어야 한다. 성공적인 내용분석은 연구자들이 자료를 분석하고 단순화시켜서 그 연구의 주제를 높은 신뢰도로 카테고리화할 수 있어야 한다. 연구의 신뢰도는 카테고리가 그 자료를 얼마나 잘 포괄하는가에 달려있는 것이기도 하다.

The results are described contents of the categories, i.e. the meanings of the categories. The content of the categories is described through subcategories (Marshall & Rossman 1995). Creating categories is both an empirical and a conceptual challenge, as categories must be conceptually and empirically grounded (Dey 1993). Successful content analysis requires that the researcher can analyse and simplify the data and form categories that reflect the subject of study in a reliable manner (Kyngäs & Vanhanen 1999). Credibility of research findings also deals with how well the categories cover the data (Graneheim & Lundman 2004).


타당도와 신뢰도가 높은 자료르 수집하는 것도 연구를 방어(definsible)하는데 중요하다. 연구의 신뢰도를 높이기 위해서는 원 자료와 결과의 연관성을 보여줄 수 있어야 한다. 이것이 연구자들이 분석과정을 가급적 상세히 기술해야 하는 이유이기도 하다. 부록과 표를 활용하여 자료와 결과 사이의 연결고리를 보여줘야 한다. 다른 상황에 대한 적용가능성을 높이기 위해서는 맥락, 표본선정, 참가자의 특징, 자료수집과 분석과정 등을 명시해야 한다. 다른 사람이 연구 절차를 따라서 수행해볼 수 있도록 결과와 해석의 신뢰도를 위한 demonstration이 필요하다.

It is important to make defensible inferences based on the collection of valid and reliable data (Weber 1990). To increase the reliability of the study, it is necessary to demonstrate a link between the results and the data (Polit & Beck 2004). This is why the researcher must aim at describing the analysing process in as much detail as possible when reporting the results. Appendices and tables may be used to demonstrate links between the data and results. To facilitate transferability, the researcher should give a clear description of the context, selection and characteristics of participants, data collection and process of analysis (Graneheim & Lundman 2004). Demonstration is needed of the reliability of the findings and interpretations to enable someone else to follow the process and procedures of the inquiry.


원문을 인용하는 것(authentic citation)도 연구의 신뢰도를 높여주면서 독자들에게 어떻게 수집된, 어떠한 원본 자료로부터 결과가 나왔는자를 보여주는 방법이다. 연구자들은 정보원(informants)들에게 연구자들이 인용하는 문구로 인해서 신분이 드러나지 않는다는 것을 확실히 해 주어야 한다. 어느 정도까지 원문을 인용하는 것이 좋으냐에 대해서는 논쟁이 있지만, 우리의 경험상 저자가 작성한 문구(authorial text)보다 인용한 부분이 더 많으면 분석이 불완전하다고 볼 수 있다.

Authentic citations could also be used to increase the trustworthiness of the research and to point out to readers from where or from what kinds of original data categories are formulated (Patton 1990, Sandelowski 1993). The researcher should make sure that informants are not identified by quotes from the data (Ford & Reutter 1990). There has been some debate about the suitable amount of authentic citation. In our experience, if there are more citations than authorial text, then the analysis process is usually incomplete.


내용분석의 내적 타당도는 일치도계수를 이용하거나 안면타당도를 이용해서 평가할 수 있다. 그러나 일치도에 대해서는 다양한 의견이 있는데, 왜냐하면 각각의 연구자들이 주관적인 관점을 바탕으로 자료를 해석하고 공동연구자는 또 다른 해석을 할 수 있기 때문이다. 내용의 타당성을 높이기 위해서는 전문가 패널들이 개념형성, 코딩문제 등을 지원해줘야 한다. Granehein과 Lundman은 공동연구자들의 대화가 데이터를 명명(label)하는데 있어서 의견일치를 이루는 방법이라고 말한다.

The internal validity of content analysis can be assessed as face validity or by using agreement coefficients (Weber 1990). However, there are various opinions about seeking agreement (Graneheim & Lundman 2004), because each researcher interpret the data according to their subjective perspective and co-researchers could come up with an alternative interpretation (Sandelowski 1995). Content validation requires the use of a panel of experts to support concept production or coding issues. Graneheim and Lundman (2004) defend the value of dialogue among co-researchers to agree the way in which the data are labelled.



고찰 Discussion

내용분석은 순차적으로 순서적으로 진행되는 것은 아니며, 표준화가 덜 되어있어 양적분석보다 더 어려울 수 있다.데이터분석의 단순한 가이드라인은 없으며, 각각의 연구는 다 다르고, 그 결과는 기술/통찰력/분석능력/연구자의 스타일에 따라 달라진다. 내용분석을 할 때 어려운 점은 하나의 '옳은' 방법이 없다는 것이다. 연구자는 어떤 형태의 변형이 그 문제를 해결하는데 가장 적절한지 판단해야 하고, 이 과정때문에 분석이 더 어려워지기도 하지만 더 흥미진진해지기도 한다. 그 과정에서 엄청난 양의 일을 해야 하기도 한다.

Content analysis does not proceed in a linear fashion and is more complex and difficult than quantitative analysis because it is less standardized and formulaic (Polit & Beck 2004). There are no simple guidelines for data analysis: each inquiry is distinctive, and the results depend on the skills, insights, analytic abilities and style of the investigator (Hoskins & Mariano 2004). One challenge of content analysis is the fact that it is very flexible and there is no simple, ‘right’ way of doing it. Researchers must judge what variations are most appropriate for their particular problems (Weber 1990), and this makes the analysis process most challenging and interesting. An enormous amount of work is required during the process (Polit & Beck 2004).


분석과정은 문헌에서 별로 다뤄진 바가 없는데, 이는 아마도 과거에 내용분석이 지나치게 단순한 방법이라며 비판받았기 때문일 것이다. 내용분석을 할 때 가장 어려운 순간은 연구를 시작하는 순간이다. 연구자들은 각각의 인터뷰를 수 차례 읽고 필수적인 특징들을 잡아내야 하며, 분석적으로 앞으로 나아가는데 압박을 느끼지 않을 때까지 이 과정을 거쳐야 한다. 카테고리화의 초기 단계를 혼돈(chaotic)으로 표현하기도 하는데, 이 시점에서 다양한, 전혀 연결되지 않아 보이는, 정보의 조각을 가지고 시작하기 때문이다. 또 다른 문제점은 서사적 자료들이 일반적으로 순서적이지 않고, 인터뷰를 기록한 한 문단 내에서도 다양한 카테고리에 해당하는 내용을 포함하고 있기 때문이다. Glaser에 따르면 불확실성을 감내하는 것이 필요하며, 이 상황을 타개하기 위해서는 자료로 돌아가서 카테고리의 신뢰도를 확인하는 수 밖에 없다. 내용분석의 기본 가정은 연구자들을 잘못된 길로 이끌기 딱 좋으며, 분석과정에서 예측하지 못한 어려움에 마주할 가능성도 높다.

The analysis process has been little discussed in literature, possibly because content analysis has in the past been criticized for being an overly simple method. The most paralysing moment in conducting content analysis is simply getting started. Researchers should allow themselves simply to read through each interview as many times as necessary to apprehend its essential features, without feeling pressured to move forward analytically (Sandelowski 1995). They often see the beginning of the categorization phase as chaotic, because at that point they possess several, seemingly unconnected, pieces of information (Backman & Kyngäs 1998). Another problem may be that narrative material is generally not linear, and paragraphs from transcribed interviews may contain elements relating to several categories (Dey 1993, Polit & Beck 2004). According to Glaser (1978), tolerance of feeling uncertain is required. To resolve the situation, it is also necessary to be prepared to go back to the data to check the reliability of the categories. The assumption that content analysis is an easy method can mislead researchers, and unexpected difficulties may arise during the analysing process (Glaser 1978).


질적자료의 '질'과 무관하게 그 양 자체로도 어마어마하다. 얼마나 세세하게 다뤘느냐에 따라서 여섯 명의 면담에서 50에서100쪽까지의 기록물이 나올 수 있다. 수백페이지의 데이터를 보면서 연구자들은 이건 할 수 없겠다고 생각하게 된다. 또한 많은 연구와 관계 없는 흥미로운 지점들이 분석 과정에서 드러난다. 이 때 연구질문을 마음 속에 잘 품고 분석을 진행해야 한다. 혼돈의 한 중간에서 연구자는 연구 과업 그 자체로 돌아가야 하며, 관련성이 있는 분석단위에 집중해야 한다.

Regardless of the ‘quality’ of qualitative data, its sheer quantity can be daunting, if not overwhelming. Depending on the level of detail, six interviews may easily run to 50–100 single-spaced pages of transcribed text (Miles & Huberman 1994). Hundreds of pages of data can lead the researcher to think that it cannot be managed. In addition, many interesting points that are not related to the topic under study often come up when analysing the data. In that case, keeping the research question in mind is an essential aspect of content analysis. Even in the middle of chaos, the researcher must always be able to go back to the research tasks and only look for units of analysis that have relevance to them.


결과를 보고하고 발표하는 것도 쉽지 않다. 왜냐하면 연구 결과가 여러 절차를 걸쳐 나오기 때문이다. 연구자들은 내용분석을 어떻게 수행했는지 더 자세한 방법을 원하지만, 그 과정을 이미 수행한 연구자는 그 과정을 기술하는 것 자체가 얼마나 어려운지를 알고 있다. 이 과정의 일부 단계를 자세히 기술하는 것은 가능하지만, 다른 부분은 그렇지 않을 수 있다. 질적자료분석 프로그램이 내용분석을 더 손쉽게 만들어주며 새로운 분석단계를 도와준다.

Reporting the study and presenting its results can also be challenging, as the results are formed through a process comprising a number of phases. Researchers often wish for more detailed instructions on how to carry out content analysis, but those who have already gone through the process know that describing the analysis is often one of the most challenging phases of the study. It is possible to describe some parts of this process in great detail, but other parts – such as the researcher’s own actions and insights – may be difficult to put into words (Backman & Kyngäs 1998). Qualitative data analysis software programs can be used to make content analysis more manageable and ordered, and may facilitate new levels of analysis (Gerbic & Stacey 2005).


만약 질적자료가 너무 과도하게 압축되었다면, 서사의 integrity을 유지하지 못할 수 있다. 만약 그 결과가 충분한 발췌구문(excerpts) 없이 요약만 되어있다면 원본 데이터의 풍요로움이 소실될 수 있다. 저널의 분량 제한으로 인해서 질적연구 결과를 발표하는 것도 어려움이 생기기도 한다.

If qualitative data are compressed too much, the very point of maintaining the integrity of narrative materials during the analysis phase becomes lost. If the conclusions are merely summarized without including numerous supporting excerpts, the richness of the original data disappears. It is sometimes difficult to give a thorough presentation of the results of qualitative research in a format that is compatible with the space and word limitations in professional journals (Polit & Beck 2004).


내용분석을 통해 만들어진 연구결과가 종종 불완전한 분석절차를 거친 경우도 있다. 만약 연구자들이 자료를 충분히 추상화하지 않았거나 지나치게 많은 내용을 한 카테고리에 담는 다면 그럴 수 있다. 그러나 카테고리가 많은 것은 종종 더 이상 카테고리화 할수 없다는 신호가 되기도 한다. 만약 추상화 과정이 여전히 진행중이라면, 서로 상쇄시키지 못하는 카테고리를 포함하고 있을 수 있다. 추가적으로 데이터의 포화도가 불충분하면, 각각을 서로 연결시키기 어려울 수 있다.

Study results developed through content analysis often display signs of an incomplete analysing process. The researcher has not abstracted the data, or has included too many different things in a single category (Dey 1993, Hickey & Kipping 1996). However, an abundance of categories is usually a sign of being unable to categorize the data. When the abstracting process is still ongoing, the results may include categories that do not cancel each other out. In addition, when the saturation of the data is incomplete, it may be difficult to link data items to each other (Patton 1990, Cavanagh 1997). Seemingly simple study results are a sign of incomplete analysis (Weber 1990).



Conclusion

Content analysis is extremely well-suited to analysing the multifaceted, sensitive phenomena characteristic of nursing. An advantage of the method is that large volumes of textual data and different textual sources can be dealt with and used in corroborating evidence. Especially in nursing research, content analysis has been an important way of providing evidence for a phenomenon where the qualitative approach used to be the only way to do this, particularly for sensitive topics. The disadvantage of content analysis relates to research questions that are ambiguous or too extensive. In addition, excessive interpretation on the part of the researcher poses a threat to successful content analysis. However, this applies to all qualitative methods of analysis.


In nursing studies, deductive content analysis has been used less than inductive approach. It is likely that in the future, the use of deductive content analysis will become more common, because inductively built models or concept systems can be complemented, tested and developed further with the aid of deductive analysis.







The qualitative content analysis process

  1. Satu Elo1 and
  2. Helvi Kyngäs2

Article first published online: 18 MAR 2008

DOI: 10.1111/j.1365-2648.2007.04569.x

Journal of Advanced Nursing

Journal of Advanced Nursing

Volume 62Issue 1pages 107–115April 2008












Keywords:

  • concept formation;
  • content analysis;
  • deductive;
  • inductive;
  • nursing;
  • research methods

Abstract

Title. The qualitative content analysis process

Aim.  This paper is a description of inductive and deductive content analysis.

Background.  Content analysis is a method that may be used with either qualitative or quantitative data and in an inductive or deductive way. Qualitative content analysis is commonly used in nursing studies but little has been published on the analysis process and many research books generally only provide a short description of this method.

Discussion.  When using content analysis, the aim was to build a model to describe the phenomenon in a conceptual form. Both inductive and deductive analysis processes are represented as three main phases: preparation, organizing and reporting. The preparation phase is similar in both approaches. The concepts are derived from the data in inductive content analysis. Deductive content analysis is used when the structure of analysis is operationalized on the basis of previous knowledge.

Conclusion.  Inductive content analysis is used in cases where there are no previous studies dealing with the phenomenon or when it is fragmented. A deductive approach is useful if the general aim was to test a previous theory in a different situation or to compare categories at different time periods.






+ Recent posts