질적내용분석의 연구절차

The qualitative content analysis process

Satu Elo & Helvi Kyngas



What is already known about this topic

    • 내용분석은 간호학의 많은 연구분야에서 사용되고 있으며, 긴 역사를 가지고 있다. 그러나 그 활용에 대해서는 별로 논의된 바가 없다.
    • 내용분석은 질적 혹은 양적 데이터 모두에서 활용 가능하고, 귀납적 또는 연역적 방법으로 활용 가능하다.
    • 내용분석은 유연성이 높으며, 데이터분석을 위한 단순한 가이드라인이 존재하지 않다는 점이 연구자들을 어렵게 하는 부분이다.

• Content analysis is used in many studies in nursing and it has a long history, but there has been little discussion of its use.

• Content analysis may be used with either qualitative or quantitative data and in an inductive or deductive way.

• Content analysis is a flexible method and there are no simple guidelines for data analysis, which makes it challenging for the researcher.



What this paper adds

  • 내용분석은 간호학의 다양한 측면과 민감한 현상을 분석하기에 매우 적합한 도우이다.
  • 귀납적 내용분석은 기존에 해당 현상에 대해 연구된 바가 없거나, 지식이 분절되어 있는 경우에 유용하다.
  • 연역적 내용분석은 기존의 이론을 다양한 상황에서 검토해보기 위한 목적 또는 서로 다른 시점에서 카테고리를 비교해보기 위한 목적으로 적절하다.

• Content analysis is extremely well-suited to analysing data on the multifaceted, sensitive phenomena characteristic of nursing.

• The use of inductive content analysis is recommended when there are no previous studies dealing with the phenomenon or when knowledge is fragmented.

• A deductive approach is useful if the aim is to test an earlier theory in a different situation or to compare categories at different time periods.




Introduction

질적자료를 분석하는 접근방법은 다양하다. 내용분석은 간호학의 다양한 연구에서 사용된 바 있으며 그 역사가 길다. 비록 질적내용분석이 간호학에서 많이 사용되어왔지만, 어떻게 이 방법을 적용할 것인가에 대한 연구는 거의 없다. CINAHL이나 Ovid Medline에서 자료를 검색해본 결과 '내용분석'이 제목에 포함된 경우는 별로 없었다.

There are numerous approaches for analysing qualitative data. Content analysis is used in many studies in nursing and it has a long history. Even if qualitative content analysis is generally used in nursing studies little has been published on how to apply the method. Information retrieval on the CINAHL and Ovid Medline(r) databases showed that content analysis was often presented as a keyword but not so often in the title. Table 1 shows how the number of papers for which content analysis is given as a keyword has increased, and most of these (70%) have been published in the 21st century. The total number of methodological papers concerning content analysis [CINAHL and Ovid Medline(r) published from 1988 to 2005 was only 15 (Table 2)].





이 연구의 목적은 귀납적 그리고 연역적 내용분석 방법에 대해 묘사하고, 몇 가지 예시를 제시해보고자한다.

The aim of this paper was to describe inductive and deductive content analysis based on theoretical knowledge and to highlight some examples from studies using content analysis, mainly based on content analysis of the methodological papers listed in Table 1.






Background

내용분석은 글, 말, 시각적 의사소통 메시지 등을 분석하는 방법이다. 처음에는 찬송가, 신문, 잡지기사, 광고 등을 분석하기 위한 목적으로 19세기에 많이 사용되었다. 이후에는 의사소통, 저널리즘, 사회학, 심리학, 경영학 등에서도 많이 사용되어왔으며, 지난 20년간 지속적인 증가가 있어왔다. 간호학에서는 주로 정신과학, 노인의학, 공공보건 연구에서 많이 사용된다.

Content analysis is a method of analysing written, verbal or visual communication messages (Cole 1988). It was first used as a method for analysing hymns, newspaper and magazine articles, advertisements and political speeches in the 19th century (Harwood & Garry 2003). Today, content analysis has a long history of use in communication, journalism, sociology, psychology and business, and during the last few decades its use has shown steady growth (Neundorf 2002). In nursing it is mostly used in psychiatry, gerontological and public health studies (Table 1).





연구방법으로서의 내용분석은 현상을 수량화하는 데 있어서 총체적이면서 객관적인 방법이다. 문서를 분석하는 방법이기도 하다. 내용분석을 통해 연구자들은 이론적인 이슈들을 검증하고, 자료에 대한 이해를 높을 수 있다. 내용분석을 통해서 단어들을 더 적은 수의 카테고리로 묶을 수 있다. 질적연구에서는 같은 카테고리로 분류된 단어, 구 등은 같은 의미를 같는다고 가정한다.

Content analysis as a research method is a systematic and objective means of describing and quantifying phenomena (Krippendorff 1980, Downe-Wamboldt 1992, Sandelowski 1995). It is also known as a method of analysing documents. Content analysis allows the researcher to test theoretical issues to enhance understanding of the data. Through content analysis, it is possible to distil words into fewer content-related categories. It is assumed that when classified into the same categories, words, phrases and the like share the same meaning (Cavanagh 1997).


내용분석은 자료로부터 재현가능하고 타당한 추론을 이끌어내는 연구방법이며, 지식과 통찰력을 주고 사실을 새로운 관점에서 보여주고 실질적인 행동지침을 준다. 현상에 대한 고밀도의 광범위한 묘사를 얻어내기 위한 목적이 있으며, 분석의 결과는 그 현상을 묘사하는 개념 또는 카테고리가 된다. 이러한 개념 또는 카테고리의 목적은 모델이나, 개념틀, 개념지도, 카테고리를 만들기 위함이다. 연구자들은 '개념'또는 '카테고리' 중 한 가지를 선택하게 되는데, 예를 들어서 어떤 연구가 이론을 개발하기 위한 것이라면 이 때는 '개념'이란 단어가 더 선호된다. 그러나 여기서는 우리는 '카테고리'라는 단어를사용하고자 한다.

Content analysis is a research method for making replicable and valid inferences from data to their context, with the purpose of providing knowledge, new insights, a representation of facts and a practical guide to action (Krippendorff 1980). The aim is to attain a condensed and broad description of the phenomenon, and the outcome of the analysis is concepts or categories describing the phenomenon. Usually the purpose of those concepts or categories is to build up a model, conceptual system, conceptual map or categories. The researcher makes a choice between the terms ‘concept’ and ‘category’ and uses one or the other (Kyngäs & Vanhanen 1999). For example, if the purpose of the study is to develop a theory, it is recommended that the term ‘concept’ be used as a proxy for ‘category’. However, in this paper, when describing the analysis process, we use the term ‘category’ because this is mostly used in literature.


양적연구에 종사하는 연구자들로부터 비판을 받는 지점은, 이 방법이 복잡한 통계적 분석을 피해가는 단순화 기술이라는 점이다. 또한 어떤 연구자들은 내용분석이 충분히 '질적(qualitative)'이지 못한다고 지적하기도 한다. 초창기에는 내용분석에 대한 논쟁이 이것이 양적연구방법이냐 질적연구방법이냐에 머물렀다. Weber는 분석의 기술이 충분치 못하다면 어떤 방법을 쓰더라도 단순화된 결과만을 얻을 것이라고 지적한다. 사실상 이 방법은 연구자들이 얼만큼 복잡하게 분석을 수행할 것인가에 그 복잡성 수준이 달려있다고 봐도 과언이 아니다.

The method found its critics in the quantitative field, who considered it to be a simplistic technique that did not lend itself to detailed statistical analysis, while others considered that content analysis was not sufficiently qualitative in nature (Morgan 1993). In the early days, the differentiation of content analysis was limited to classifying it primarily as a qualitative vs. quantitative research method (Hsieh & Shannon 2005). According to Weber (1990), it is possible to attain simplistic results by using any method whatsoever if skills of analysis are lacking. The truth is that this method is as easy or as difficult as the researcher determines it to be (Neundorf 2002).


그러나 이러한 비판에도 불구하고, 내용분석은 간호학 연구를 비롯한 다른 연구분야에서 몇 가지 주요한 장점을 바탕으로 확고히 자리를 잡아가기 시작했다. 그 장점 중 하나는 이것이 내용-민감한(content sensitive) 방법이라는 것이며, 다른 하나는 연구설계 측면에서 유연성이 높다는 것이다. 데이터의 단순한 묘사나 숫자세기에 불과한 수준의 결과만을 얻을 수 있는 별거 아닌 기술이 아니다. 내용분석은 의사소통의 의미를 이해하기 위하여 사용될 수도 있고, 결정적 절차가 무엇인지 알아내기 위해서 사용될 수도 있다. 의미, 의도, 결과, 맥락이 중요한 방법이기도 하다.

Despite criticism, content analysis has an established position in nursing research and offers researchers several major benefits. One of these is that it is a content-sensitive method (Krippendorff 1980), and another is its flexibility in terms of research design (Harwood & Garry 2003). It is also much more than a naive technique that results in a simplistic description of data (Cavanagh 1997) or a counting game (Downe-Wamboldt 1992). Concept analysis can be used to develop an understanding of the meaning of communication (Cavanagh 1997) and to identify critical processes (Lederman 1991). It is concerned with meanings, intentions, consequences and context (Downe-Wamboldt 1992).



Process of analysis

두 가지 방법 Two approaches

내용분석은 질적, 양적 자료 모두를 가지고 사용할 수 있다. 또한 연역적 방법과 귀납적 방법이 모두 가능하다. 기존의 지식이 충분치 않거나, 기존의 지식이 분절화되어있다면 귀납적 방법이 권장된다. 귀납적 방법에서는 카테고리를 만들어낸다. 연역적 방법은 분석의 구조가 조작화되어있을 때 사용할 수 있으며, 기존의 지식을 바탕으로 하거나 기존의 이론을 검증하는 방법이 될 수 있다. 귀납적 접근법은 구체적인 것에서 일반적인 것으로 자료를 만들어나가는 것이며, 연역적 접근법은 기존의 모델로부터 출발하므로 일반적인 것에서 구체적인 것으로 진행하게 된다. 이 두 가지는 모두 비슷한 준비과정을 거친다.

Content analysis is a method that may be used with either qualitative or quantitative data; furthermore, it may be used in an inductive or deductive way. Which of these is used is determined by the purpose of the study. If there is not enough former knowledge about the phenomenon or if this knowledge is fragmented, the inductive approach is recommended (Lauri & Kyngäs 2005). The categories are derived from the data in inductive content analysis. Deductive content analysis is used when the structure of analysis is operationalized on the basis of previous knowledge and the purpose of the study is theory testing (Kyngäs & Vanhanen 1999). An approach based on inductive data moves from the specific to the general, so that particular instances are observed and then combined into a larger whole or general statement (Chinn & Kramer 1999). A deductive approach is based on an earlier theory or model and therefore it moves from the general to the specific (Burns & Grove 2005). These approaches have similar preparation phases.


준비과정 Preparation phase

귀납적 방법과 연역적 방법 모두 준비-조직화-보고의 세 단계를 거친다. 그럼에도 불구하고, 분석에 대해서는 어떤 총체적인 규칙이 있지는 않다. 모든 내용분석의 핵심 특징은 기존의 모든 단어들이 훨신 작은 내용카테고리로 분류가능하다는 것이다. 준비단계는 분석의 '단위'를 정하는 것부터 시작된다. 이것은 '단어' 또는 '주제'가 될 수 있다. 분석의 단위를 결정하기에 앞서서, 어떤 것을 분석할지를 결정하고 표본 수집시에 고려해야 할 사항을 결정하는 것이 중요하다. 표본은 모집단을 대표할 수 있어야 한다. 분석해야 할 문헌이 너무 방대하다면 확률표집 또는 판단표집이 필요하다.(probability or judgement sampling) 하나의 문장에 여러 개의 '의미 단위'가 있을 수도 있다. 따라서 '의미 단위'를 분석의 단위로 삼는 것은 분석과정을 더 어렵게 만들 수도 있다. 반대로 만약 분석의 단위가 너무 작아서, 예컨대 하나의 단어 단위라면, 분절화를 유발할 수도 있다. 연구질문에 따라서 분석의 단위는 글자, 단어, 문장, 한 페이지 내의 어떤 부분, 논의에 참여한 사람의 수, 논의가 진행된 시간 등등이 될 수 있다.

Both inductive and deductive analysis processes are represented as three main phases: preparation, organizing and reporting (Figure 1). Despite this, there are no systematic rules for analysing data; the key feature of all content analysis is that the many words of the text are classified into much smaller content categories (Weber 1990, Burnard 1996). The preparation phase starts with selecting the unit of analysis (McCain 1988, Cavanagh 1997, Guthrie et al. 2004). This can be a word or a theme (Polit & Beck 2004). Deciding on what to analyse in what detail and sampling considerations are important factors before selecting the unit of analysis (Cavanagh 1997). The sample must be representative of the universe from which it is drawn (Duncan 1989). Probability or judgement sampling is necessary when a document is too large to be analysed in its entirety (GAO 1996). A unit of meaning can consist of more than one sentence and contain several meanings. On that account, using it as a unit of analysis makes the analysis process difficult and challenging (Catanzaro 1988, Graneheim & Lundman 2004). On the other hand, an analysis unit that is too narrow, for example one word, may result in fragmentation (Graneheim & Lundman 2004). Depending on the research question, the unit of analysis can also be a letter, word, sentence, portion of pages or words, the number of participants in discussion or the time used for discussion (Robson 1993, Polit & Beck 2004).





Graneheim과 Lundman은 분석에 적합한 단위는 '그 자체로 온전하면서, 분석과정에서 하나의 의미단위로 기억할 수 있을 만큼 작은 것' 이 되어야 한다고 지적한다. 분석을 시작할 때, 연구자는 드러난 내용(manifest content)를 분석할 것인지 함축된 내용(latent content)를 분석할 것인지도 정해야 한다. 함축된 내용을 분석하는 목적은 침묵, 한숨, 웃음, 자세 등의 의미를 분석하는 것에 있다. 문서의 숨겨진 의미를 분석하는 것이 가능한가에 대한 논쟁이 있는데, 왜냐하면 그 과정에서 대개 '해석'이 개입되기 때문이다. Robson에 따르면 연구자들은 어떤 것을 분석할지 결정하는데 있어서 연구의 목적과 연구질문을 기준으로 판단해야 한다.

Graneheim and Lundman (2004) pointed out that the most suitable unit of analysis is whole interviews or observational protocols that are large enough to be considered as a whole and small enough to be kept in mind as a context for meaning unit during the analysis process. When starting the analysis, the researcher must also decide whether to analyse only the manifest content or the latent content as well. The aim with latent content is also to notice silence, sighs, laughter, posture etc. (Catanzaro 1988, Robson 1993, Morse 1994, Burns & Grove 2005). There has been some debate as to whether hidden meanings found in documents can be analysed, because their analysis usually involves interpretation. According to Robson (1993), researchers are guided by the aim and research question of the study in choosing the contents they analyse.


그 다음 분석 단계에서, 연구자들은 데이터를 살펴봄으로써(make sense of the data) 분석하려는 자료가 대략 어떤지 그 전체적인 감을 잡아야 한다. Dey에 따르면 자료를 읽을 때는 다음의 것을 고려해야 한다.

Next in the analytic process, the researcher strives to make sense of the data and to learn ‘what is going on’ (Morse & Field 1995) and obtain a sense of whole (Tesch 1990, Burnard 1991). According to Dey (1993), when reading the data the questions are:

      • who is telling?
      • where is this happening?
      • when did it happen?
      • what is happening?
      • why?

이 과정의 목적은 자료에 푹 빠지는 것이고(immersed), 이것이 자료를 수 차례 읽어야 하는 이유이기도 하다. 연구자가 자료에 완전히 익숙해지기 전에는 어떤 이론이나 통찰력도 생길 수 없다. 이러한 감을 잡은 뒤에 귀납적/연역적 분석이 진행된다.

 The aim is to become immersed in the data, which is why the written material is read through several times (Burnard 1991, Polit & Beck 2004). No insights or theories can spring forth from the data without the researcher becoming completely familiar with them (Polit & Beck 2004). After making sense of the data, analysis is conducted using an inductive or deductive approach (Kyngäs & Vanhanen 1999).



귀납적 내용분석 Inductive content analysis

귀납적 내용분석을 하기로 정하였다면, 그 다음단계는 질적 연구 자료를 정리하는 것이다. 이 과정은 개방코딩, 카테고리형성, 추상화 의 단계를 거친다. 개방코딩은 자료를 읽는 과정에서 노트를 하거나 제목을 다는 것이다. 자료를 반복해서 읽으면서 가능한 많은 제목과 필수항목을 메모하여 가능한 내용의 모든 부분을 묘사할 수 있어야 한다. 코딩시트의 메모로부터 제목을 끌어내고, 이 단계에서 카테고리를 자유럽게 생성한다.

If the researcher has chosen to use inductive content analysis, the next step is to organize the qualitative data. This process includes open coding, creating categories and abstraction. Open coding means that notes and headings are written in the text while reading it. The written material is read through again, and as many headings as necessary are written down in the margins to describe all aspects of the content (Burnard 1991, 1996, Hsieh & Shannon 2005). The headings are collected from the margins on to coding sheets (Cole 1988, Downe-Wamboldt 1992, Dey 1993) and categories are freely generated at this stage (Burnard 1991).


개방 코딩이 마무리되면, 카테고리의 목록을 더 높은 수준의 제목으로 그룹화한다. 이 그룹화의 목적은 유사하거나 서로 다른 카테고리들을 더 높은 차원의 카테고리로 묶어내는 것이다. 그러나 Dey는 카테고리를 만드는 것이 연관되어 보이는 관찰한 결과를 단순히 모아놓는 작업이 아니며, 이 과정은 자료를 특정 그룹의 '소유물'로 분류함으로서 이 그룹에 속한 것과 그렇지 않은 자료를 서로 비교하는 것이라 지적한다. 카테고리를 만드는 목적은 현상을 묘사할 수 있는 의미를 부여하고, 지식을 생성하기 위해 이해를 높이는 것이다. 귀납적 과정을 통해서 카테고리를 만들었다면 연구자는 그 결과를 해석해서 어떤 것들을 같은 카테고리로 묶을지 결정을 내려야 한다.

After this open coding, the lists of categories are grouped under higher order headings (McCain 1988, Burnard 1991). The aim of grouping data was to reduce the number of categories by collapsing those that are similar or dissimilar into broader higher order categories (Burnard 1991, Downe-Wamboldt 1992, Dey 1993). However, Dey (1993) points out that creating categories is not simply bringing together observations that are similar or related; instead, data are being classified as ‘belonging’ to a particular group and this implies a comparison between these data and other observations that do not belong to the same category. The purpose of creating categories is to provide a means of describing the phenomenon, to increase understanding and to generate knowledge (Cavanagh 1997). When formulating categories by inductive content analysis, the researcher comes to a decision, through interpretation, as to which things to put in the same category (Dey 1993).


'추상화'과정이란 카테고리를 형성해감으로써 연구주제의 일반적 기술을 만들어가는 것이다. 각각의 카테고리는 내용-특징을 나타내는 단어를 활용하여 이름을 붙일 수 있다. 비슷한 사건에 대한 하위 카테고리를 묶고 하위 카테고리를 묶어 주 카테고리로 만든다. 이 추상화 과정은 논리적인 절차를 거쳐 이 과정이 수행가능한 한 계속 진행된다. 

Abstraction means formulating a general description of the research topic through generating categories (Robson 1993, Burnard 1996, Polit & Beck 2004). Each category is named using content-characteristic words. Subcategories with similar events and incidents are grouped together as categories and categories are grouped as main categories (Dey 1993, Robson 1993, Kyngäs & Vanhanen 1999). The abstraction process continues as far as is reasonable and possible. An example of the abstraction process is shown in Figure 2. Inductive content analysis has been used, for example, in studies of the environment that supports well-being in older people (Juvani et al. 2005), support networks of adolescents with chronic disease (Kyngäs 2004) and men’s experiences of heart failure (Europe & Tyni-Lenne 2004).




연역적 내용분석 Deductive content analysis

연역적 내용분석은 기존의 이론을 새로운 맥락에서 검증해보고 싶을 때 활용할 수 있다. 카테고리에 대한 검증, 개념에 대한 검증, 모델이나 가설에 대한 검증 등이 모두 가능하다. 만약 연역적 내용분석을 하기로 결정하였다면, 그 다음 단계는 카테고리화 메트릭스를 만들고, 데이터를 이러한 카테고리에 맞게 코딩해넣는 것이다. 연역적 내용분석은 연구의 목적에 따라 구조화된 매트릭스를 사용할 수도 있고, 제한이 없는(unconstrained) 매트랙스를 사용할 수도 있다. 연역적 내용분석은 대개 그 내용에 대한 이론, 모델, 마인드맵, 리뷰문헌 등에 바탕을 둔다.

Deductive content analysis is often used in cases where the researcher wishes to retest existing data in a new context (Catanzaro 1988). This may also involve testing categories, concepts, models or hypotheses (Marshall & Rossman 1995). If a deductive content analysis is chosen, the next step is to develop a categorization matrix (Table 3) and to code the data according to the categories (Table 4). In deductive content analysis, either a structured or unconstrained matrix of analysis can be used, depending on the aim of the study (Kyngäs & Vanhanen 1999). It is generally based on earlier work such as theories, models, mind maps and literature reviews (Sandelowski 1995, Polit & Beck 2004, Hsieh & Shannon 2005).






카테고리화를 위한 메트릭스를 만들었다면, 모든 내용을 해당 카테고리에 코딩해야 한다. 비구조화(unconstrained)매트릭스의 경우, 귀납적 내용분석의 원칙을 따라서 서로 다른 카테고리들의 경계를 만들어낼 수 있다. 만약 매트릭스가 구조화되어 있다면, 분석매트릭스에 맞는 자료만 선택해서 넣는다. 구조화된 매트릭스를 사용할 경우 카테고리틀에 맞는 자료만 사용할 수도 있고 또는 그렇지 않은 자료까지도 사용할 수도 있다. 카테고리 프레임에 맞지 않는 것들은 귀납적 내용분석 방법을 통해 그 자체의 고유한 개념을 형성할 수도 있다.

After a categorization matrix has been developed, all the data are reviewed for content and coded for correspondence with or exemplification of the identified categories (Polit & Beck 2004). When using an unconstrained matrix, different categories are created within its bounds, following the principles of inductive content analysis. If the matrix is structured, only aspects that fit the matrix of analysis are chosen from the data (Patton 1990, Sandelowski 1993, 1995). This can also be called testing categories, concepts, models or hypotheses (Marshall & Rossman 1995). When using a structured matrix of analysis, it is possible to choose either only the aspects from the data that fit the categorization frame or, alternatively, to choose those that do not. In this way, aspects that do not fit the categorization frame can be used to create their own concepts, based on the principles of inductive content analysis.


어떤 방법을 선택할지는 연구의 목적에 따라 다르며, 만약 십대에서 당뇨라는 질환이 가지는 서로 다른 의미를 묘사하기 위한 연구라면 이를 류마티스 관절염을 가진 십대에 대한 연구틀로 활용해 볼 수 있다. 이러한 경우에 목적은 과연 당뇨병과 류마티스 관절염을 가진 10대에게 질병이 서로 동일한 의미를 갖는가를 검증하는 것이 될 수 있다. 

The choice of method depends on the aim of the study (Catanzaro 1988, Robson 1993, Marshall & Rossman 1995). For example, categories used to describe the different meanings that the concept of illness has for teenagers with diabetes could be used as a frame of categorization when analysing interviews with teenagers suffering from rheumatoid arthritis. In this case, the aim would be to test whether illness has the same meaning for teenagers suffering from rheumatoid arthritis as for those with diabetes (Kyngäs & Vanhanen 1999). Deductive content analysis has been used for example in studies of patients’ readiness for dietary change (Kasila et al. 2003), self-care of older people (Backman & Hentinen 2001) and mental health care (Latvala et al. 2000).



신뢰성 Trustworthiness

분석단계와 그 결과는 충분히 자세히 묘사되어야 하며, 이를 통해 독자들이 어떻게 분석이 행해졌고 그 장점과 한계점이 무엇인지 인식할 수 있게 해줘야 한다. 이를 위해서는 분석과정을 분석해야하며 결과의 타당도를 보장할 수 있다. 내용분석의 '타당도'는 다른 질적연구와 마찬가지로 분석 절차와 결과를 보고할 때 고려해야 할 다른 요소들이 있다.

The analysis process and the results should be described in sufficient detail so that readers have a clear understanding of how the analysis was carried out and its strengths and limitations (GAO 1996). This means dissection of the analysis process and the validity of results. Elements of validity in content analysis are universal to any qualitative research design there are additional factors to take into consideration when reporting the process of analysis and the results.


결과에서는 각 카테고리의 컨텐츠가 무엇인지 설명해야 한다. 즉, 각 카테고리의 의미와도 같다. 각 카테고리에 속하는 컨텐츠는 하위 카테고리를 묘사함으로써 가능하다. 카테고리를 만드는 것음 실질적이면서도 개념적인 과정으로서 카테고리는 개념적으로, 그리고 실질적으로(empirically) 근거가 있어야 한다. 성공적인 내용분석은 연구자들이 자료를 분석하고 단순화시켜서 그 연구의 주제를 높은 신뢰도로 카테고리화할 수 있어야 한다. 연구의 신뢰도는 카테고리가 그 자료를 얼마나 잘 포괄하는가에 달려있는 것이기도 하다.

The results are described contents of the categories, i.e. the meanings of the categories. The content of the categories is described through subcategories (Marshall & Rossman 1995). Creating categories is both an empirical and a conceptual challenge, as categories must be conceptually and empirically grounded (Dey 1993). Successful content analysis requires that the researcher can analyse and simplify the data and form categories that reflect the subject of study in a reliable manner (Kyngäs & Vanhanen 1999). Credibility of research findings also deals with how well the categories cover the data (Graneheim & Lundman 2004).


타당도와 신뢰도가 높은 자료르 수집하는 것도 연구를 방어(definsible)하는데 중요하다. 연구의 신뢰도를 높이기 위해서는 원 자료와 결과의 연관성을 보여줄 수 있어야 한다. 이것이 연구자들이 분석과정을 가급적 상세히 기술해야 하는 이유이기도 하다. 부록과 표를 활용하여 자료와 결과 사이의 연결고리를 보여줘야 한다. 다른 상황에 대한 적용가능성을 높이기 위해서는 맥락, 표본선정, 참가자의 특징, 자료수집과 분석과정 등을 명시해야 한다. 다른 사람이 연구 절차를 따라서 수행해볼 수 있도록 결과와 해석의 신뢰도를 위한 demonstration이 필요하다.

It is important to make defensible inferences based on the collection of valid and reliable data (Weber 1990). To increase the reliability of the study, it is necessary to demonstrate a link between the results and the data (Polit & Beck 2004). This is why the researcher must aim at describing the analysing process in as much detail as possible when reporting the results. Appendices and tables may be used to demonstrate links between the data and results. To facilitate transferability, the researcher should give a clear description of the context, selection and characteristics of participants, data collection and process of analysis (Graneheim & Lundman 2004). Demonstration is needed of the reliability of the findings and interpretations to enable someone else to follow the process and procedures of the inquiry.


원문을 인용하는 것(authentic citation)도 연구의 신뢰도를 높여주면서 독자들에게 어떻게 수집된, 어떠한 원본 자료로부터 결과가 나왔는자를 보여주는 방법이다. 연구자들은 정보원(informants)들에게 연구자들이 인용하는 문구로 인해서 신분이 드러나지 않는다는 것을 확실히 해 주어야 한다. 어느 정도까지 원문을 인용하는 것이 좋으냐에 대해서는 논쟁이 있지만, 우리의 경험상 저자가 작성한 문구(authorial text)보다 인용한 부분이 더 많으면 분석이 불완전하다고 볼 수 있다.

Authentic citations could also be used to increase the trustworthiness of the research and to point out to readers from where or from what kinds of original data categories are formulated (Patton 1990, Sandelowski 1993). The researcher should make sure that informants are not identified by quotes from the data (Ford & Reutter 1990). There has been some debate about the suitable amount of authentic citation. In our experience, if there are more citations than authorial text, then the analysis process is usually incomplete.


내용분석의 내적 타당도는 일치도계수를 이용하거나 안면타당도를 이용해서 평가할 수 있다. 그러나 일치도에 대해서는 다양한 의견이 있는데, 왜냐하면 각각의 연구자들이 주관적인 관점을 바탕으로 자료를 해석하고 공동연구자는 또 다른 해석을 할 수 있기 때문이다. 내용의 타당성을 높이기 위해서는 전문가 패널들이 개념형성, 코딩문제 등을 지원해줘야 한다. Granehein과 Lundman은 공동연구자들의 대화가 데이터를 명명(label)하는데 있어서 의견일치를 이루는 방법이라고 말한다.

The internal validity of content analysis can be assessed as face validity or by using agreement coefficients (Weber 1990). However, there are various opinions about seeking agreement (Graneheim & Lundman 2004), because each researcher interpret the data according to their subjective perspective and co-researchers could come up with an alternative interpretation (Sandelowski 1995). Content validation requires the use of a panel of experts to support concept production or coding issues. Graneheim and Lundman (2004) defend the value of dialogue among co-researchers to agree the way in which the data are labelled.



고찰 Discussion

내용분석은 순차적으로 순서적으로 진행되는 것은 아니며, 표준화가 덜 되어있어 양적분석보다 더 어려울 수 있다.데이터분석의 단순한 가이드라인은 없으며, 각각의 연구는 다 다르고, 그 결과는 기술/통찰력/분석능력/연구자의 스타일에 따라 달라진다. 내용분석을 할 때 어려운 점은 하나의 '옳은' 방법이 없다는 것이다. 연구자는 어떤 형태의 변형이 그 문제를 해결하는데 가장 적절한지 판단해야 하고, 이 과정때문에 분석이 더 어려워지기도 하지만 더 흥미진진해지기도 한다. 그 과정에서 엄청난 양의 일을 해야 하기도 한다.

Content analysis does not proceed in a linear fashion and is more complex and difficult than quantitative analysis because it is less standardized and formulaic (Polit & Beck 2004). There are no simple guidelines for data analysis: each inquiry is distinctive, and the results depend on the skills, insights, analytic abilities and style of the investigator (Hoskins & Mariano 2004). One challenge of content analysis is the fact that it is very flexible and there is no simple, ‘right’ way of doing it. Researchers must judge what variations are most appropriate for their particular problems (Weber 1990), and this makes the analysis process most challenging and interesting. An enormous amount of work is required during the process (Polit & Beck 2004).


분석과정은 문헌에서 별로 다뤄진 바가 없는데, 이는 아마도 과거에 내용분석이 지나치게 단순한 방법이라며 비판받았기 때문일 것이다. 내용분석을 할 때 가장 어려운 순간은 연구를 시작하는 순간이다. 연구자들은 각각의 인터뷰를 수 차례 읽고 필수적인 특징들을 잡아내야 하며, 분석적으로 앞으로 나아가는데 압박을 느끼지 않을 때까지 이 과정을 거쳐야 한다. 카테고리화의 초기 단계를 혼돈(chaotic)으로 표현하기도 하는데, 이 시점에서 다양한, 전혀 연결되지 않아 보이는, 정보의 조각을 가지고 시작하기 때문이다. 또 다른 문제점은 서사적 자료들이 일반적으로 순서적이지 않고, 인터뷰를 기록한 한 문단 내에서도 다양한 카테고리에 해당하는 내용을 포함하고 있기 때문이다. Glaser에 따르면 불확실성을 감내하는 것이 필요하며, 이 상황을 타개하기 위해서는 자료로 돌아가서 카테고리의 신뢰도를 확인하는 수 밖에 없다. 내용분석의 기본 가정은 연구자들을 잘못된 길로 이끌기 딱 좋으며, 분석과정에서 예측하지 못한 어려움에 마주할 가능성도 높다.

The analysis process has been little discussed in literature, possibly because content analysis has in the past been criticized for being an overly simple method. The most paralysing moment in conducting content analysis is simply getting started. Researchers should allow themselves simply to read through each interview as many times as necessary to apprehend its essential features, without feeling pressured to move forward analytically (Sandelowski 1995). They often see the beginning of the categorization phase as chaotic, because at that point they possess several, seemingly unconnected, pieces of information (Backman & Kyngäs 1998). Another problem may be that narrative material is generally not linear, and paragraphs from transcribed interviews may contain elements relating to several categories (Dey 1993, Polit & Beck 2004). According to Glaser (1978), tolerance of feeling uncertain is required. To resolve the situation, it is also necessary to be prepared to go back to the data to check the reliability of the categories. The assumption that content analysis is an easy method can mislead researchers, and unexpected difficulties may arise during the analysing process (Glaser 1978).


질적자료의 '질'과 무관하게 그 양 자체로도 어마어마하다. 얼마나 세세하게 다뤘느냐에 따라서 여섯 명의 면담에서 50에서100쪽까지의 기록물이 나올 수 있다. 수백페이지의 데이터를 보면서 연구자들은 이건 할 수 없겠다고 생각하게 된다. 또한 많은 연구와 관계 없는 흥미로운 지점들이 분석 과정에서 드러난다. 이 때 연구질문을 마음 속에 잘 품고 분석을 진행해야 한다. 혼돈의 한 중간에서 연구자는 연구 과업 그 자체로 돌아가야 하며, 관련성이 있는 분석단위에 집중해야 한다.

Regardless of the ‘quality’ of qualitative data, its sheer quantity can be daunting, if not overwhelming. Depending on the level of detail, six interviews may easily run to 50–100 single-spaced pages of transcribed text (Miles & Huberman 1994). Hundreds of pages of data can lead the researcher to think that it cannot be managed. In addition, many interesting points that are not related to the topic under study often come up when analysing the data. In that case, keeping the research question in mind is an essential aspect of content analysis. Even in the middle of chaos, the researcher must always be able to go back to the research tasks and only look for units of analysis that have relevance to them.


결과를 보고하고 발표하는 것도 쉽지 않다. 왜냐하면 연구 결과가 여러 절차를 걸쳐 나오기 때문이다. 연구자들은 내용분석을 어떻게 수행했는지 더 자세한 방법을 원하지만, 그 과정을 이미 수행한 연구자는 그 과정을 기술하는 것 자체가 얼마나 어려운지를 알고 있다. 이 과정의 일부 단계를 자세히 기술하는 것은 가능하지만, 다른 부분은 그렇지 않을 수 있다. 질적자료분석 프로그램이 내용분석을 더 손쉽게 만들어주며 새로운 분석단계를 도와준다.

Reporting the study and presenting its results can also be challenging, as the results are formed through a process comprising a number of phases. Researchers often wish for more detailed instructions on how to carry out content analysis, but those who have already gone through the process know that describing the analysis is often one of the most challenging phases of the study. It is possible to describe some parts of this process in great detail, but other parts – such as the researcher’s own actions and insights – may be difficult to put into words (Backman & Kyngäs 1998). Qualitative data analysis software programs can be used to make content analysis more manageable and ordered, and may facilitate new levels of analysis (Gerbic & Stacey 2005).


만약 질적자료가 너무 과도하게 압축되었다면, 서사의 integrity을 유지하지 못할 수 있다. 만약 그 결과가 충분한 발췌구문(excerpts) 없이 요약만 되어있다면 원본 데이터의 풍요로움이 소실될 수 있다. 저널의 분량 제한으로 인해서 질적연구 결과를 발표하는 것도 어려움이 생기기도 한다.

If qualitative data are compressed too much, the very point of maintaining the integrity of narrative materials during the analysis phase becomes lost. If the conclusions are merely summarized without including numerous supporting excerpts, the richness of the original data disappears. It is sometimes difficult to give a thorough presentation of the results of qualitative research in a format that is compatible with the space and word limitations in professional journals (Polit & Beck 2004).


내용분석을 통해 만들어진 연구결과가 종종 불완전한 분석절차를 거친 경우도 있다. 만약 연구자들이 자료를 충분히 추상화하지 않았거나 지나치게 많은 내용을 한 카테고리에 담는 다면 그럴 수 있다. 그러나 카테고리가 많은 것은 종종 더 이상 카테고리화 할수 없다는 신호가 되기도 한다. 만약 추상화 과정이 여전히 진행중이라면, 서로 상쇄시키지 못하는 카테고리를 포함하고 있을 수 있다. 추가적으로 데이터의 포화도가 불충분하면, 각각을 서로 연결시키기 어려울 수 있다.

Study results developed through content analysis often display signs of an incomplete analysing process. The researcher has not abstracted the data, or has included too many different things in a single category (Dey 1993, Hickey & Kipping 1996). However, an abundance of categories is usually a sign of being unable to categorize the data. When the abstracting process is still ongoing, the results may include categories that do not cancel each other out. In addition, when the saturation of the data is incomplete, it may be difficult to link data items to each other (Patton 1990, Cavanagh 1997). Seemingly simple study results are a sign of incomplete analysis (Weber 1990).



Conclusion

Content analysis is extremely well-suited to analysing the multifaceted, sensitive phenomena characteristic of nursing. An advantage of the method is that large volumes of textual data and different textual sources can be dealt with and used in corroborating evidence. Especially in nursing research, content analysis has been an important way of providing evidence for a phenomenon where the qualitative approach used to be the only way to do this, particularly for sensitive topics. The disadvantage of content analysis relates to research questions that are ambiguous or too extensive. In addition, excessive interpretation on the part of the researcher poses a threat to successful content analysis. However, this applies to all qualitative methods of analysis.


In nursing studies, deductive content analysis has been used less than inductive approach. It is likely that in the future, the use of deductive content analysis will become more common, because inductively built models or concept systems can be complemented, tested and developed further with the aid of deductive analysis.







The qualitative content analysis process

  1. Satu Elo1 and
  2. Helvi Kyngäs2

Article first published online: 18 MAR 2008

DOI: 10.1111/j.1365-2648.2007.04569.x

Journal of Advanced Nursing

Journal of Advanced Nursing

Volume 62Issue 1pages 107–115April 2008












Keywords:

  • concept formation;
  • content analysis;
  • deductive;
  • inductive;
  • nursing;
  • research methods

Abstract

Title. The qualitative content analysis process

Aim.  This paper is a description of inductive and deductive content analysis.

Background.  Content analysis is a method that may be used with either qualitative or quantitative data and in an inductive or deductive way. Qualitative content analysis is commonly used in nursing studies but little has been published on the analysis process and many research books generally only provide a short description of this method.

Discussion.  When using content analysis, the aim was to build a model to describe the phenomenon in a conceptual form. Both inductive and deductive analysis processes are represented as three main phases: preparation, organizing and reporting. The preparation phase is similar in both approaches. The concepts are derived from the data in inductive content analysis. Deductive content analysis is used when the structure of analysis is operationalized on the basis of previous knowledge.

Conclusion.  Inductive content analysis is used in cases where there are no previous studies dealing with the phenomenon or when it is fragmented. A deductive approach is useful if the general aim was to test a previous theory in a different situation or to compare categories at different time periods.






+ Recent posts