질적연구의 일반화가능성: 오해, 기회, 권고(Qualitative Research in Sport, Exercise and Health, 2018)
Generalizability in qualitative research: misunderstandings, opportunities and recommendations for the sport and exercise sciences
Brett Smith

 

일반화는 일반적으로 정량적 연구와 관련하여 논의되는 용어이다. 일반화 가능성은 또한 양적 연구를 긍정적인 방식으로 정의하기 위해 종종 사용된다. 정량적 방법을 적절히 적용하면 더 넓은 모집단이나 다른 맥락에 적용할 수 있는 대표적인 참여자 표본으로부터 신뢰할 수 있는 결과를 얻을 수 있다고 한다. 그런 점에서 좋은 정량적 연구의 결과는 유용하고 유익하다고 볼 수 있다. 예를 들어, 보건 정책 입안자들은 정량적 연구의 결과를 일반 대중들에게 자신 있게 적용하여 희망적으로 많은 대중들이 혜택을 볼 수 있다. 
Generalisation is a term ordinarily discussed in relation to quantitative research. Generalizability is also often used to define quantitative research in positive ways. It is said that when properly applied quantitative methods can produce reliable results from a representative sample of participants that can be applied to a wider population or different contexts. Given that, the results from good quantitative research can be viewed as useful and beneficial. For instance, health policy-makers can confidently apply results from quantitative studies to the general population so that hopefully numerous publics can benefit. 

일부 연구자들은 생산적으로 질적 연구의 일반화 가능성에 더 많은 주의를 요구한다(예: Darnell et al. 2017). 때때로 문헌 저자들은 질적 연구가 일반화될 수 있는 방법에 대해서도 주목한다(예: Black and Holt 2009, Allen-Collinson and Hockey 2010, Hayhurst 2016, Horrocks et al. 2016, Hurley et al. 2016, Shirazipour et al. 2017, Sparkes 및 Brighton 2017). 
some researchers productively call for more attention to generalizability in qualitative research (e.g. Darnell et al. 2017). Occasionally in the literature authors also note how their qualitative study might be generalizable (e.g. Black and Holt 2009, Allen-Collinson and Hockey 2010, Hayhurst 2016, Horrocks et al. 2016, Kuklick et al. 2016, Hurley et al. 2017, Shirazipour et al. 2017, Sparkes and Brighton 2017).

일반화 가능성을 간략하게 언급한 다양한 저널 기사에도 불구하고 스포츠 및 운동 과학 저널의 질적 연구와 관련하여 일반화와 그 의미 및 사용에 대한 자세한 논의가 부족한 것으로 남아 있다. 따라서 이 글의 목적은 질적 연구와 관련하여 일반화에 대해 자세히 논의함으로써 그 차이를 메우기 위함입니다.
Notwithstanding the various journal articles that mention generalizability briefly, it remains that there is a lack of detailed discussion on generalisation and its meaning and use in relation to qualitative research in sport and exercise science journals. The purpose of this article therefore is to fill that gap by discussing generalisation in detail in relation to qualitative research. 

 

오해
Misunderstandings

문헌을 면밀히 살펴보면 질적 기사의 저자들이 다양한 방식으로 일반화 가능성에 관여한다는 것을 알 수 있을 것이다. 언급한 바와 같이, 많은 기사들은 일반화에 대해 전혀 언급하지 않는 반면, 다른 기사들은 질적 연구가 일반화될 수 있다고 간략히 언급하고 있다. 그러한 연구자들은 일반화 가능성을 질적 연구의 한계로 명명하는 것이 옳다고 생각할 수 있다. 하지만 이것이 정말 한계일까요? 질적 연구가 항상 일반화 가능성이 부족하다는 것과 기사에서 그것을 제안하는 것이 오해라는 것은 근거 없는 믿음인가요?
A close inspection of the literature will reveal that authors of qualitative articles engage with generalizability in different ways. As noted, many articles do not mention generalisation at all, whilst others briefly note that their qualitative study might be generalizable. Such researchers might assume it is correct to name generalizability as a limitation of their qualitative research. But is it really a limitation? Is it a myth that qualitative research always lacks generalizability and a misunderstanding to suggest that in an article?

질적 연구는 한 가지 특정 유형의 일반화 가능성, 즉 통계적 확률론적 일반화 가능성을 통해서만 이해될 경우 일반화 가능성이 부족하다. '통계적 일반화 모델(statistical generalizationability model)'은 일반적으로 통계 샘플링 절차를 통해 추구되며 다음과 같은 두 가지 기능을 갖는다. 

  • (1) 그것은 연구자가 그들의 샘플의 대표성에 대해 확신을 가질 수 있게 한다. 
  • (2) 그러한 대표성은 연구자가 더 넓은 추론을 할 수 있게 한다. 

Qualitative research does lack generalizability when it is understood only through one particular type of generalizability, that is, statistical-probabilistic generalizability. Whilst the ‘statistical generalizability model is almost never fully realised, even though the research community usually acts as though it is’ (Polit and Beck 2010, p. 1457), that type of generalisation is normally sought through statistical sampling procedures and has two functions:

  • (1) it allows the researcher to feel confident about the representativeness of their sample, and
  • (2) such representativeness allows the researcher to make broader inferences.

 

이러한 이유로 통계적 확률론적 일반화 가능성은 정량적 연구에 합리적이고 일반적으로 적용된다.

For such reasons, statistical-probabilistic generalizability is sensibly and commonly applied to quantitative research.

그러나 통계적 확률론적 일반화 가능성을 정성 연구에 적용하는 것은 문제가 있다. 첫째, 질적 연구에 많은 정보를 제공하는 [존재론적 및 인식론적 가정]은 양적 이후의 연구를 뒷받침하는 가정과 다르다. 종종 질적 연구자는 현실은 다중적이며, 사람에 달려있다고 믿는다(연구자, 참여자, 그리고 다양한 사람들). 그들은 또한 지식이 연구자들과 독립적으로 발견되고 객관적인 방법으로 발견되기 보다는, 지식은 구성되고 주관적이라고 종종 믿는다(Lincoln et al. 2017). 무엇이 질적연구이고 무엇이 질적연구가 아닌가에 대한 이러한 이해를 고려할 때, 통계적 확률론적 일반화 가능성은 많은 질적 연구의 존재론적 및 인식론적 가정과 맞지 않는다. 따라서 질적 작업에 통계적 확률론적 일반화 가능성을 적용하는 것은 의미가 없다.

Yet, to apply statistical-probabilistic generalizability to qualitative research is problematic. Firstly, the ontological and epistemological assumptions that inform much qualitative research are different from the assumptions that underpin post-positivist quantitative research. Often the qualitative researcher believes that reality is multiple and dependent on them (i.e. the researcher, participants and various people). They frequently as well believe that knowledge is constructed and subjective, rather than discovered independently from researchers and found in an objective way (Lincoln et al. 2017). Given these understandings about what ‘is’ and ‘is not’ qualitative research, statistical-probabilistic generalizability does not fit with the ontological and epistemological assumptions of much qualitative research. Thus, the application of statistical-probabilistic generalizability to qualitative work makes little sense.

둘째, 통계적 확률 일반화 가능성을 통해 질적 연구를 이해한다면, 그러한 유형의 일반화가 모든 형태의 연구의 목표가 되는 것과 같다. 그러나 통계적 확률론적 일반화 가능성은 정성적 연구에 의미 있는 목표가 아니다. 질적 연구는 사람들의 삶을 풍부하게 상세하게 조사하는 것이고, 그 목표를 달성하기 위해 소수의 사람들은 종종 목적적 또는 목적적 샘플링 전략(예: 최대 변동 및/또는 기준 기반 목적적 샘플링)을 통해 선택된다(Braun and Clarke 2013, Sparkes and Smith 2014). 따라서 의도적으로 선택한 풍부한 지식과 작은 샘플은 약점이 아니라 질적 연구의 고유한 장점입니다. 루이스 외 연구진(2014)은 다음과 같이 평했다.

Secondly, when qualitative research is understood through statistical-probability generalizability it is as if that type of generalisation has been overgeneralized, as it were, to be the goal of all forms of research. Yet, statistical-probabilistic generalizability is not a meaningful goal for qualitative research. Qualitative research is about examining people’s lives in rich detail, and to achieve that goal, small numbers of people are often chosen through purposive or purposeful sampling strategies (e.g. maximum variation and/or criterion-based purposeful sampling) (Braun and Clarke 2013, Sparkes and Smith 2014). Rich knowledge and small samples purposefully chosen are thus unique strengths of qualitative research, not weaknesses. As Lewis et al. (2014) commented:

질적 연구는 통계적으로 일반화될 수 없다. 즉, 특정 관점이나 경험의 확산이 아니라, 표본의 일부 내에서의 위치 정도가 아니라 추론을 도출할 수 있다. 물론 이것이 질적 연구의 목적도 아니다. 오히려, 질적 연구의 가치는 연구 대상 현상의 폭과 성격을 밝히는 데 있다. (351쪽)
Qualitative research cannot be generalised on a statistical basis – it is not the prevalence of particular views or experiences, not the extent of their location within parts of the sample, about which inferences can be drawn. Nor, of course, is this the objective of qualitative research. Rather, the value of qualitative research is in revealing the breadth and nature of the phenomena under study. (p. 351)

따라서 한 연구자가 질적 연구의 약점이 일반화 가능성 부족이며, 이는 통계적 확률 일반화만을 의미한다고 한다면, 그들은 옳을 것이다. 그러나 그들은 질적인 연구 또한 오해하고 있다. 강조된 이유로 통계적 확률 일반화는 질적 연구에도 적용할 수 없을 뿐만 아니라, 질적 연구의 목표조차 아니다. 연구자들은 질적 연구에 통계적 확률의 일반화 가능성을 적용하고 그러한 유형의 일반화를 통해 이를 판단하는 것을 피해야 한다. 
Accordingly, if a researcher states that a weakness of their qualitative research is a lack of generalizability, and by which they
 only mean statistical-probability generalisation, they would be correct! But they have also misunderstood qualitative research. For reasons highlighted, statistical-probability generalisation is neither applicable to qualitative research nor a goal of it. Researchers should then avoid applying statistical-probability generalizability to qualitative research and making judgements about it through that type of generalisation. 

다양한 학자들에 따르면, 일반화는 질적 연구자들의 정당한 관심사여야 한다. 다시 말해, Wolcott (1995)의 표현처럼, '우리는 일반화에 대한 끈질긴 질문을 피할 수 없다' (132쪽) 그러나 일반화 가능성에 대해 우려하는 것은 인간, 사회 생활 및 물질성에 대한 상세하고 풍부한 이해를 희생할 필요가 없다. 일반화를 사용한다고 반드시 사후 실증주의를 채택해야 하는 것은 아니며, 일반화가 (잠정적이고 주관적이며 맥락과 분리되기보다는) 최종적이고 객관적이라고 믿어야만 하는 것도 아니다. 또한 그 작품에서 추출된 무작위 샘플의 종류를 모방하려고 시도함으로써 정량적 연구 방법을 채택하거나 심지어 병행해야 한다는 것을 의미하지도 않는다. 질적 연구자들은 일반화를 다루고 전달하는 방법을 포함하여 질적 연구의 과정과 산출물을 안내하기 위해 약속하는 인식론(예: 구성론)과 존재론(예: 상대론)을 여전히 보장해야 한다. 이러한 점들을 염두에 두고, 왜 질적 연구자가 일반화 가능성에 관심을 가져야 하는가? 

According to various scholars (e.g. Sandelowski 1997, Yardley 2008, Green and Thorogood 2009, Lewis et al. 2014, Sparkes and Smith 2014, Hayhurst 2016, Kuklick et al. 2016, Shaw and Hoeber 2016, Darnell et al. 2017), generalisation should be a legitimate concern for qualitative researchers. In other words, as Wolcott (1995) put it, ‘we cannot escape the nagging question of generalisation’ (p. 132). Being concerned about generalizability does not however require sacrificing detailed and rich understandings of human beings, social life and materiality. Using generalisation doesn’t either necessitate that one must adopt post-positivism, and believe that generalisations are final, objective and divorced from context rather than provisional, subjective and contextual. Nor does it mean that one should adapt, or even parallel, the methods of quantitative research by attempting to imitate the kinds of random samples drawn on in that work. Qualitative researchers must still ensure that the epistemologies (e.g. constructionism) and ontologies (e.g. relativism) they commit to guide the process and product of qualitative research, including how generalisation is dealt with and communicated. With these points in mind, why might a qualitative researcher be concerned with generalizability?

일반화 가능성을 고려해야 하는 한 가지 이유는 우리가 일반화를 무시할 때 질적 연구에 많은 것이 걸려 있기at stake 때문이다. 예를 들어, 일반화를 무시하면 질적 연구자들이 일반화에 신경 쓸 필요가 없다는 인상을 줄 수 있다. 하지만 우리는 신경써야 한다. 아니면 적어도 일반화 가능성에 대한 입장을 가져야 한다. 그것은 [지배적인 형태의 진실]이 때때로 (질적인 연구에 의해 만들어진 지식과 같은) 특정한 형태의 지식을 폐쇄하거나 경찰하는 방식으로 우리의 분야disciplines을 형성shape하기 때문이다. 

One reason to consider generalizability is that much is at stake for qualitative research when we ignore generalisation. For instance, ignoring generalisation can give the impression that qualitative researchers don’t need to care about generalising. But we do need to care, or at least have a position on generalizability. That is because dominant forms of truth shape our disciplines in ways that at times shut down and/or police particular forms of knowledge, such as that produced by qualitative research. 

일반화 가능성에 engage하는 것이 중요한 또 다른 이유는, 연구자, 저널 편집자 및 리뷰어는 질적 연구의 한계가 일반화 능력의 부족이라고 믿고 질적 연구를 비판, 비하 또는 거부하기 위한 근거로서 사용할 수 있기 때문이다. 우리는 또한 정부, 스포츠 코치 및 스포츠 단체의 정책 입안자들이 때때로 질적 연구의 발견을 심각하게 받아들이지 못할 수 있다는 것을 알고 있다. 그 실패에 기여하는 중요한 요인은 그 결과가 일반화될 수 없다는 자주 인용되지만 잘못된 주장이다. 
It is likewise important to engage with generalizability because, as Shaw and Hoeber (2016) suggested, researchers, journal editors and reviewers may (continue to) believe that a limitation of qualitative research is a lack of generalizability and then use that as a rationale to critique, demean or reject qualitative research (see also Greenhalgh et al. 2016). We also know that policy-makers in government, sport coaches and sporting organisations can, at times, fail to take the findings of qualitative studies seriously. An important factor contributing to that failure is the often cited but false charge that the results are not generalizable (Green and Thorogood 2009).

따라서 연구자, 단체, 정부 등이 질적 연구에 대해 적절하고 공정한 판단을 내리고 그들이 우리의 연구를 활용하기를 원한다면, 우리는 일반화 가능성에 관여할 필요가 있다. 이러한 참여를 달성하는 한 가지 방법은 연구 논문, 대화 등에서 질적 연구의 약점이나 한계가 항상 일반화 가능성이 부족하다는 신화를 제거하는 것이다. 질적 연구자들이 참여할 수 있는 또 다른 방법은 적절한 수준에 상관없이 그들의 결과가 유용하다고 주장하는 것이다(Kay 2016).

Thus, if we want researchers, organisations, government and so on to make appropriate and fair judgements about qualitative research, and want them to use our work, we need to be engaged with generalizability. One way to accomplish such engagement is to dispel any myth in research articles, conversations and so forth that a weakness or limitation of qualitative research is that it always lacks generalizability. Another way for qualitative researchers to engage is to make claims to their results being useful, at whatever level, when appropriate (Kay 2016).

둘째로, 질적 연구는 때때로 일반화될 수 있고 일반화될 수 있기 때문에 일반화 가능성은 합법적인 관심사이다. [일반화의 가능성]이라는 점을 고려한다면, 일반적으로 고려되지 않는 연구자들에게 기회가 열려 있다. 예를 들어, 우리는 일반화 가능성이 특정 연구에 적합한지를 생산적으로 고려하고, 질적 연구가 일반화될 수 있는 방법을 반영하며, 일반화가 어떻게 가능한지를 입증하기 위해 청중과 참여하는 방법을 숙고할 수 있다. 질적 연구 결과가 통계적 확률 유형을 넘어 [다양한 유형의 일반화 가능성]과 어떤 관계를 가질 수 있는지 생각해 보는 데 도움이 될 수 있다(Green and Thorogood 2009). 콜링리지와 갠트(2008)가 언급했듯이, 일반화 가능성은 확률 표본 추출 이론에 국한되지 않는다. 일반화를 이해하는 방법은 다양하다'(392쪽). 따라서, 단순히 일반화 가능성이 질적 연구에서 문제가 아니라고 말하거나, 또는 그것이 한계라고 주장하기 보다는, 연구자들은 연구 결과가 [다른 유형의 일반화]와 가질 수 있는 가능한 종류의 관계에 흥미를 가질 수 있다.
Secondly, generalizability is a legitimate concern because qualitative research can be and is at times generalizable. Given that possibility of generalising, opportunities are opened for researchers not typically considered. For example, we can productively consider if generalizability is appropriate for a particular study, reflect on how qualitative research might be generalizable, and deliberate on ways to engage with audiences to demonstrate how generalisation is possible. To help with all that it can be useful to think through what kind of relationship the qualitative research findings might have to the multiple and different types of generalizability that can be drawn on beyond the statistical-probability type (Green and Thorogood 2009). As Collingridge and Gantt (2008) comment, ‘generalizability is not limited to probability sampling theory. There are different ways of understanding generalisation’ (p. 392). Thus, rather than simply stating that generalizability is not an issue in qualitative research, or claiming it is a limitation, researchers can be intrigued with the possible kind of relationship the study results may have to different types of generalisation.

일반화 기회: '일반화 가능성'에서 '일반화 가능성들'까지
Opportunities to generalise: from generalizability to generalizabilities

질적 연구 결과가 일반화 가능성과 어떤 관계를 가질 수 있는지 생각하는 연구자들에게 고려할 수 있는 일반화 가능성의 유형은 다양하다. 고려해야 할 일반화 유형 중 하나는 [자연주의적 일반화 가능성naturalistic generalizability ]이다(Stake 1978, 1995). [대표적 일반화representational generalisation]라고도 하는 그러한 유형의 일반화에서, 일반화 가능성은 독자가 익숙한 결과와의 유사성과 차이점에 대한 인식을 기반으로 달성된다. 즉, 자연주의적 일반화 가능성은 연구가 독자의 삶의 일에 대한 개인적인 참여나 종종 암묵적인 경험에 공명할 때 발생한다. 

There are different types of generalizability available to consider for researchers who choose to think about what kind of relationship their qualitative study results may have to generalizability. One type of generalisation for consideration is naturalistic generalizability (Stake 1978, 1995). In that type of generalisation, which is sometimes also referred to as representational generalisation (Lewis et al. 2014), generalizability is reached on the basis of recognition of similarities and differences to the results with which the reader is familiar. That is, naturalistic generalizability happens when the research resonates with the reader’s personal engagement in life’s affairs or vicarious, often tacit, experiences.

자연주의 일반화를 가능하게 하기 위해, 연구자들은 적절한 '증거'(예: 인터뷰 인용문, 관찰 필드 노트 및/또는 시각적 자료), 충분한 상황별 세부 사항 및 풍부한 층의 현실의 이론적 표현을 통해 참가자의 삶에 대한 충분한 세부 정보를 청중에게 제공해야 한다. 그럼으로써 독자들이 이것들을 성찰하고 자신의 삶과 연결하도록 돕는다

To enable naturalistic generalizability the researcher is required to provide audiences with enough detail of the participant’s lives through adequate ‘evidence’ (e.g. interview quotations, observation field notes and/or visual material), enough contextual details, and richly layered theoretical expressions of a reality to help readers reflect upon these and make connections to their own lives. 

질적 연구자가 추구할 수 있는 또 다른 유형의 일반화는 전이성transferability (Tracy 2010)으로, 추론적 일반화inferential generalisation(Lewis et al. 2014) 또는 사례 간 일반화case-to-case generalisation (Chenail 2010)라고도 한다.

  • 정의를 제시하기 전에, 여기서 전이성은 링컨과 구바(1985)가 전이성을 의미하는 것이 아니라는 것을 유념해야 한다. 링컨과 구바의 이전가능성에 대한 생각은 신뢰할 수 없는 현실의 해석으로부터 신뢰할 수 있는 것을 구분하기 위한 절차나 방법의 형태의 인식론적 기초주의에 의해 뒷받침되었다. 그 후, 전이성은 '적합성fittingness'에 관한 것으로, '전송과 수신 상황 사이의 일치성 정도'로 정의되었다 (124쪽).

Another type of generalisation that a qualitative researcher might seek is transferability (Tracy 2010), which is sometimes also referred to as inferential generalisation (Lewis et al. 2014) or case-to-case generalisation (Chenail 2010).

  • Before offering a definition, it is important to note that what is meant by transferability here is not what Lincoln and Guba (1985) meant by transferability. Lincoln and Guba’s idea of transferability was underpinned by epistemological foundationalism in the form of procedures or method to sort out trustworthy from untrustworthy interpretations of reality. Following that, transferability was about ‘fittingness’, ‘defined as the degree of congruence between sending and receiving contexts’ (p. 124).

링컨과 구바(1985)가 정의한 것과는 대조적으로, 여기서 전이가능성의 개념은, 지식은 구성되고 주관적이며, 현실은 다중이며 창조되고 정신에 의존적이며, 방법은 [이론과 무관한 지식]을 제공할 수 없다는 인식론적 가정에 의해 뒷받침된다. 전달성은 한 환경에서 사람이나 집단이 연구가 식별한 다른 환경에서 채택하는 것을 고려할 때마다 발생하는 것으로 정의된다는 점에서 여기서도 다르다. 그렇다면 문제는 '텍스트 A와 컨텍스트 B가 일치하고 적합한가'가 아니라 '이러한 결과가 어느 정도까지 다른 설정으로 전달될 수 있는가'이다. 예를 들어, 체육 교육자, 스포츠 공동체 지도자, 또는 건강 정책 입안자가 활동적인 생활 방식을 장려하는 방법에 대한 질적 보고서를 읽는 것은 알고 싶을지도 모른다: '이것은 나의 체육 수업, 지역 공동체 그룹, 또는 국가에 활동적인 생활 방식을 장려하기 위해 적용할 수 있는 것인가?' 독자들이 [연구가 자신의 상황과 겹친다]고 믿거나, 직관적으로 연구 결과를 자신의 행동으로 옮길 수 있다고 생각할 때, 연구는 전달 가능성을 통해 일반화된다고 말할 수 있다.
In contrast to how Lincoln and Guba (1985) defined it, the idea of transferability here is underpinned by the epistemological assumption that knowledge is constructed and subjective, reality is multiple, created and mind-dependent, and methods cannot provide theory-free knowledge. Transferability is also different here in that it is defined as occurring whenever a person or group in one setting considers adopting something from another that the research has identified. The question then is not ‘If Context A and Context B are congruent and fit’, but rather ‘To what extent are these results transferable to other settings?’ For example, a physical educator, sport community leader, or health policy-maker reading a qualitative report on how to promote active lifestyles might want to know: ‘Is this something I can apply to my physical education class, local community group, or country to encourage active lifestyles’? When readers feel as though this can be the case – when they believe that research overlaps with their own situation and/or they can intuitively transfer the findings to their own action –, then the research can be said to generalise through transferability.

Tracy (2010)에 따르면, 그러한 유형의 일반화 가능성을 촉진하기 위해, 자연주의 일반화 가능성 연구자들처럼, '직접 증언을 수집하고 풍부한 설명을 제공하며 접근 가능하고 초대적으로 작성함으로써 전이가능성을 유발하는 보고서'를 작성한다(페이지 845). 그녀는 또한 전달성이 evocative storytelling과 관련될 수 있다고 언급했다. 이야기는 다른 분야에서도 같은 일을 겪었다는 생각을 독자들에게 심어주는 힘이 있기 때문이다(Papathomas 2016). 
To facilitate that type of generalizability, according to Tracy (2010), like naturalistic generalizability researchers ‘create reports that invite transferability by gathering direct testimony, providing rich description and writing accessibly and invitationally’ (p. 845). She notes that transferability can also relate to evocative storytelling. That is because stories have the power to create in readers the idea that they have experienced the same thing in another arena (Papathomas 2016). 

질적 연구 결과가 일반화 가능성과 어떤 관계를 가질 수 있는지 생각하고자 하는 연구자들을 위해, 이들이 추구할 수 있는 추가적인 유형의 일반화는 광범위하게 분석적 일반화analytical generalization 라고 할 수 있다(Chenail 2010, Polit and Beck 2010, Lewis et al. 2014, Simons 2014). 때로는 수직적 일반화vertical generalizability (Stephens Generalization, 1982년)과 관용적 일반화idiographic generalizability (Sandelowski 2004년)으로도 알려져 있으며, 분석 일반화는 개념 일반화concept generalization 이론적 일반화theoretical generalization를 통해 다양한 방식으로 발생할 수 있다. 
For those researchers who wish to think about what kind of relationship their qualitative study results may have to generalizability, a further type of generalisation they might seek can be broadly termed analytical generalization (Chenail 2010, Polit and Beck 2010, Lewis et al. 2014, Simons 2014). Sometimes also known as vertical generalizability (Stephens 1982) and idiographic generalizability (Sandelowski 2004), analytical generalisation can occur in differing ways, that is, through concept generalization and theoretical generalization.

예를 들어, [분석적 일반화]는 연구자가 특정한 결과의 집합을 [확립된 개념이나 이론으로 일반화]함으로써 연구 개념에 일반화 가능성 또는 이론적 일반화 가능성을 표시할 때 발생할 수 있다. 연구는 또한 맥락이나 모집단이 다르더라도 나중에 타당하고 다른 연구에서 의미를 갖는 [새로운 개념이나 새로운 이론이 구성]될 때 분석적 일반화 가능성을 생산할 수 있다. 아니면, 연구자는 다른 방법론을 통해 연구에서 확립된 개념과 이론을 재검토하여, [주제에 대한 새로운 개념과 이론적 이해를 도출]할 수도 있다. 연구자나 다른 연구자가 다른 연구에서 그러한 개념이나 이론의 가치를 보여줄 때, 다시 말해 그 작업은 분석적 일반화의 형태를 만들어 낸다고 할 수 있다. 

For example, analytical generalisation can happen when the researcher generalises a particular set of results to an established concept or theory, thereby displaying in their research concept generalizability or theoretical generalizability. Research might also produce analytical generalizability when a new concept or new theory is constructed that later makes sense and has significance in other research, even if the contexts or populations are different. Or, the researcher might re-examine established concepts and theories in a study through a different methodology and, in turn, produce new conceptual and theoretical understandings of a topic. When that occurs, and the researcher or other researchers show the value of such concepts or theories in other research, then again it can be said that the work generates a form of analytical generalisation.

따라서 [분석적 일반화]에서 일반화할 수 있는 것은 (특정 맥락이나 모집단이 아니라) [개념이나 이론]이다. 더욱이 개념적 또는 이론적 일반화는 고정적이거나 불변하거나 절대적으로 확실하게 주장될 수 있는 것으로 보지 않는다. 오히려 분석적 일반화는 세상과 사람들의 삶을 이해하기 위한 [유동적인 아이디어]로 더 잘 이해될 수 있다. 또한 중요한 것은 다넬 외 연구진(2017)이 제안한 바와 같이 질적 데이터는 종종 [개념 구성과 이론화]를 주도한다

Thus, in analytical generalisation it is the concepts or theories that are generalizable, not the specific context or populations. Moreover, conceptual or theoretical generalisations are not viewed as fixed, immutable, or to be asserted with absolute certainty. Rather, analytical generalisations are perhaps better understood as fluid ideas (Atkinson 2017) for making sense of the world and people’s lives. Importantly too, as Darnell et al. (2017) suggested, qualitative data often drive conceptual construction and theorisation. 

또 다른 유형의 일반화 가능성은 Fine, Tuck 및 Zeller-Berkman(2008)이 교차 일반화intersectional generalizability을 정의했던 것이다. 그들은 교차 일반화를 역사적으로 억압받거나 식민화된 민족/공동체의 세부사항과 그들의 저항의 사회적 움직임을 기록하기 위해 시간이 지남에 따라 공동체를 깊고 존중하게 파고드는 작업으로 정의했다. 이러한 유형의 일반화 가능성은 또한 '국가, 공동체, 가정 및 신체에 걸친 패턴을 추적하여 억압과 식민주의의 동맥arteries을 이론화하는 작업'을 산출하는 것이다(Fine et al. 2008, 페이지 174). 이러한 방식으로 교차 일반화 가능성은 커뮤니티 기반 연구(싱키와 블로젯 2016 참조), 페미니즘(쿠키 2016 참조) 및 토착 연구(노먼과 하트 2016 참조)와 연결된다. 
Another type of generalizability is what Fine, Tuck and Zeller-Berkman (2008) termed intersectional generalizability. They defined intersectional generalisation as work that digs deep and respectfully with a community over time to record the particulars of historically oppressed and/or colonised peoples/communities and their social movements of resistance. That type of generalizability is also about producing ‘work that tracks patterns across nations, communities, homes, and bodies to theorize the arteries of oppression and colonialism’ (Fine et al. 2008, p. 174). In such ways, then, intersectional generalizability connects with community-based research (see Schinke and Blodgett 2016), feminism (see Cooky 2016) and indigenous research (see Norman and Hart 2016).

그것은 또한 자극적 일반화provocative generalizability이라고 불리는 것뿐만 아니라 이론적 일반화 가능성과 연결되고 인식된다. 예를 들어, 이론적 일반화의 관점에서 연구팀은 사회적 억압과 한 맥락에서 다른 맥락으로 이동하는 저항의 형태에 대한 이론적 교훈을 얻을 수 있다. Fine 등에 따르면, 아마도 생성성generativity과 비슷하게, [자극적 일반화]는 독자와 청중으로 하여금 '가능성'을 재고하도록 자극하고, 연구자들에게 '아직 상상하지도, 실제로도, 아직 가시권에 있지 않은 것을 향해 연구 결과를 이동시킬 것'을 요청한다(페이지 169). 

It also connects with and recognises theoretical generalizability as well as what is termed provocative generalizability. For example, in terms of theoretical generalisation the research team can glean theoretical lessons about social oppression and forms of resistance moving from one context to another. For Fine et al., provocative generalizability, perhaps not unlike generativity (Barone and Eisner 2012), provokes readers and audiences to rethink ‘the possible’, and asks researchers to ‘move their findings toward that which is not yet imagined, not yet in practice, not yet in sight’ (p. 169). 

일반화 기회: 몇 가지 과제 및 실제 전략
Opportunities to generalise: some challenges and practical strategies

질적 연구가 통계학적 또는 확률론적 증거에 의존하지 않고 일반화할 수 있지만, 일반화가 질적 연구의 의미 있는 목표가 될 수 있다고 믿는 연구자들에게는 여전히 과제가 있다. 한 가지 과제는 '독자 일반화 reader generalizability'과 관련이 있다.

  • 확률론적-통계적 일반화 가능성의 경우, [연구자]가 일반화 가능성을 확립하는 것이 기대되지만,
  • 여러 유형의 질적 일반화에서는 [독자]가 종종 일반화에 적극적으로 참여해야 한다.

예를 들어, 자연주의적 일반화 또는 전이성을 촉진하기 위해서는 독자들이 자신의 상황과 유사하고 다른 것이 무엇인지 식별할 수 있도록 연구에 대한 두꺼운 설명과 풍부한 해석이 필요하다(Chenail 2010, Sparkes and Smith 2014).
Even though qualitative research can generalise without having to rely on statistical or probabilistic evidence, there are still challenges for researchers who believe that generalizability can be a meaningful goal for qualitative research. One challenge relates to ‘reader generalizability’.

  • Whereas in cases of probabilistic-statistical generalizability the expectation is for the researcher to be responsible for establishing generalizability, 
  • the reader in qualitative types of generalizability is often called on to be actively involved in making generalisations.

For example, to facilitate naturalistic generalizability or transferability thick descriptions and rich interpretations of the research are needed so that the readers themselves can discern what is similar and different to their own situations (Chenail 2010, Sparkes and Smith 2014).

이러한 관점에서, 일반화는 의미 있는 주제에 대한 연구를 심층적으로 제시하고 해석적 풍부함을 가진 [연구자의 능력]에 의존한다. 그러나 그들이 잘 조작된 질적 보고서를 통해 특정 일반화를 촉진하려고 할 수 있지만, 또한 [청중]이 보고서에 관여한 다음, 그들이 일반화할 수 있는 결과를 지지하거나 거부할 책임이 있다. 따라서 이러한 관점에서, [연구자와 독자]는 모두 '원래 연구의 맥락과 세부사항을 넘어서는 일련의 질적 연구 결과의 가치를 평가하는 것에 대한 책임을 공유한다.'(Chenail 2010, 페이지 6). 일반화할 수 있는 연구를 생산하는 책임이 연구원뿐만 아니라 적절한 독자에게도 주어지면서, 연구자들은 [연구가 일반화될 수 있는지에 관한 어떤 확신도 가지지 못하며, 예측할 수 없는 상황]에 놓이게 된다
Generalisation then relies on the ability of the researcher to render studies on meaningful topics, presented in depth, and with interpretive richness. But whilst they might seek to facilitate certain generalisations through a well crafted qualitative report, the onus is also placed on the audience to engage with the report, and then either support or reject the results as generalizable to them. From this perspective, therefore, researchers and readers ‘both share a responsibility when it comes to assessing the value of a particular set of qualitative research findings beyond the context and particulars of the original study’ (Chenail 2010, p. 6). With that responsibility for producing generalizable research placed on not simply the researcher but also on appropriate readers, researchers are left in a situation where they cannot predict with any certainty if research is generalizable.

따라서, 어떻게 연구자들은 (절대적인 방법론적인 확실성이 보장되는) 더 이상 완벽한God's의 관점이 없다는 것을 인식한 상태에서, 일반화의 문제를 실질적으로 진행할 수 있는가? 이러한 상황에서는,

  • 그 누구도 특정 연구의 일반화 가능성에 대한 최종적인 의견을 가지고 있지 않고,
  • 지식은 우발적인contingent 것
  • 연구자는 역사적으로 그리고 지역적으로 연구되고 있는 바로 그 과정 안에 위치한다

Accordingly, how might researchers practically proceed with the issue of generalizability whilst recognising there is no longer a God’s eye view that guarantees absolute methodological certainty, that no one person has the final word on a particular study’s generalizability, that knowledge is contingent, and that the researcher is historically and locally situated within the very processes being studied?

고려해야 할 한 가지 전략은 최종 보고서에서 특정 프로젝트에 대한 일반화 가능성에 대한 주장이나 참조를 하지 않는 것이다. 연구자는 글을 쓸 때 그들의 연구를 일반화할 자신이 없기 때문에 그렇게 하는 것일 수도 있다. 그러나 그러한 솔직함은, 예를 들어, 나중에 독자들이 그 결과가 그들에게 반향을 불러일으켰다고 말하거나, 그들의 직장으로 옮겨질 수 있다는 것을 배제하지는 않는다. 그러나 이러한 전략의 위험성은 일반화에 대한 언급이 전혀 없을 때 그 연구가 '낮은 가치'와 '부실'로 간주된다는 것이다. 왜냐하면 점점 더 연구와 평가에서 엄격함에 대한 강조가 증가하고 있으며, 질적 특성이 일반화 가능성이 결여되어 제한적이라는 여전히 너무 일반적인 믿음이 존재하기 때문이다. 하지만 그렇다고 해서 연구자가 그러한 지적을 회피하고, 잠재적 리뷰어를 만족시키기 위해 과도하게 부풀려진 주장을 하도록 해서는 안 된다. 연구는 일반화될 수 없지만 여전히 큰 장점이 될 수 있으며, 많은 분야에서 출판될 수 있다.

One strategy to consider is to make no claim or reference to generalizability for a specific project in the final report. A researcher might do that because they are not confident generalising from their study at the time of writing. That candour does not though preclude that later readers might say the results resonated with them or can be transferred to their workplace, for example. However, with an increasing emphasis on rigour in research and assessment exercises, and the still too common belief that qualitative is limited because its lacks generalizability, the risk – in some spaces – of this strategy is that the research is deemed of ‘low value’ and ‘poor’ when there is no mention at all of generalizability. That risk should not drive a researcher to making over inflated claims in order to evade such judgements and satisfy possible reviewers. Research can still be of great merit without being generalizable, and is publishable in many spaces.

특정 목적을 위해 일반화 가능성을 고려하는 경우 채택해야 할 또 다른 전략은 [일반화와 관련하여 명확하면서도 위험회피적인 방식hedging style을 사용하는 것]이다(Chenail 2010). 그러한 위험회피전략은 연구자가 보고서에서 독자에게 제안된 연구가 특정 방법(예: 양도가능성)으로 일반화될 가능성might, potential이 있다는 점을 명시적으로 강조하는 것을 포함한다. 독자에게 이 연구가 일반화될 수 있다고 제안하기 위해, 연구자는 [연구 결과에 대해 신중하게 말로 된 성찰을 제공할 수] 있다. 또한, 연구자는

  • 연구자가 선택한 일반화 유형을 명명하고,
  • 특정 유형의 일반화 가능성이 연구에 적합한 이유를 정당화하고,
  • 품질 판단 기준의 과정과 결과를 설명하고,
  • 결과의 잠재적 일반화 가능성에 대한 신뢰 수준을 측정할 수 있다.

If considering generalizability for certain purposes, another strategy to adopt is to use a clear yet hedging style of prose in relation to generalisation (Chenail 2010). That hedging strategy involves the researcher explicitly highlighting to the reader in the report that the research offered might, that is it has the potential, to be generalizable in certain ways (e.g. transferability). To suggest to the reader that the work might be generalizable, the researcher can offer carefully worded reflections about their research results. They also can

  • name the type of generalisation selected,
  • justify why that particular types of generalizability is appropriate for the research,
  • describe the process and outcome of the criteria for judging quality, and
  • gauge their level of confidence on the results’ potential generalizability.

이 예술적artful이고, 정보에 입각한 방법으로, 연구자는 독자에게 그들의 질적 연구가 맥락적 한계를 넘어서는 잠재적 가치를 가지고 있다고 제안한다(Chenail 2010). 그 전략의 한 가지 이점은 독자들이 그 연구가 일반화에 대한 최종 단어를 제공하지 않는다는 것을 상기시킨다는 것이다. 동시에, 이 전략은 독자들이 [결과에 대해서만 생각]하는 것이 아니라, [결과를 가지고 생각]하도록 자극하는 이점을 가질 수 있다. 그렇게 함으로써, 독자들은 그 연구가 얼마나 일반화 가능한지 혹은 그렇지 않은지를 성찰할 수 있을 것이다.

In this artful and informed way, the researcher suggests to audiences that their qualitative study has potential value beyond its contextual confines, or in a phrase, to be generalizable in a certain way(s) (Chenail 2010). One benefit of that strategy is that readers are reminded that the research does not offer the final word on generalisation. At the same time, the strategy could have the benefit of provoking the reader to think with the results, not just about them. In so doing, readers might reflect on how generalizable the research is or isn’t.

물론 위험회피전략hedging style에서는 '증거'를 제시하지 않고 '잠재적'이라고 주장하는 것에 대한 비판에 자신을 노출시킬 위험이 있다. 이런 비판에 대해 '연구가 일반화 될 수 있는가, 없는가'라는 문제는 경험적 질문이 아닌 개념적 문제라는 식으로 대응할 수 있다. 더욱이 '증거란 무엇인가'에 문제를 제기하고 '증거'가 논쟁적contested 용어임을 정확하게 지적함으로써 정당하게 대응할 수 있다. 이러한 이슈는 연구실 외부로 나와서, 연구자, 정책 입안자, 스포츠 조직 등의 다른 그룹과 함께할 때, 일반화 가능성에 대한 대화는 종종 곧잘 '증거'에 대한 실증적 질문으로 되돌아가버리곤 한다. 다양한 학자들이 상기시키듯 자신의 작품이 유용하고 변화를 일으키기를 원할 때 그 도전은 무시하기 어렵다. 

Of course, with a hedging strategy there is the danger of leaving oneself open to critiques about claiming ‘potential’ without providing ‘the evidence’. One could respond to such a critique by arguing that the issue of ‘can a study be generalizable or can’t it’ is a conceptual not an empirical question. Moreover, one can respond legitimately by problematizing ‘what is evidence’ and accurately pointing out that ‘evidence’ is a contested term (see Denzin 2009). Such issues recognised, when we move outside our offices and engage with different groups of researchers, policy-makers, sport organisations and so on, conversations about the potential of generalisation can often return quickly back to an empirical question about evidence. That challenge is difficult to ignore when, as various scholars remind us (Wolcott 1995, Yardley 2008, Green and Thorogood 2009, Lewis et al. 2014, Kay 2016, Darnell et al. 2017), one wants their work to be useful and make a difference.

따라서 '잠재적' 문제에 대한 대응을 고려하는 또 다른 방법은, (앞서) 연구가 발표된 후에 다른 사람들이 결과에 어떻게 반응했는지를 '증거'하고, 나중에 이 '증거'를 보여주는 것이다. 물론 그 '증거'가 연구의 일반화 가능성을 뒷받침할 것이라고 가정할 수는 없다. 또한 일반화 가능성이 '증거'된다면 '증거'는 공표 후 일정 기간 동안 생성될 것이라는 점을 인식해야 한다. 그러한 '증거'는 일부 청중을 납득시키기 위해 향후 작업에서 포착될 필요가 있을 수 있다.

Thus, another way to consider responding to the ‘potential’ issue is to ‘evidence’ after the research has been published how others have responded to the results and later show the ‘evidence’. Of course, one cannot assume that the ‘evidence’ will support research generalizability. Further, it must be recognised that if generalizability is ‘evidenced’ that ‘evidence’ would be produced some time after publication. That ‘evidence’ might need to be captured in future work to convince some audiences.

세 번째 전략은 출판을 모색하기 전에 작업이 일반화 가능하다는 '증거'를 수집한 뒤, 최종 보고서에서 연구가 특정 유형의 일반화를 입증했음을 강조하는 것이다. 그것은 연구원이 주장을 과장하거나 절대 확실성을 가지고 일반화 가능성을 제안해야 한다는 것을 의미하는 것이 아니다; 우리는 일반화 주장에 대해 신중해야 한다. 다만, 연구자들은 '증거'를 바탕으로 특정 유형의 표시 일반화 가능성을 독자들에게 강조할 수 있다. 
A third strategy is to gather the ‘evidence’ that the work is generalizable before seeking publication and to highlight in the final report that the research has demonstrated a certain type(s) of generalisation. That does not mean the researcher should exaggerate claims or suggest generalizability with absolute certainty; we should be cautious over claims to generalise. That noted, and guided through the whole research by an aligned epistemology and ontology (Onwuegbuzie and Poth 2016, Levitt et al. 2017), a researcher can highlight to readers that based on the ‘evidence’ gathered the results of the study display a certain type(s) generalizability. 

위의 전략을 사용함으로써, 어떤 질적 연구들은 '증거'를 통해 일반화 가능성을 보여준다는 이점이 있지만, 한 가지 단점은 연구가 전통적인 사례보다 훨씬 늦게 저널에 발표될 가능성이 높다는 것이다. 초기 연구보고서에 대한 답변을 받는 데에 시간이 걸릴 수 있기 때문이다. 예를 들어, Smith와 Caddick(2015)은 일반화 가능성을 얻기 위해 보고서를 펑더에 전달하고 그에 대한 응답을 수집한 지 거의 1년 만에 동료 검토를 위해 논문을 저널에 제출했다. 저널 출판 시간 지연 외에도 연구자들은 연구가 일부 또는 모든 독자에게 일반화되지 않을 수 있다는 것을 알아야 한다. 연구자가 연구의 일반화 가능성을 검토하기 위해 나섰을 때, 그들은 그것이 사람들과 어떤 식으로 일반화되지 않는다는 것을 알게 되면, 그것을 연구에 보고해야 하는 윤리적 책임이 있습니다. 그렇게 정직한 댓가가 연구에는 손해로 다가올 수 있다. 예를 들어, 일부 독자는 일반화의 가능성이 제한적이거나 부족한 것을 '부실'한 연구의 결과로 해석하여 그 가치에 의문을 제기할 수 있다. 대안적으로, 사람들이 연구에 동의하지 않거나 그것이 일반화되지 않는다고 느낄 때, 연구원들은 이러한 통찰을 주제에 대한 추가적인 이해의 원천으로 볼 수 있다. 그들은 연구에 대한 사람들의 관점을 모순, 차이점, 지식의 차이, 대안적 경험을 인정하거나 탐구할 수 있는 실용적인 기회로 사용할 수 있다.
Whilst there are benefits of suggesting that a certain piece of qualitative work displays generalizability via ‘evidence’, one challenge or drawback is that the research is likely to be published in a journal much later than traditionally the case. That is because inviting responses to an initial research report can take time. For instance, Smith and Caddick (2015) submitted their article for peer-review to a journal nearly one year after delivering the report to the funder and collecting responses to it in order to gain a sense of generalizability. In addition to journal publication time delay, researchers need to be aware that the research might not end up being generalizable to some or even all readers. When the researcher sets out to examine the generalizability of the research, and they learn it doesn’t generalise in a certain way with people, there is an ethical responsibility to report that in the research. That honesty can come at a cost to the research. For instance, some readers might interpret the limited or lack of generalizability as the result of ‘poor’ research, thereby questioning the value of it. Alternatively, when people disagree with the research or feel it doesn’t generalise, the researcher might view these insights as an additional source of understanding about a topic. They might use people’s views of the research as a practical opportunity to acknowledge and/or explore with them contradictions, differences, gaps in knowledge, and alternative experiences.

이 섹션에서 제공된 전략은 고정적이거나 최종적인 것으로 간주되어서는 안 되며, 각 전략은 수정될 수 있습니다. 이러한 전략은 연구자들이 질적 연구를 출판하거나 이미 발표된 연구에 대해 다시 반영하고자 할 때 실용적으로 일반화 가능성을 고려하는 방법에 대한 옵션과 출발점이다. 공유된 세 가지 전략 또한 연구자가 사용할 수 있는 유일한 전략은 아니다(Goodman 2008, Chenail 2010, Lewis et al. 2014 참조). 
The strategies offered within this section for thinking about generalisation should not of course be considered inflexible or final; each can be adapted. The strategies are options and starting points for how researchers might consider generalizability in a practical manner when seeking to publish qualitative research or re-reflect on already published work. The three strategies shared are also not the only ones that a researcher might use (see also Goodman 2008, Chenail 2010, Lewis et al. 2014). 

마지막으로, 이 전략을 프로젝트 중간에 고려하거나, 마지막에 바꿔버려서는 안 됩니다. '연구자들이 연구를 시작할 때 일반화 과정에 대해 생각하기 시작하는 것이 중요하다.'(6페이지) 처음부터 전략을 확정하거나 확정해야 한다는 뜻은 아니다. 그러나 프로젝트를 시작할 때 일반화 가능성에 대해 생각하기 위해서는, 연구자들은 [일반화 가능성에 대한 확장된 비전]을 가지고 있어야 한다. 여기에는 다양한 유형의 일반화 가능성, 일반화에 접근하기 위한 가능한 전략, 각 전략에 수반되는 과제 또는 리스크가 포함된다. 그들은 또한 일반화의 문제에 대한 연구 전반에 걸쳐 성찰적이어야 하며 일반화를 하나의 과정으로 보아야 한다.
Finally, the strategies offered should not ideally be considered half way through a project or bolted on at the end. As Chenail (2010) advised, it is ‘important for researchers to start thinking about the generalisation process at the beginning of their research’ (p. 6). This doesn’t mean that one has to finalise or settle on a strategy at the very beginning. Thinking about generalizability at the very start of a project does however require that researchers have an expanded vision of generalizability. That involves the researcher being familiar with different types of generalizability, the possible strategies to approach generalisation, and the challenges or risks that go with each strategy. They also need to be reflexive throughout the research on the issue of generalisation and view generalising as a process.

결론 및 권고사항
Conclusions and recommendations

우리가 일반화 가능성에 대한 논쟁을 피하거나 일반화 가능성에 대한 신화를 문제 삼지 않을 때 많은 것이 위태로워진다. 또한 질적 조사는 일반화할 수 있는 작업을 생산할 수 있기 때문에 일반화 가능성에 관심을 가져야 한다고 강조되었다. 통계적 유형의 일반화 가능성을 사용하는 대신, 질적 연구자들이 추구할 수 있는 것은 다른 유형의 일반화 가능성이라고 제안했다. 여기에는 자연주의적, 전이적, 분석적, 교차적 일반화성의 조합이 하나 이상 포함될 수 있다. 연구자가 선택할 수 있는 다른 유형의 일반화에는 유연한 일반화 가능성(Goodman 2008 참조)과 프로세스 일반화 가능성(Simons 2014 참조)이 포함된다. 마지막으로, 이 논문은 질적 연구를 출판하려고 할 때 연구자가 실질적으로 일반화 가능성에 관여하는 방법에 대한 세 가지 전략을 제공했다. 이 모든 점들을 상세히 설명함으로써, 이 논문이 '일반화 가능성에 대한 확장된 비전'을 제시하기를 바란다. 
As was suggested, much is at stake when we avoid engaging with debates on generalizability or letting myths about generalizability go unchallenged. It was moreover highlighted that we should be intrigued with generalizability since qualitative inquiry can produce work that can be generalised. Rather than use a statistical type of generalizability, it was suggested that what qualitative researchers might seek are other types of generalizability. These could include one or more of a combination of naturalistic, transferable, analytical and/or intersectional generalizability. Other types of generalizability that a researcher might choose include flexible generalizability (see Goodman 2008) and process generalizability (see Simons 2014). Finally, the paper offered three strategies for how a researcher might practically engage with generalizability when seeking to publish qualitative research. By detailing all these points, it is hoped that the paper offers an ‘expanded vision of generalizability.’

일반화에 대한 확대된 비전expanded vision of generalisation을 추구함에 있어, 모든 질적 연구자들이 일반화 가능성을 추구하거나 확립해야 한다고 제안하고 싶지는 않다. 그들이 생산하는 연구는 일반화를 넘어서거나 특정 유형의 일반화 가능성을 통해 포착할 수 없는 이익을 제공할 수 있다. 따라서 모든 정성적 연구가 일반화할 수 있는 결과를 달성하거나 고품질 일반화를 위해 동일한 유형의 일반화 가능성을 추구해야 하는 것은 아니다. 그러나 동시에, 루딘 (2006)이 질적 연구와 관련하여 언급했듯이, "너는 어리석음을 일반화할 수 있어!" (797쪽) 이를 언급하면서, 요점은 일반화는 질적 조사로부터 만들어질 수 있으며, 이것들은 정량적 연구에서 열망하는 것과는 다르다는 것이다(Ruddin 2006). 질적 연구 결과는 일반화될 수 있지만 정량적 결과와 동일한 방식으로 일반화되는 것은 아니다(Braun and Clarke 2013).
In seeking an expanded vision of generalisation, I do not wish to suggest that all qualitative researchers must seek or establish generalizability. The research they produce could offer benefits that that go beyond generalisation or which cannot be captured through a certain type of generalizability. Accordingly, not every qualitative study must achieve generalizable results or seek the same type of generalizability to be of high quality. But at the same time, as Ruddin (2006) states in relation to qualitative research, ‘You can generalise stupid!’ (p. 797). In saying this, the point is that generalisations can be made from qualitative inquiry and these are different from those aspired to in quantitative research (Ruddin 2006). Qualitative research results can be generalizable, but just not in the same way as quantitative results are (Braun and Clarke 2013).

게다가, 나는 이 논문이 스포츠와 운동 과학자들에게 일반화와 같은 다른 맥락에서 우리가 할 수 있는 대화를 자극하는 데 도움이 되는 유용한 자료가 되기를 바란다. 대화 분석가, 분열 분석가, 서술 분석가가 모두 강조하듯이, 대화는 우리의 현실을 구성하고 일을 하는데 도움을 준다. 대화가 구성적이고 행동 지향적이라는 점을 고려할 때, 질적 연구자가 일반화 가능성이 결여된 자신의 작업에 대해 사과하고 싶은 마음이 든다면, [전체 연구를 가이드하는 인식론적 및 존재론적 가정]이 [일반화 가능성에 대해 말하는 방식과 어떻게 일치하는지]만 성찰해서는 안 된다. 

Furthermore, I hope this paper is a useful resource for sport and exercise scientists to help stimulate conversations we could have in different contexts about issues like generalizability. As conversational analysts (see LeCouteur and Cosh 2016), discursive analysts (see McGannon et al. 2017), and narrative analysts (see Papathomas 2016) all highlight, conversations help constitute our realities and do things. Given that conversations are constitutive and action-orientated, if a qualitative researcher feels inclined to apologise for their work lacking (statistical-probability) generalizability, they should not only reflect on how their epistemological and ontological assumptions that guide their whole research are aligned with how they talk about generalizability.

연구자들은 특히 감사audit의 문화의 틀에서 짜여진 현재의 사회적, 정치적 풍토 속에, 사과apology를 할 때 생길 수 있는 현실과 행동을 재고할 필요가 있다. 예를 들어, 만약 연구자가 일반화 가능성이 결여된 연구에 대해 사과해야 한다고 느낀다면, 그들은 (광고적으로) 다른 사람들이 질적 조사를 거부하거나 촉진 위원회 검토와 같은 맥락에서 그것을 비하할 수 있는 근거를 제공할 수 있다. 사과함으로써 그들은 질적 연구가 양적 연구보다 열등하다는 입장을 갖게 될 수 있다. 그렇게 함으로써, 연구자는 무심코 방법의 위계를 강화하며, 권력 관계 내에서, 편집자나 검토자가 질적 연구가 표준 미달, 이류 과학, 낮은 우선순위 및 저널에 포함시킬 가치가 없다고 말하는 것에 수긍하게 된다.

They also need to reconsider the possible realities being created and actions when they offer an apology, especially within the current social and political climate framed within an audit culture (see Sparkes 2013, Giardina 2017). For example, if a researcher feels compelled to apologise for their research lacking generalizability they might (inadvertently) provide a justification for others to reject qualitative inquiry or to demean it in contexts like a promotion committee review. By apologising they could likewise position qualitative research as inferior to quantitative research. In so doing, the researcher might inadvertently reinforce a hierarchy of methods and, within power relations, any understanding an editor or reviewer might hold about qualitative research being sub-standard, a second-class science, a low priority, and/or not worthy of inclusion in journals.

그렇다면, 사과하거나, 비극적이거나, 방어적인 담론을 채택하기 보다는, 대안적 대화를 통해 질적 연구의 독특한 강점에 초점을 맞출 수 있을 것이다

  • 예를 들어, 연구자는 질적 연구의 강점은 자연주의적이고 이전가능하며 이론적이거나 교차적인 일반화를 도출할 수 있는 방법이라는 점을 지적할 수 있다. 만약 적절하다면, 그들은 또한 그 연구가 어떻게 영향을 미치고 사회에 차이를 만들었는지 강조할 수 있다.
  • 더욱이, 대화, 담론, 서술 분석가는 대화가 (자신 및 다른 사람들과의) 매일 대화와 상호작용의 형태에 내재되어 있을 뿐만 아니라 특정한 제도적 환경과 실천에 자리 잡고 있음을 상기시킨다.
  • 질적 연구자들은 우리끼리만 대화를 하거나, 단순히 같은 생각을 가진 사람들과만 대화를 할 수 없다. 우리는 가르칠 때 스포츠와 운동 과학을 넘나드는 학생들과 연결할 필요가 있습니다. 몇 개의 단체만 언급하자면, 우리는 또한 다른 분야의 비평가, 의심하는 사람들, 그리고 지지자들과 함께 참여해야 할 필요가 있다.


Rather than apologising then, or even adopting a tragic or defensive discourse, an alternative conversation could focus on the unique strengths of qualitative research.

  • For instance, when appropriate a researcher could point out that a distinctive strength of qualitative research is how it can produce naturalistic, transferable, theoretical and/or intersectional generalisations. If appropriate, they might also highlight how that research achieved impact and made a difference in society (Kay 2016).
  • Furthermore, a conversational, discursive and narrative analyst would remind us that conversations are embedded in every day forms of talk and interaction (with oneself and others), as well as situated in certain institutional settings and practices (McGannon and Smith 2015, LeCouteur and Cosh 2016).
  • Given the interactional, occasioned, constitutive and action orientated nature of talk and discourse, qualitative researchers cannot then only have conversations amongst ourselves or simply speak with like-minded people. We need to connect with students from across the sport and exercise sciences when teaching (see Knight 2016). To name just a few groups, we need to also engage with our critics, doubters and supporters from other disciplines.

마찬가지로, 약간의 영향력을 획득하고, 좋은 질적 연구를 긍정적으로 촉진하려면, 우리의 대화는 전통적으로 양적으로 더 지향적인 사람들에 의해 지배되어 왔던 맥락으로 확장될 필요가 있다.

  • 예를 들어, 대학의 질적 연구자는 테마 연구 그룹을 적극적으로 이끌거나, 연구 팀장 또는 학교/교회의 장/학장이거나, 보조금 패널, 추진 위원회 또는 윤리 위원회에서 봉사하는 자원봉사를 할 수 있다.
  • 또한, 외부 영향력 조직과의 양해각서를 개발하고, 정책 입안자를 연구 테이블에 초대하고, 지역 커뮤니티에 참여하고, 자연 과학자와 사회 과학자를 멘토링하고, 학제 간 연구 프로젝트를 시작하고 운영할 수 있습니다.
  • 그러한 일을 할 때, 사무실의 경계에 머물거나 '너무 바쁘다'고 반복해서 말하기 보다는, 일반화 가능성 등에 대한 대화를 시작하고 질적 연구가 번창할 수 있도록 도울 수 있는 방식으로 지시할 수 있다.
  • 오해하지 마십시오. 이 중 어느 것도 쉽거나 간단하거나 항상 실현 가능한 것은 없습니다(Bochner 2014 참조). 하지만 최근 몇 년 동안 다양한 질적 연구자들이 긍정적인 영향을 미치며 그런 일을 하는 것을 봐왔습니다.

Likewise, to achieve some influence and positively promote good qualitative research, our conversations need to extend into contexts that traditionally have been dominated by those who are more quantitatively orientated.

  • For instance, university qualitative researchers might seek to actively lead a themed research group, be a Head of Research or Head/Dean of a School/Faculty, or volunteer to serve on grant panels, promotion committees, or ethical boards.
  • Further, and is being done, we might develop memorandum of understandings with external organisations of influence, invite policy-makers to our research table, engage with local communities, mentor natural and social scientists, and/or initiate and run an interdisciplinary research project.
  • When doing such things, rather than remaining in the confines of our office or repeatedly saying we are ‘too busy’, conversations about generalizability (and so on) can be initiated and directed in ways that can help enable qualitative research to flourish.
  • Make no mistake – none of that is easy, straightforward, or always feasible (see Bochner 2014). I have, though, over recent years witnessed various qualitative researchers doing such things, with positive affects.

질 높은 질적 연구를 적극적으로 추진하고 일반화 가능성을 논의하려는 질적 연구자들은, 지지적인 자연과학자와 더 정량적으로 지향하는 사회과학자들의 도움을 받을 수 있다고도 할 수 있다. 사람들이 기꺼이 경청하고, 지적으로 호기심이 많고, 경찰 분야에 필요성을 느끼지 않고, 변화를 만들기 위해 최선의 연구를 하고 싶을 때 특히 그렇다.  
It must equally be said that qualitative researchers seeking to actively promote high quality qualitative research, and discuss generalizability, can be helped by supportive natural scientists and more quantitatively orientated social scientists. That is especially so when people are willing to listen, are intellectually curious, feel no need to police fields and want to do the best research to make a difference.

왜 질적 연구에 약간의 저항이 있다고 생각하느냐고 물었을 때, 모든 사람들은 이런 용어로 대답했다: '질적 연구를 받지 않거나 거의 가치를 보지 못하는 사람들은 대체로 평범한 연구자들이다. 최고의 과학자들은 좋은 질적 연구의 가치를 높이 평가하며, 질문을 고려할 때 적절할 때 더 많은 질적 연구를 원한다'.

When asked why they thought there was some resistance to qualitative research, all responded in these terms: ‘It is largely mediocre researchers who don’t get qualitative research or see little value in it. The best scientists appreciate the value of good qualitative research and want more of it when appropriate given the questions asked’.

질적 연구를 수행하기 위한 다음과 같은 요약과 권고사항이 일반화와 관련하여 제공된다.
the following summaries and recommendations for doing qualitative research are offered in relation to generalizability:

(1) 정량적 연구에 정보를 제공하는 통계적 유형의 일반화 가능성은 질적 연구에 사용하고 그 가치를 판단하는 데 적용할 수 없다. 질적 연구는 양적 연구와 다른 인식론적, 존재론적 가정, 논리학 및 목표에 의해 informed by하기 때문이다. 연구자들은 일반화 가능성을 다룰 때 연구에 inform하는 인식론, 온톨로지, 목표, 접근법, 방법론 및 방법의 차이를 인식하고 존중해야 한다.
(1) Statistical types of generalizability that inform quantitative research are not applicable to use for qualitative research and to judge the value of it. That is because qualitative research is informed by different epistemological and ontological assumptions, logics and goals to quantitative research. Researchers need to be aware and respectful of the differences in underlying epistemologies, ontologies, goals, approaches, methodologies and methods that inform research when dealing with generalizability.

(2) 질적 연구는 양적 연구와 같은 방식으로 일반화될 수 없다.
(2) Qualitative research can be generalizable, just not in the same way as quantitative research.

(3) 질적 연구가 일반화 될 수 있고, 좋은 질적 연구가 항상 일반화 가능성을 표시할 필요는 없기 때문에, 학술지 논문에 질적 작업의 약점이나 한계가 일반화 가능성 부족이라고 쓴 것은 잘못이다.
(3) Because qualitative research can be generalizable, and good qualitative research need not always display generalizability, it is a mistake to write in a journal article that a weakness or limitation of qualitative work is its lack of generalizability.

(4) 우리는 한 가지 특정 유형의 일반화 가능성(통계적 확률)에만 제한해서는 안 되며, 모든 연구에 그러한 유형을 부과해야 한다. 질적 연구에 유익한 방법으로 사용될 수 있는 다양한 유형의 일반화 가능성이 있다. 이러한 유형에는 자연주의 일반화, 전이성, 분석 일반화 및 교차 일반화성이 포함된다. 이러한 각 유형의 일반화는 정량적 연구의 일반화가 제공할 수 있는 것과 매우 다르지만 매우 유용하며, 따라서 우리의 지식과 연구 능력에 독특하게 추가된다.
(4) We should not restrict ourselves to just one particular type of generalizability – namely, statistical-probability – and impose that type onto all research. There are various types of generalizability that might be used in qualitative research in beneficial ways. These types include naturalistic generalizability, transferability, analytical generalizability and intersectional generalizability. Each of these types of generalisation offers something very different – but highly useful – to what generalizability in quantitative research can provide, thereby uniquely adding to our knowledge and research abilities.

(5) 연구자들은 통계적 확률의 일반화 가능성이 결여된 질적 연구에 대해 사과하거나 친구에게 우리가 오해하고 있다고 한탄하기보다는, 질적 연구의 가치를 보여주고 일반화 가능성에 대한 이슈를 토론함으로써 다양한 그룹과 참여하는 것을 고려할 수 있다. 분명 쉽지 않거나 항상 적용가능하지는 않지만, 우리는 용기를 가지고 리더십의 자리를 차지할 수 있고, 기관들을 넘나들며 우리와 다른 학자들을 참여시키고, 교육하고 권력자들에게 진실을 말할 수 있는 시간을 가질 수 있다.

(5) Rather than apologising for qualitative research lacking statistical-probability generalizability or bemoaning to friends that we are misunderstood, researchers can consider engaging with different groups by showing them the value of qualitative research and debating issues around generalizability. Whilst certainly not easy or always applicable, we can have the courage and take the time to take leadership positions, engage with scholars who are different to us across our institutions, take the time to educate and speak truth to those in power.

(6) 저널 검토자, 편집자 및 정책 입안자는 일반화를 이유로 질적 연구를 무시해서는 안 된다. 그들은 일반화 가능성이 통계적 확률 표본 추출 이론에만 국한되지 않는다는 수많은 학자들의 견해를 이해할 필요가 있다. 일반화에는 다른 유형이 있으며, 따라서 일반화를 위한 또 다른 방법들이 있다. 어떤 유형도 모두 본질적으로 다른 유형보다 좋거나 나쁘지는 않다; 각각은 다른 목적과 다른 결과를 가지고 있으며, 이는 채택된 기본 가정과 방법론에 연결되어 있다.

(6) Journal reviewers, editors and policy-makers should not dismiss qualitative research on grounds of generalizability. They need to appreciate the view held by numerous scholars that generalizability is not limited to statistical-probability sampling theory. There are different types of generalisation, and therefore different ways to generalise. Neither type is inherently better or worse than another; each has different purposes and differing outcomes, which are tied to the underlying assumptions and methodology employed.

(7) 과장하지 않으면서, 또한 연구를 안내하는 존재론적 및 인식론적 가정 내에서 정렬을 지키면서, 연구자는 일반화 가능성을 추구하기 위하여, 독자들에게 [일반화가 가능하다]거나, [일반화의 유형을 뒷받침하기 위해 '증거를 수집'할 수 있음]을 제안하는 것을 고려할 수 있다. 질적 연구자만이 항상 일반화 가능성을 추구할 의무가 있는 것은 아니다. 생성된 연구는 일반화되지 않아도 여전히 큰 이점을 제공할 수 있다.

(7) Without overstating things, and working in alignment within the ontological and epistemological assumptions that guide ones work, when a researcher seeks generalizability they could consider suggesting to readers that their research might be generalizable or ‘gather the evidence’ to support a type(s) of generalizability. Qualitative researchers should not though be obliged to always seek generalizability. The research produced can still offer great benefits without it being generalizable. 

 


Abstract

Generalisation in relation to qualitative research has rarely been discussed in-depth in sport and exercise psychology, the sociology of sport, sport coaching, or sport management journals. Often there is no mention of generalizability in qualitative studies. When generalizability is mentioned in sport and exercise science journals it is often talked about briefly or highlighted as a limitation/weakness of qualitative research. The purpose of this paper is to provide a detailed discussion of generalisation in order to dispel any misunderstandings or myths about generalizability in qualitative research and offer guidance about how researchers might consider generalisation. It is emphasised that it is a misunderstanding to claim that qualitative research lacks generalizability. It is highlighted that statistical types of generalizability that inform quantitative research are not applicable to judge the value of qualitative research or claim that it lacks generalizability. Reasons as to why researchers might consider generalizability in qualitative research are then offered. It is emphasised that generalisations can be made from qualitative research, but just not in the same way as quantitative results are. To help guide how generalisation might be considered, four different types of generalizability are presented: naturalistic generalisation, transferability, analytical generalizability and intersectional generalizability. Practical strategies are also offered for considering generalizability when seeking to publish qualitative research or reflect on already published work. The paper concludes with a set of recommendations to support high quality and rigorous qualitative research for scholars – including journal editors and reviewers – in relation to generalizability.

 

질적연구에서 포화: 개념과 조작화 탐색(Qual Quant, 2018)
Saturation in qualitative research: exploring its conceptualization and operationalization
Benjamin Saunders1 • Julius Sim1 • Tom Kingstone1 • Shula Baker1 • Jackie Waterfield2 • Bernadette Bartlam1 • Heather Burroughs1 • Clare Jinks

 

 

도입 Introduction

넓은 의미에서, 포화는 질적 연구에서 데이터 수집 및/또는 분석을 중단하는 기준으로 사용된다. 그것의 기원은 근거이론(글레이저와 스트라우스 1967)에 있지만, 현재 질적 연구에 대한 다양한 접근법에 걸쳐 어떤 형태로든 받아들여지고 있다. 실제로, 포화는 종종 그러한 작업 내에서 필수적인 방법론적 요소로 제안된다. Fusch와 Ness (2015: 페이지 1408)는 '포화에 도달하는 데 실패하는 것은 수행된 연구의 질에 영향을 미친다'고 단정적으로 주장한다. Morse (2015: 페이지 587)는 포화도가 '저자들이 제공하는 질적 엄격성의 가장 빈번하게 주장하는 보증'이라고 언급한다. Guest 등은 포화를 '건강 과학 연구에서 목적적 표본 크기가 결정되는 황금률'가 되었다고 언급한다. 많은 저자들이 질적 연구의 포화를 '규칙'(Denny 2009; Sparkes et al. 2011) 또는 '칙령'(Morse 1995)으로 언급하고 있으며, 질적 방법에 대한 여러 가지 일반적인 퀄리티 기준에 등장한다.

In broad terms, saturation is used in qualitative research as a criterion for discontinuing data collection and/or analysis.Footnote1 Its origins lie in grounded theory (Glaser and Strauss 1967), but in one form or another it now commands acceptance across a range of approaches to qualitative research. Indeed, saturation is often proposed as an essential methodological element within such work. Fusch and Ness (2015: p. 1408) claim categorically that ‘failure to reach saturation has an impact on the quality of the research conducted’;Footnote2 Morse (2015: p. 587) notes that saturation is ‘the most frequently touted guarantee of qualitative rigor offered by authors’; and Guest et al. (2006: p. 60) refer to it as having become ‘the gold standard by which purposive sample sizes are determined in health science research.’ A number of authors refer to saturation as a ‘rule’ (Denny 2009; Sparkes et al. 2011), or an ‘edict’ (Morse 1995), of qualitative research, and it features in a number of generic quality criteria for qualitative methods (Leininger 1994; Morse et al. 2002).

  1. 1. 일차 연구에 주로 사용되었지만, 포화 원칙은 정성적 합성에도 적용되었다. 그러나 여기서 우리의 초점은 1차 연구에서 사용하는 것에 있다.
    1. 
    Although primarily employed in primary research, principles of saturation have also been applied to qualitative synthesis (Garrett et al. 2012; Lipworth et al. 2013). However, our focus here is on its use in primary studies.
  1. 2. 이 저자들은 포화가 '양적, 질적 또는 혼합된 방법에 관계없이 모든 연구에서 중요하다'는 보다 극단적인 주장을 펼친다(Fusch and Ness 2015: 페이지 1411).
    2. 
    These authors proceed to make the more extreme claim that saturation ‘is important in any study, whether quantitative, qualitative, or mixed methods’ (Fusch and Ness 2015: p. 1411).

 

그러나, 명백하게 정통성의 지위에 도달했음에도 불구하고, 포화상태는 문헌 내에서 다양한 방식으로 정의되거나 때로는 정의되지 않으며, 여러 가지 개념적, 방법론적 문제를 제기한다(Dey 1999; Bowen 2008; O'Reilly and Parker 2013) 본 논문은 문헌의 여러 예를 바탕으로 세 가지 핵심 질문과 관련하여 이러한 문제 중 일부를 탐구하고자 한다. 
However, despite having apparently attained something of the status of orthodoxy, saturation is defined within the literature in varying ways—or is sometimes undefined—and raises a number of problematic conceptual and methodological issues (Dey 1999; Bowen 2008; O’Reilly and Parker 2013). Drawing on a number of examples in the literature, this paper seeks to explore some of these issues in relation to three core questions:

  • "포화는 무엇인가?"—포화는 어떤 방식으로 정의되는 거죠?
  • '어디서 왜?'—어떤 유형의 질적 연구, 그리고 어떤 목적을 위해 포화를 추구해야 하는가?
  • '언제 어떻게?—연구의 어떤 단계에서 포화를 추구하며, 그것이 달성되었는지 어떻게 평가할 수 있는가?
  • ‘What?’—in what way(s) is saturation defined?
  • ‘Where and why?’—in what types of qualitative research, and for what purpose, should saturation be sought?
  • ‘When and how?’—at what stage in the research is saturation sought, and how can we assess if it has been achieved?

 

"포화란 무엇인가?"—포화는 어떤 방식으로 정의되는 거죠?
‘What?’—in what way(s) is saturation defined?

글레이저와 슈트라우스는 그들의 근거이론에 대한 최초의 논문에서 포화를 다음과 같이 정의했다.
In their original treatise on grounded theory, Glaser and Strauss (1967: p. 61) defined saturation in these terms:

[특정 범주와 관련하여 또 다른 그룹의 표본수집을 중단해야 하는 시기를 판단하는 기준]은 범주의 이론적 포화도이다. 포화상태는 사회학자가 범주의 속성을 개발할 수 있는 추가 데이터가 발견되지 않음을 의미한다. 유사한 사례를 반복해서 보면서, 연구자들은 한 범주가 포화 상태라는 것을 경험적으로 확신하게 된다. 연구자는 가능한 한 다양한 데이터를 확장시켜줄 수 있는 그룹을 찾기 위해 노력합니다. 이러한 노력을 통해 '포화'는 해당 범주에서 가능한 가장 광범위한 데이터를 기반으로 한다는 것을 확실하게 해준다.
The criterion for judging when to stop sampling the different groups pertinent to a category is the category’s theoretical saturation. Saturation means that no additional data are being found whereby the sociologist can develop properties of the category. As he sees similar instances over and over again, the researcher becomes empirically confident that a category is saturated. He goes out of his way to look for groups that stretch diversity of data as far as possible, just to make certain that saturation is based on the widest possible range of data on the category.

 

여기서, [의사결정은 '추가 표본 추출을 할 것인지']와 관련이 있으며, 적절한 표본 추출의 결정 요인은 분석 과정에서 이론적 범주theoretical category의 개발 정도와 관련이 있다. 따라서 포화는 [이론적 표본 추출]의 개념과 밀접한 관련이 있다. 이는 표본 추출이 '새롭게 등장하는emerging 이론에 필요한 유사점 및 대비점'에 의해 유도된다는 생각이다. 포화는 연구자가 '샘플링, 데이터 수집, 데이터 분석을 (선형적으로 이뤄지는 별도의 단계로 취급하기보다는) 결합하게끔' 한다.

Here, the decision to be made relates to further sampling, and the determinant of adequate sampling has to do with the degree of development of a theoretical category in the process of analysis. Saturation is therefore closely related to the notion of theoretical sampling—the idea that sampling is guided by ‘the necessary similarities and contrasts required by the emerging theory’ (Dey 1999: p. 30)—and causes the researcher to ‘combine sampling, data collection and data analysis, rather than treating them as separate stages in a linear process’ (Bryman 2012: p. 18).

Urquhart(2013: 페이지 194)는 근거이론의 관점에서 포화를 다음과 같이 정의한다. '데이터에서 새로운 코드가 발생하지 않는 것을 발견하는 지점을 말한다. 같은 코드를 가진 인스턴스가 있지만 새로운 코드는 없는 것이다' Given은 은 포화 상태를 '추가 데이터가 새로운 Emergent themes를 초래하지 않는' 지점이라고 이야기했다. 다른 사람들도 새로운 코드나 테마의 출현에 대해 비슷한 입장을 취했다. 이러한 정의는 강조의 변화를 보여주며, [두 번째 포화 모델]을 제안합니다. 초점은 [분석 수준]에 머물러 있지만, 결정은 (이미 확인된 코드의 개발 정도보다는) [새로운 코드나 테마의 출현]과 관련이 있는 것으로 보인다. 또한 Urqhart(2013)와 Birks and Mills(2015)는 포화 상태를 [새로운 데이터 수집보다는 분석의 종료]와 주로 연관시킨다.

Also writing from a grounded theory standpoint, Urquhart (2013: p. 194) defines saturation as: ‘the point in coding when you find that no new codes occur in the data. There are mounting instances of the same codes, but no new ones’, whilst Given (2016: p. 135) considers saturation as the point at which ‘additional data do not lead to any new emergent themes’. A similar position regarding the (non)emergence of new codes or themes has been taken by others (e.g. Birks and Mills 2015; Olshansky 2015).Footnote3 These definitions show a change of emphasis, and suggest a second model of saturation. Whilst the focus remains at the level of analysis, the decision to be made appears to relate to the emergence of new codes or themes, rather than the degree of development of those already identified. Moreover, Urqhart (2013) and Birks and Mills (2015) relate saturation primarily to the termination of analysis, rather than to the collection of new data.

  1. 3. Birks and Mills (2015)는 또한 이론적 포화의 일부로서 '범주는 명확하게 정의되고 차원화된 특성으로 명확하게 표현된다'고 언급하고 있으며, 이는 새로운 테마의 (비) 출현의 사실보다는 포화에 대한 다소 광범위한 관점을 시사한다는 점에 주목해야 한다.
    3. 
    It should be noted that Birks and Mills (2015) also state that, as part of theoretical saturation, ‘Categories are clearly articulated with sharply defined and dimensionalized properties’, suggesting a somewhat broader view of saturation, in which the nature of emerging themes is important, rather than just the fact of their (non)emergence.

그러나 Starks and Trinidad (2007: p. 1375)에 따르면, 이론적인 포화는 '이론을 구성하는 전체 범위의 구조가 데이터로 완전히 표현될 때' 발생한다. 완전히 명시적이지는 않지만, 이 정의는 [다른 논리의 방향성을 가진 세 번째 포화 모델]을 제안한다: '데이터를 고려할 때, 우리는 분석적 또는 이론적 적절성을 가지고 있는가?'가 아니라, '이론을 고려할 때, 우리는 그것을 설명하기에 충분한 데이터를 가지고 있는가?'인 것이다.
According to Starks and Trinidad (2007: p. 1375), however, theoretical saturation occurs ‘when the complete range of constructs that make up the theory is fully represented by the data’. Whilst not wholly explicit, this definition suggests a third model of saturation with a different directional logic: not ‘given the data, do we have analytical or theoretical adequacy?’, but ‘given the theory, do we have sufficient data to illustrate it?’Footnote4

  1. 4. 이것은 슈트라우스의 표본 추출에 대한 접근에 대한 글레이저의 비판을 불러일으킨다. 그는 그것을 이론적인 표본 추출이라기 보다는 관습적인 표본 추출로 간주한다. 슈트라우스에게 발견은 귀납induction와 출현emergence을 의미하는 것이 아니라, 그의 이론을 시험할 수 있도록 데이터에서 찾는 것finding을 의미한다.' (Glaser 1992: 페이지 103).
    4. 
    This evokes Glaser’s criticism of Strauss’s approach to sampling, which he regards as conventional, rather than theoretical, sampling: ‘In conventional sampling the analyst questions, guesses and uses experience to go where he thinks he will have the data to test his hypotheses and find the theory that he has preconceived. Discovery to Strauss does not mean induction and emergence, it means finding his theory in data so that it can be tested’ (Glaser 1992: p. 103).

 

근거이론 문헌 밖으로 이동하면, [네 번째 관점은 이론적 포화theoretical saturation보다는 데이터 포화data saturation를 참조하는 것]이 명백해진다(예: Fusch 및 Ness 2015). 이러한 포화 관점은 새로운 것이 드러나지 않을 때까지 [얼마나 많은 데이터(보통 인터뷰 횟수)가 필요]한가, 또는 Sandelowski(2008: 페이지 875)가 '정보 중복성'(예: 프랜시스 외 2010; Guest et al. 2006)이라고 부르는 것에 초점을 맞춘 것으로 보인다. Grady(1998: 페이지 26)는 [데이터 포화]에 대한 유사한 설명을 제공한다:
If we move outside the grounded theory literature,Footnote5 a fourth perspective becomes apparent in which there are references to data saturation, rather than theoretical saturation (e.g. Fusch and Ness 2015).Footnote6 This view of saturation seems to centre on the question of how much data (usually number of interviews) is needed until nothing new is apparent, or what Sandelowski (2008: p. 875) calls ‘informational redundancy’ (e.g. Francis et al. 2010; Guest et al. 2006). Grady (1998: p. 26) provides a similar description of data saturation as the point at which:

새로운 데이터는 이미 수집된 데이터를 중복하는 경향이 있습니다. 인터뷰에서 연구원이 동일한 의견을 계속해서 듣기 시작하면 데이터 포화 상태에 도달하게 됩니다. 이제 정보 수집을 중단하고 수집된 정보를 분석하기 시작해야 할 때입니다.
New data tend to be redundant of data already collected. In interviews, when the researcher begins to hear the same comments again and again, data saturation is being reached… It is then time to stop collecting information and to start analysing what has been collected.

 

  1. 5. Charmaz(2008, 2014)는 근거이론의 맥락을 넘어선 포화 개념의 확장에 비판적이다. 특히 데이터 포화라고 부르는 것으로의 확장에 대해 그렇다.
    5. 
    Charmaz (2008, 2014) is critical of the extension of the notion of saturation beyond the context of grounded theory, and in particular of its extension into what we here refer to as data saturation.
  2. 6. 데이터 포화와 이론적 포화를 명시적으로 구분하는 저자는 거의 없다. 
    6. 
    Few authors draw an explicit distinction between data and theoretical saturation—among the exceptions are Bowen (2008), Sandelowski (2008), O’Reilly and Parker (2013), and Hennink et al. (2017).

 

다른 몇몇 연구진도 유사한 방식으로 데이터 포화도를 정의한 반면, 레가드 등은 [데이터 포화에 관하여 조금 더 협소하고 개인 지향적인 관점]을 채택하는 것으로 보인다. 즉, 포화는 데이터 세트 전체 수준이 아니라 [개별 참가자가 제공한 데이터]와 관련하여 작동한다. 즉, 포화는 [특정 인터뷰 내의 특정 지점]에서 달성된다.
Whilst several others have defined data saturation in a similar way (e.g. Hill et al. 2014: p. 2; Middlemiss et al. 2015; Jackson et al. 2015), Legard et al. (2003) seem to adopt a narrower, more individual-oriented perspective on data saturation, whereby saturation operates not at the level of the dataset as a whole, but in relation to the data provided by an individual participant; i.e. it is achieved at a particular point within a specific interview:

연구자가 참가자의 관점을 완전히 이해한 포화 상태에 도달했다고 느낄 때까지 조사를 계속할 필요가 있다(Legard 등 2003: 페이지 152).
Probing needs to continue until the researcher feels they have reached saturation, a full understanding of the participant’s perspective (Legard et al. 2003: p. 152).

 

이러한 관점에서, 데이터에 대한 연구자의 대응(새로운 '정보'의 생성 여부에 대한 의사결정)이 반드시 분석 자체의 일부로 인식되지는 않는다. 따라서 이 모델에서 포화 과정은 [주로 데이터 수집 수준에 위치]하며, 데이터 분석의 전체 프로세스, 즉 이론과 분리된다.
From this perspective, the researcher’s response to the data—through which decisions are made about whether or not any new ‘information’ is being generated—is not necessarily perceived as forming part of the analysis itself. Thus, in this model, the process of saturation is located principally at the level of data collection and is thereby separated from a fuller process of data analysis, and hence from theory.

따라서 네 가지 다른 포화 모델이 존재하는 것으로 보인다(표 1).

1. 첫 번째는 전통적인 근거이론에 뿌리를 두고 있으며, [이론적 표본 추출]의 개념에 따라서, [분석 과정에서의 범주 개발과 새롭게 만들어지는 이론Emerging theory]을 [추가 데이터 수집의 기준]으로 사용한다. 일반적으로 사용되는 용어를 사용하지만, 더 구체적인 정의에 초점을 둔다면, 이 모델은 [이론적인 포화theoretical saturation]로 분류될 수 있다. 

2. 두 번째 모델은 유사한 접근방식을 취하지만, 포화도는 [새로운 코드나 테마의 식별]에 초점을 맞추고 있으며, 기존의 [이론적 범주의 완전성]보다는, 그러한 [코드나 테마의 수]를 기반으로 한다. 이것은 [귀납적 주제 포화inductive thematic saturation]이라고 할 수 있다. 이 모델에서 포화도는 [분석 수준에 국한된 것]으로 보이며, 데이터 수집에 대한 의미는 기껏해야 함축적이다. 

3. 세 번째 모델에서는 앞선 논리가 반전되는데, 여기서 데이터는 (이론을 발전시키거나 정제refine하기보다는), [낮은 단계의 코드나 테마 수준에서 이론을 예시exemplify]하기 위해 수집된다. 이 모델은 사전 결정된 이론적 범주의 개념을 가리키고 근거 이론의 '귀납적 논리'라는 특성으로부터 우리를 멀어지게 하기 때문에, [선험적 주제 포화a priori thematic saturation]라고 불릴 수 있다. 

4. 네 번째 모델은 포화도를 [데이터에서 중복성을 식별하는 문제]로 간주하며, 이러한 데이터에 연결된 이론을 참조할 필요가 없다. 이러한 포화를 일반적으로 사용되고 있는 용어에 맞추어 [데이터 포화data saturation]라고 합니다. 네 번째 모델에서 포화는 공식적인 [데이터 분석과는 구별되는 것]으로 보입니다.
Four different models of saturation seem therefore to exist (Table 1).

The first of these, rooted in traditional grounded theory, uses the development of categories and the emerging theory in the analysis process as the criterion for additional data collection, driven by the notion of theoretical sampling; using a term in common use, but with a more specific definitional focus, this model could thus be labelled as theoretical saturation.

The second model takes a similar approach, but saturation focuses on the identification of new codes or themes, and is based on the number of such codes or themes rather than the completeness of existing theoretical categories. This can be termed inductive thematic saturation. In this model, saturation appears confined to the level of analysis; its implication for data collection is at best implicit.

In the third model, a reversal of the preceding logic is suggested, whereby data is collected so as to exemplify theory, at the level of lower-order codes or themes, rather than to develop or refine theory. This model can be termed a priori thematic saturation, as it points to the idea of pre-determined theoretical categories and leads us away from the inductive logic characteristic of grounded theory.

Finally, the fourth model—which, again aligning with the term already in common use, we will refer to as data saturation—sees saturation as a matter of identifying redundancy in the data, with no necessary reference to the theory linked to these data; saturation appears to be distinct from formal data analysis.

 

'하이브리드' 형태의 포화
‘Hybrid’ forms of saturation

일부 저자들은 위에서 정의한 [두 개 이상의 모델을 결합]하여 개념화를 덜 구별되게 하는 포화 해석을 지지하는 것으로 보인다. 예를 들어, Goulding(2005)은 데이터와 이론 모두 근거이론 내에서 포화되어야 한다고 제안했고, Drisko(1997: 페이지 192)는 포화를를 '데이터 수집과 분석의 포괄성' 측면에서 정의했다. 비슷하게, 모스의 포화에 대한 관점은 [이론적인 요소와 데이터 포화 요소 모두를 구체화한 것]으로 보인다. 그녀는 데이터 포화 과정을 제안하는 방식으로 포화 상태를 복제 개념과 연결한다.
Some authors appear to espouse interpretations of saturation that combine two or more of the models defined above, making its conceptualization less distinct. For example, Goulding (2005) suggests that both data and theory should be saturated within grounded theory, and Drisko (1997: p. 192) defines saturation in terms of ‘the comprehensiveness of both the data collection and analysis’. Similarly, Morse’s view of saturation seems to embody elements of both theoretical and data saturation. She links saturation with the idea of replication, in a way that suggests a process of data saturation:

그러나 도메인이 완전히 샘플링되면(모든 데이터가 수집되면) 데이터의 복제가 발생하고 이 복제를 통해 포화 신호가 발생합니다(Morse 1995: 페이지 148).

However, when the domain has been fully sampled – when all data have been collected – then replication of data occurs and, with this replication… the signal of saturation (Morse 1995: p. 148).

 

모스는 자신의 학생들이 '언제 포화 상태에 이르렀는지를 알 수 있다. 바로 더 일반적인 용어로 데이터에 대해 이야기하기 시작하는 때, 그리고 질문을 받았을 때 예시를 쉽게 제공할 수 있는 때이다. 학생들이 자신의 데이터를 '알고' 있는 것이다.' (모스 2015: 페이지 588) 이 역시 [데이터 포화 형태]를 시사한다. 그러나 모스는 또한 '개념의 특성을 파악하고 이론을 발전시키기에는 각 범주에 예시가 너무 적을 때'는 포화가 결여되었다고 제안한다. 이러한 관점은 [데이터 수준]과 [데이터가 이론을 예시하는 방식]에 큰 중점을 두고 있으므로 데이터와 이론적 포화 상태를 모두 환기시키는 것처럼 보이지만, 이론 개발의 개념에 확고히 자리 잡고 있는 것으로 보인다.

Morse notes elsewhere that she is able to tell when her students have achieved saturation, as they begin to talk about the data in more generalized terms and ‘can readily supply examples when asked. These students know their data’ (Morse 2015: p. 588). This too suggests a form of data saturation. However, Morse also proposes that saturation is lacking when ‘there are too few examples in each category to identify the characteristics of concepts, and to develop theory’ (Morse 2015: p. 588). This perspective seems to be located firmly in the idea of theory development (as other parts of the quoted papers by Morse make clear), though a heavy emphasis is placed at the level of the data and the way in which the data exemplify theory, thereby seeming to evoke both data and theoretical saturation.

Hennink 등(2017)은 더 나아가 네 가지 포화 모델의 요소를 모두 결합한 것으로 보인다. 그들은 먼저 '코드 포화'를 식별한다. 이는 [귀납적 주제 포화 요소]와 [데이터 포화] 요소를 결합한 것으로 보인다. 즉, '추가 문제가 식별되지 않고 코드북이 안정화되기 시작하는 지점'이다. 그러나, 이 접근법 내에서 포화는 귀납적으로 개발된 코드뿐만 아니라 세 번째 모델인 [선험적 주제적 포화]를 반영하는 [선험적 코드]와도 관련이 있는 것으로 논의된다. 그들은 또한 '코드 포화'와 '의미 포화'를 구별한다. '의미 포화'에서 분석가는 '[구체적 코드]로부터 [개념적 코드나 개념적 차원]을 완전히 이해하려고 한다'. 코드의 차원을 포화시키는 것에 대한 이러한 초점은 이론적 포화와 더 유사한 것처럼 보인다. 그러나 그들의 분석은 이러한 [코드에서 개발된 이론적 범주]보다는 [코드 수준]에 머무르며, Hennink 등은 그들의 접근방식을 명시적으로 근거이론 방법의 외부에 배치한다.
Hennink et al. (2017) go further, appearing to combine elements of all four models of saturation. They firstly identify ‘code saturation’, the point at which ‘no additional issues are identified and the codebook begins to stabilize’ (2017: p. 4), which seems to combine elements of both inductive thematic saturation and data saturation. However, within this approach saturation is discussed as relating not only to codes developed inductively, but also to a priori codes, which echoes the third model: a priori thematic saturation. They go on to distinguish ‘code saturation’ from ‘meaning saturation’; in the latter, the analyst attempts to ‘fully understand conceptual codes or the conceptual dimensions of… concrete codes’ (2017: p. 14). This focus on saturating the dimensions of codes seems more akin to theoretical saturation; however, their analysis remains at the level of codes, rather than theoretical categories developed from these codes, and Hennink et al. explicitly position their approach outside grounded theory methods.

'어디서 왜?'—어떤 유형의 질적 연구, 그리고 어떤 목적을 위해 포화를 추구해야 하는가?
‘Where and why?’—in what types of qualitative research, and for what purpose, should saturation be sought?

모스(2015: 페이지 587)는 포화가 모든 질적 연구에서 '존재'하고 있으며, 질적 연구에서 표본 크기를 결정하기 위한 '황금률'로 간주되며, 질적 연구의 다른 유형 간 차이는 거의 없다. 우리는 이 관점에 의문을 제기한다. 대신 이전 절에서 고려된 다른 포화 모델에서 제안된 바와 같이, [포화는 이론의 역할에 따라 다른 관련성과 다른 의미]를 가지며, 이러한 관점은 질적 연구방법의 여러 스펙트럼에 걸쳐 그것의 적용에 의문을 제기했던 다른 연구자들도 어느 정도 지지하고 있다. (Walker 2012; O'Reilly and Parker 2013; van Manen et al. 2016)
Morse (2015: p. 587) takes the view that saturation is ‘present in all qualitative research’ and as previously noted, it is commonly considered as the ‘gold standard’ for determining sample size in qualitative research, with little distinction between different types of qualitative research. We question this perspective, and would instead argue—as is suggested by the different models of saturation considered in the previous section—that saturation has differing relevance, and a different meaning, depending on the role of theory, a viewpoint somewhat supported by other commentators who have questioned its application across the spectrum of qualitative methods (Walker 2012; O’Reilly and Parker 2013; van Manen et al. 2016).

연역적 접근법(즉, 데이터에 사전 식별된 코드, 테마 또는 기타 분석 범주를 귀납적으로 나타내기 보다는 전체적으로 또는 주로 적용하는 접근법)에서 포화는 [사전 결정된 코드 또는 테마가 데이터에 적절하게 표현되는 정도]를 나타낼 수 있다. 위에 요약된 [선행 주제 포화 모델]에서 제안된 바와 같이, 범주가 데이터의 인스턴스(instance)로 충분히 채워지는 것을 의미한다. 따라서 포화도에 대한 적절한 표본 크기를 설정하려는 시도에서, 프랜시스 등은 [포화]를 [내용 타당도 개념]과 연결하였다. 대조적으로, 귀납적 접근법(예: 위에서 설명한 귀납적 주제 포화 모델 및 이론적 포화 모델)에서, 포화도는 데이터 내에서 '새로운' 코드나 테마가 식별되는 정도 및 이 과정을 통해 데이터에서 새로운 이론적 통찰력을 얻는 정도를 제시한다.
In a largely deductive approach (i.e. one that relies wholly or predominantly on applying pre-identified codes, themes or other analytical categories to the data, rather than allowing these to emerge inductively) saturation may refer to the extent to which pre-determined codes or themes are adequately represented in the data—rather like the idea of the categories being sufficiently replete with instances, or ‘examples’, of data, as suggested in the a priori thematic saturation model outlined above. Thus, in their attempt to establish an adequate sample size for saturation, Francis et al. (2010) refer explicitly to research in which conceptual categories have been pre-established through existing theory, and it is significant in this respect that they link saturation with the notion of content validity. In contrast, within a more inductive approach (e.g. the inductive thematic saturation and theoretical saturation models outlined above), saturation suggests the extent to which ‘new’ codes or themes are identified within the data, and/or the extent to which new theoretical insights are gained from the data via this process.

연역적 접근법과 귀납적 접근법 모두에서, 분석에 대한 근본적인 접근법은 본질적으로 주제적이며, 대개 다수의 정보 제공자를 포함하는 인터뷰 또는 포커스 그룹 연구의 맥락에서 발생하기 때문에, 각각의 경우에 따라 포화의 역할을 이해할 수 있다. 분석에 대한 전기적 또는 서술적 접근법에 기초하거나 보다 일반적으로 개별 정보 제공자의 설명에 대한 특정 초점을 포함하는 질적 접근법에서 포화 역할을 식별하는 것은 덜 간단하다(예: 해석적 현상학적 분석. 이러한 연구에서 분석은 분석적 주제themes보다는 개별 accounts의 가닥strand에 더 집중하는 경향이 있다. 가닥은 본질적으로 연속적인 반면, 테마는 본질적으로 반복적이다.

In both the deductive and the inductive approach, we can make sense of the role of saturation, however much it differs in each case, because the underlying approach to analysis is essentially thematic, and usually occurs in the context of interview or focus group studies involving a number of informants. It is less straightforward to identify a role for saturation in qualitative approaches that are based on a biographical or narrative approach to analysis, or that, more generally, include a specific focus on accounts of individual informants (e.g. interpretative phenomenological analysis). In such studies, analysis tends to focus more on strands within individual accounts rather than on analytical themes; these strands are essentially continuous, whereas themes are essentially recurrent.

포화가 목적을 명확히 하는 데 도움이 될 수 있는 다양한 유형의 연구를 고려한다.

  • 연역적 접근법에서 사용될 때, 포화는 데이터가 이전에 결정된 개념 범주를 instantiate하는 정도를 입증하는 역할을 한다.
  • 반면, 귀납적 접근법, 특히 근거이론에서 포화는 이론 개발과 관련하여 표본 추출의 적절성에 대해 무언가를 알려준다.(비록 이것이 얼마나 구체적으로 달성되어야 하는지에 대한 서로 다른 설명들이 있다는 것을 알긴 하지만.)

Considering the various types of research in which saturation might feature helps to clarify the purposes it is intended to fulfil.

  • When used in a deductive approach to analysis, saturation serves to demonstrate the extent to which the data instantiate previously determined conceptual categories,
  • whereas in more inductive approaches, and grounded theory in particular, it says something about the adequacy of sampling in relation to theory development (although we have seen that there are differing accounts of how specifically this should be achieved).

내러티브 연구에서, 포화를 위한 역할은 구별하기가 더 어렵다. 이론의 충분한 발전이라기보다는 전기적인 서술의 '완전성'을 나타내는 것으로 보일 수 있다. 그러나 참가자의 이야기가 '완전'으로 해석되는 지점(연구의 초점과 관련이 있어 보이는 모든 것을 전달한 때)이 사실 포화 개념에 의해 유용하게 묘사되는 것인지 의문을 가질 수 있다. 이것은 더 나아가 잠재적인 개념화와 용도가 너무 광범위하게 확장되면, [포화의 일관성과 효용성을 잃을 위험이 있는지]에 대한 의문을 갖게 만들 수도 있다.

In narrative research, a role for saturation is harder to discern. Rather than the sufficient development of theory, it might be seen to indicate the ‘completeness’ of a biographical account. However, one could question whether the point at which a participant’s story is interpreted as being ‘complete’—having presumably conveyed everything seen to be relevant to the focus of the study—is, in fact, usefully described by the concept of saturation, given the distance that this moves us away from the operationalization of saturation in broadly thematic approaches. This might, furthermore, lead us to ask whether there is the risk of saturation losing its coherence and utility if its potential conceptualization and uses are stretched too widely.

동일한 이슈가 [포화를 위해 제안된 여러 가지 목적]과도 관련이 있다. 예를 들어 코딩의 신뢰성을 입증한다고 되었지만, 포화는 [코딩 결정의 직접적이고 자동적인 결과]이기 때문에, 어떻게 그것이 품질의 독립적인 척도가 될 수 있는지는 명확하지 않다. Dubé 등은 포화 상태가 (결정적이지는 않더라도) 발견을 추론하는 능력에 대해 무언가를 말해준다고 제안한다. Boddy는 '포화에 도달하면, 그 결과는 어느 정도 일반화될 수 있어야 한다'고 주장한다. Boddy의 주장은 우리를 [분석의 이론적 적절성의 개념과 이론의 설명적 범위]에서 훨씬 더 [경험적인 일반화 가능성]의 감각으로 이동시키는 것처럼 보인다. 이러한 두 가지 경우에 포화도를 사용하면 앞에서 설명한 다른 포화 모델을 고려하더라도 포화의 의미와 목적에 대한 일부 연구에서 혼란의 정도를 나타낼 수 있다. 따라서, 우리는 포화가 개념적으로 의미 있고 실질적으로 유용하기 위해서는 포화가 적용될 수 있는 목적에 어느 정도 제한이 있어야 한다고 제안한다.
The same issue is relevant with regard to a number of other, less obvious, purposes that have been proposed for saturation. For example, it has been claimed to demonstrate the trustworthiness of coding (Damschroder et al. 2007)—but as saturation will be a direct and automatic consequence of one’s coding decisions, it is not clear how it can be an independent measure of their quality. Dubé et al. (2016) suggest that saturation says something about (though not conclusively) the ability to extrapolate findings, and Boddy (2016: p. 428) claims that ‘once saturation is reached, the results must be capable of some degree of generalisation’; this seems to move us away from the notion of the theoretical adequacy of an analysis, and the explanatory scope of a theory, toward a much more empirical sense of generalizability. The use of saturation in these two cases could perhaps indicate a degree of confusion in some studies about the meaning of saturation and its purpose, even when taking into account the differing models of saturation outlined earlier. Therefore, we would suggest that for saturation to be conceptually meaningful and practically useful there should be some limit to the purposes to which it can be applied.

'언제 어떻게?—연구의 어떤 단계에서 포화를 추구하며, 그것이 달성되었는지 어떻게 평가할 수 있는가?
‘When and how?’—at what stage in the research is saturation sought, and how can we assess if it has been achieved?

포화에 대한 관점
Perspectives taken on saturation

주어진 연구 내에서 포화가 의미하는 바를 어떻게 바라보느냐에 따라, 언제 포화를 추구할지가 달라질 것이다. 앞에서 식별된 [네 번째 포화 모델](정보 중복성의 개념에 기초한 데이터 포화 접근방식)을 취하면, 이러한 관점에서 포화는 종종 [공식적인 분석으로부터 분리]되고, [공식적인 분석 이전 단계의 무엇]으로 간주되기 때문에, 프로세스의 초기 단계에서 식별될 수 있는 것이 분명하다. [추가 데이터 수집이 불필요한 시기에 대한 결정]은 일반적으로 인터뷰 내에서 듣고 있는 것에 대한 연구자의 감각에 기초하며, 따라서 이 결정은 코딩과 범주 개발 전에 내려질 수 있다.

The perspective taken on what is meant by saturation within a given study will have implications for when it will be sought. Taking the fourth model of saturation identified earlier—the data saturation approach, as based on the notion of informational redundancy—it is clear that saturation can be identified at an early stage in the process, as from this perspective saturation is often seen as separate from, and preceding, formal analysis. Decisions about when further data collection is unnecessary are commonly based on the researcher’s sense of what they are hearing within interviews, and this decision can therefore be made prior to coding and category development.

그러나 이 단계에서 [무엇이 주제theme를 구성할 수 있는지에 대한 해석]은, 심지어 식별된 주제가 포화 상태인지에 대해 고려하기도 전에 이뤄지는 것으로, 기껏해야 피상적일 것이다. 게다가, 이 단계에서 도달한 결론은 후속 이론 개발과 관련하여 특별히 유익하지 않을 수 있다. 처음 고려되었을 때 매우 유사한 것으로 보이는 데이터 조각이 상세한 분석후에 서로 다른 이론적 구성의 예시로 발견될 수 있고, 반대로, 경험적으로 서로 다른 데이터가 이론적으로 많이 일치하는 것으로 판명될 수 있다. 이 단계의 판단은 [이론적으로 미숙하며, 상당한 수정이 필요할 수 있는] 주제와 범주의 프레임과 관련되어있을 것이다. 예를 들어, 근거이론에서 개방코딩, 선택코딩, 이론코딩의 연속적인 단계 동안 변화들이 발생할 수 있다.

However, interpretations at this stage regarding what might constitute a theme, before even beginning to consider whether identified themes are saturated, will be superficial at best. Moreover, conclusions reached at this stage may not be particularly informative as regards subsequent theory development—pieces of data that appear to be very similar when first considered may be found to exemplify different theoretical constructs on detailed analysis, and correspondingly, data that are empirically dissimilar may turn out to have much in common theoretically. Judgments at this stage will also relate to a framework of themes and categories that is theoretically immature, and that may be subject to considerable modification; for example, the changes that may occur during the successive stages of open, selective and theoretical coding in grounded theory (Glaser 1978).

[두 번째 모델]인 [귀납적 주제 포화]에 관하여, 포화를 판단할 때 분석 수준(즉, 코드 또는 테마가 출현하거나 출현하지 않는 것과 관련)더 명시적으로 초점을 맞춘다는 사실은, 포화가 (데이터 포화 접근방식보다) 더 후기 단계에서 달성될 것임을 암시할 수 있다(많은 정성적 접근방식에서 데이터 수집과 분석의 동시적에 진행되긴 하지만). 그렇긴 하지만, [이론적 개발]보다 [코드의 출현]에 초점을 맞추게 되면, 여전히 비교적 이른 단계에서 포화에 달성되게 한다. 

With regard to the second model identified, inductive thematic saturation, the fact that the focus is more explicitly on reaching saturation at the level of analysis—i.e. in relation to the (non-)emergence of new codes or themes—might suggest it will be achieved at a later stage than in data saturation approaches (notwithstanding the concurrent nature of data-collection and analysis in many qualitative approaches). However, focusing on the emergence or otherwise of codes rather than on their theoretical development still points us towards saturation being achieved at a relatively early stage. 

Hennink 등은 [코드의 포화]가 [코드와 관련된 '차원, 뉘앙스 또는 통찰력'의 포화]보다 더 이른 시점에 달성되었음을 발견했다. 헤닝크 등은 코드의 수에만 의존하는 포화 접근방식은 이러한 코드의 '의미'에 대한 이해 부족으로 인해 '포화 지점을 놓친다'고 주장한다.
Hennink et al. (2017) highlight this in a study on patient retention in HIV care, in which they found that saturation of codes was achieved at an earlier point than saturation of the ‘dimensions, nuances, or insights’ related to codes. Hennink et al. argue that an approach to saturation relying only on the number of codes ‘misses the point of saturation’ (2017: p. 15) owing to a lack of understanding of the ‘meaning’ of these codes.

[데이터 포화(네 번째) 및 [귀납적 주제 포화(두 번째)와는 달리, [첫 번째 포화 모델]인 [이론적 포화]는 분석 과정이 [더 발전된 단계와 더 높은 수준의 이론적 일반성]에 있음을 나타낸다. 첫 번째 모델은 [이론적 범주의 특성이 적절하게 개발된 시점이 언제인가]를 결정하는 근거이론에 기반을 두고 있다. 따라서, 자오와 데이비(2015: 페이지 1178)는 '이론적 완전성'에 의해 결정되는 포화의 형태를 가리키며 '근거 이론의 각 범주의 차원과 간극이 설명되었을 때' 샘플링을 중단했다. 

In contrast to data saturation and inductive thematic saturation, the first model of saturation considered, theoretical saturation—as based on the grounded theory notion of determining when the properties of theoretical categories are adequately developed—indicates that the process of analysis is at a more advanced stage and at a higher level of theoretical generality. Accordingly, Zhao and Davey (2015: p. 1178) refer to a form of saturation determined by ‘theoretical completeness’ and ceased sampling ‘when dimensions and gaps of each category of the grounded theory had been explicated,’ .

 

사건 또는 프로세스로서의 포화
Saturation as event or process

포화를 식별하는 데 기초가 되는 핵심 이슈는 [사건이나 과정으로 보는 범위가 어디까지인가]이다. 일반적으로 포화는 '점point'이라고 부르며, 이는 분석가가 인지할 수 있는 이산적 사건으로 간주해야 함을 시사한다. 그러나

  • Strauss와 Corbin은 [포화상태에 대해 '정도의 문제']로서 언급하며, '새로운 것'이 항상 나타날 가능성이 있다고 주장한다. 그들은 포화 상태가 추가적인 데이터 수집이 '반생산적'이 되는지 여부를 고려해야 하며, '반생산적'이란 '새로운 것'이 전체 이야기나 이론에 어떤 것도 추가하지 않는 지점에 도달하는 것이다.
  • Mason(2010)은 [추가 데이터 수집으로 인한 '수익성의 저하diminishing returns'가 발생하는 지점]에 대해 유사한 주장을 하며, 많은 연구자들은 포화에 대해 이러한 점진적 접근법을 취하는 것으로 보인다.
  • 넬슨(2016)은 Dey (1999)의 초기 관점을 반영하며, '포화'라는 용어는 문제가 있는데, 왜냐하면 직관적으로 고정된 지점과 '완전성completeness'의 관점에서 사고하게끔 만들기 때문이다. 따라서 그는 적어도 근거이론의 관점에서는, '개념의 깊이conceptual depth'가 더 적절한 용어일 수 있다고 주장한다. 이러한 관점에서 포화를 판단할 때 연구자는 [새로운 이론적 범주와 관련하여 충분한 이해 깊이가 달성되었는지 여부]를 고려한다.

A key issue underlying the identification of saturation is the extent to which it is viewed as an event or a process. Commonly, saturation is referred to as a ‘point’ (e.g. Otmar et al. 2011; Jassim and Whitford 2014; Kazley et al. 2015), suggesting that it should be thought of as a discrete event that can be recognized as such by the analyst.

  • Strauss and Corbin (1998: p. 136), however, talk about saturation as a ‘matter of degree’, arguing that there will always be the potential for ‘the “new” to emerge’. They suggest that saturation should be more concerned with reaching the point where further data collection becomes ‘counter-productive’, and where the ‘new’ does not necessarily add anything to the overall story or theory.
  • Mason (2010) makes a similar argument, talking of the point at which there are ‘diminishing returns’ from further data-collection, and a number of researchers seem to take this more incremental approach to saturation. 
  • Nelson (2016), echoing Dey’s (1999) earlier view, argues that the term ‘saturation’ is itself problematic, as it intuitively lends itself to thinking in terms of a fixed point and a sense of ‘completeness’. He thus argues that ‘conceptual depth’ may be a more appropriate term—at least from a grounded theory perspective—whereby the researcher considers whether sufficient depth of understanding has been achieved in relation to emergent theoretical categories.

 

포화에 대한 이러한 점증적 읽기에서, 분석결과는 한 번의 추가 인터뷰 후에 [어느 순간 갑자기 '풍부rich'해지거나 '통찰적insightful'이 되는 것]이 아니라, 아마도 [점진적으로 더 풍부해지거나richer 더 통찰력more insightful이 있게] 된다. 그렇다면 질문은 '포화가 얼마나 일어났는가'가 아니라 ['지금의 포화가 얼마나 충분한가']가 될 것이다. 이것은 덜 간단한 질문이지만, 이것이 분석가의 결정의 문제일 수 있다는 사실을 더 잘 강조하는 질문이다. 즉, 포화상태는 특정 시점에서 정확히 지적할 수 있는 것이 아니라, [진행 중인 누적적 판단]이며 아마도 결코 완료되지 않을 것이다.

On this incremental reading of saturation, the analysis does not suddenly become ‘rich’ or ‘insightful’ after that one additional interview, but presumably becomes richer or more insightful. The question will then be ‘how much saturation is enough?’, rather than ‘has saturation occurred?’Footnote7 This is a less straightforward question, but one that much better highlights the fact that this can only be a matter of the analyst’s decision—saturation is an ongoing, cumulative judgment that one makes, and perhaps never completes,Footnote8 rather than something that can be pinpointed at a specific juncture.

  1. 7. 따라서 Dey(1999: 페이지 117)는 '포화' 대신에 '충족'이라는 용어를 제안한다.
    7. 
    Hence, Dey (1999: p. 117) suggests the term ‘sufficiency’ in preference to ‘saturation’.
  2. 8. 이것은 이론 생성에 대한 글레이저와 스트라우스의 관점을 반영한다: '누군가는 그의 이론을 변화시키고 발전시키는 데 도움이 될 새로운 관점에 지속적으로 주의를 기울인다. 이러한 관점은 연구 마지막 날이나 심지어 원고를 페이지 교정본으로 검토할 때에도 쉽게 나타날 수 있기 때문에 출판된 단어는 최종적인 것이 아니라 이론 생성 과정의 끝없는 중단일 뿐이다.'
    8. 
    This reflects Glaser and Strauss’s (1967: p. 40) view of theory generation: ‘one is constantly alert to emergent perspectives that will change and help develop his theory. These perspectives can easily occur even on the final day of study or even when the manuscript is reviewed in page proof; so the published word is not the final one, but only a pause in the never-ending process of generating theory’.

 

불확실성과 애매모호
Uncertainty and equivocation

포화가 달성되는 특정 시점을 식별하려는 욕구는 종종 불확실성이나 애매모호함을 야기하는 것으로 보인다. 많은 연구에서 포화에 달성했다고 언급하지만, 추가적인 데이터 수집은 이러한 주장을 'confirm' 또는 '유효성 확인validate'하기 위한 명백한 시도로 이루어진다.
A desire to identify a specific point in time at which saturation is achieved seems often to give rise to a degree of uncertainty or equivocation. In a number of studies, saturation is claimed, but further data collection takes place in an apparent attempt to ‘confirm’ (Jassim and Whitford 2014: p. 191; Forsberg et al. 2000: p. 328) or ‘validate’ (Vandecasteele et al. 2015: p. 2789) this claim; for example:

10차 면접이 끝난 후, 면접을 통해 창출된 새로운 테마는 없었다. 따라서, 데이터 수집이 포화 상태에 도달했다고 간주되었다. 새로운 테마가 등장하지 않음을 확인하고 확인하기 위해 두 번의 인터뷰를 위해 데이터 수집을 계속했습니다.
After the 10th interview, there were no new themes generated from the interviews. Therefore, it was deemed that the data collection had reached a saturation point. We continued data collection for two more interviews to ensure and confirm that there are no new themes emerging (Jassim and Whitford (2014: pp. 190–191).

 

또한, 포화 증거에 대한 의존을 꺼리는 것은, 포화가 기껏해야 불분명하거나, 최악의 경우 일관성이 없는 방식으로 사용되고 있음을 나타낸다. 예를 들어, Hill 등(2014: 페이지 2)은 포화 원리를 지지하면서도 이를 완전히 신뢰하지는 않는 것으로 보인다.
Furthermore, a reluctance to rely on evidence of saturation sometimes indicates that saturation is being used in at best an unclear, or at worst an inconsistent or incoherent, fashion. For example, Hill et al. (2014: p. 2), whilst espousing the principle of saturation, seem not fully to trust it:

포화는 채용 기간 내내 지속적으로 모니터링되었습니다. 완성도를 위해 테마를 놓칠 가능성을 줄이기 위해 모든 참가자 그룹 전체 모집을 선택했습니다.
Saturation was monitored continuously throughout recruitment. For completeness we chose to fully recruit to all participant groups to reduce the chance of missed themes.

 

잭슨 외 연구진도 비슷합니다. (2000: 페이지 1406)는 포화가 확립되었다고 주장하지만, 그리고나서는 다소 후퇴하는 것으로 보인다.
Similarly, Jackson et al. (2000: p. 1406) claim that saturation had been established, but then appear to retreat somewhat from this conclusion:

8개 데이터 세트를 분석한 후 데이터 포화도를 설정했지만 데이터 포화도를 확보하기 위해 2명의 추가 참가자를 모집했다.
Following analysis of eight sets of data, data saturation was established… however, two additional participants were recruited to ensure data saturation was achieved.

 

콘스탄티누 외 연구진(2017)은 포화 지점에 대한 불확실성의 가능성을 고려할 때, 이것이 발생한 지점에 대한 우려보다는, [포화 지점에 도달했다는 증거를 제공]하는 데 더 집중해야 한다고 제안한다. 따라서 그들은 '최초 표본 추출의 모든 인터뷰를 포함해도 나쁠 것이 없다'고 제안한다. 그러나 이러한 관점은 본질적으로 문제가 있다. 왜냐하면 포화도가 [지속적인 샘플링 결정을 안내하는 것]이 아니라 [데이터 수집의 완료 후의 후향적 결정]이라는 것을 의미하기 때문이다. 하지만, 모든 데이터가 추가 통찰력에 기여하는지 또는 개념 이해에 추가하는지 여부에 관계없이, [(무조건) 모든 데이터가 포함]된다면, 포화가 관련성relevance을 잃게 된다고 주장할 수도 있다. 이 접근방식은 [표본의 적절성을 판단하는 데 포화가 도움이 되는지]보다는, 충분한 데이터를 가지고 포화의 증거를 보여주는 것(즉, 너무 적은 인터뷰는 안 됨)에 대한 선입견을 나타내는 듯 하다.

Constantinou et al. (2017) propose that, given the potential for uncertainty about the point at which saturation is reached, attention should focus more on providing evidence that saturation has been reached, than on concerns about the point at which this occurred. Thus, rather curiously, they propose that it ‘does not hurt to include all interviews from the initial sampling’ (2017: p. 13). This view is inherently problematic, however, as not only does it imply that saturation is a retrospective consideration following the completion of data collection, rather than as guiding ongoing sampling decisions, but one could also argue that saturation loses its relevance if all data are included regardless of whether or not they contribute further insights or add to conceptual understanding. This approach appears to indicate a preoccupation with having enough data to show evidence of saturation, i.e. not too few interviews, rather than saturation aiding decisions about the adequacy of the sample.

위의 내용은 [포화가 달성된 지점]의 평가에 양면성이 있음을 시사하는 반면, 다른 보고서에서는 의도적으로 포화 상태를 넘어 샘플링을 계속하기로 결정을 내렸다. 이는 표본 추출 결정을 강화하기 위한 추가적인 객관적 증거를 찾는 것으로 보인다. 그러한 시도를 한 연구자들은, 정확히 무엇인지에 대해 명확히 설명하지는 않지만, [포화에 의해 포착되지 않는 이론적으로 중요한 어떤 것이 있다]는 견해를 시사한다.
Whilst the above suggests ambivalence towards assessing the point at which saturation is achieved, others report having made the conscious decision to continue sampling beyond saturation, appearing to seek additional objective evidence to bolster their sampling decisions. These examples suggest a view that there is something of theoretical importance that is not captured by saturation, though it is unclear from the explanations given as to exactly what this is.Footnote9

  1. 9. 때때로, 포화를 넘어서는 이유는 방법론적인 것이라기보다는 윤리적인 것으로 보인다. 포화상태에 이르렀음에도 불구하고, 프랑스 등은. (2008: 페이지 22)에 따르면 '연구에 참여하고자 하는 모든 여성에 대한 헌신과 존중'으로 인해, 데이터 수집은 모든 사람이 인터뷰를 마칠 때까지 끝나지 않았다. 비슷하게, 케네디 외 연구진(2012: 페이지 858)은 이것이 '재면접을 위해 의도적으로 개인을 선택하는 것보다, 또는 포화될 때까지 인터뷰만 하는 것보다 더 윤리적인' 것처럼 보였기 때문에 포화도를 초과했다고 보고했다.
    9. 
    On occasions, a reason for going beyond saturation appears to be ethical rather than methodological. Despite reaching saturation, France et al. (2008: p. 22) note that owing to their ‘commitment to and respect for all the women who wanted to participate in the study, data collection did not end until all had been interviewed.’ Similarly, Kennedy et al. (2012: p. 858) report that they exceeded saturation as this appeared to be ‘more ethical than purposefully choosing individuals to re-interview, or only interviewing until saturation’.

 

포화에 대한 양면적인 관점의 또 다른 징후는 인터뷰에 기초한 연구에서 표본 크기가 일반적으로 10의 배수라는 메이슨의 관찰(2010)에 의해 제안된다. 이는 실제로 포화도와 같은 적응적 접근법에 우선하여 경험칙이나 다른 선험적 지침이 일반적으로 사용된다는 것을 시사한다. 꽤 자주, 포화라는 기준을 채택하는 연구는, 선행 연구에서 제안된 표본 크기를 동시에 언급한다. 니콜라이 등은 분석 중 포화를 추구하면서, 또한 다음과 같이 진술했다.

Another indication of an ambivalent view taken on saturation is suggested by Mason’s (2010) observation that sample sizes in studies based on interviews are commonly multiples of ten. This suggests that, in practice, rules of thumb or other a priori guidelines are commonly used in preference to an adaptive approach such as saturation. Quite frequently, studies that adopt the criterion of saturation propose at the same time a prior sample size (e.g. McNulty et al. 2015; Long-Sutehall et al. 2011). In a similar way, Niccolai et al. (2016) sought saturation during their analysis, but also state (p. 843) that:

이러한 성격의 정성적 연구에 대한 권장 사항과 연구 질문에 대한 예상 복잡성 및 원하는 깊이 수준을 바탕으로 
30 - 40의 선험 표본 크기를 선택했다.

An a priori sample size of 30 to 40 was selected based on recommendations for qualitative studies of this nature… and the anticipated complexity and desired level of depth for our research questions.

 

Fush와 Ness는 (연구자가 '데이터 포화도에 도달할 수 있는 최고의 기회'를 가진 표본 크기를 선택해야 한다고 주장할 때) 다소 일관되지 않은 이 접근법을 지지하는 것으로 보인다.
Fusch and Ness (2015: p. 1409) appear to endorse this somewhat inconsistent approach when advocating that the researcher should choose a sample size that has ‘the best opportunity for the researcher to reach data saturation’.Footnote10

  1. 10. Bloor and Wood (2006: 페이지 165)는 이러한 경향은 연구자들이 방법론적 신뢰성을 유지하기 위해 포화 상태에 대한 주장을 하면서 이전에 자금 지원 기관이나 윤리 위원회에 공표된 표본 크기를 준수해야 한다고 느끼는 것에서 기인할 수 있다고 시사한다. 일부 작성자—예: 게스트 등. (2006년), 프랜시스 외(2010년), 헤닝크 외(2017년)—포화 달성에 필요한 특정 참여자 수가 사전에 계산되는 절차를 공식화하려고 시도했다.
    10. 
    Bloor and Wood (2006: p. 165) suggest that this tendency may stem from researchers feeling obliged to abide by sample sizes previously declared to funding bodies or ethics committees, whilst making claims to saturation in order to retain a sense of methodological credibility. Some authors—e.g. Guest et al. (2006), Francis et al. (2010), Hennink et al. (2017)—have attempted for formulate procedures whereby the specific number of participants required to achieve saturation is calculated in advance.

 

이러한 포화 상태에 대한 잠정적이고 모호한 약속을 하는 모습은, 현실적으로 연구를 시작하기 전에 [표본 크기에 대한 명확한 진술을 요구하는 연구비 지원 기관과 윤리 위원회의 요구] 때문일 수 있다. 즉, 현실적으로 방법론적 고려사항보다 따라야 하는 의무로 부과되는 것이다. 그러나 (포화에 대한 모호한 모습은) 포화의 기반이 되는 [구체적이지만 다소 불확실한 논리] 때문에 발생할 수도 있다. [지금까지 수집된 데이터로부터 내린 결론에 기초하여 추가적인 데이터 수집이나 분석이 불필요하다고 판단하는 것]은 본질적으로 [관측한 것(지금까지 수행된 데이터 수집 및/또는 분석)]에 기반해서 [관측되지 않은 것(데이터 수집 및/또는 분석 프로세스가 진행되었더라면 발생했을 것)]에 대한 판단이다. 게다가, 만약 포화가 근거이론에서와 같이 [부정적 사례 분석(즉, 새로운 이론의 측면에 의문을 제기하거나 disconfirm하는 자료)]과 관련하여 사용된다면, (포화의) 논리는 더 빈약해진다.

This tentative and equivocal commitment to saturation may reflect a practical response to the demands of funding bodies and ethics committees for a clear statement of sample size prior to starting a study (O’Reilly and Parker 2013)—perceived obligations that, in practice, may be given priority over methodological considerations. However, it may also arise from the specific but somewhat uncertain logic that underlies saturation. Determining that further data collection or analysis is unnecessary on the basis of what has been concluded from data gathered hitherto is essentially a statement about the unobserved (what would have happened if the process of data collection and/or analysis had proceeded) based on the observed (the data collection and/or analysis that has taken place hitherto). Furthermore, if saturation is used in relation to negative case analysis in grounded theory (i.e. sources of data that may question or disconfirm aspects of the emergent theory) the logic becomes more tenuous—a statement about the unobserved based on the unobserved.Footnote11 

  1. 11. 첫 번째 논리는 반직관적이다. 데이터, 코드 또는 이론적 통찰력의 미래의 미발생이 이전의 발생에 기초하여 가정된다. 그러나 부정적인 사례 분석과 관련하여, 논리는 귀납적이 되며, 미래의 비발생은 이전의 비발생에 기초하여 가정된다.
    11. 
    The first logic is counter-inductive—future non-occurrences of data, codes or theoretical insights are posited on the basis of prior occurrences. In relation to negative case analysis, however, the logic becomes inductive—future non-occurrences are posited on the basis of prior non-occurrences.

 

어떤 경우이든, [아직 수집되지 않은 데이터의 성격]에 대한 [불확실한 예측적 주장]이며, 더 나아가 데이터 수집 중단 결정이 뒤집힐 경우(즉, 데이터를 수집하기로 할 경우)에만 검증될 수 있는 주장이다. 또한, 기본적인 추론은 분석이 이론을 생성하는 방법에 대한 구체적인 가정을 하며, 이론 개발 과정에서 이러한 가정이 일찍 발생할수록 그러한 가정은 덜 정당화될 수 있다. 따라서 연구를 시작할 때 포화를 샘플링 기준으로 자신 있게 제안하는 연구자들은, 연구가 진행되면 어떻게 운영되어야 하는지에 대해 덜 확신하게 되어, 결과적으로 최초의 샘플링 기준을 준수하기를 꺼릴 수 있다.

In either case, an uncertain predictive claim is made about the nature of data yet to be collected, and furthermore a claim that could only be tested if the decision to halt data collection were to be overturned. Additionally, the underlying reasoning makes specific assumptions about the way in which the analysis will generate theory, and the earlier in the process of theory development that this occurs the less warranted such assumptions may be. Accordingly, researchers who confidently propose saturation as a criterion for sampling at the outset of a study may become less certain as to how it should be operationalized once the study is in progress, and may therefore be reluctant to abide by it.

결론
Conclusion

 

질적 연구의 퀄리티를 평가할 때 '황금률'로서의 사용되어온 포화의 명백한 위치와 거의 보편적인 적용에 대한 의문은  이전에도 제기되었다. 마찬가지로, 데이터 수집 및 분석이나 또는 이론 개발의 적절성을 판단하는 유일한 기준으로 흔하게 채택되는 것에 대해서도 의구심이 제기되어왔다. '우아함, 정확성, 일관성 및 명확성은 이론을 평가하는 전통적인 기준이나, 포화를 은유적으로 강조하면서 다소 침수되어 왔다.' (Dey) 2007: 페이지 186). 
Saturation’s apparent position as a ‘gold standard’ in assessing quality and its near universal application in qualitative research have been previously questioned (Guest et al. 2006; O’Reilly and Parker 2013; Malterud et al. 2016). Similarly, doubts have been raised regarding its common adoption as a sole criterion of the adequacy of data collection and analysis (Charmaz 2005), or of the adequacy of theory development: ‘Elegance, precision, coherence, and clarity are traditional criteria for evaluating theory, somewhat swamped by the metaphorical emphasis on saturation’ (Dey 2007: p. 186).

포화 상태가 의심할 여지 없이 제공되어서는 안 된다는 주장에 동의하지만, 적용 가능 vs 적용 불가능의 양극화로 보는 것은 너무 단순한 것이다. 대신, 우리는 포화가 이론의 역할, 채택된 분석적 접근법 등에 따라 다른 관련성과 다른 의미를 가진다고 주장한다. 따라서 연구자에 의해 명확하게 표현될 필요가 있는 각 유형의 연구에 맞춰서, 각각의 목적에 따라 유용하게 사용될 수 있다고 제안한다.

Whilst we concur with the argument that saturation should not be afforded unquestioned status, polarization of saturation as either applicable or non-applicable to different approaches, as has been suggested (Walker 2012), may be too simplistic. Instead we propose that saturation has differing relevance, and a different meaning, depending on the role of theory, the analytic approach adopted, and so forth, and thus may usefully serve different purposes for different types of research—purposes that need to be clearly articulated by the researcher.

포화의 목적과 사용 측면에서 유연성이 있어야 한다고 주장하면서, 동시에 우리는 이러한 [(포화를 사용하는) 목적의 범위]에는 어느 정도 [제한이 있어야 한다]고 제안한다. 포화 상태가 운영화된 방법 중 일부는 너무 광범위하게 포괄될 정도로 의미를 확장하거나 희석시킬 위험이 있어 일관성과 효용성을 훼손할 수 있다고 제안할 수 있다.
Whilst arguing for flexibility in terms of the purpose and use of saturation, we also suggest that there must be some limit to this range of purposes. Some of the ways in which saturation has been operationalized, we would suggest, risk stretching or diluting its meaning to the point where it becomes too widely encompassing, thereby undermining its coherence and utility.

언제 그리고 어떻게 포화 상태에 도달했다고 판단될 수 있는지는, 연구 유형뿐만 아니라 그것이 [뚜렷한distinct 사건인지] 또는 [진행 중인 과정을 나타내는지]에 대한 가정에 따라서도 달라진다. 포화를 사건으로 보는 관점은 다른 사람들에 의해 문제화되었다. 우리가 보기에 포화는 부분적으로 [개념 자체의 불확실한 논리]에 의해 추진되는 것으로 보인다고 주장했다. 즉, 포화는 [관찰된 것을 바탕으로 관찰되지 않은 것에 대한 설명]을 하는 것이다. 이러한 불확실성은 그것의 사용에 있어서 비일관성과 모순을 야기하는 것으로 보이며, 우리는 포화를 단순히 달성되거나 달성되지 않은 것으로 간주하기 보다는, 최소한 부분적으로라도 정도의 문제로 간주한다면 해결될 수 있다고 주장한다. 그러나 '점진적'이라는 측면에서 포화를 고려하는 것은, 포화를 주장하는 연구자들의 자신감을 높일 수 있지만, 우리는 연구자가 포화를 사용하는 구체적인 목적이 무엇인지, 포화시키기를 바라는 것이 무엇인지를 적절히 고려해야만 개념을 둘러싼 불확실성을 해결할 수 있다고 제안한다.
When and how saturation may be judged to have been reached will differ depending on the type of study, as well as assumptions about whether it represents a distinct event or an ongoing process. The view of saturation as an event has been problematized by others (Strauss and Corbin 1998; Dey 1999; Nelson 2016), and we have explored the implications of conceptualizing saturation in this way, arguing that it appears to give rise to a degree of uncertainty and equivocation, in part driven by the uncertain logic of the concept itself—as a statement about the unobserved based on the observed. This uncertainty appears to give rise to inconsistencies and contradictions in its use, which we would argue could be resolved, at least in part, if saturation were to be considered as a matter of degree, rather than simply as something either attained or unattained. However, whilst considering saturation in incremental terms may increase researchers’ confidence in making claims to it, we suggest it is only through due consideration of the specific purpose for which saturation is being used, and what one is hoping to saturate, that the uncertainty around the concept can be resolved

 

 

 


Qual Quant. 2018;52(4):1893-1907.

 doi: 10.1007/s11135-017-0574-8. Epub 2017 Sep 14.

Saturation in qualitative research: exploring its conceptualization and operationalization

Affiliations collapse

Affiliations

11Institute for Primary Care and Health Sciences, Keele University, Keele, Staffordshire ST5 5BG UK.

22School of Health Sciences, Queen Margaret University, Edinburgh, EH21 6UU UK.

PMID: 29937585

PMCID: PMC5993836

DOI: 10.1007/s11135-017-0574-8

Free PMC article

Abstract

Saturation has attained widespread acceptance as a methodological principle in qualitative research. It is commonly taken to indicate that, on the basis of the data that have been collected or analysed hitherto, further data collection and/or analysis are unnecessary. However, there appears to be uncertainty as to how saturation should be conceptualized, and inconsistencies in its use. In this paper, we look to clarify the nature, purposes and uses of saturation, and in doing so add to theoretical debate on the role of saturation across different methodologies. We identify four distinct approaches to saturation, which differ in terms of the extent to which an inductive or a deductive logic is adopted, and the relative emphasis on data collection, data analysis, and theorizing. We explore the purposes saturation might serve in relation to these different approaches, and the implications for how and when saturation will be sought. In examining these issues, we highlight the uncertain logic underlying saturation-as essentially a predictive statement about the unobserved based on the observed, a judgement that, we argue, results in equivocation, and may in part explain the confusion surrounding its use. We conclude that saturation should be operationalized in a way that is consistent with the research question(s), and the theoretical position and analytic framework adopted, but also that there should be some limit to its scope, so as not to risk saturation losing its coherence and potency if its conceptualization and uses are stretched too widely.

Keywords: Data analysis; Data collection; Grounded theory; Qualitative research; Saturation.

의료전문직 학술활동: 그것의 등장, 현재상태, 미래(FASEB Bioadv. 2021)
Health professions education scholarship: The emergence, current status, and future of a discipline in its own right
Olle ten Cate

 

 

1 의학교육의 역사적 연구
1 THE HISTORICAL OUVERTURE OF SCHOLARSHIP IN MEDICAL EDUCATION

교육 또는 의학 학문에 관여하는 대부분의 생물 의학 과학자는 물론 대부분의 교육 과학자는 현재 "보건 전문직 교육"이라는 더 넓은 용어로 포괄되는 의학 교육 학술활동이라는 교차 영역의 풍부함을 깨닫지 못할 수 있다.
Most educational scientists, as well as most biomedical scientist, involved in educational or medical scholarship, may not realize the richness of the intersecting field of medical education scholarship, currently subsumed under the broader term of “health professions education.”

[인구 건강]과 [인구 교육]은 번영하는 사회의 두 가지 기본 요소이다. 이 둘의 교차점에는 의사 및 보건 전문직이 인구의 건강을 위해 복무하도록 교육하는 기술art가 있다. 의학 교육은 항상 [의사와 교육자]의 헌신적인 관심을 누려왔다. 아폴로와 코로니스의 아들인 최초의 저명한 의대생이자 교육자인 아스클레피오스가 켄타우루스 키론에게 의술을 배웠고, 마법의 막대기와 함께 자신의 회사가 된 뱀으로부터 치유와 부활에 대해 배웠다는 것이 신화의 교훈이다(그림 1). 전 세계 의료협회의 수많은 로고에서 볼 수 있듯이, 막대기와 뱀은 오늘날까지 가장 중요한 의학 상징이 되었고 지금도 남아 있다. 키론과 아스클레피오스가 의학적 지식뿐만 아니라 [교육적 능력]으로도 유명했다는 것을 인정해야 한다.
The intersection of two fundamental pillars of a thriving society—population health and population education—is the art of educating doctors and other health professionals to serve the health of populations. Medical education has always enjoyed the dedicated interest of physicians and educators. Mythology teaches us that the first renown medical student and educator, Asclepius, son of Apollo and Coronis, had been educated himself in the art of medicine by centaur Chiron, and had learned about healing and resurrection from a snake who became his company along with a magical rod (Figure 1). Rod and snake became and remained the most important symbols of medicine throughout the ages until today, as witnessed by the many logos of medical associations around the world. It should be acknowledged that Chiron and Asclepius were not only famous for their medical knowledge, but also known for their educational skill.

 

 

21세기에 의학과 생의학은 전문 병원, 실험실, 대학 및 상업 기업을 통해 주요 산업이 되었다. 교육은 여러 세기에 걸쳐서 청소년들을 위한 초등교육과 handcraft에 초점을 맞추었지만, 대부분의 중등교육과 중요한 과학적 토대를 가진 많은 시민들을 위한 3차교육과 함께 지난 세기 동안 산업화된 사회에서 발전해왔다. 교육과학은 20세기에 강하게 발전했다.
In the 21st century, medical and biomedical sciences have become a major industry through specialized hospitals, laboratories, universities, and commercial enterprises. Education, while for many ages focused on primary schooling and handicraft for the youth, has developed in the past century in industrialized societies with secondary education for most and tertiary education for many citizens with important scientific foundations. The science of education has developed strongly in the 20th century.

어느 시대든, 의학 교육 자체는 존경받는 기술respected art이었다. 시대를 통한 유명한 의학 학자들과 교육자들은 히포크라테스, 셀수스, 갤런, 안드레아스 비살리우스, 허먼 보어하브, 윌리엄 오슬러, 그리고 윌리엄 할스테드를 20세기 초까지 주요한 예로 포함한다. 국내적이든 국제적으로든 더 많은 의학 교육자들이 따랐고, 대부분의 의과대학들은 과거에 있었던 교수들에 대하여 초상화 갤러리와 강의실에서 그들의 이름과 얼굴을 기리는 형태로 자부심을 드러낸다.
Medical education itself has been a respected art through the ages. Famous medical scholars and educators through the ages include Hippocrates, Celsus, Galen, Andreas Vesalius, Herman Boerhaave, William Osler, and William Halsted as prime examples until the early 20th century.1-4 Many more medical educators followed, nationally or internationally famous, and most medical schools take pride in some of their own professors of the past, honoring their names and faces in portrait galleries and lecture halls.

오랜 세월 동안 dissection을 통한 [인체 해부학]은 임상 전 교육의 중심이었다. 그림 2는 암스테르담의 와그 해부학 극장에서 공공 해부 강의를 하는 니콜라이스 툴프 교수 (1593–1674)를 보여준다.
For many ages, the anatomy of the human body through dissection was central to preclinical education. Figure 2 shows professor Nicolaes Tulp (1593–1674), delivering a public dissection lecture at the Waag Anatomical Theater in Amsterdam.

2 학문적 연구의 영역으로서 의학 교육의 탄생
2 THE BIRTH OF MEDICAL EDUCATION AS A DOMAIN OF SCHOLARLY STUDY

[의학을 가르치는 기술Art of teaching medicine]이 수 세기에 걸쳐 널리 인정받았지만, 개별 교육자와는 별개로 의학 교육의 방법과 효과에 초점을 맞춘 의학교육 연구는 최근에야 연구의 초점이 되었다. 그 출현은 주로 [20세기 중반]부터 시작된 것으로 간주될 수 있으며, 새로운 방법, 목표 및 내용과 함께 의학 커리큘럼에 대한 새로운 접근법의 개발과 연결된다. 세계적으로 의과대학이 1953년 566개에서 2018년 2881개로 급증하면서 의과대학 학술활동, 이후 보건전문교육에 대한 관심이 눈에 띄게 발전했다.
While the art of teaching medicine became widely acknowledged over the centuries, the study of medical education, with its focus on methods and effectiveness of medical education, independent of individual educators, became a focused domain of study only recently. Its emergence can be considered to have started primarily from mid-20th century, linked to development of new approaches to the medical curriculum, with new methods, objectives, and content. With the rapid increase of medical schools around the world, from 566 in the year 1953 to 2881 in the year 20185 the interest in scholarship of medical and, later, health professional education has developed remarkably.

학문으로서 의학교육 학술활동의 출발점을 어디로 볼 것인가를 논란의 여지없이 정확히 집어내기는 어렵다. 보통 많은 요소들이 함께, 우연히 작동하여, 그러한 출현을 가능하게 한다.

  • 의학교육사학자 Ludmerer는 1920년 전후를 미국의 현대 의학 교육의 시작이라고 본다. (비록 유럽에서는 영향력이 작았지만) 이 시기는 미국 학교들을 폐쇄하거나 현대화하도록 강요한 유명하지만 비판적인 1910년 카네기 보고서(플렉스너 보고서) 직후이다.
  • Journal of Medical Education 의 첫 호는 1920년에 나왔지만, 솔직히, 학문적 노력으로서 의학 교육 발전과 연구의 시작은 [Western Reserve 대학교가 그들의 의학 교육과정을 현대화하기 위해 위원회를 설립한 1950년 즈음]이라고 보는 것이 더 나을지도 모른다. 이후 콜로라도대학이 이를 따랐고, 이 두 대학의 노력은 철저히 기록되었기에, 그 변화의 움직임의 시작을 정확히 짚어낼 수 있다.
  • 조지 밀러, 스티븐 에이브러햄슨, 힐리어드 제이슨, 크리스틴 맥과이어, 그리고 하워드 베로우스 같은 연구자들이 뉴욕, 미시간, 일리노이, 캘리포니아의 여러 대학에서 등장하면서, 대표적인 1세대 의학 교육 학자가 등장했다고 볼 수 있다. 이렇게 약 70년 전에 새로운 학문을 구성하였고, 이 당시 최초로 뚜렷한 교육 연구 유닛들이 의과대학에 설립되었습니다.
  • 동시에 1950년대에 의학 교육은 사회과학자들의 연구 대상이 되었다. 그들은 의사가 되는 것이 어떤 의미인지를 연구한 후 영향력 있는 심리학적, 사회학적 보고서를 작성하였다. 미국만이 의학교육을 위한 단위units을 설립한 것은 아니다. 캐나다의 맥마스터 대학, 스코틀랜드의 던디 대학, 네덜란드의 마스트리흐트 대학이 다른 나라에서 의학교육을 위한 학술활동을 가진 최초의 기관이다.

It is difficult to pinpoint an undisputed moment in time that can be qualified as the starting point of medical education scholarship as a discipline. Usually many factors together, operating coincidentally, enable such an emergence.

  • Medical education historian Ludmerer rightly qualifies the years around 1920 as the start of modern medical education in the United States,6 shortly after Flexner's famous but critical 1910 Carnegie Report that forced U.S. schools to either close or modernize7—while less influential in Europe.8 
  • The first issue of the Journal of Medical Education appeared in 1920, but, frankly, the start of medical education development and research as a scholarly endeavor may be better located around 1950, the year that Western Reserve University established a committee to modernize their medical curriculum, followed by the University of Colorado a few years later, two endeavors that were extensively documented,910 and therefore, enabling to pinpoint the start of a movement.
  • With George Miller, Stephen Abrahamson, Hilliard Jason, Christine McGuire, and Howard Barrows at universities in New York, Michigan, Illinois, and California, prominent examples of a first generation of medical education scholars emerged, together constituting a new discipline about 70 years ago, when the first distinct units of education research were established in medical schools.1112 
  • In parallel, in the 1950s, medical education became an external object of study by social scientists, who produced influential psychological and sociological reports after studying what it means to become a doctor.13-15 Not only the United States established units for the study of medical education. McMaster University in Canada, University of Dundee in Scotland, and Maastricht University in the Netherlands are among the first institutions with units for scholarship in medical education in other countries.

몇몇 개인, 교사, 연구원, 또는 과학적 추구의 특정 영역에 특정한 관심을 가진 센터들은 아직 그 분야를 인정받을 수 있는 학문 영역으로 만들지 못할 수 있다. 그래서 질문은 이것이다. 누군가를 의료 또는 보건 전문직 교육의 학자scholar라고 부르고, 그러한 개인들의 공동체를 "학술적scholarly"이라고 부르려면 무엇이 필요할까? 아자위와 동료들은 연구자 정체성 형성과 협력관계, 연구에 대한 보호시간을 조성하는 환경이 보건직 학술활동을 번창하게 할 수 있다는 것을 발견했다. 학술 공동체는 어니스트 보이어의 널리 인용된 네 가지 기준을 사용하여 정의될 수 있다: 발견, 통합, 응용, 그리고 가르침.17
A few individuals, teachers, researchers, or even centers with a specific interest in a particular domain of scientific pursuit may not yet make the field a recognizable scholarly domain. So the questions is: what would be needed to call someone a medical or health professions education (HPE) scholar1 and to call a community of such individuals scholarly? Ajjawi and colleagues found that an environment fostering researcher identity formation, collaborative relationships, and protected time for research is likely to make health professions education scholarship thrive.16 To create that identity, the scholar should belong to a community with specific characteristics. Scholarly communities may be defined using Ernest Boyer's widely cited four criteria that, together, should determine scholarship: discovery, integration, application, and teaching.17

[디스커버리]란 과학적 호기심을 충족시키기 위해서만 알 가치가 있는 새로운 아이디어와 통찰력의 생산이다. 상당수의 학자들이 적극적인 HPE 연구에 참여하고 영역을 발전시키는 연구 결과를 산출하고 있다는 사실은, 이 준거를 중요하게 만든다.
Discovery is the production of new ideas and insights, things that are worth knowing, if only to satisfy scientific curiosity. A significant number of scholars should engage in active HPE research and yield research findings that advance the domain, to give this criterion weight.

[통합]은 고립된 사실에 의미를 부여하고 새로운 발견과 이미 알려진 것을 연결하는 것이다. 학술활동은 응집력coherence를 갖추어야 하고, 그러기 위해서는 [사회 및 기타 과학과 관련을 짓거나, 다양한 연구 합성 노력]을 해야 한다. 이렇게 해야만 "바퀴의 재발명"을 피할 수 있다. [수용될 지식체body of accepted knowledge]는 통합을 통해 구축된다.
Integration is giving meaning to isolated facts and connecting new findings with what is already known, within and across disciplines. Coherence must be established, by relating to or involving social and other sciences and by various research synthesis efforts, if only to avoid wheels being reinvented. A body of accepted knowledge is to be built through integration.

[응용]은 문제를 해결하기 위한 발견의 유용성과 관련이 있습니다. 학술활동은 "그 자체로서가 아니라, 사회에 대한 복무를 통하여 가치를 입증해야 한다."(보이어, 23페이지) 실무적으로 개선된 의료 및 보건직 교육 커리큘럼을 통해, 졸업생들의 역량 향상을 통해, 궁극적으로는 더 나은 의료 서비스를 통해 보여야 한다.
Application relates to the usefulness of findings to solve problems. Scholarship must "prove its worth not on its own terms but by service [to society]"(Boyer, page 23). It should be visible through improved medical and health professions education curricula in practice, through improved competence of graduates and, ultimately, through better health care.

[가르치는 것]은 "가장 높은 형태의 이해"이다. 여기에는 [과학적 의사소통]과 [미래 학자를 위한 교육]을 포함한다. 보이어는 학생과 개인의 상호작용을 염두에 두고 있었지만, 강의는 회의, 책, 논문, 현대 미디어를 통해서도 이루어질 수 있다. 더 넓은 의미에서 Teaching이란 [차세대 학자들의 충분하고 지속적인 훈련]과 [충분한 출판물, 회의, 협회]로 특징지어지며, 이는 [진정한 상호작용적 학문 공동체의 존재]를 의미한다.
Teaching, as "the highest form of understanding" (Boyer, page 23), involves scientific communications and the education of future scholars. While Boyer had students and individual interactions in mind, teaching can also be done through conferences, publication of books, papers, and modern media. Teaching in its broader sense, would be characterized by the sufficient and sustained training of next generation scholars and sufficient publications, conferences, associations that would characterize the existence of a true interactive scholarly community.

글래식18과 오브라이언 외 19는 보이어의 기준을 건강 직업 교육 학술활동 단위의 개별 학자들뿐만 아니라 더 자세히 설명했다. 
Glassick18 and O'Brien et al19 have elaborated Boyer's criteria not only for individual scholars in health professions education scholarship units. 

보건 전문직 교육HPE은 학술적 영역이나 학문으로서 적합한가?
3 DOES HEALTH PROFESSIONS EDUCATION QUALIFY AS A SCHOLARLY DOMAIN OR DISCIPLINE?

학문 분야와 하위학문 분야가 명확하게 정의된 것은 아니다. 그것들은 보통 대학들에 의해 인정되고, 때로는 과학 학회에 의해, 때로는 법에 의해, 면허와 특권이 제한될 때, 교수진, 학과, 학술 과정에 분류된다. 그러나 공식적인 제도적 진술을 넘어, [학문적 공동체나 학문이 무엇인지를 결정하는 것]은 [학문적 개인들 간의 상호작용과 활동]이다. [사회 정체성 이론Social Identity Theory] 은 개인에게 정체성을 제공하는 집단에 속하는 것이 중요하다고 가정한다. 사회적 정체성은 자존감과 집단 행동을 서포트하는데, 이는 사람들이 자신의 존재를 알고 자부심을 느끼고, 다른 사람들에게 그것을 설명하고, (명함이나 문구처럼) 쓸모 없어 보이는 목적을 위해 사용할 수 있고, 또한 마음이 비슷한 다른 사람들과 연결되기 위해서이다. 학문적 공동체에서 정의된 정체성은 [조직 내에서의 승진]과 심지어 [연구 자금]에도 영향을 미칠 수 있다. 분야를 정의하는 것은 사소하지 않다.

Academic disciplines and subdisciplines are not unequivocally defined. They are usually acknowledged by universities and categorized in faculties, departments, and academic courses, sometimes by scientific societies and sometimes by law, when licensing and privileging is restricted. But beyond formal, institutional statements, it is the dynamics among scholarly individuals, with their interactions and activities, that determines what a scholarly community or discipline is. Social Identity Theory posits that for individuals it is important to belong to a group that provides them with identity.20 Social identification supports self-esteem and group behavior,21 as people like to know and take pride in what they are, be able to explain that to others, use it for purposes as seemingly futile as business cards and stationary, and also to connect with likeminded others. A defined identity in a scholarly community can also affect promotions in an organization, and even funding of research. Defining a discipline is not trivial.

 

3.1 검색
3.1 Discovery

(학문분야로서) Discovery 기준을 충족시키려면 현재 발견자 역할을 하는 충분한 연구자가 있어야 한다. 2021년에 세계적으로 얼마나 많은 HPE 연구원들이 활동하고 있는지 정확히 알 수 없다. 그러나 1950년 이후 그 수가 증가했다는 몇 가지 대리 지표가 있다. 만약 활동적인 연구원이 10년이라는 기간 동안 매년 적어도 한 편의 저널 기사를 발표하는 사람이고, 발견이 건강 직업 교육의 지식의 본체에 사실이나 통찰력의 추가라고 정의된다면, 시간에 따라 발표된 논문의 수와 저자들을 볼 가치가 있다.
To meet the Discovery criterion, there must be sufficient researchers who are active discoverers. We do not know how many HPE researchers exactly are active worldwide, in 2021. However, there are some proxy indicators of growth in volume since 1950. If an active researcher would be someone who publishes at least one journal article per year over a sustained period of time, say 10 years, and discovery would be defined as the addition of a fact or insight to the body of knowledge of health professions education, it is worth looking at number of published papers and their authors at different moments in time.

1980년에는 의학 교육 저널(현재의 학술 의학 저널), 영국 의학 교육 저널(현재의 의학 교육 저널), 그리고 의학 교사(Medical Teacher)의 세 개의 의학 교육 전문 저널이 있었다. 가장 오래된 것(의학교육저널)에는 1980년 한 해 동안(12호)에 걸쳐 450여 명의 저자가 등장했는데, 여기에는 비연구자뿐 아니라 두 번 이상 출판한 작가도 포함됐다. 2020년에, 이 저널의 12개 호에 기고하는 추정 저자의 수는 약 3배가 되었다. 2018년에 제이슨이 제시한 그래프와 비교할 수 있는 다른 성장 대용치가 그림 3에 나와 있다. 저널 기사 제목에 있는 "의료"와 "교육"이라는 단어의 조합은 50년 이내에 10배 증가를 보여준다. 게다가, 그 40년 동안, 국제 의학교육 저널의 수는 (해부학, 생리학, 생화학, 수술, 시뮬레이션, 그리고 많은 국가에서 의학 교육을 위한 국가 협회의 저널과 같은 전문 분야의 전용 교육 저널을 제외하고도) 3개에서 약 35개로 꾸준히 증가하였다
In 1980, there were three dedicated medical education journals:

  • the Journal of Medical Education (now called Academic Medicine),
  • The British Journal of Medical Education (now called Medical Education), and 
  • Medical Teacher.

The oldest one (the Journal of Medical Education) featured about 450 authors across the year of 1980 (12 issues), including non-researchers, but also some authors who published more than once. In 2020, the estimated number of authors contributing to the 12 issues of this same journal has about tripled. A different proxy of growth is shown in Figure 3, comparable to graphs presented by Jason in 2018.22 The combined words "medical" and "education" in journal article titles shows a 10-fold increase in less than 50 year (data from Google Scholar; and note that such titles only cover a small minority of articles in the domain). In addition, in those 40 years the number of international peer reviewed medical education journals has steadily grown from three to about 35, excluding dedicated education journals in specialty areas such as anatomy, physiology, biochemistry, surgery, simulation, and journals of national associations for medical education in many countries, not counting education journals in other health professions than medicine.

 

HPE에 관한 학술지의 총 목록은 주로 약 90개에 달한다. 만약 이들 각각이 연간 100명의 저자를 배출하고 모든 학자가 매년 하나의 학술 논문을 낸다면(둘 다 매우 보수적인 추정치이다), 이 영역은 거의 100,000명의 저자를 보유하게 될 것이다. 로건스는 2010년 최근 12년간 가장 많이 발간된 6개 의학교육전문지에 1만건의 기사가 실렸다고 추산했다. 논문 한 편당 평균 3명의 저자를 취해서 현재 양질의 학술지 수가 늘어난 것에 대해 3을 곱하면 비슷한 수치로 이어진다. 수많은 의학 교육 저널 기사의 질은 학문적 기준을 모두 충족시키지 못할 수도 있지만, 만약 20%만이 진정으로 학문적scholarly인 것으로 잡더라도, (보수적으로 추정해도) 연구와 개발에 적극적으로 참여하는 HPE 학자들은 최소한 20,000명에 이르는 구성된 공동체를 구성한다. 공동체의 기준으로서의 [임계질량]은, 논쟁의 여지 없이 충분히 충족된 것으로 보인다.

The total list of journals predominantly publishing on health professional education approaches about ninety2. If these each would feature only 100 authors per year and every scholar would produce one scholarly paper per year (both are very conservative estimates), the domain would have close to 100,000 authors. Rotgans estimated in 2010 that 10,000 articles had appeared in the six most common medical education journals in the past 12 years.23 Taking an average number of three authors per paper and multiplying by three for the increased number of current quality journals leads to a similar figure. The quality of the numerous medical education journal articles may not all meet scholarly standards,24 but if only 20% would be regarded as truly scholarly, the combined authors would establish a community of at least 20,000 true health professions education scholars, educators actively involved in research and development, which again is probably a conservative estimate. The critical mass for a scholarly community as criterion seems, arguably, amply met.

다음으로, 일반적으로 인정된 도메인의 발전은 발견을 지원해야 합니다. 의학교육이 70년 전보다 '더 나아지지' 않는다면 보이어의 발견 기준은 아마도 충족되지 않을 것이다. 그래서 문제는, 우리가 이 개선을 확인할 수 있을까 하는 것입니다. 이 기준은 측정하거나 추정하기가 훨씬 더 어렵다. [2020년 의대 졸업자]들이 [1950년 졸업자]보다 의료행위에 더 적합한지 여부를 확인할 수 있는 측정 수단이 전혀 없다.
Next, generally acknowledged advances in the domain should support discovery. If medical education would not be “better” than 70 years ago, then, the Boyer's discovery criterion would probably not be met. So the question is, can we confirm this improvement? This criterion is much more difficult to measure or estimate. There is simply no measurement instrument to establish whether the 2020 medical graduates are better equipped for clinical practice than in 1950.

교육 연구의 진보와 발견은 종종 [근거 기반의 교육적 진보]가 아닌 [새로운 이론과 연구 방법]에 초점을 맞추는데, 이는 단계적이고 부정할 수 없이 더 나은 교육 결과를 보여준다. 물리, 화학, 의학 등의 분야에서 이론과 실천에 기반을 두고 새로운 사실들이 만들어 질 수 있지만, 이는 교육 연구에서 드물다. 소이어는 "교육에 대한 과학적 접근의 역사는 유망하지 않다"고 주장하며, [교육이 과학인지 예술인지에 대한 계속되는 논쟁]을 인용한다. 그러나 다른 이들은 학습과 지도에 대한 증거 기반 원칙을 확립했다. 새로운 절차나 치료법이 적절히 적용될 때마다 '작동할 것work'을 기대할 수 있는 생물의학이나 공학의 발전과는 달리, 교육원리의 효과는 예측 가능성이 낮다. 종종 통제할 수 없는 많은 변수들이 교육의 결과를 방해할 뿐만 아니라, "교육 시스템" 자체가 복잡하고 적응적이다.

Advances and discoveries in educational research often focus on new theories and research methods, rather than evidence-based education advances, that stepwise and undeniably show better and better education outcomes. New, undisputed facts on which theories and practice can build, such as in physics, chemistry, and medicine, are rare in educational research.2526 Sawyer contends that "the history of scientific approaches to [general] education is not promising" and cites the ongoing debate about whether education is a science or an art.27 Others, however, have established evidence-based principles of learning and instruction.28-30 Different from biomedical or engineering advances that may be expected to “work” every time new procedures or therapies are applied appropriately, the effects of educational principles are less predictable. Not only do many variables, often not controllable, interfere with outcomes of education, the "system of education" itself is complex and adaptive.

[복잡한 적응 시스템]은 변수가 바뀌면 자신의 방식대로 반응한다. 새롭고 "증명된" 교육 방법은, 그것이 적용되었을 때, 학생들의 감정적, 동기적, 지적 반응을 불러일으킬 것이다. 의사가 되고자 고도로 동기부여를 받은 학생들은 어떤 교육적 방법과 요구 사항이 적용되든지 간에 목표에 도달하기 위해 그들이 필요하다고 느끼는 모든 것을 할 것이다. 학생은 블랙박스나, [조작이 가능한 수동적인 대상]이 아니라, 어느 정도 학습 경로를 스스로 형성하려는 자유의지가 있다. 예를 들어, 우수한 강의는 자기주도적인 학습 성향을 감소시킬 수 있으며, 시험에서는 이러한 우수한 교사 수행에 참석하지 않은 학생들보다 더 나쁜 성적을 낼 수 있고, 내용물의 복잡성을 스스로 알아내야 한다고 느꼈을 수도 있다. 

Complex adaptive systems react in their own way when variables change. A new, "proven" teaching method will, when applied, evoke emotions, motivations, and intelligent responses by students. Students, highly motivated to become doctors, will simply do whatever they feel is needed to reach their target, no matter which curricular methods and demands apply. They are not a black box, or a passive object that can be manipulated, but have a free will to shape their learning pathway to some extent.3132 

  • For instance, excellent lectures may decrease the students' inclination to self-directed study, to the point that on tests they may perform worse than students who did not attend these superb teacher performances, and who may have felt forced to figure out the complexities of the content matter themselves.33 

교육 연구를 더욱 복잡하게 만드는 것은 교육 개입의 결과 척도를 결정하기 어렵다는 것이다. 시험에서 증명된 지식과 기술이 그러한 결과로 간주될 수 있지만, 의학에서와 같은 교육의 진정한 목적은 실습에서의 효과적인 성과와 개선된 임상 결과이며, 이는 종종 우수한 개인 기술에 의해서만 결정되는 것이 아니라 생물 의학 및 기술 발전, 맥락 및 팀워크에 의해 결정된다. 

What further complicates educational research is that outcome measures of educational interventions are difficult to determine. While knowledge and skills demonstrated at exams may be considered such outcomes, the true purpose of education, such as in medicine, is effective performance in practice and improved clinical outcomes, which are often determined by biomedical and technical advances, context and teamwork, not only by superior individual skills.3435

그러나 이러한 어려움에도 불구하고, 현재 HPE의 학자들은 많은 발전이 분명히 이루어졌고, 이러한 발전이 교육 관행으로 확립되어왔다는 것에 동의할 가능성이 높다. 의학 교육에서 "발견"은 [일반화된 이론적 진리를 뒷받침하는 발견]보다는 [새로운 교육 또는 평가 방법]인 경우가 더 많다. 성공이 보장된 교육 혁신에 대한 논란의 여지가 없는 증거는 확립하기 어렵지만, 신뢰할 수 있는 이론에 기초한 의학의 몇 가지 변화는 지난 50년 동안 의료 커리큘럼에 깊은 영향을 미쳤으며 현재 권장 접근법으로 간주되고 있다. [이론의 여지가 없는 증거 기반]이라기보다는, 엄격한 최선의 근거에 기반한 의학교육 BEME 문헌 리뷰가 의료 교육자들에게 인기 있는 자료였다. 지난 20년 동안 60개 이상의 BEME 리뷰가 출판되었으며, 건강 직업 교육에서 많은 다른 지식 합성도 이루어졌다.
Despite these difficulties, however, current scholars in HPE would likely agree that many advances have certainly been made and turned into established educational practices in the health care domain. "Discoveries" in medical education are more often new educational or assessment methods, rather than findings supporting generalized theoretical truths. While undisputable evidence of educational innovations with guaranteed success is hard to establish,36 several changes in medical education, based on credible theory, have had profound influence on medical curricula in the past 50 years and would now be viewed as recommended approaches. Rather than suggesting to be unequivocally evidence based, rigorous best-evidence medical education (BEME) literature reviews have been popular resources for medical educators.37 Over 60 BEME reviews have been published in the past 20 years, in addition to many other knowledge syntheses in health professions education.

표 1은 50년 동안 의학에 대한 발견과 교육 발전의 예를 보여주는데, 이는 보건 직업 교육 분야의 학자들 덕분이라고 할 수 있다. 표의 한계는 단일 식별 가능한 개념, 발견 또는 혁신과 관련되지 않은 많은 의학 교육자들의 중요한 학문적 작업을 공정하게 수행하지 못한다는 것이다. 아래의 모두든 것들이 어느 정도 의료 훈련을 개선했다. 한편 다른 학자들은 (혁신을 제시하거나 시도하기보다는), 의학교육에 대한 [신화를 폭로]하거나 [의학교육의 강점과 약점에 대한 주요 개요를 제공]하고, [개혁을 촉구]함으로써 이 분야를 더 예리하게 하는 데 도움을 주었다. 
Table 1 shows examples across a 50-year period of findings and educational advances in medicine, “discoveries” if you will, that can be attributed to scholars in the field of health professions education. A limitation of the table is that does not do justice to the important scholarly work of many medical educators not associated with single identifiable concepts, findings, or innovations.

  • Applying advanced skills training and advanced assessment techniques,
  • deliberate practice,
  • mastery learning,
  • clinical reasoning tests,
  • instruments to measure clinical learning environments,
  • physical space for education,
  • studies to correlate lapses in professional behavior with later adverse practice events,
  • studies on theories of workplace learning,
  • motivation,
  • cognitive load in medical education,
  • conditions for interprofessional education,
  • studies on burn-out and depression, and
  • many other findings or innovations that were tried on smaller scale

all have improved medical training to some extent.

Still other scholars, rather than presenting or trying an innovation, have helped sharpen the mind by

  • debunking myths about medical education,38-41 or
  • provided major overviews of strengths and weaknesses in medical education, and urged for reform.4243

 

의학 교육, 그리고 어느 정도 다른 건강 직업 교육은 오늘날 우리가 알고 있는 바와 같이 이러한 진보가 없었다면 분명히 달라졌을 것이다.
Medical education, and to some extent other health professions education, as we know it today would be definitely different without these advances.

3.2 통합
3.2 Integration

[통합]은 [분야 내부에서의 통합] 및 [분야 간 새로운 발견의 통합]과 관련이 있습니다. 표 1에 나타난 모범적인 발전은 특히 보건 직업 교육을 위해 개발되었으며, 많은 것들이 문제 기반 학습과 같은 의료 교육이나 보건 직업보다 더 넓은 지역사회에서 상당한 영향을 미쳤다. 일부 발전은 연구가 불충분한 것으로 밝혀진 후 포기되고 새로운 방법으로 대체되었다. 예를 들면 임상 추론 기술(크리스틴 맥과이어와 동료들에 의한) 평가를 위한 환자 관리 문제의PMP 도입이 그러하다. 그러나 PMP의 후계자라고 할 수 있는 Key-Feature 항목은 선구적인 근거가 없었더라면 결코 도입되지 않았을 것이다. 이러한 통합consolidation의 예는 의학 교육이 스스로 발전하는 학문적 전통으로 자리잡아간다는 증거이다.
Integration pertains to the consolidation of new findings within and across disciplines. The exemplary advances shown in Table 1 have specifically been developed for health professions education, and many had significant impact in a wider community than only medical education or the health professions, such as problem-based learning.44 Some advances, such as the introduction of Patient Management Problems for the assessment of clinical reasoning skill (by Christine McGuire and colleagues) were abandoned45 and replaced by newer methods after research had revealed inadequacies. But Key-Feature items (more or less their successor)46 would have never been introduced without its precursory grounding. This example of consolidation is a testimony of a self-developing scholarly tradition in medical education.

통합은, 연구의 전통을 구축하는, HPE를 전담하는 학술활동 단위가 꾸준히 확산되는 것으로 해석되었다. 1980년대 북미와 유럽에서는 이런 유닛이 적었지만 2000년 북미에는 61개가 생겼고, 2020년에는 전 세계 여러 나라에 셀 수 없이 많은 유닛이 있다. 의학교육연구회에는 현재 78명의 회원이 등록되어 있으며, 많은 이사들은 SDRME 회원이 아니다. 이 부서들은 일반적으로 연구, 교수 개발(교육) 및 봉사에 관여하는 과학자, 학술 교육자 및 행정 지도자를 고용한다. 
Consolidation has translated in the establishment of a steady proliferation of dedicated health professions education scholarship units that build a tradition of research.47 In the 1980s, such units were just few in North America and Europe, but in 2000 North America had 61 units48 and 2020 there are countless units in several countries worldwide. The Society of Directors of Medical Education Research currently lists 78 members directing such units, and many directors are not SDRME members. These units typically employ scientists, scholarly educators, and administrative leaders, involved in research, faculty development (teaching), and service.49, 50

통합은 또한 [다양한 과학 영역의 이종교배cross-fertilization]를 의미한다. 보건직 학술활동은 사회과학의 혜택을 많이 받았다. 노먼은 심리학, 사회학자, 심리학자, 심리학자 등 건강 직업 분야에서 비의료적 배경을 가진 학자들의 공헌을 인정하였다. 1980년대와 1990년대에는 사회과학 학자들이 HPE분야에 자신들의 기술을 적응시키는 물결이 거세었다. 이들 중 소수만이 외부 관찰자로 남아 인류학자가 하듯이 HPE를 연구 주제로서 연구하였다. 오히려, 많은 사회과학자들은  의과대학에 고용되어, 의학 및 생물의학 전문가들과 긴밀히 협력하여, 교육의 질적인 발전을 지원하면서, 의학교육 학술공동체에 통합되었다. 이는 보건 직업 교육의 발전과 실천에 학습, 교육, 심리학 이론의 통합을 상당히 자극했다. 
Integration also speaks to the cross-fertilization of different domains of sciences. Health professions scholarship has hugely benefited from the social sciences. Norman has qualified the contributions made by scholars with a nonmedical background as made by “immigrants” in the health professions domain: psychologists, sociologists, and psychometricians. He saw a strong wave of these scholars in the 1980 s and 1990s,45 adapting their skills to serve HPE. Only few of these remained outside observers, studying HPE as a topic of research, as would an anthropologist do, without becoming part of it. Rather, PhD level social scientists were hired by medical schools, and integrated in their communities, to support the quality development of their education, in close collaboration with medical and biomedical experts. This has significantly stimulated the integration of theories of learning, education, and psychology in the development and practice of health professions education.

"의료", "교육", "이론"을 결합한 저널 기사 제목은 1960년 이후 60년 동안 기하급수적으로 증가했다. 이 통합은 Norman이 "3세대" 학자라고 부른 이들을 향해 한 걸음 더 나아갔다. 이들은 이민자가 아니라 의학적으로 훈련받은 사람으로서, HPE 석사와 박사과정 고유의 전통 속에서 HPE 학술활동을 훈련받으며 보완해나간 사람들이다. 3세대 학자들은 장점(상아탑 스탠스 없이 고도로 전문화된)과 단점(다른 학문분야에서 경험과 배경지식의 깊이가 얕은)이 있었다. 또 다른 중요한 영향은 연구의 방법론에 관한 것이다. HPE 연구는 통제된 실험의 한계에 대한 인식을 반영하듯, [질적 연구]의 상당한 증가를 보였다. 

The number of journal article titles combining "medical," "education," and "theory" has exponentially grown across the six decades since 1960 (from 3, via 7, 11, 31, 96, to 195 in 2020) (Google Scholar). The integration made a further step in what Norman called “third generation” scholars, not immigrants but medically trained, and supplemented with HPE scholarship training in an own tradition of dedicated HPE Masters and PhD education, with its pros (being highly specialized without an ivory tower stance) and cons (with less depth of experience and background in other disciplines).45 Another important influence regards the methodology of research. HPE research has seen a significant increase of qualitative studies,51, 52 reflecting the awareness of the limitations of controlled experiments.36, 53

HPE분야의 학술활동은, 보이어가 이야기한 통합이라는 용어에 비추어볼 때 한계가 있는가? 전문 영역으로 성숙되어갈 때 나타나는 특징 중 하나는, 전문 학술지가 만들어지며, 역설적으로 다른 학문과 통합하는 것을 주저하는 모습니다. 사회과학 저널에 게재된 HPE 연구의 양은 비교적 적다. 그것은 HPE 학자들이 어떻게 이러한 저널을 읽고 출판하는 것을 덜 선호하는지, 그리고 이러한 저널의 독자들이 HPE에 대한 관심을 덜 가질 수 있는지를 보여준다. 가장 큰 교육 학자 집단은 거의 틀림없이 미국 교육 연구 협회(AERA)이며, 매년 10,000~15,000명의 학자들이 모인다. HPE 학자들은 AERA에 속하지만, HPE 학자들이 지배하는 "The Profession"의 한 분과 내에서 주로 교류한다. 대조적으로, 일부 주제는 다른 교육 문헌보다 HPE 문헌에서 단순히 더 잘 표현될 수 있다. 예를 들어, Van Dijk 등은 대학교에서의 Teaching task의 프레임워크를 검색한 결과, 광범위한 문헌 리뷰에서 46개를 확인했는데, 그 중 18개는 의학 교수진, 6개는 간호, 치과, 약국 및 조산사를 포함한 다른 보건 직종에 관한 것이었다.
Are there limitations of Boyer's sense of integration with regards to health professions education scholarship? One hallmark of maturation of a professional domain, the establishment of specialized journals, paradoxically shows a hesitation to integrate with other disciplines. Comparatively very little about health professions education is published in journals of the social sciences. It shows how HPE scholars may be less inclined to read and publish in these journals, and how readers of these journal may be less interested in HPE. The largest community of educational scholars is arguably the American Educational Research Association (AERA), with an annual meeting that brings together 10,000–15,000 scholars. HPE scholars are represented in AERA, but interact largely within one division of it, that of “The Professions”, dominated by HPE scholars. In contrast, some topics may simply be better represented in the HPE literature than in other educational literature. As an example, Van Dijk et al., searching for frameworks of university teaching tasks identified 46 in an extensive literature review, 18 of which pertained to medical faculty and 6 more to other health professions including nursing, dentistry, pharmacy, and midwifery.54

결론적으로, 통합은 혁신과 발견의 통합을 통해 [내부적]으로 이루어졌지만, 다른 분야와의 통합(외부적)은 제한적이었다.
To conclude, integration has happened internally, through consolidation of innovations and findings, but integration with other disciplines has been limited.

3.3 적용
3.3 Application

HPE학술활동에서는 연구와 개발이 함께 진행된다. 응용은 이 분야의 핵심적 특성이다. HPE 연구에 관여하는 대부분의 학자들은 임상의, 교사, 또는 둘 다, 교육 과정이나 프로그램 책임자, 부학장과 같은 행정 담당자로서 교육에 대한 역할을 한다. 대학 사회과학부의 교육과학자들이 초중고교 교사가 아니었을 수도 있고 상아탑과학에 대해 비판받을 수도 있는 반면, 매우 많은 경우, HPE 연구자들은 활동적인 교사들, 활동적인 교수 개발자들, 활동적인 교육과정 및 과목 개발자로서, 임상 또는 생의학 연구경험을 가지고 있다. 많은 학구적인 HP 교육자들은 초기에 환자 진료 또는 기초 과학 분야에서 경력을 쌓았고, 이후 단계에서 [두 번째 직업]으로 학문 교육자로 발전했다.

In health professions education scholarship, research and development go hand-in-hand. Application is a core characteristic. The vast majority of scholars involved in HPE research have roles in education, either as clinicians, as teachers, or both; as course or program directors or as administrative officers, such as associate deans. While educational scientists in university faculties of social science, may never have been primary or secondary school teachers (even if that is their domain of study) and may be criticized for ivory tower science, HPE researchers are very often active teachers, active faculty developers, active curriculum and course developers with clinical or biomedical research experience. Many scholarly HP educators have initially built a career in patient care or the basic sciences and developed as scholarly educators only at a later stage, as a second career.

HPE의 학술활동 적용 기준이 다른 고등교육 영역보다 더 강력한 이유는 [양질의 의료 서비스에 대한 명확한 사회적 욕구] 때문이다. 의료는 모든 사람에게 영향을 미치며, [사회적 신뢰]를 필요로 하는데, 이는 주로 [의료 제공자와 그들이 제공할 것으로 추정되는 교육]에 초점을 맞춘 신뢰이다. 수십 년에 걸친 의학 훈련의 개선을 옹호하는 많은 보고서들은 크리스타키스가 1995년에 그들 모두가 다음과 같은 결론을 내리고 있다고 정리했다.

"놀랄 정도로 일관되게, [의료 전문직의 특정한 사회적 비전]을 제시하고 있으며, 여기에서 의과대학은 다음을 달성하기 위하여 사회에 복무하는 것으로 여겨진다.

  • [공공의 이익]에 더 잘 봉사하기 위해 
  • [의료 인력 수요]를 해결하기 위해 
  • [급성장하는 의학 지식에 대처]하기 위해 
  • [일반주의를 강조]하기 위해 

다음의 권고사항은 1910년 이후로 거의 지속적으로 등장해 왔다

  • 일반의 교육을 늘린다. 
  • 외래 진료 노출을 증가시킨다. 
  • 사회과학 강좌를 제공한다. 
  • 평생 및 자기 학습 기술을 가르친다. 
  • 교육활동에 보상한다, 
  • 학교 사명을 명확히 하고 
  • 교육 과정을 중앙 집중식으로 관리하다 

The reason why the application criterion of scholarship in HPE may be stronger than in other higher education domains is a clear societal desire for high-quality health care. Health care affects everyone, and requires societal trust to operate, a trust that primarily focuses on care providers and their presumed education. The many reports, across several decades, advocating for improvement of medical training led Christakis to conclude in 1995 that they all

"articulate a specifically social vision of the medical profession, in which medical schools are seen as serving society [..] with a remarkable consistency, [..]

  • to better serve the public interest,
  • to address physician workforce needs,
  • to cope with burgeoning medical knowledge, and
  • to increase the emphasis on generalism.

[Recommendations to]

  • increase generalist training,
  • increase ambulatory care exposure,
  • provide social science courses,
  • teach lifelong and self-learning skills,
  • reward teaching,
  • clarify the school mission, and
  • centralize curriculum control

have appeared almost continuously since 1910",55 

이러한 결론은 1995년 이래로, 의학 교육 개혁에 대한 후속 요구로 쉽게 확장된다. 
conclusions that easily extend to subsequent calls for medical education reforms after 1995.42, 43, 56

보건직업 교육학술활동은 응용과학의 전형이며, 응용에 지속적으로 치중하기 때문에 순수과학으로 볼 수 없다. 현재 주요 HPE 저널에 게재된 모든 간행물 중 대다수는 연구 보고서가 아니라 관점의 기사, 지침, 리뷰이다. 그것들은 교육을 발전시키고 매우 유용하며, 응용이 HPE 학문 영역의 중심이라는 것을 보여준다.
Health professions education scholarship is an exemplar of an applied science and cannot be viewed as a pure science, because of its continuous focus on application. Of all current publications in the major HPE journals, the majority are not research reports, but perspective articles, guidelines, and reviews. They serve to advance education and are highly useful, and show that application is central to the HPE scholarly domain.

3.4 교육 및 학술 커뮤니케이션
3.4 Teaching and scholarly communication

네 번째 기준은 Teaching이며, 더 넓게 해석하자면 지식, 통찰력, 발견을 커뮤니케이션함으로써 공동체와 후배 학자들에게 가르치는 것이다. 1970년 이전에는 사실상 존재하지 않았던 의학 교육에 대한 지역, 국가 및 국제 회의는 수와 규모가 급격히 증가했다(표 2)
Boyer's fourth criterion of scholarship is Teaching, or, interpreted more broadly, the communication of knowledge, insight, and discovery, to the community at large and to junior generations of scholars. Not only the number of journals and publications increased significantly; local, national, and international conferences in medical education––virtually nonexistent before 1970, increased rapidly in number and size (Table 2).

 
 

회원들과 회의 참석자들에 의해 가장 큰 국제 HPE 협회는 유럽 의학교육협회이다. 1973년 창설된 이래 매년 열리는 이 회의는 유럽 밖에서 온 대다수의 참석자들이 참석하는 글로벌 회의로 성장했다. AMEE는 의료 및 보건 직업 교육의 질을 높이기 위한 다양한 다른 서비스(여행, 웨비나, 자격증 과정, 지침 및 리뷰를 포함한 자원, 상, 상금, 소액 보조금, 펠로우 멤버 옵션)를 제공합니다. 그들의 웹사이트에는 의료 또는 보건 직업 교육을 위한 37개의 소규모 활동적인 국내 및 국제 사회와 협회가 나열되어 있다. 이들 중 다수는 매년 국가 또는 지역 컨퍼런스를 개최하기도 하며, 일부 국가 HPE 컨퍼런스는 국제 컨퍼런스를 능가한다. 미국 의과대학협회는 2019년 연례 회의에서 4490명의 참가자를 받아들였지만, 교육 연구는 AAMC 회의에서 덜 강조되었다. 네덜란드 연례 HPE 컨퍼런스는 지난 10년 동안 매년 900~1000명의 참가자를 안정적으로 받고 있다.
The largest international HPE society by members and conference attendees is the Association of Medical Education in Europe (AMEE). Its annual conference has grown since its inception in 1973 into a global conference with a majority of attendees from outside Europe.57 AMEE offers a variety of other services to foster the quality of medical and health professions education (journals, webinars, certificate courses, resources including guidelines and reviews, awards, prizes, and small grants, fellowship member options). Their website lists 37 smaller active national and international societies and associations for medical or health professions education (www.AMEE.org). Many of these also hold annual national or regional conferences. Some national HPE conferences exceed international conferences. The Association of American Medical Colleges received 4490 participants at their 2019 annual meeting, but educational research has less emphasis at AAMC meetings; the Dutch annual 2-day HPE conference has received a stable number of 900–1000 participants annually across the past decade.

Teaching이란, 좀 더 구체적으로 말하면, 특정 영역에서 [미래 세대를 교육하는 것]이다. 교육학술활동의 목적은 가르치는 것을 포함하지만, [새로운 세대의 학자들을 가르치는 것]은 뭔가 다르다. 그래서 문제는 HPE 공동체가 HPE 학술활동의 내용과 방법을 가르치는데 어느 정도 투자를 했는가 하는 것입니다. [의학적 배경을 가진 1세대 HPE 학자들]은 교육학과 또는 사회과학 분야에서 석박사 학위를 취득하기 위해 교육 방법을 스스로 훈련하거나 시간을 보냈다. 이러한 모습은 1990년대에 HPE 학술활동 단위에서 [자체적인 HPE 석박사 프로그램]이 제공되기 시작하고, 의과대학에서 teacher career에 대한 진지한 관심이 등장하면서 바뀌었다.58 HPE에서

  • [전담dedicated 교수] 및 [부교수associated 직책]의 설립,
  • [임상 및 비임상 교수진]을 위한 대안적 커리어 기회 제공,
  • 의과대학 내 교육 커뮤니티로서 [아카데미Academies의 설립]

...은 이러한 흐름을 더 촉진하였다.
Teaching, more specifically, involves educating future generations in a specific domain. While the object of educational scholarship includes teaching, teaching new generations of scholars is something different. So the question is: to what extent has the HPE community invested in teaching the content and methods of HPE scholarship? The first generations of HPE scholars with a medical background have trained themselves in educational methods or spent time to obtain an advanced degree in schools of educational or social sciences. This has shifted in the 1990s, when advanced academic degree programs began to be offered by units of health professions education scholarship, and serious attention for teacher careers in medical schools emerged.58 

  • The establishment of dedicated professor and associate professor positions in health professions education,
  • providing an alternative career opportunity for clinical and nonclinical faculty members,59 and
  • the establishment of Academies as educational communities within medical schools for early career or distinguished educators60 

has further fostered this.

석사와 박사 프로그램은 이러한 지속적인 학문의 전문적 발전을 가능하게 하였다. HPE의 석사급 프로그램은 1996년 7개에서 2012년 76개, 2020년 139개로 증가했으며, 구조화된 박사급 프로그램은 2014년 24개, 2020년 26개로 집계됐다. 여기서 훈련받은 학생 수도 크게 늘었다. 일례로 마스트리히트대 보건전문대학원(School of Health Professional Education)에서 활동 중인 박사과정 학생의 수가 지난 10년간 25명에서 100명으로 증가했다. 확장된 국제 협력은 프로그램이 한 곳에 점점 덜 제한됨에 따라 그러한 증가를 촉진한다. 몇몇 국가들은 이 운동에서 지도력이 뛰어났다. 1960년 이후 영국, 캐나다, 미국에 이어 네덜란드, 호주까지 건강 직업 교육에서 학술활동을 장려해 왔다. 의과대학별 생산성으로 측정했을 때, 즉, 지난 10년 반 동안 캐나다와 네덜란드는 가장 높은 상대적 HPE 연구 생산성을 보여주었으며, 학술지 기사에 대한 선임 저자 자격을 종종 제공했으며(표 4), 국제 연구 멘토십의 표시로 해석된다

Masters and PhD programs enable this continued professional development in scholarship. The number of masters level programs in HPE increased from 7 in the year 1996 to 76 in the year 201261 and 139 in the year 2020 (www.faimer.org) and the number of structured doctoral programs was calculated to be 24 in the year 201462 and 26 in the year 2020 (www.faimer.org). The numbers of students trained in these units also expanded significantly. As an example, the number of active PhD students in Maastricht University's School of Health Professions Education increased in the past decade from 25 to 100.63 Expanded international collaborations foster such increases as programs become less and less confined to one location.64 A few countries have excelled in leadership in this movement. Since 1960 the United Kingdom, Canada, and the USA, followed by the Netherlands and Australia have promoted scholarship in health professions education. Measured by productivity per medical school, that is, considering the size of the country, Canada and the Netherlands have shown the highest relative HPE research productivity across the past decade and a half, and often provided senior authorships on journal articles (Table 4), to be interpreted as a sign of international research mentorship (Table 3).

[네덜란드]와 같은 일부 국가에서는 교수직은 박사과정 학생들을 개별적으로 또는 구조화된 프로그램에서 감독할 수 있는 공식적인 권리와 기대를 포함한다. 보건직 교육에서 이러한 의자의 증가는 HPE 박사과정 학생 수의 증가로 인한 촉매 효과를 가져왔다. 박사 학위 졸업에 기초한 대학 연구의 정부 자금과 결합하면, 이것은 네덜란드에서 건강 직업 교육 연구의 다작 생산을 설명할 수 있을 것이다.
In some countries, such as the Netherlands, professor positions include the formal right and expectation to supervise doctoral students in their domain of expertise, individually or in structured programs. In health professions education, the increase of such chairs has had the catalytic effect of increased numbers of PhD students in HPE which. Combined with government funding of university research based on PhD graduations, this may explain the prolific production of health professions education research in the Netherlands.65

의심할 여지 없이, 보이어의 Teaching 기준은 개별 국가 수준 뿐만 아니라, 국제적인 수준에서도 충족되었다.
Boyer's teaching criterion, no doubt, has been met, not only locally, but also at the international level.

4 결론 및 전망
4 CONCLUSION AND OUTLOOK

HPE 학술활동의 발전과 현황을 분석해보았을 때, 보이어의 성숙한 학문 규율 기준을 모두 충족한다는 것을 부인할 수 없다. HPE 학문 단위는 학문적 단위가 될 수 있으며, 따라서 이어져야 하는 질문은 그러한 학과 또는 단위가 대학에서 어디에 속하느냐이다. 지금까지는 사회과학이나 교육과학의 학부나 학과보다는, 보건전문직 대학들이 이러한 단위를 설립하고 주최해왔으며, 이를 유치해야 했다. (사회과학의 통찰력과 결합하여) [보건의료행위가 이뤄지는 곳과 근접하게 자리하는 것]이 이러한 단위가 번창하기 위한 중요한 조건이었던 것으로 보인다. 66 HPE 연구는 의사, 간호사 또는 다른 건강 전문가처럼 생각하고 행동하고 느끼는 것이 무엇인지 이해하는 사고방식을 가진 학자들에 의해 가장 잘 수행되어야 한다. 즉, 의료 분야에서 [전문지업적 정체성]을 소유하거나, 적어도 공감하기 위한 것이다. 
The analysis of the development and current status of health professional education scholarship would undeniably qualify it as meeting all of Ernest Boyer's criteria of mature scholarly discipline. HPE scholarly units can become academic departments and a relevant question is then where in universities such departments or units belong.50 Rather than in faculties or departments of social or educational sciences, schools in the health professions have established and hosted such units and should host them. Situated in close vicinity to the practice of health care seems to have been a critical condition for these units to flourish, combined with the insights of the social sciences.66 HPE research should be best conducted by scholars with a mindset to understand what it is to think, act, and feel like a physician, nurse, or other health professional, in other words to possess, or at least sympathize, with professional identities in health care.67

20세기 중반 이후 HPE 학술활동 활동에 대한 관심의 성장은 다른 고등 교육 분야에서도 유사한 발전을 앞질렀다. 잘 준비된 의료 전문가를 위한 최적의 의료 서비스에 대한 추구는 사회적 영향, 전문적인 존중, 직업의 명확성과 70년 전에는 부족했던 교육 이론 및 연구 방법론의 통찰력을 결합한 명확한 교육적 집중으로부터 이익을 얻었을 수 있다.
The growth of health professions education scholarship activities and interest since mid-20th century (journals, publications, conferences, HPE research, and development centers, scholars) has out-paced similar developments in other higher education domains. The quest for optimal health care, and consequently, for well-prepared health care professionals may have benefited from a clear educational focus that combines societal impact, professional esteem, and clarity of occupations with insights from educational theory and research methodology that lacked 70 years ago.

초기 수십 년 동안 몇몇 계몽된 사람들이 HPE 학술활동의 성장과 방향에 큰 영향을 미쳤지만, 현재 학자들의 숫자는 오랫동안 지속 가능한 영역을 유지하는데 중심적인 임계 질량을 넘어섰다.
While during the early decades a few enlightened individuals had a major impact on the growth and direction of HPE scholarship, the number of scholars now has likely passed the pivotal critical mass to keep the domain sustainable for a long time.

스털리 외 연구진(222-225페이지)은 의료 교육의 미래에 대한 분석에서 의료 교육 연구의 개선을 위한 5가지 주요 의제를 상세히 설명한다.
In their analysis of the future of medical education,77 Bleakley et al. (page 222–225) elaborate a five-point agenda for improvement of medical education research (slightly amended):

(1) [개념적 질문 및 명확화]에 초점을 맞추고, 증거로서 무엇이 중요한지 결정한다.
(1) a focus on conceptual questions and clarifications and deciding on what counts as evidence,

(2) 기회주의적 연구보다는 [체계적인 연구]의 프로그램 구축
(2) building programs of systematic research rather than conducting just opportunistic studies,

(3) 보다 엄격한 [성과-기반 연구],
(3) more rigorous outcome-based research,

(4) 질적 및 정량적 (혼합된 방법) 연구에 대한 더 나은 전문지식을 구축하고,
(4) building better expertise in combined qualitative and quantitative (mixed methods) research, and

(5) 학술계와 임상계 사이에 생산적인 대화를 창출한다. 
(5) creating a productive dialog between the academic and clinical communities.77 

 

아스클레피오스는 히포크라테스의 선서에 포함된 건강 전문가들의 고유 임무인 뱀과 막대기에 대한 자신의 상징이 어떻게 수천 년 후에 활발한 학문 교육자 공동체로 이어졌는지 알면 놀랄 것이다. 그때나 지금이나, 최고의 자격을 갖춘 의료 전문가를 양성한다는 일반적인 목적은 변하지 않았습니다. 연구자와 학자들은 [유능한 의료 인력이라는 궁극적인 목표]가 달성가능하며, [이 목표가 의료 교육의 지속적인 혁신에 기름을 부을 것]이라는 비전을 만들지만, 학술활동을 특징짓는 것은 달성 가능한 종점이 아니라 거기에 이르는 과정pathway일 수 있다. 최적의 교육을 통해 만들어진 '역량있는 전문직'은 마치 성배Holy Grail처럼 보일지 모르지만, 이를 달성하려면 보이어의 기준에 따른 학술활동이 필요하다. 이 과정에는 부침이 있으며, [역량있는 의료인력]에 대한 [학교, 병원 및 규제 기관의 관심]은 [자금 조달, 효율성, 법적인 제약]이라는 "의도하지 않은 결과"로 이어졌다. 이러한 결과를 분별하고 이를 극복할 수 있는 방법을 제시하는 학자들이 필요하다. 이러한 역학의 혼합은 미래의 학자들이 학습자, 임상의, 환자 및 사회를 위해 건강 직업 교육의 지속적인 혁신을 만들고 시험하도록 계속 도전하게 될 것이다.

Asclepius would be surprised to know how his symbols of snake and rod as well as the obligation to teach—an inherent task of health professionals, incorporated in Hippocrates' oath—have led to a lively community of scholarly educators several millennia later. The common pursuit, then and now, for the best qualified health professionals has not changed. While researchers and scholars develop visions that suggest that the ultimate goal of a competent health care workforce may be attainable and fuel the continued innovation in medical education, it may be the pathway rather than an attainable endpoint that characterizes scholarship. While "the competent health professional," molded by optimal education, may seem a Holy Grail, the quest for it is served by scholarship according to Boyer's criteria. The pathway shows ups and downs,78 and the interest of schools, hospitals, and regulatory bodies in this competent workforce, has led, in the words of Woolliscroft, to "unintended consequences" of financing, efficiency, and legal constraints.69 Scholars are needed to discern these consequences and recommend routes to overcome them. This amalgam of dynamics is bound to keep challenging future scholars to create and test ongoing innovations in health professions education, to the benefit of learners, clinicians, patients, and society.

 

 

 


FASEB Bioadv. 2021 Mar 29;3(7):510-522.

 

 doi: 10.1096/fba.2021-00011. eCollection 2021 Jul.

Health professions education scholarship: The emergence, current status, and future of a discipline in its own right

Affiliations collapse

Affiliation

1Center for Research and Development of Education University Medical Center Utrecht Utrecht the Netherlands.

PMID: 34258520

PMCID: PMC8255850

DOI: 10.1096/fba.2021-00011

Free PMC article

 

Abstract

Medical education, as a domain of scholarly pursuit, has enjoyed a remarkably rapid development in the past 70 years and is now more commonly known as health professions education (HPE) scholarship. Evidenced by a solid increase of publications, numbers of specialized journals, professional associations, national and international conferences, academies for medical educators, masters and doctoral courses, and the establishment of many units of HPE scholarship, the domain of HPE education scholarship has matured into a scholarly discipline in its own right. In this contribution, the author reviews the developments of the field from Boyer's four criteria that determine scholarship: discovery, integration, application, and teaching. Born mid-20th century, and in the first decades developed in the predominant area of physician education, HPE scholarship has matured, with increasing breadth, depth, and volume of scholars, publications, conferences, and dedicated centers for research and development. The author concludes that, given the infrastructure that has emerged, HPE can arguably be considered a discipline in its own right. This academic question may not matter hugely for practices of scholarly work in this domain, and any stance in this academic debate inevitably reflects a personal view, but the author would support the view of health professions scholarship as being a unique niche, with inherent dependence on both medical and other health professional sciences, on the one hand, and social sciences, including educational sciences, on the other hand.

Keywords: History; conferences; health professions education; medical education; publications; scholarship.

When I say … 리커트 문항(Med Educ, 2021)
When I say … Likert item
Edward Krupat

 

 

정량 지향적인 연구자들은 설문지와 설문 조사 형태의 자기 보고 조치에 크게 의존한다. 특히 리커트 아이템을 이용해 태도와 신념을 평가하는 방식이 의대 교육자부터 여론 조사자까지 전 세계 연구진에 의해 채택됐다. 리커트 아이템이라는 용어는 1932년 유망한 젊은 사회과학자 렌시스 리커트가 자신의 논문에서 태도를 측정하는 새로운 방법의 사용을 소개한 것으로 거슬러 올라간다. 
Researchers who are quantitatively oriented rely greatly on self-report measures in the form of questionnaires and surveys. In particular, the use of Likert items to assess attitudes and beliefs has been adopted by researchers worldwide, from medical educators to public opinion pollsters. The term Likert item dates back to 1932 when a promising young social scientist, Rensis Likert, introduced the use of a new method to measure attitudes in his dissertation.

발명자의 이름을 딴 리커트 항목은 진술에 불과하며(예: 내 주치의에게 만족함), 강한 동의에서 강한 반대까지 다양한 옵션이 뒤따른다. 태도를 측정하는 다른 수단(아래 참조)이 존재하지만, 기술적으로 보자면, 리커트 문항은 독점적으로 이러한 형식만을 의미한다. 그럼에도 불구하고, 의학 교육 문헌에서 이 라벨은 종종 '라이커트 스타일'이라고 불리는 다양한 태도 항목 형식과 함께 매우 느슨하게 사용되어 왔다. 

Named after its inventor, a Likert item is nothing more than a statement (e.g., I am satisfied with my physician), followed by several options varying from Strongly Agree to Strongly Disagree.1 While other means of measuring attitudes exist (see below), technically, a Likert item refers exclusively to this format. Nonetheless, in the medical education literature, this label has been used very loosely, with a range of attitude item formats often referred to as ‘Likert style’. 

겉보기에는 간단해 보이지만, 리커트 항목과 리커트 척도의 사용(리커트 항목을 합치거나 조합한 결과)을 둘러싸고 많은 잘못된 정보와 논쟁이 존재한다. 첫째, 문자 그대로, 내가 "라이크-에르트"라고 말할 때, 나는 "라이크-에르트"가 아니라 "i"로 짧게 발음하는데, 이것은 전 세계의 많은 학식 있는 동료들이 저지른 실수이다. 이 발음의 이유는 간단합니다. 렌시스 리커트는 자기 이름을 '릭-에르트'라고 발음했다. 마치 'k' 앞에 'c'가 붙은 것과 같다. 우리도 그래야 한다.

Although seemingly straightforward, a good deal of misinformation and debate exists around the use of Likert items and Likert scales (which are the result of summing or combining Likert items). First, literally, when I say … Likert, I pronounce it Lick-ert, with a short ‘i’, not Like-ert (with a long ‘i’), a mistake made by so many of my learned colleagues around the world. The reason for this pronunciation is simple. Rensis Lickert pronounced his name ‘Lick-ert’, as if it had a ‘c’ before the ‘k’, and we should too. 

리커트 아이템은 찬성과 반대 의견의 다양한 이슈와 우려를 가지고 있습니다.2-4

  • 질문 중 하나는 얼마나 많은 선택지가 있어야 하는가 하는 것이다. 일반적인 관행은 4개보다 적지 않고, 7개를 넘지 않으며, 필자의 경험상 의학교육연구자는 4, 5개의 선택지를 사용하는 경향이 큰 반면, 더 넓은 사회과학계, 특히 심리학자와 사회학자들 사이에서는 6, 7개를 사용한다.
  • 선택한 숫자에 관계없이, 짝수 또는 홀수 수의 응답지 수를 선택할 경우 종종 동의 안 함으로 분류되는 중간점을 제공하는 것이 좋은 생각인지에 대한 의문이 제기된다. 설문 조사 실무자들 사이에 논쟁이 존재하며, 일부는 응답자들에게 자신의 태도가 진정으로 중립적이라는 것을 나타내는 방법을 제공하는 것이 더 낫다고 믿고, 다른 일부는 중간점이 단순한 중립성을 반영하지 않는 이유로 개인에 의해 종종 부적절하게 사용된다고 주장한다.5
  • 또한 리커트 항목 데이터를 분석하고 제시하는 방법에 대해서도 의견이 일치하지 않는다.6 일부에서는 빈도 및 백분율의 사용(카이-제곱과 같은 통계 사용)을 지지하지만, 다른 많은 사람들은 기술적으로는 선택사항이 구간 수준 데이터를 나타내지 않더라도 합계 및 평균이 계산되고 보고될 수 있다고 믿는다. 

Likert items come with a range of issues and concerns, pro's and con's.2-4 

  • One question is that of how many response alternatives there should be. The general practice is no less than four nor more than seven, and in my experience, medical education researchers greatly tend to use four or five options, whereas in the broader social science community, in particular among psychologists and sociologists, six or seven are used.
  • Regardless of the number chosen, the choice of whether to go with an even or odd number of alternatives raises the question of whether providing a midpoint, often labelled neither-agree-nor-disagree, is a good idea. Debates exist among survey practitioners, some believing that it is better to offer respondents a way of indicating that their attitude is truly neutral; others arguing that the midpoint is often used inappropriately by individuals for reasons that do not reflect simple neutrality.5 
  • Disagreement also exists as to how the Likert-item data should be analysed and presented.6 While some endorse the use of frequencies and percentages (using statistics such as chi-square), many others believe that sums and means can be calculated and reported (using statistics such as t-tests), even though technically, the choices do not represent interval-level data. 

또한 리커트 항목에서 파생된 가능한 편견에 대한 의문도 많다.

  • 한 가지 가능한 편견은, '묵인'으로서 사람들이 진술에 부동의하기보다는 동의하는 경향을 의미한다.
  • 또 다른 [사회적 만족도 편향]은 사람들이 자신의 '진정한' 반응보다는 다른 사람들이 듣고 싶어한다고 믿는 대답을 제공하는 경향이 있다는 것이다.
  • '자대고 긋기straightlining'를 생성하는 응답 집합은 여러 항목이 모두 같은 방향으로 단어화될 때 지나치게 일관된 방식으로 답하는 경향이다. 비록 일부에서는 '아니오'를 문장에 삽입하여 항목의 의미를 되돌리려고 시도했지만, 이것이 형편없는 해결책이라는 증거가 존재한다.7
    • 선호하는 관행은 일부와 동의하지만 다른 사람들과의 의견 불일치가 유사한 태도를 나타내는 항목을 작성하는 것이다. 예를 들어, '진료 중 환자와 의사는 동등해야 한다' 항목에 동의하는 것과  '의사가 진료면담에 책임이 있다'는 의견에 부동의하는 것은 둘 다 환자-중심적 지향성의 표현일 수 있습니다.

Questions also abound about possible biases deriving from Likert items.

  • One possible bias results from response acquiescence, the tendency of people to agree with statements rather than disagree.
  • Another, the social desirability bias, is the tendency for people to provide answers they believe others want to hear rather than their ‘true’ responses.
  • Response set, which generates ‘straightlining’, is a tendency to answer multiple items in an overly consistent manner when all are worded in the same direction. Although some have attempted to reverse an item's meaning by inserting ‘not’ into the statement, evidence exists that this is a poor solution.7
    • A preferred practice is to write items such that agreement with some, but disagreement with others, indicate a similar attitude (e.g., agreement with the item ‘Patients and their doctors should be seen as equals during a visit’ but disagreement with ‘The doctor should be in charge of the medical interview’ would both be expressions of a patient-centred orientation). 

최근 리커트 항목에 대한 회의적인 시각으로 인해 대안적 유형의 접근법, 특히 '항목-특이적item-specific'(IS) 형식의 사용에 대한 논란이 일고 있다. 이와 같은 항목은 질문 초점의 함수로 다양한 응답 대안과 함께 문제를 제기한다. 예를 들어, 의대생들을 대상으로 설문조사를 할 때, 찬성 또는 반대와 관련된 선택사항에 따라 '나는 환자에게 나쁜 소식을 효과적으로 전달할 수 있다'는 진술보다는, IS의 지지자들은 '당신은 얼마나 자주 나쁜 소식을 환자에게 효과적으로 전달합니까?'와 같은 진술과 그 다음 '항상 그러함'에서 '절대 안 함'까지 다양한 선택을 추천할 것이다. IS 항목에는 대응 옵션 사용의 통일성이 잠재적으로 결여되어 교차 연구 비교를 어렵게 하는 것과 같은 가능한 문제가 있다. 예를 들어 빈도를 측정할 때 '빈번히', '종종', '대부분의 시간' 사이의 동등성을 확인하기는 어렵다.

Recently, scepticism about Likert items has led to debate about the use of alternative types of approaches, in particular the use of ‘Item-Specific’ (IS) formats. Items such as these pose a question, with response alternatives that vary as a function of the question's focus. In surveying medical students, for example, rather than providing the statement, ‘I can deliver bad news to patients effectively’, followed by options involving agreement or disagreement, IS proponents would recommend something such as, ‘How often do you deliver bad news to patients effectively?’ followed by choices that might range from Always to Never. IS items have their own possible problems, such as potential lack of uniformity in the use of response options, which would make cross-study comparison challenging. In measuring frequency, for instance, the equivalence among ‘frequently’, ‘often’ and ‘much of the time’ is difficult to ascertain.

Artino 등과 같이 의학 교육의 일부 연구자들은, 설문 조사 연구 설계에서 이러한 형태의 항목을 사용하는 것은 '문제Pitfall'중 하나로 지적하며, 동의-부동의 항목의 지속적인 사용에 대해 강한 (반대적) 입장을 취해왔다. 8 이러한 저자들이 방법론적 전문지식과 지식을 갖춘 사회 과학자들에 의해 논문을 인용하는 만큼, 이에 대한 정보는 다른 질문 형식을 사용하여 비교 연구에 집중하는 [조사 방법론자]와 [미국 여론 조사 협회와 같은 조직]의 회의에 정기적으로 참석하는 전문가에 의해 생성된 증거에서 나온다. 
Some in medical education have taken a strong position on the continued use of agree–disagree items, such as Artino et al, who have listed the use of this form of item as a ‘pitfall’ in survey research design.8 As much as these authors are respected for their methodological expertise and cite papers by informed social scientists,9 the ultimate source of information about this comes from the evidence generated by those survey methodologists who focus on comparative research using different question formats, professionals who regularly attend meetings of organisations such as the American Association of Public Opinion Research.

현재 증거의 상태를 요약한 매우 최근 그리고 철저한 리뷰에서, Dykema 등은 우리에게 다음과 같이 말한다.

  • (1) 증거 기반은 여전히 작고 잠정적이며, 연구 설계의 문제점과 혼란으로 인해서 결론을 쉽게 내리기 어렵다.
  • (2) 여러 연구에 따르면, 어떤 리커트 형식이 사용되었는지를 비교했을 때, 차이 또는 비교상의 긍정적 효과는 없다.
  • (3) 상당한 증거는 분명히 IS 질문의 방향으로 진행되고 있다.

In a very recent and thorough review summarising the state of the current evidence, Dykema et al tell us that

  • (1) the evidence base in still small and tentative, and problems and confounds in research design limit easy conclusions;
  • (2) several studies show no differences or comparative positive effects resulting from the comparative use of the Likert format; however,
  • (3) the preponderance of evidence is definitely trending in the direction of IS questions.

 

수년 동안 데이터의 신뢰성과 타당성에 대한 큰 걱정 없이 동의-불합치 형식을 사용하여 설문조사를 설계해 온 필자는 데이터 중심적이어야 하며, 근거의 무게가 명확하고 일관될 때까지 오랜 접근 방식을 단순히 거부해서는 안 된다고 굳게 믿고 있다. 만약 당신이 '얼마나 자주 항목특이적IS 질문을 사용할 생각인가'라는 질문을 한다면, 제 개인적인 대답은 '자주Often'일 것입니다. 그러나 만약 '동의-불합치 항목이 공룡처럼 멸종되어야 한다'는 문장이 있다면, 내 대답은 '강력히 동의하지 않는다'일 것이다.

Having for many years designed surveys using the agree–disagree format without great concern for the reliability and validity of the data, I am a strong believer that we should be data driven, and not simply reject long-standing approaches until the weight of the evidence is clear and consistent. If you presented me with the question, ‘How often do you intend to employ Item-Specific questions’, my personal response would be ‘Often’. Yet, if presented with the statement: ‘Agree–disagree items should go the way of the dinosaurs’, my response would be ‘Strongly Disagree’. 


Med Educ. 2021 Sep 6.

 doi: 10.1111/medu.14660. Online ahead of print.

When I say … Likert item

Edward Krupat 1

Affiliations expand

정답은 하나? (성찰적) 주제분석의 옳바른 실천은 무엇인가? (Qualitative Research in Psychology, 2021)
One size fits all? What counts as quality practice in (reflexive) thematic analysis?
Virginia Braun a and Victoria Clarke b

 

 

주제 분석의 질: 무엇이 중요합니까?
Quality in thematic analysis: what matters?

"저자들은 분석 과정에서 어떻게 편견을 피하려고 했는지 논의해야 합니다."
“The authors should discuss how they attempted to avoid bias in their analytic process.”

전문가 질적 저널에 제출한 경험적 논문에 대한 익명의 리뷰에서 이 의견을 받았고, 2006년(Braun and Clarke 2006) 이 저널에서 처음 요약한 반사적 주제 분석(TA) 접근법을 사용했다. 검토자의 명령은 TA와 관련된 여러 가지 문제가 있는 가정과 본 논문에서 맥락화, 언팩 및 확장한 질적 품질 기준을 반영한다. TA의 사용이 확대되고 다양해짐에 따라, 논문 발표 이후 출판된 연구의 일관성과 무결성이 항상 유지되는 것은 아니다. 본 논문에서는, TA의 품질에 대해 생각하고 학자들이 우수하고 응집력 있는 TA를 수행하도록 지원하기 위한 도구로서, 출판된 TA에서 확인되는 10가지 문제적 관행과 가정을 설명하고자 한다.
We received this comment in an anonymous review of an empirical paper we had submitted to a specialist qualitative journal, and in which we used our reflexive thematic analysis (TA) approach, which we first outlined in this journal in 2006 (Braun and Clarke 2006). The reviewer’s command reflects a number of problematic assumptions around TA, and indeed qualitative quality criteria, which we contextualise, unpack and expand on in this paper. As the use of TA has expanded, and diversified, since the publication of that paper, the coherence and integrity of published research does not always hold. We use ten problematic practices and assumptions evident in published TA as a tool for thinking about quality in TA, and to support scholars in doing excellent, cohesive TA. 

이러한 [문제적 관행]은 TA에 대한 혼란과 오해를 반영하며, 이를 양질의 TA를 위한 명확한 권고사항을 줌으로써 명확히 하고자 하였다 (일부는 질적 학문에 더 폭넓게 적용될 수 있으므로 TA 이상의 관련성을 가질 수 있다). 편집자와 검토자가 품질 관리자로서 역할을 잘 하게끔 돕기 위해, 우리는 이러한 문제가 있는, 그리고 그에 상응하는 좋은(또는 최선의) 관행을 TA 연구의 품질을 평가하기 위한 '지침guideline'으로 정리하였다. 이는 출판을 위해 TA 연구를 평가할 때 고려해야 할 20개의 중요한 질문의 형태로 제시된다. 
These problematic practices reflect confusions and misconceptions about TA that we seek to clarify with clear ‘take away’ recommendations for quality TA (some of which may apply to qualitative scholarship more broadly, and thus have relevance beyond TA). In order to support editors and reviewers in their role as quality custodians, we translate these problematic, and corresponding good (or best), practices into ‘guidelines’ for assessing the quality of TA research – presented in the form of twenty critical questions to consider when evaluating TA research for publication 

이 질문들은 독립적으로 또는 TA에 대한 우리의 방법론적 글과 함께 사용되도록 고안되었다.
특히 더 많은 설명이 필요한 경우 본 논문은 더욱 그렇다.
These questions are designed to be used either independently, or alongside our methodological writing on TA, and especially the current paper, if further clarification is needed.

방법과 방법론의 적절한 선택과 설명
Adequate choice and explanation of methods and methodology


1. 저자들은 간단하게나마 왜 TA를 사용하는지 설명합니까?
1. Do the authors explain why they are using TA, even if only briefly?

2. 저자는 어떤 유형의 TA를 사용하는지 명확히 명시하고 정당화합니까?
2. Do the authors clearly specify and justify which type of TA they are using?

3. 특정 유형의 TA의 사용과 정당화가 연구 질문이나 목적과 일치합니까?

3. Is the use and justification of the specific type of TA consistent with the research questions or aims?

4. 연구의 이론적, 개념적 토대와 TA의 특정 유형 사이에 좋은 '적합'이 있습니까(즉, 개념적 일관성이 있습니까)?
4. Is there a good ‘fit’ between the theoretical and conceptual underpinnings of the research and the specific type of TA (i.e. is there conceptual coherence)?

5. 데이터 수집 방법과 특정 유형의 TA 사이에 양호한 '적합'이 있습니까?
5. Is there a good ‘fit’ between the methods of data collection and the specific type of TA?

6. 지정된 유형의 TA가 문서 전체에서 일관되게 집행되고 있는가?
6. Is the specified type of TA consistently enacted throughout the paper?

7. TA와 관련하여 문제가 있는 가정과 실천의 증거가 있습니까? 여기에는 일반적으로 다음이 포함된다.
7. Is there evidence of problematic assumptions about, and practices around, TA? These commonly include:

● TA를 하나의 통일된 개체로 취급하고, 널리 합의된 하나의 절차로 취급한다. 
● Treating TA as one, homogenous, entity, with one set of – widely agreed on – procedures. 

● 어떠한 인정이나 설명 없이 철학적, 절차적으로 양립할 수 없는 TA 접근 방식을 결합합니다.
● Combining philosophically and procedurally incompatible approaches to TA without any acknowledgement or explanation.

● 핵심 개념으로 뒷받침되는 공유 의미의 주제적 패턴과 데이터 주제를 혼동하는 요약. 
● Confusing summaries of data topics with thematic patterns of shared meaning, underpinned by a core concept. 

● 근거 이론 개념 및 절차(예: 포화, 상수 비교 분석, 라인별 코딩)를 어떠한 설명이나 정당화 없이 TA에 적용한다.
● Assuming grounded theory concepts and procedures (e.g. saturation, constant comparative analysis, line-by-line coding) apply to TA without any explanation or justification.

TA가 본질주의자, 현실주의자 또는 무이론적이라고 가정한다.
● Assuming TA is essentialist or realist, or atheoretical.

● TA는 데이터 축소 또는 기술 접근 방식일 뿐이므로 다른 목적을 달성하기 위해 다른 방법 및 절차로 보완되어야 한다고 가정한다. 
● Assuming TA is only a data reduction or descriptive approach and therefore must be supplemented with other methods and procedures to achieve other ends. 

8. 보완 절차나 방법이 정당하고 필요한가, 아니면 단순히 TA를 더 효과적으로 사용함으로써 동일한 결과를 얻을 수 있었는가?
8. Are any supplementary procedures or methods justified, and necessary, or could the same results have been achieved simply by using TA more effectively?

9. TA를 귀납적으로 사용하는 경우에도 TA 사용의 이론적 토대가 명확히 명시되어 있는가(예: 존재론적, 인식론적 가정, 이론적 프레임워크 지침)?
9. Are the theoretical underpinnings of the use of TA clearly specified (e.g. ontological, epistemological assumptions, guiding theoretical framework(s)), even when using TA inductively (inductive TA does not equate to analysis in a theoretical vacuum)?

10. 연구자들은 (단순히나마) 개인적, 사회적 관점 및 포지셔닝에 대해 '자신의 관점'을 가지려고 노력하고 있는가? (이것은 연구자들이 사회정의 지향적인 연구에 종사할 때 그리고 한계적이고 취약한 집단, 연구원이 속하지 않는 집단의 '목소리'를 대변할 때 특히 중요하다.)
10. Do the researchers strive to ‘own their perspectives’ (even if only very briefly), their personal and social standpoint and positioning? (This is especially important when the researchers are engaged in social justiceoriented research and when representing the ‘voices’ of marginal and vulnerable groups, and groups to which the researcher does not belong.)

11. 사용된 분석 절차가 일반적인 절차가 아닌, 저자가 실제로 수행한 작업에 대해 명확하게 개략적으로 설명하고 있는가?
11. Are the analytic procedures used clearly outlined, and described in terms of what the authors actually did, rather than generic procedures?

12. 개념적, 절차적 혼동의 증거가 있지는 않은가? 예를 들어, 반사성 TA(예: Braun과 Clarke 2006)가 주장된 접근법이지만 다른 절차가 개략적으로 설명되어 있다. 코드북 또는 코딩 프레임의 사용, 복수의 독립적인 코더 및 합의 코딩, 평가자 간 신뢰성 측정 및/또는 테마를 출력물이 아닌 분석 입력으로 개념화하기에 주제를 식별하고 코딩으로 분석이 진행됩니다.  (테마 개발을 향하여 코딩을 하는 것보다)
12. Is there evidence of conceptual and procedural confusion? For example, reflexive TA (e.g. Braun and Clarke 2006) is the claimed approach but different procedures are outlined such as the use of a codebook or coding frame, multiple independent coders and consensus coding, inter-rater reliability measures, and/or themes are conceptualised as analytic inputs rather than outputs and therefore the analysis progresses from theme identification to coding (rather than coding to theme development).

13. 저자들이 TA에 대한 그들의 주장된 접근법에 대한 완전하고 일관성 있는 이해를 증명하고 있는가?
13. Do the authors demonstrate full and coherent understanding of their claimed approach to TA?


잘 개발되고 정당화된 분석
A well-developed and justified analysis


14. 보고서의 주제가 무엇이며 어디에 있는지 명확합니까? 원고는 분석 개요, 즉 주제 목록, 서술 개요, 주제 표, 주제 지도에서 이익을 얻을 수 있을까요?
14. Is it clear what and where the themes are in the report? Would the manuscript benefit from some kind of overview of the analysis: listing of themes, narrative overview, table of themes, thematic map?

15. 보고된 주제는 주제 요약이 아니라 '완전히 실현된 테마'(중앙 조직 개념에 기초한 공통적인 의미의 패턴)인가?
15. Are the reported themes topic summaries, rather than ‘fully realised themes’ – patterns of shared meaning underpinned by a central organising concept?

● 만약 그렇다면, 주제 요약이 연구의 목적에 적합한가?
● If so, are topic summaries appropriate to the purpose of the research?

 ○ 저자가 반사 TA를 사용하는 경우, 주제 개념화의 수정이 설명되고 정당화되는가?

 ○ If the authors are using reflexive TA, is this modification in the conceptualisation of themes explained and justified?

● 자료 수집 질문을 주제로 사용하였는가?
● Have the data collection questions been used as themes?

● 원고는 [완전히 실현된 테마]를 보고함과 함께, 추가 분석을 수행함으로써 이익을 얻을 수 있는가?
● Would the manuscript benefit from further analysis being undertaken, with the reporting of fully realised themes?

● 또는 저자가 반사형 TA를 사용한다고 주장하는 경우, 원고는 다른 유형의 TA(예: 코딩 신뢰성 또는 코드북)를 사용한다고 주장함으로써 이익을 얻을 것인가?
● Or, if the authors are claiming to use reflexive TA, would the manuscript benefit from claiming to use a different type of TA (e.g. coding reliability or codebook)?

16. 비주제적 맥락화 정보를 테마로 제시하였는가? (예: 첫 번째 '요약'은 상황별 정보를 제공하는 주제 요약이지만, 보고된 나머지 주제는 완전히 실현된 주제이다.) 만약 그렇다면, 원고는 이것이 비주제적 맥락화 정보로 제시되는 것으로부터 이익을 얻을 것인가?
16. Is non-thematic contextualising information presented as a theme? (e.g. the first 'theme' is a topic summary providing contextualising information, but the rest of the themes reported are fully realised themes). If so, would the manuscript benefit from this being presented as non-thematic contextualising information?

17. 응용연구에서 보고된 주제는 실행 가능한 결과를 초래할 가능성이 있는가?
17. In applied research, do the reported themes have the potential to give rise to actionable outcomes?

18. 논문에 개념적인 충돌이나 혼란이 있습니까? (예: 사회 구성주의자의 접근방식을 주장하는 동시에 코딩 신뢰성에 대한 긍정적 개념에 대한 우려를 표명하거나 참가자의 언어를 경험과 행동의 투명한 반영으로 취급하면서 구성주의자의 접근방식을 주장하는 것)
18. Are there conceptual clashes and confusion in the paper? (e.g. claiming a social constructionist approach while also expressing concern for positivist notions of coding reliability, or claiming a constructionist approach while treating participants’ language as a transparent reflection of their experiences and behaviours)

19. 다음과 같은 미약하거나 설득력이 없는 분석의 증거가 있는가?
19. Is there evidence of weak or unconvincing analysis, such as:

● 테마가 너무 많나요, 적나요?
● Too many or two few themes?

● 테마 레벨이 너무 많습니까?
● Too many theme levels?

● 코드와 테마가 혼동되는가?
● Confusion between codes and themes?

● 데이터 추출과 분석 클레임이 일치하지 않는가?
● Mismatch between data extracts and analytic claims?

● 데이터 추출물이 너무 적거나 너무 많습니까?
● Too few or too many data extracts?

● 테마 간에 겹치는가?
● Overlap between themes?

20. 저자들은 결과의 일반성 결여에 대해 문제가 있는 진술을 하거나, 일반성을 통계적 확률론적 일반성으로 암묵적으로 개념화 하는가? (Smith 2017 참조)
20. Do authors make problematic statements about the lack of generalisability of their results, and or implicitly conceptualise generalisability as statistical probabilistic generalisability (see Smith 2017)?
 


우리가 출판된 TA에서 흔히 마주치는 문제는 종종 절차의 기초가 되는 이론적, 철학적 가정과 거의 관련이 없는 것으로 보이며, 또는 진정의로 quality criteria를 정교하게, 의도적으로, 상황적으로 적용하는 것과도 거의 관련이 없는 것으로 보인다. 
The problems we commonly encounter in published TA often seem to reflect little to no engagement with the theoretical and philosophical assumptions that underlie procedures, with wider quality discussions in qualitative research (e.g. Levitt et al. 2018; Madill et al., 2000; Sparks & Smith, 2009; Yardley 2015), or indeed nuanced, aware and situated application of quality criteria.

TA는 실증주의/양적 그리고 질적 패러다임 내에서 사용되며, 다양한 유형의 TA가 질적 연구의 다른 개념화에 포함되고 반영되기 때문에, TA에 대한 '보편적인' 품질 표준과 기준을 명확히 표현하는 것은 어렵다. 우리는 [작은 q]와 [큰 Q]로 정성 연구를 구분한 키더와 파인(1987)의 구분이 유용하다는 것을 발견한다. 

  • (small q, 질적 실증주의): 실증주의 패러다임 내에서 데이터 수집 및 분석의 질적 기술의 사용,
  • (Big Q): 질적 패러다임 내에서 질적 기법을 사용

As TA is used within positivist/quantitative and qualitative paradigms, and different types of TA are embedded within, and reflect, different conceptualisations of qualitative research, articulating ‘universal’ quality standards and criteria for TA is challenging. We find Kidder and Fine’s (1987) distinction between small q and Big Q qualitative research useful for demarcating between

  • qualitative positivism (small q), the use of qualitative techniques of data collection and analysis within a positivist paradigm, and
  • the use of qualitative techniques within a qualitative paradigm (Big Q qualitative).

이러한 패러다임의 가치는 다소 긴장 상태에 있으며, 이러한 긴장에 대한 인식 없이, 발표된 TA 연구는 우리의 TA 공동 저자 중 한 사람(니키 헤이필드)이 기억될 정도로 'confused q' qualitative라고 부르는 것과도 비슷하다. 즉, 이는 질적 실증주의의 요소와 질적 패러다임의 가치 및 가정을 아무 생각 없이, 비성찰적으로, 비일관적으로 결합하는 것처럼 보이는 연구를 말한다.
The values of these paradigms are in more or less tension, and without awareness of this tension, published TA research can exemplify what one of our TA co-authors (Nikki Hayfield) memorably dubbed ‘confused q’ qualitative – research that seems to unknowingly, unreflexively and incoherently combine elements of qualitative positivism with the values and assumptions of a qualitative paradigm.

일부에서는 우리가 (성찰적) TA에 대한 접근 가능한 지침을 개발한 것이 '절차주의'(King and Brooks 2017) 또는 '방법론'(Chemberlain 2000)에 굴복했음을 의미한다고 이야기한다. 연구자들에게 유연한 '시작점'을 제공하기보다는 성문화하고, 이론적 민감성과 반사성보다 절차를 우선시하며, TA 연구를 위한 엄격하고 구체적인 '규칙'을 만들었다는 지적이다. 하지만 이러한 비판은 TA가 연구자에게 어떤 좋은 (즉 성찰적인) 것을 요구하는지를 잘못 읽은 것이다. 세인트피에르와 잭슨(2014) 등이 '질적 코딩'과 관련해 하는 비판과 같은 종류다. – 그러나 마찬가지로 방법에 따라 질적 연구가 어떻게 보여야 하고 어떻게 보일 것인지에 대한 협소한 이해로도 어려움을 겪는다.

Some might suggest our development of accessible guidelines for ‘how to do’ (reflexive) TA means we’ve succumbed to ‘proceduralism’ (King and Brooks 2017) or ‘methodolatry’ (Chamberlain 2000). That we have codified practice, prioritised procedure over theoretical sensitivity and reflexivity, and created rigid and concrete ‘rules’ for TA research, rather than providing researchers with flexible ‘starting points’. This is a misreading of what good (reflexive) TA requires of the researcher. It is the same sort of critique that St. Pierre and Jackson (2014) and others make in relation to ‘qualitative coding’ – but similarly suffers from a narrow reading of what qualitative researching, guided by methods, should and will look like.

프로세스에 대한 세부 지침을 제공하는 것을 목표로 하지만, 우리는 동시에 TA 내에서 강조되는 유동성, 맥락, 우발성, 그리고 실제로 이론을 강조한다. 절차를 따르는 것이 '좋은 TA'를 수행하는 것을 보증하는 것은 아닙니다. 그보다는, 절차가 무엇을 촉진하는지, 절차가 무엇에 대한 접근을 가능하게 하는지를 이해해야 한다. 또한 절차는 분석의 목적이 아니라 과정을 위한 "도구"라는 것을 이해하는 것이 중요합니다. (품질 보장과 입증에 중점을 둔) 분석 절차는 - 명시적으로 했는지 여부에 관계없이 - 의미 있는 지식과 지식 생산에 대한 기본 패러다임 및 인식론적 가정을 반영한다. 우리는 이 논문이 오용이나 오해의 소지가 있는 부분을 명확히 하기를 바랍니다.

Although we aim to provide detailed guidelines on process, we also emphasise the fluid, the contextual and contingent, and indeed theory, as crucial within TA. Following procedure is not a guarantor for doing ‘good TA’; instead, understanding what the procedures facilitate, what they give you access to, and that these are tools for a process, rather than the purpose of analysis, is important. Analytic procedures, including those centred on ensuring and demonstrating quality, typically reflect underlying paradigmatic and epistemological assumptions about meaningful knowledge and knowledge production (Carter and Little 2007), whether explicated or not. We hope this paper clarifies some potential misuses or misunderstandings.

우리의 목표는 어떤 TA가 되었든지간에, TA에 대한 이론적으로 민감하고, 성찰적이고, 신중한 참여를 장려하는 것이다. 현재의 모습'What is'을 TA 측면에서 비판함으로써, 나가아야 할 방향'What could be'을 촉진하고, 개별 연구과제에서 TA의 넓은 지형에 대한 이해와 TA의 제정을 동시에 증진시키는 것을 목표로 하고 있습니다. TA가 고유한distinct 방법인지 아니면 일반적인 분석 절차인지에 대한 논의가 있었지만, 우리는 [비록 TA가 데이터에서 '패턴'을 식별하려는 다른 접근법(예: 근거 이론, 해석 현상학적 분석[IPA] 또는 질적 내용 분석)과 공통적으로 일부 특징을 공유함에도] 질적 데이터를 다루는 나름의 고유한 방법을 제공한다고 믿는다. 그럼에도 불구하고 그것은 그 자체로 하나의 방법(또는 방법의 클러스터)이다.

Our aim is to encourage theoretically sensitive (Yardley 2015), and reflexive and deliberative engagement with TA, of whatever variety. By critiquing ‘what is,’ in terms of TA, we aim to promote ‘what could be’, and improve both the understanding of the wider terrain of TA, and the enactment of TA in individual research projects. Although there has been discussion as to whether TA is a distinct method, or a generic set of analytic procedures (e.g. Boyatzis 1998; Willig 2013), TA does – we believe – offer a distinct way of working with qualitative data, and that, although it shares some features in common with other approaches that seek to identify ‘patterns’ in data (e.g., grounded theory, interpretative phenomenological analysis [IPA] or qualitative content analysis), it is nonetheless a method (or cluster of methods) in its own right.

(반복) 주제 분석: 간략한 상황별 소개
(Reflexive) thematic analysis: a brief contextualising introduction

TA에 대해 처음 썼을 때(Braun and Clarke 2006) 우리의 목표는 정성적 패러다임(Braun and Clarke 2019a)의 가정을 반영하고 양립할 수 있는 TA에 대한 접근 방식을 명확히 하는 것이었다. 이 목표는 아래의 과정을 통해 개발되었다.  
Our aim, when we first wrote about TA (Braun and Clarke 2006), was to articulate an approach to TA that reflected, and was compatible with, the assumptions of a qualitative paradigm (Braun and Clarke 2019a). This aim has been developed in

  • a qualitative research textbook (Braun and Clarke 2013),
  • numerous chapters (Braun and Clarke 2012; Braun Clarke and Rance 2014; Braun Clarke and Terry 2015; Braun Clarke and Weate 2016; Braun et al. 2019a ; Clarke and Braun 2016; Clarke, Braun, and Hayfield 2015; Terry et al. 2017),
  • encyclopaedia entries (Clarke and Braun 2014a, 2014b),
  • commentaries (Braun and Clarke 2016, 2019a, 2019b, 2019c; Clarke and Braun 2018) and
  • editorials about TA (e.g. Braun and Clarke 2014; Clarke and Braun 2017).

최근 출판물에서, 우리는 우리의 접근방식에 대한 우리의 접근법(예: 브라운과 클라크 2019a)을 알려주고 우리의 접근방식에 대해 구별되는 것과 다른 것(예: 브라운과 클라크 2019c; Braun 등 2019a)을 구별하는 정성적 연구와 관련된 가정과 가치를 더 신중하게 표현했다. 우리는 이제 이러한 접근방식을 성찰적 TA라고 부른다 Braun and Clarke 2019a, 2019b; Braun 등 2019a; Terry 등 2017 참조). 이러한 명칭은 이것을 특정 TA 접근법으로 정의할 뿐만 아니라, 분석 자원으로서의 연구자의 주관성과 이론, 데이터 및 해석에 대한 성찰적 참여를 강조한다.

In recent publications, we have more carefully articulated the assumptions and values around qualitative research that inform our approach to TA (e.g. Braun and Clarke 2019a) to demarcate what is distinct and different about our approach (e.g. Braun and Clarke 2019c; Braun et al. 2019a). We now call this approach reflexive TA (see Braun and Clarke 2019a, 2019b; Braun et al. 2019a; Terry et al. 2017). This not only demarcates it as a particular TA approach, it emphasises the importance of the researcher’s subjectivity as analytic resource, and their reflexive engagement with theory, data and interpretation.

우리의 원래 논문은 유연성을 유지하는 TA 연구를 위한 [접근 가능한 지침]을 제공하고자 했다. 우리는 다양한 참여 모드의 가능성의 범위를 강조했고, 우리의 목표는 TA 연구의 가능성을 폐쇄가 아닌 개방하고 창의성과 광범위한 사용을 장려하는 것이었다. 우리는 질적 분석이 '공예 기술craft skill'이며, 분석 절차의 설명을 통해 완전히 포착하기 어려운 것이기에, '스승master'의 발치에서 가장 잘 배울 것이라는 포터(1997)의 주장에 부분적으로 동의한다. 하지만, 우리 중 한 명은 예리한 공예사이며, 어느 정도까지는 공예 기술도 가르치기 위해 공식화될 수 있다는 것을 알고 있습니다. 일부 구조화된 비계는 이 기술을 그냥 직관적으로 '이해해버리지get it' 못하는 사람들에게 개념을 소개하고 기술을 가르칠 수 있다. 

Our original paper sought to provide accessible guidance for TA research that retained flexibility. We emphasised the range of possibilities of different modes of engagement, and our aim was to open-up, rather than close-down, possibilities for TA research, encouraging creativity and wide-ranging use. We partly agree with Potter’s (1997) claim that qualitative analysis is a ‘craft skill’, and something ideally learnt at the feet of ‘master’, something difficult to fully capture through descriptions of analytic procedures. However, one of us is a keen crafter, and we know craft skills can be formulised for teaching to some extent. Some structured scaffolding can introduce concepts and teach skills to those who do not intuitively just ‘get it’, who are not the proverbial ducks-to-water. 

모든 사람이 질적 분석의 '마스터'를 만날 수 있을 만큼 운이 좋거나 특권이 있는 것은 아니기 때문에, 질적 방법에 대한 접근을 민주화하는 것은 특히 중요하다. 질적 연구에 대한 관심은 감독자의 availability을 훨씬 초과하며, 방법 커리큘럼(학문 및 지역별로 상당히 다양함)에서 잘 교육되지 않는 경우도 많다. 그래서 데이터 참여, 코딩 및 테마 개발을 위한 6단계 프로세스를 설명했습니다. 이에 대한 가장 최근의 표현은 다음과 같다.

This is especially important for democratising access to qualitative methods, as not everyone is fortunate or privileged enough to have access to a ‘master’ qualitative analyst. Interest in qualitative research far exceeds the availability of supervisors and remains often under-taught in methods curricula (varying considerably by discipline and by locale). So, we explicated a six-phase process for data engagement, coding and theme development. Our most recent articulation of this is:

  • 1) 데이터 친숙화 및 익숙화 노트 작성;
  • 2) 체계적인 데이터 코딩,
  • 3) 코드화되고 수집된 데이터로부터 초기 테마를 생성한다.
  • 4) 테마의 개발 및 검토
  • 5) 테마의 정제, 정의 및 명명
  • 6) 보고서 작성
  • 1) data familiarisation and writing familiarisation notes;
  • 2) systematic data coding;
  • 3) generating initial themes from coded and collated data;
  • 4) developing and reviewing themes;
  • 5) refining, defining and naming themes; and
  • 6) writing the report.

우리는 서면 지침의 한계와 그것이 규범적으로 해석될 수 있는 가능성을 인정한다. 그러나, 언급한 바와 같이, 이러한 지침에는 전문가의 감독이나 멘토링 없이 질적 연구를 더 쉽게 할 수 있도록 하는 데 많은 가치가 있다(McLeod 2001). 또한, 우리는 이 단계적 접근법이 엄격하게 따르려는 의도가 아니라는 것을 명확히 하는 것을 목표로 한다. 그리고 분석 기술이 발달함에 따라, 이 여섯 단계는 어느 정도 섞일 수 있고, 분석 과정은 필연적으로 점점 더 재귀적이 된다.

We acknowledge the limits of written guidance, and the potential for it to be (mis)interpreted as prescriptive. However, as noted, there is much value in such guidance, not least in making qualitative research more accessible to those without expert supervision or mentoring (McLeod 2001). Furthermore, we aim to be clear that this phase-approach is not intended to be followed rigidly. And as one’s analytic (craft) skill develops, these six phases can blend together somewhat, and the analytic process necessarily becomes increasingly recursive.

데이터 세트 전체에서 의미 패턴을 식별하고 의미를 이해하는 것을 목표로 하는 다양한 TA 접근 방식이 있다. 동일한 이름과 패턴 있는 의미에 초점을 맞추고 있음에도 불구하고, 서로 다른 TA 접근법 사이에 유의미한 차이가 존재한다(이러한 사항은 나중에 논의한다). 예를 들어, 주제를 공유된 의미의 패턴으로 개념화하는 것은 중심 개념(주제가 포착하는 중심 아이디어 또는 의미)을 중심으로 하는 것은 보편적이지 않다. [완전히-내재된 방법론]보다는 [방법]으로서 [(성찰적) TA가 갖는 유연성]은 상당히 다른 guiding theories으로 수행될 수 있음을 의미한다(의미있는 지식과 지식 생산에 대한 질적 패러다임과 인식론적 가정에 의해 제한되지만). 또한 데이터, 코딩 관행 및 테마 개발에 상당히 다른 방향을 사용합니다.

There are various TA approaches that all aim to identify and make sense of patterns of meaning across a dataset. Despite a shared name and focus on patterned meaning, there are not insignificant differences between different TA approaches (we discuss these later). Our conceptualisation of themes as patterns of shared meaning, cohering around a central concept – the central idea or meaning the theme captures – is not universal, for instance. The flexibility of (reflexive) TA as a method, rather than a fully-embedded methodology, means it can be undertaken with quite different guiding theories (albeit constrained by qualitative paradigmatic and epistemological assumptions about meaningful knowledge and knowledge production), and using quite different orientations to data, coding practices and theme development.

성찰적 TA는 언어, 데이터 및 의미에 대한 경험적(예: 비판적 현실주의자, 맥락론자) 및 비판적(예: 상대론자, 구성론자) 프레임 모두에 적합하다(Braun 및 Clarke 2013). 성찰적 TA는 연역적으로 사용될 수도 있고 귀납적인 분석 과정에 사용될 수도 있다(이 두 가지는 이분법적이지 않고 연속적일 될 수 있음). TA를 할 때, 이론적으로 진공인 상태에서 TA를 수행할 수 없기 때문에, [순수한 귀납적 분석]이 아니라 [데이터에 '근거된' 분석]이라는 의미에서 귀납성을 의미한다. 패러다임, 인식론적, 존재론적 가정은 불가피하게 분석에 정보를 제공한다.

  • 성찰적 TA를 귀납적으로 사용하는 연구자들은 그들의 분석에 inform하는 [이론적 가정]을 확인하고, 이상적으로는, 그들의 분명하게 표현하여 보고할 필요가 있다.
  • 성찰적 TA를 연역적으로 사용하는 것은 기존의 연구와 이론이 우리가 데이터를 분석하고 해석하는 렌즈를 제공한다는 것을 의미한다.
    • 좁게는, 이것은 이전 연구에서 확인된 주제에 대한 증거를 탐구하는 것을 의미할 수 있다;
    • 넓게는 (그리고 더 일반적으로) 이것은 종종 데이터를 코딩하고 해석하는 렌즈로 기존의 정치 또는 설명 이론을 사을용하는 것을 의미한다. (예를 들어 애착 이론 (윌콕스, 몰러, 클라크 2019) 또는 푸코의 성윤리 이론 (베레스와 파비드 2010))

Reflexive TA is suited to both experiential (e.g. critical realist, contextualist) and critical (e.g. relativist, constructionist) framings of language, data and meaning (Braun and Clarke 2013). It can be used for a more deductive or more inductive analytic process (recognising this can be a continuum, rather than dichotomy). We mean inductive in the sense of analysis ‘grounded in’ the data, rather than ‘pure’ induction, because you cannot enter a theoretical vacuum when doing TA. Paradigmatic, epistemological and ontological assumptions inescapably inform analysis.

  • Researchers using reflexive TA inductively need to identify, and ideally articulate in their reporting, the theoretical assumptions informing their analysis.
  • Using reflexive TA deductively means existing research and theory provide the lens through which we analyse and interpret data. Narrowly, this might mean exploring evidence for themes identified in previous research; broadly (and more commonly), this often means using existing political or explanatory theory – such as attachment theory (Willcox, Moller, and Clarke 2019) or Foucault’s theory of sexual ethics (Beres and Farvid 2010) – as a lens through which data are coded and interpreted.

또한 (TA간의 차이는) 의미론적(표면적, 명백함, 명백함)인 것에서 잠재적(암시적, 기저적, '숨겨진')인 것까지의 스펙트럼에 걸쳐, [의미 탐색을 위한 코딩의 포커스]에서도 발생한다. 성찰적 TA 내에서 코딩 프로세스는 테마가 이러한 코딩 프로세스의 '결과'이며, 테마는 코딩을 통해through 개발된다는 점에서 테마 "개발"에 필수적이다. 코딩은 [사전에 개념화한 주제에 대한 증거를 찾는 과정]이 아니다. 분석 과정에는 데이터에 대한 몰입, 읽기, 반성, 질문, 상상, 궁금, 쓰기, 후퇴, 복귀가 포함됩니다. 코딩은 기계적으로 하는 것과는 거리가 멀고, '제대로 생각할 시간'을 필요로 하며, 영감이 떠오르고 통찰력을 발휘해 발전해야 하는 과정이다(고프·라이언스 2016).

Variation also occurs through coding focus, where meaning can be explored across a spectrum from the semantic (surface, obvious, overt) to the latent (implicit, underlying, ‘hidden’). Within reflexive TA, the coding process is integral to theme development, in the sense that themes are an ‘outcome’ of these coding and theme development processes, are developed through coding; coding is not – in general – a process for finding evidence for pre-conceptualised themes. The analytic process involves immersion in the data, reading, reflecting, questioning, imagining, wondering, writing, retreating, returning. It is far from mechanical and is a process that requires ‘headspace’ and time for inspiration to strike and insight to develop (Gough and Lyons 2016).

Ho, Chiang, Leung(2017)은 홍콩에서 일하는 외국인 가정 도우미(FDH)의 경험에 대한 연구에서, TA에 대한 해석학적 접근법을 사용하면서, 자료에 'dwelling with'하는 과정과, '지속적이고 엄격하게' 자신의 생각을 반영하는 과정을 생생하게 보여준다. 호는 다음을 기록했다.

  • 참가자들이 말하는 단어 뒤에 숨겨진 무언의 의미를 궁금해한 것
  • FDH를 고용하고 간호사로 일했던 개인적인 경험을 성찰해본 것
  • 참가자가 설명하고 경험한 상황에서 그가 어떻게 느낄지 상상하고 질문한 것
  • 통찰력 따른 것
  • 데이터에서 유사하거나 반대되는 언어 및 경험을 찾은 것
  • 이것들을 곰곰이 생각한 것

Ho, Chiang, and Leung (2017) provide a vivid example of this process of ‘dwelling with’ data, and of ‘continuously and rigorously reflect[ing] on their own taken for granted thinking’ (p. 1760) when researching the experiences of foreign domestic helpers (FDHs) working in Hong Kong, using a hermeneutic phenomenological approach to TA. Ho documents his

  • wondering about unspoken meaning behind the words spoken by participants,
  • reflecting on his personal experiences of hiring FDHs and working as a junior nurse,
  • imagining and questioning how he would feel in situations described and experienced by participants,
  • following insights,
  • looking for instances of similar or contrary language and experiences in the data, and
  • pondering these.

이 과정은 빠른 과정도, 쉬운 과정도 아니다. 시간과 공간(데이터 포함)은 반사적 TA가 제공할 수 있는 미묘한 분석을 개발하여 분석 전에는 결코 예상할 수 없었던 풍부하고 복잡하며 명확하지 않은 테마를 생성한다.

It is neither a quick nor an easy process. Time and space (with the data) help develop the nuanced analyses that reflexive TA can deliver, producing rich, complex, non-obvious themes that could never have been anticipated in advance of analysis.

(성찰적) TA에 대한 이 간략한 설명과 2006년 논문(Braun and Clarke 2019a, 2019b; Braun et al. 2019a 참조) 사이에는 몇 가지 차이점이 있다. TA에 대해서 우리의 접근 방식에 대한 가정을 완전히 표현하지 못한 것, 그리고 우리의 접근 방식이 우리가 인용한 다른 접근법과 어떻게 다른지를 설명하지 못한 것은 의심할 여지 없이 일부 TA 연구에서 명백한 혼란과 오해에 기여한다. 우리는 이 논문이 최근의 다른 기여(Braun and Clarke 2019a, 2019b; Braun 등 2019a; Terry 등 2017)와 함께 교정적corrective 역할을 하고, 더 명확성을 가져오며, 궁극적으로 연구자들이 현재 개략적으로 설명하는 일반적인 문제를 피하는 데 도움이 되기를 바란다.

There are some differences between this brief account of (reflexive) TA, and that in our 2006 paper (for discussion of how our thinking has evolved and what has changed, see Braun and Clarke 2019a, 2019b; Braun et al. 2019a). Our failure to fully articulate the assumptions informing our approach to TA, and how our approach differs from the other approaches we cited (e.g. Boyatzis 1998), undoubtedly contributes to the confusions and misconceptions apparent in some TA research. We hope this paper, alongside other more recent contributions (Braun and Clarke 2019a, 2019b; Braun et al. 2019a; Terry et al. 2017), serves as a corrective and helps to bring greater clarity, and ultimately assists researchers to avoid the common problems we now outline.

발표된 TA 연구의 10가지 일반적인 문제
Ten common problems in published TA research

이제 우리는 우리의 접근방식을 인용하거나 따르고 있다고 주장하는 발표된 TA 연구에서 볼 수 있는 10가지 문제를 강조한다. 이러한 문제는 TA 연구에서도 더욱 광범위하게 드러난다. 이러한 문제들은 광범위하거나 개념적인 문제, 오해 또는 문제적 가정, 처리 또는 실행 문제에 걸쳐 있다.
We now highlight ten problems we see in published TA research that cites, or claims to follow, our approach. Such problems are also apparent in TA research more broadly. These problems span broad or conceptual issues, misunderstandings or problematic assumptions, and process or practice problems.

첫 번째 문제: TA가 하나의 접근 방식이라고 가정합니다.
Problem one: assuming TA is one approach

앞서 언급한 바와 같이, TA는 단일한 접근법이 아니다. 그보다 TA는 [여러 접근법의 클러스터]를 의미하며, 이들은 절차와 기본 철학 모두에서 서로 다르지만(때로는 상충되지만), 데이터에서 패턴을 포착하는 데 관심을 공유한다. 그러나 너무 자주 저자들은 TA에 대한 "그들 자신의" 구체적인 지향을 명시하지 않거나, 실제로 TA의 다양성을 인정하지 않는다. 우리가 처음 우리의 접근 방식을 명확히 했을 때, 우리는 분명히 이것을 인정하지 않았다. (유용한 것을 이용했지만, 보야치스(1998)와 다른 보다 실증적인 접근법은 질적 패러다임의 가정, 가치 및 감성을 '실제로 얻지 못한다'고 치부했다(Braun and Clarke 2019a)). 우리는 이제 TA를 몇 가지 다른 '버전'이 있는 것으로 개념화하는 것이 더 낫다고 생각한다. 우리는 접근 방식을 '코딩 신뢰성', '코드북' 및 '성찰적' 변형이라고 부르는 것으로 묶는다(Braun et al. 2019a). 
군집화와 구분은 다양한 패러다임과 인식론적 위치 및 관련 절차적 차이를 반영한다. 
요약하면 다음과 같다.
As previously noted, TA refers not to a singular approach, but rather to a cluster of sometimes conflicting approaches, divergent both in procedure and underlying philosophy, but which share an interest in capturing patterns in data. Yet too often authors do not specify their particular orientation to TA, or indeed acknowledge the diversity of TA. We certainly failed to acknowledge this when we first articulated our approach – utilising what was useful, but privately dismissing Boyatzis’ (1998) and other more positivist approaches as ‘not really getting’ the assumptions, values and sensibility of a qualitative paradigm (Braun and Clarke 2019a). We now think that it is better to conceptualise TA as having several different ‘versions’; we cluster the approaches into what we call ‘coding reliability’, ‘codebook’ and ‘reflexive’ variations (Braun et al. 2019a). The clustering and demarcation reflects divergent paradigmatic and epistemological positions and associated procedural differences. Briefly, these are:

  • '코딩 신뢰성' TA는 '객관적'과 '편향되지 않은' 코딩에 대한 핵심적 관심을 두는 신-실증주의적 접근법을 포착한다. 분석 프로세스 및 복수의 코더를 위한 코드북의 사용은 '정확하고' '신뢰할 수 있는' 코딩의 핵심이다. 이러한 접근법은 일반적으로 코드 품질의 핵심 척도로 평가자 간 신뢰성(코딩 일치)을 사용한다. 그것들은 종종 분석 초기 또는 분석 이전에 주제가 개발된다는 점에서 연역적이다.
    ‘Coding reliability’ TA captures neopositivist approaches that have at their core concerns about ‘objective’ and ‘unbiased’ coding. The use of a codebook for the analytic process, and multiple coders, is key to ensuring ‘accurate’ and ‘reliable’ coding. Such approaches typically use inter-rater reliability (coding agreement) as a key measure of coding quality. They are often deductive in orientation, in the sense that themes are developed early on in, or even prior to, analysis.
  • '코드북' TA는 질적 패러다임(일부 실용적 타협이 있기는 하지만) 안에 폭넓게 자리 잡고 있는 방법의 클러스터를 포착한다. 그들은 분석을 개발하고 문서화하기 위해 일종의 구조화된 코딩 프레임워크를 사용하지만, 코드 작성자 간의 합의와 평가자 간 신뢰성은 보통 품질의 척도가 아니다. 테마는 일반적으로 초기에 코딩 신뢰성과 함께 개발되지만, 일부 방법에서는 유도 데이터 참여와 분석 과정을 통해 개선되거나 새로운 테마를 개발할 수 있다.
    ‘Codebook’ TA captures a cluster of methods that broadly sit within a qualitative paradigm (albeit with some pragmatic compromises). They use some kind of structured coding framework for developing and documenting the analysis, but consensus between coders and inter-rater reliability are not usually measures of quality. Themes are typically initially developed early on, as they are with coding reliability, but in some methods can be refined or new themes can be developed through inductive data engagement and the analytic process.
  • '성찰적' TA는 질적 연구의 가치를 완전히 포용하며, 연구자가 프로세스에 제공하는 주관적 기술을 완벽하게 포용하는 접근 방식을 의미한다. 연구 팀은 품질에 필요하지도 않고, 심지어 연구의 퀄리티를 위하여 바람직하지도 않습니다.
    • 분석은 더 귀납적이거나 더 이론적이거나 추론적일 수 있으며,
    • 분석은 상황적situated인 해석적 성찰적 과정이다.
    • 코딩은 개방적이고 유기적이며 어떠한 코딩 프레임워크도 사용하지 않는다.
    • 테마는 데이터 코딩과 반복적인 테마 개발의 최종 '결과'가 되어야 한다.
      ‘Reflexive’ TA captures approaches that fully embrace qualitative research values and the subjective skills the researcher brings to the process – a research team is not required or even desirable for quality. Analysis, which can be more inductive or more theoretical/deductive, is a situated interpretative reflexive process. Coding is open and organic, with no use of any coding framework. Themes should be the final ‘outcome’ of data coding and iterative theme development.

TA는 종종 하나의 접근법인 것처럼 쓰여진다. 예를 들어, Firmin 등이 있습니다. (2008) TA와 텍스트 분석 소프트웨어를 비교하는 논문에서 '전통 주제 분석'(p. 202)을 단일하고 널리 이해되는 것처럼 언급했지만 귀납적이고 수정된 근거 이론과 유사한 버전을 개략적으로 설명한다. TA의 유일성 또는 균질성에 대한 가정은 또한 때때로 암시적이다.

  • 연구자들은 그들의 데이터가 TA를 사용하여 분석되었다고 언급하면서,
  • 복수의 (개념적으로 호환되지 않거나 모순된) 접근법을 인용하며,
  • (여러가지 어마어마한 차이가 있는 TA의 버전들 가운데) 무엇을 가지고 실제로 분석을 어떻게 수행했는지에 대한 구체적인 정보를 제공하지 않는다.

TA is often written about as if it is just one approach. For example, Firmin et al. (2008), in a paper comparing TA and text analysis software, referred to ‘traditional thematic analysis’ (p. 202), as if that is singular and widely understood, but outline a version that is inductive and similar to a modified grounded theory. The assumption of singularity or homogeneity is also at times implicit, with researchers

  • noting their data were analysed using TA,
  • citing multiple (conceptually incompatible or contradictory) approaches, and
  • not providing any specific information about how the analysis was actually conducted – which varies considerably across different versions of TA.

이러한 '단일 접근법' 개념화와 밀접하게 관련된 기준은 '단일 품질 표준' 기준이다. 검토자가 인용한 본 논문의 서두 인용문은 이를 예시한다. 그 인용문을 보면 일부 형태의 TA(특히 '코딩 신뢰성' 접근법)에만 가장 잘 적용되는 품질 표준quality standard을 지향한다. 이러한 접근법은 가장 오랜 역사를 가지고 있으며, 종종 TA의 가까운 사촌인 [질적 내용 분석]과 유사하다(예: Forman 및 Damschroder 2008). Boyatzis(1998)는 [질적 데이터의 수집과 분석]을 [퀄리티에 대한 양적 지표]와 결합시키는 것을 실증주의(양적) 패러다임과 해석적(질적) 패러다임 사이의 '격차를 메우기' 위한 하나의 전략으로서, TA에 대한 자신만의 접근 방식을 제공했다. 그가 제시한 방법에는 [측정 또는 관찰의 신뢰성], [코딩 절차의 표준화를 통해 연구자 '편향' 을 억제하 것], [여러 코더의 합의를 입증하는 것] 등이 있다. 이러한 quality marker가 종종 모든 형태의 TA에 적용되는 것으로 가정된다. 그러나 [코딩 신뢰성 TA]를 위한 논리, 과정, 그리고 품질 측정은 [성찰적 TA]와는 상당히 다릅니다. 질적 연구, 그리고 질적 연구에 대한 다른 접근법이 그들 자신의 관점에서 평가되는 것이 중요하다. 

Intimately connected to this ‘one approach’ conceptualisation is a ‘one quality standard’ criterion. This paper’s opening quotation from a reviewer exemplifies this – orienting to quality standards that best apply only to some forms of TA, and in particular to ‘coding reliability’ approaches (e.g. Boyatzis 1998; Guest, MacQueen, and Namey 2012; Joffe 2012). These approaches have the longest history, and are often similar to TA’s close cousin, qualitative content analysis (e.g. Forman and Damschroder 2008). Boyatzis (1998) offered his approach to TA as one to ‘bridge the divide’ between positivist (quantitative) and interpretative (qualitative) paradigms by marrying the collection and analysis of qualitative data with positivist markers of quality – reliability of measurement or observation and containing researcher ‘bias’ through the standardisation of coding procedures and the demonstration of consensus among multiple coders. Such quality markers are often assumed to apply to all forms of TA. And yet the logic, process, and thus quality measures for coding reliability TA are quite different from reflexive TA. It is important that qualitative research, and different approaches to qualitative research, are evaluated on their own terms (Madill et al., 2000; Sparkes and Smith 2009; Yardley 2015).

간략히 언급한 바와 같이, [코딩 신뢰성 접근법]은 아래의 것들을 권고한다는 점에서 [성찰적 TA]와 다르다. 

  • 초기 테마 개발(일부 데이터 익숙화 이후 진행),
  • 구조화되고 고정된 코드북 또는 코딩 프레임의 사용(일부 데이터 익숙화 또는 데이터 부분의 초기 분석에 따라 개발된 정보)
  • 독립적으로 작업하는 여러 코더의 사용
  • 코드 간 일치도(또는 평가자 간 신뢰도) 및
  • 합의를 통한 최종 코딩 결정.

As briefly noted above, these coding reliability approaches differ from reflexive TA in recommending 

  • early theme development (perhaps following some data familiarisation),
  • the use of a structured and fixed codebook or coding frame (perhaps developed following some data familiarisation or initial analysis of a portion of the data),
  • the use of multiple coders who work independently,
  • measurement of between-coder agreement (or inter-rater reliability) and
  • the determination of final coding through consensus.

[코딩 신뢰성 TA]에서 가장 중요한 관심사는 코딩의 정확성 또는 신뢰성을 입증하는 것이며, 이러한 실증주의적 우선 순위는 분석이 수행되는 방법을 형성한다. 하지만 [질적 패러다임과 성찰적 TA]에서는 코딩 신뢰성을 입증하는 것이나 '편향'을 회피하는 것은 비논리적인 것이고, coherent하지 못한 것이며, 궁극적으로 무의미하다. 왜냐하면 의미와 지식은 위치적이고 맥락적인 것으로 이해되며, 연구자의 주관성은 지식 생산을 위한 자원으로 개념화되기 때문이다. 연구자의 주관성은, credibility의 위협이기에 억제되어야 하는 것이 아니라, 만들어질 지식을 형상화sculpt하는 것이다. [성찰적 TA]에 '코딩 신뢰성' 기준을 적용하는 것은 연구자가 반사적 TA의 근간fundamentals을 완전히 '이해하지 못하며' 프레임워크를 뒷받침하는 질적 가치가 무엇을 기대하거나 구분하는지 이해하지 못한다는 것을 시사한다.

An overriding concern is with demonstrating the accuracy or reliability of coding, and this positivist prioritisation shapes how analysis is conducted. Demonstrating coding reliability and the avoidance of ‘bias’ is illogical, incoherent and ultimately meaningless in a qualitative paradigm and in reflexive TA, because meaning and knowledge are understood as situated and contextual, and researcher subjectivity is conceptualised as a resource for knowledge production, which inevitably sculpts the knowledge produced, rather than a must-be-contained threat to credibility. The application of such ‘coding reliability’ criteria to reflexive TA also, to us, suggests that the researcher does not fully ‘get’ the fundamentals of reflexive TA, does not understand what the qualitative values underpinning the framework expect or delimit.

TA의 이 두 가지 '극poles' 사이에서 다음과 같은 '코드북' 접근방식이 등장했다.

  • 프레임워크 분석(예: 게일 외 2013; Ritchie 및 Lewis 2003; Smith & Firth, 2011),
  • 매트릭스 분석(예: Miles 및 Huberman 1994; Nadin 및 Cassell 2014)과
  • 템플릿 분석(예: Brooks et al. 2015; 2012)

이 방법 각각은 자체적인 '모범 사례' 및 품질 기준 가이드라인을 가지고 있다. 이들은 다음의 특징을 공유한다.

  • 테마를 초기에 개발(일부 또는 모든 테마)
  • 코딩 신뢰성 접근법과 마찬가지로 구조화된 코드북 또는 코딩 프레임(프레임, 템플릿 또는 매트릭스)의 사용
  • 질적 철학과 성찰적 TA의 가치(연구자의 주관성을 인정)를 공유하고, 지식이 문맥적임을 인정한다.

Between these two ‘poles’ of TA, ‘codebook’ approaches, like framework analysis (e.g. Gale et al. 2013; Ritchie and Lewis 2003; Smith & Firth, 2011), matrix analysis (e.g. Miles and Huberman 1994; Nadin and Cassell 2014) and template analysis (e.g. Brooks et al. 2015; King 2012, 2014), comprise processes and conceptualisations that have elements of each, with their own ‘best practice’ and quality criteria guidelines. They share

  • early theme development (of some or all themes) and
  • the use of a structured codebook or coding frame (the framework, template or matrix) with coding reliability approaches, and
  • the qualitative philosophy and values of reflexive TA, such as recognising researcher subjectivity and that knowledge is contextual (see Braun et al. 2019a, for more discussion). 

일부 코드북 지지자들의 경우, 이들의 접근방식은 [사전에 미리 결정된 정보 요구(이것 때문에 '테마'는 종종 특정 질문에 대한 응답 요약으로 구성된다.)], [결과를 내야 하는 엄격한 타임프레임], [팀워크의 필요성] 등을 둘러싼 [실용적 요구]에의해 주도되기에, 어느 정도 질적 원칙의 '타협'을 시도한다. (코드북 TA)에서는

  • 여러 연구자데이터의 여러 부분을 코딩하여 '결과'를 정해진 기한 내에 전달할 수 있게 한다.
  • 이 방법은 연구 배경이 거의 없거나 전혀 없는, 질적 초보자와 참여자 또는 이해관계자의 참여를 개방하여 포괄적 연구팀을 용이하게 한다.
  • 데이터는 종종 다소 구체적이며, 연구를 통해서 얻어야 하는 산출물은 종종 [의미론적 의미의 서술적 또는 요약적 분석]으로서 [실무자와 이해관계자가 접근하고 실행할 수 있는 결과]가 된다(Ritchie and Spencer 1994; Smith and Firth 2011).
  • 이러한 접근법은 종종 '질적 실용주의'를 보여주며 응용 연구에 효과적이다. 예를 들어, 프레임워크 접근법은 1980년대에 응용 사회 정책 연구에 사용하기 위해 (영국) 국립 사회 연구 센터의 연구원들이 개발했다(리치와 스펜서 1994).

For some codebook proponents, their approach represents some degree of ‘compromise’ of qualitative principles, with research driven by pragmatic demands around pre-determined information needs (with ‘themes’ often consisting of summaries of responses to particular questions), strict time frames for producing ‘results,’ and the necessity of team work.

  • Multiple researchers code different portions of the data, facilitating delivery of ‘results’ to a fixed deadline.
  • The methods facilitate inclusive teams of researchers, opening participation for qualitative novices and participants or stakeholders, with little or no research background.
  • Data are often rather concrete, and the required output can often be a descriptive or summative analysis of semantic meaning with results accessible to and actionable by practitioners and stakeholders (Ritchie and Spencer 1994; Smith and Firth 2011).
  • These approaches often demonstrate a ‘qualitative pragmatism’ and work well for applied research – for instance, the framework approach was developed by researchers at the (British) National Centre for Social Research in the 1980s for use in applied social policy research (Ritchie and Spencer 1994).

요약하자면… 'TA'는 [공통적으로 (코딩과 테마 개발을 통한 분석, 어느 정도의 이론 및 연구 설계 유연성; 의미와 잠재 의미에 대한 초점과 같은) 일부 특성을 공유하는 접근법]의 포괄적 용어 또는 '불분명한fuzzy' 집합으로 가장 잘 생각되지만(Madill and Gough 2008) 기저의 패러다임과 인식론적 가치, 그리고 절차에서 크게 다를 수 있다. 연구자, 검토자 및 편집자가 서로 다른 버전의 TA 사이의 광범위한 패러다임 차이를 이해하는 것이 중요하다. 우리는 TA 연구자들이 어떤 TA 접근법을 사용하고 있는지 명확하게 구분하도록 권장한다. 또한, 그들이 TA에 대해 다른 방향의 저자들을 인용하는 경우, 그들이 각각에서 '취하는taking' 것을 명확히 명시하고 (잘) 다양한 기준과 실천의 사용을 정당화하여야 한다.
The take away … ‘TA’ is best thought of as an umbrella term for, or a ‘fuzzy’ set (Madill and Gough 2008) of, approaches that share some characteristics in common (analysis through coding and theme development; some degree of theoretical and research design flexibility; a focus on semantic and latent meaning) but can differ significantly in both underlying paradigmatic and epistemological values, and in procedures. It is vital that researchers, reviewers and editors understand the broad paradigm distinctions between different versions of TA. We encourage TA researchers to clearly demarcate which TA approach they are using. Furthermore, if they cite authors from different orientations to TA, to clearly specify what they are ‘taking’ from each and justify (well) any use of divergent criteria and practice.

 

문제2: 읽지 않고 인용!
Problem two: citing without reading!

안타깝게도 이 문제는 장난이 아닙니다. 2006년 논문을 인용한 일부는 보여주기식performative이었다. '편리함' 또는 '필수' 인용문으로도 활용될 수 있는 것으로 보입니다. 수많은 저자들은 '브라운과 클라크(2006)가 개괄한 절차를 따랐다'고 주장하며, 우리가 개괄한 절차와 거의 또는 전혀 유사하지 않은 절차를 설명한다. 예를 들어, Kaye, Wall 및 Malone(2016)은 그들의 접근방식과 절차를 'Braun and Clarke (2006) 분석 전략과 일치한다'(p. 464)라고 설명했지만, 신뢰성 TA 코딩에 더 가까운 분석 과정을 개략적으로 설명하고 있다.

  • 데이터는 '두 개의 순진한 코드 작성자'에 의해 읽혔다.
  • 각 코더가 독립적으로 초기 주제를 식별함
  • 데이터는 초기 테마의 타당성을 시험하기 위해 코딩되었다(부분적으로는 각 테마의 빈도를 결정하기 위해).
  • 데이터는 코드북의 개발과 함께 다시 검토되었다.

Unfortunately, this problem is not a joke. Some citations of our 2006 paper appear performative: dropped in as a ‘convenient’ or maybe even ‘required’ citation. Numerous authors claim to have ‘followed the procedures outlined by Braun and Clarke (2006),’ then describe procedures with little or no resemblance to those we outlined. For example, Kaye, Wall, and Malone (2016) described their approach as TA and their procedure as ‘in line with Braun and Clarke (2006) analytic strategy’ (p. 464), but then outlined an analytic process more akin to coding reliability TA:

  • the data were read by ‘two naïve coders’;
  • each coder independently identified initial themes;
  • the data were coded to test the validity of the initial themes (in part to determine the frequency of each theme);
  • the data were reviewed again alongside the development of a codebook.

그러한 논문을 읽으면서, 우리는 코드북과 코딩 프레임, 합의 코딩, 코딩 신뢰성의 측정, 데이터 코딩 이전의 주제 개발, 데이터 또는 테마 포화, 주제 빈도의 측정 및 보고, 지속적인 비교 분석 등을 장려한다는 것을 발견했다. 독자들이여, 우리는 그렇지 않다! 이러한 것들은 우리가 말하지 않았을 뿐만 아니라, 빅 Q 질적 조사를 위한 관행으로서 우리가 정말로 비판적인 것들입니다. 우리가 실제로 지지하지 않는 절차에 대해 옹호하는 주장에 대한 가장 그럴듯한(아마도 관대할 수 있는) 설명은 저자들이 우리의 논문을 읽지 않았다는 것이다.

Reading such papers, we have discovered that we promote the use of codebooks and coding frames, consensus coding, the measurement of coding reliability, developing themes before data coding, data or theme saturation, the measurement and reporting of theme frequency, constant comparative analysis, and more … Reader, we do not! Not only are these things we have not said, they are all things we are indeed critical of, as practices for Big Q qualitative inquiry (Braun and Clarke 2013, 2019c; Clarke and Braun 2019). The most plausible (and perhaps generous) explanation for claims that we advocate for procedures that we do not in fact advocate for, is that the authors have not read our paper.

숙제를 하십시오. 즉, 다음 사항 없이 TA에 사용되는 방법으로 저희(또는 다른 TA 저자)를 인용하지 마십시오.

  • a) 제공된 방법론적 지침을 읽을 것.
  • b) 당신이 한 일이 지지받는 것임을 확인하는 것;
  • c) 어떤 '개정deviation'이 있었다면 그 이유를 명확히 하는 것.

The take away … Do your homework – by which we mean, do not cite us (or indeed any other TA author) as the method used for TA without:

  • a) reading the methodological guidelines provided;
  • b) confirming that what you did is what is advocated; and
  • c) being clear on why any ‘deviations’ from the broad approach were adopted.

 

문제 3: 정당하지 않거나 호환되지 않는 '매시업'
Problem three: unjustified or incompatible ‘mash-ups’


연구자들이 TA에 대해 복수의 (호환되지 않는) 소스를 인용하는 것을 넘어, 정당성이나 설명 없이 반사성 TA를 종종 양립할 수 없는 다른 절차와 효과적으로 결합하는 수많은 문제적 실무 사례가 있다. 방법론적인 '매쉬업'의 개념은 그 자체로 문제가 되지 않는다. TA의 유연성은 그러한 창의성과 혁신을 불러온다. 우리가 지적하려는 것은 이론적이고 개념적인 모순인 '혼돈된 q' 연구를 초래하는 겉보기에는 알 수 없고 유연하지 않은 매시업이다. 예를 들어, 성찰적 TA와 코드북 및 코딩 신뢰성 측정의 조합은 일반적이지만 [성찰적 TA의 유기적이고 주관적인 코딩 프로세스]와 [코딩 정확성과 신뢰성에 대한 우려] 사이의 긴장감에 대한 인식은 훨씬 낮은 것으로 보이며, 확실히 자주 논의되지는 않는다. 
There are numerous instances of problematic practice that go beyond researchers citing multiple (incompatible) sources for TA, effectively combining reflexive TA with other often incompatible procedures without justification or explanation. The notion of methodological ‘mash-ups’ is not problematic per se; the flexibility of TA invites such creativity and innovation. Our concern is with seemingly unknowing and unreflexive mash-ups that result in theoretical and conceptual incoherence – ‘confused q’ research. For example, the combination of reflexive TA with the use of codebooks and coding reliability measures is common, but the tensions between the organic and subjective coding processes of reflexive TA and concerns for coding accuracy and reliability seem to be far less commonly recognised – certainly they are not often discussed.

일부 연구자들은 또한 [개념과 실천과 관련된 위치 및 특정 의미 또는 이론적 앵커에 대한 논의 없이] 다른 분석적 접근법과 독특하게 연관된 개념과 용어를 사용한다.

  • (예: IPA와 관련하여 emergent라는 용어나, superordinate theme이라는 용어;
  • 근거이론에서의 개념인 지속적 비교 분석, 라인 바이 라인 코딩, 포화
  • TA의 포화 개념 사용에 대한 비판적 논의는 Braun 및 Clarke 2019c 참조)

Some researchers also use concepts and terminology distinctively associated with other analytic approaches without discussion of the located and particular meanings, or theoretical anchors, associated with these concepts and practices.

  • (e.g. the terms emergent and superordinate theme, associated with IPA;
  • the grounded theory concepts of constant comparative analysis, line-by-line coding and saturation;
  • see Braun and Clarke 2019c, for a critical discussion of the use of the saturation concept in TA) 

이러한 개념이나 용어들이 항상 TA로 잘 translate되거나 TA에 부합하지는 않는다. 우리는 또한 연구자들이 TA가 분석 목적을 달성하기에 그 자체로 불충분하다고 주장하며 추가 절차나 접근법으로 TA를 '보충'(반복)하는 것을 본다(예: Floersch et al. 2010). 이는 [잘못된 가정]에 근거하고 있으며, [TA가 단일한 것이라는 아이디어]에 기초한 것으로 보입니다(이후의 문제에서 더 자세히 설명).

They do not always translate (well) to, or cohere with, TA. We also see researchers ‘supplementing’ (reflexive) TA with additional procedures or approaches, arguing that TA is insufficient in and of itself to achieve their analytic purpose (e.g. Floersch et al. 2010) – which seems to be based on flawed assumptions and a singular idea of what TA is (discussed further in subsequent Problems).

방법론적인 매시업은 보증되고 정당화되고 이론적으로 일관되어야 하며, (반복적인) TA가 제공할 수 있는 것과 제공할 수 없는 것에 대한 완전한 이해에 기초해야 한다.

The take away … Methodological mash-ups should be warranted, justified and theoretically coherent, and based in a full understanding of what (reflexive) TA can – and cannot – offer.

문제 4: TA가 무이론적이라고 가정함
Problem four: assuming TA is atheoretical

[TA의 이론적 유연성]은 내재된inbuilt 지침 이론guiding theory의 부재함을 의미하고, TA가 IPA, 기초 이론, 담화 분석 및 서술 분석과 같은 인기 있고 잘 활용된 질적 분석 접근법에서 벗어나는 부분이다. 이러한 접근법 중 일부는 원래 접근법의 다른 반복의 확산을 통해 다양한 이론적 가능성을 제공한다(예: 근거 이론의 다양한 'flavor'가 있다 – 실증론자, 맥락론자/실용론자, 급진 구성론자가 모두 논의된다;2008년 차마즈와 헨우드, 1992년 글레이저, 1997년 피존과 헨우드).

The theoretical flexibility of TA, the absence of inbuilt guiding theory, is where TA departs from other popular and well-utilised qualitative analytic approaches such as IPA, grounded theory, discourse analysis and narrative analysis. Some of these approaches offer a range of theoretical possibilities through the proliferation of different iterations of the original approach (e.g. there are various ‘flavours’ of grounded theory – positivist, contextualist/constructivist and radical constructionist are all discussed; see Charmaz and Henwood 2008; Glaser 1992; Pidgeon and Henwood 1997).

TA에 내재된 이론적 처방의 상대적 부족은 종종 TA가 무이론적임을 나타내는 것으로 잘못 해석된다. 우리는 또한 TA를 하면서 연구자들의 engagement에 informing하는 이론적 가정을 명시하지 못한 연구자를 보며 [TA가 무이론적 방법으로 취급되는 것]을 마주한다. 실제로 최근 원고에 대한 저자의 응답에서 명백해졌듯이, 어떤 연구자들은 [귀납적 TA]는 전적으로 이론적 근거가 없으며, 연역적 TA만이 이론의 논의를 필요로 한다고 가정한다. (또한 우리는 [연역적 TA]가 [연구 질문이나 연구자의 존재론적, 인식론적 가정 또는 주제에 대한 관심에 의해 informed되는 TA]로 잘못 인식되고 있다고 본다.)

The relative lack of theoretical prescription inherent in TA is often misinterpreted as indicating TA is atheoretical. We also encounter TA being treated as an atheoretical method through researchers failing to specify the theoretical assumptions informing their engagement with TA. Indeed, as became clear to us in an author’s response to our review of their manuscript recently, it is sometimes assumed that inductive TA is entirely without theoretical foundations, and that only deductive TA requires discussion of theory. (We also see deductive TA misconceptualised as TA informed by a research question, or the researcher’s ontological and epistemological assumptions or interests in the topic.)

내재된 이론이 없음에도 불구하고, TA는 절대로 이론적인 공백에서 수행될 수 없다; 연구자들은 항상 가정을 한다

  • 데이터가 나타내는 것은 무엇인가?
    • 예: 참가자의 말은 비교적 투명하게 개인의 경험을 전달하고 있는가?
    • 또는 참가자가 한 말은 사회적 담론을 구성하고 사회적 행동을 수행하는가?)
  • 이 데이터에 기초하여 무엇을 주장할 수 있는가?
  • 궁극적으로, 무엇이 의미 있는 지식을 구성하는가?

Despite not having inbuilt theory, TA can never be conducted in a theoretical vacuum; researchers always make assumptions about

  • what data represent
    • (e.g. do participants’ words relatively transparently communicate individual experience or
    • do their words constitute social discourse, performing social actions?),
  • what can be claimed on the basis of these data, and
  • indeed what constitutes meaningful knowledge.

만약 가정들이 더 '상식적common-sensical'이거나, 학문분야 내에서 지배적인 가정을 반영한다면, 이러한 가정들을 [가정으로서], 더 나아가 실제로 [이론으로서], 인식하는 것은 어려울 수 있지만, 그럼에도 불구하고 이론적으로 정보에 근거한 가정이며 결과적으로 분석적 함의가 있다.

If the assumptions made are more ‘common-sensical’ or reflect the dominant assumptions within a discipline, it can be hard to recognise these as assumptions, indeed as theory, but they are nonetheless theoretically-informed assumptions with consequent analytic implications.

연구자들은 항상 TA의 사용에 informing하는 철학적, 이론적 가정을 성찰하고 명시해야 한다. 심지어 귀납적 TA에서도 그러하다. (구체적인 iteration에 따라 다소간 차이가 있더라도) TA는 이론적으로 유동적이지만, 무이론적 접근법이 아니며 [질적 연구의 경험적, 비판적 지향]에 동일하게 적합한 접근법으로 인식되어야 한다. (종종 경험적 지향experiential orientation에만 TA를 사용하는 것이 적절하다고 가정한다.)

The take away … Researchers should always reflect on and specify the philosophical and theoretical assumptions informing their use of TA, even inductive TA. TA should be recognised as a (more or less, depending on the specific iteration) theoretically flexible, but not atheoretical, approach and one equally suited to experiential and critical orientations for qualitative research (TA is often assumed to be only appropriate to use in experiential orientations, a Problem we now discuss).

문제 5: TA가 현실주의자/본질주의자 또는 경험적/현상학적이라고 가정한다.
Problem five: assuming TA is only realist/essentialist or experiential/phenomenological 

문제 4와 밀접하게 연결되어, TA는 단순히 진리와 현실을 검색하는 현실주의 또는 본질주의 방법으로 암묵적으로 배치되며, 두 방법 모두 문제없이 접근 가능한 것으로 취급되며 종종 이론화되지 않는다. 경험은 종종 TA를 통해 접근할 수 있다고 가정하며, TA는 일반적으로 특히 더 현상학 또는 현상학적인 방법으로도 설명된다. 이런 식이다. '주제 분석'은 주제를 체계적으로 식별하기 위한 현상학적 위치를 채택한다(Newton-John et al. 2017, 1822). 
Closely connected to Problem four, TA is regularly positioned implicitly as a realist or essentialist method that simply retrieves truth and reality, both of which are treated as unproblematically accessible (and are often un[der]theorised). Experience is likewise often assumed to be accessible through TA, and TA is commonly described as particularly compatible with phenomenology (e.g. Guest, MacQueen, and Namey 2012; Joffe 2012) or even as a phenomenological method: ‘thematic analysis adopts a phenomenological position to systematically identify themes’ (Newton-John et al. 2017, 1822).

IPA 이전에, TA는 심리학에서 현상학적 방법으로 사용되었지만(예: Dapkus 1985) TA와 현상학이 일치한다는 선언은 거의 설명되지 않는다. 우리는 이것이 TA를 [질적 연구에 대한 광범위한 경험적 접근법에 (유일하게) 양립할 수 있는 것]이며, TA를 ['주관적 관점'의 분석인 것]으로 이해하는 것를 반영한다고 추측한다(Flik 2014, 423). 즉, 언어에 대한 성찰적 관점으로 뒷받침되고, 참여자들의 생생한 경험, 감각 형성, 관점, 요구, 실천 등을 광범위하게 '감정적' 렌즈(Braun and Clarke 2013; Willig 2013)를 통해 탐구하는 데 초점을 맞춘 연구. 이 프레임은 불필요하게 제한적이다.

Before IPA, TA was used as a phenomenological method in psychology (e.g. Dapkus 1985), yet the proclamation that TA and phenomenology are aligned is rarely explained. We speculate that this reflects an understanding of TA as (only) compatible with broadly experiential approaches to qualitative research, and the analysis of ‘subjective viewpoints’ (Flick 2014, 423) – research underpinned by a reflective view of language and focused on exploring participants’ lived experience, sense-making, views, needs, practices and so on, through a broadly ‘empathic’ lens (Braun and Clarke 2013; Willig 2013). This framing is unnecessarily limited.

이와는 대조적으로, 우리는 (성찰적) TA를 [경험적 질적 연구]와 [비판적 질적 연구] 두 가지 모두와 양립할 수 있을 만큼 충분히 유연한 접근법으로 포지셔닝한다(Clarke와 Braun 2014b 참조). 이는 의심의 여지 없이 비판적 질적 심리학에 대한 우리의 배경과 훈련을 반영합니다. 또한 심리학에는 주제 분해(Stenner 1993), 주제 담화 분석(가수와 헌터 1999; 테일러와 어셔 2001)과 같은 주제적(thematic) 디스커버리 방법의 전통이 있다. 그리고 우리는 성찰적 TA의 흥미로운 매시업과 디스커버리 및 서술적 접근 방식을 점점 더 많이 볼 수 있으며, TA를 결합하여 주제를 식별하고 참가자의 말account에서 사건의 순차적 구성을 탐구하는 '주제적 내러티브 분석'과 같은 혼합적 접근 방식의 개발을 볼 수 있다. '비판적 주제 분석'(예: Terry and Braun 2011)도 마찬가지로 반사적 TA를 비판적 분산 심리의 일부 특징(예: Wetherell 및 Edley 2009)과 결합한다. 3번 문제에서 기술된, 아무 생각 없이 성찰적 TA를 질적 실증주의와 섞어버린 것과는 반대로, 우리가 환영하는 것은 정확히 이런 종류의 이론적이고 창의적이고 성찰적인 매시업이다.

In contrast, we position (reflexive) TA as an approach that is flexible enough to be compatible with both experiential and critical qualitative research (see Clarke and Braun 2014b) – no doubt a reflection of our background and training in critical qualitative psychology (see Braun and Clarke 2019a; Jankowski, Braun, and Clarke 2017; Lainson, Braun, and Clarke 2019). Moreover, there is a tradition of ‘thematic’ discursive methods in psychology such as thematic decomposition (Stenner 1993) and thematic discourse analysis (Singer and Hunter 1999; Taylor and Ussher 2001). And we increasingly see exciting mash-ups of reflexive TA and discursive and narrative approaches, and the development of hybrid approaches like ‘thematic narrative analysis’, which combines TA to identify themes with narrative analysis to explore the sequential organisation of events in participants’ accounts (e.g. Palomäki, Laakasuo, and Salmela 2013). ‘Critical thematic analysis’ (e.g. Terry and Braun 2011) likewise combines reflexive TA with some features of critical discursive psychology (e.g. Wetherell and Edley 2009). It is precisely this kind of theoretically-knowing, creative and reflexive mash-ups that we welcome, in contrast to the seemingly unknowing ‘mash-ups’ of reflexive TA with qualitative positivism described in Problem three.

TA가 본질적으로 질적 연구에 대한 한 가지 유형의 지향만을 제공하는 것처럼 취급하는 것을 피하십시오. 대신, (성찰적) TA의 특별한 사용 방법과 사용 중인 (성찰적) TA에 대한 특정 지향을 설명하는 근거를 제시하십시오.

The take away … Avoid treating TA as if it inherently offers only one type of orientation to qualitative research. Instead, provide a rationale that explains the particular use of (reflexive) TA, and the particular orientation to (reflexive) TA you are taking.

문제 6: TA는 설명만 한다고 가정합니다.
Problem six: assuming TA is only descriptive


앞의 두 가지 문제와 밀접한 관련이 있는 것은 TA가 데이터 패턴을 패러프레이즈하거나 요약하는 기술 또는 데이터 감소 방법일 뿐이라는 개념이다. TA 연구는 근거 이론이나 서술 분석과 같은 접근법에 비해 낮은 수준의 해석을 제공하는 것으로 가정되며, TA를 잘못 이해한 경우 종종 TA를 '더 높은 수준의 해석'을 제공하는 다른 접근법(예: 근거 이론)과 결합하는 것을 정당화하기 위해 사용된다. (예: Floersch et al. 2010). 우리는 이 문제 있는 가정에 대해 두 가지 염려가 있습니다.
Closely related to the previous two Problems is the notion that TA is only a descriptive or data reduction method, in which data patterns are paraphrased or summarised. TA research is assumed to offer a low level of interpretation compared to approaches such as grounded theory or narrative analysis (e.g. Aguinaldo 2012; Vaismoradi, Turunen, and Bondas 2013), and this impoverished conceptualisation of TA is often used to justify combining TA with other approaches (such as grounded theory) that are positioned as offering (a higher level of) interpretation (e.g. Floersch et al. 2010). We have two concerns with this problematic assumption.

첫째, 기술과 해석은 분리되고 별개의 활동이다. 그리고 기술적 또는 종합적 분석에서, 연구자는 참가자들의 목소리에 대해 수동적이고, 무관심하며, 탈맥락화된 전달자가 되는 것으로 보인다. 우리는 기술적 목적을 가진 TA조차도 다양한 방식으로 위치하며 그들의 특정한 사회적, 문화적, 역사적, 규율적, 정치적, 이념적 위치의 렌즈를 통해 데이터를 읽는 연구자에 의해 수행되는 [해석적 활동]이라고 주장한다. 그들은 참여자의 '목소리'를 편집하고 환기시키지만 궁극적으로는 데이터에 대한 [그들의 이야기]를 들려준다: '목소리를 통해 주조되는 사회적 연구는 일반적으로 우리가 우리의 주장을 경계하기 위해 선택하고 편집하고 배치하는 확인되지 않은 서술적 증거의 조각을 조각내는 것을 포함한다.' (Fine 1992, 218) 그리고 (객관적 과학자의) 수동적 목소리와 같은 [실증-경험적 보고 관행]은 실제로 ('정확성'을 위하여) '코딩 신뢰성'을 입증하였다고 어필하는데, 이는 참가자의 말을 해석하는 방법에 대한 [우리의 책임]을 불명확하게 만든다(클라크와 브라운 2019). 우리가 사용하는 언어는 심지어 명백한 기술적 보고에서조차 중립적이지 않다.
First, description and interpretation are positioned as separate and distinct activities. And in descriptive or summative analyses, the researcher appears to become a passive, disinterested and decontextualised conduit for the voices of participants. We contend that even TA with a descriptive purpose is an interpretative activity undertaken by a researcher who is situated in various ways, and who reads data through the lenses of their particular social, cultural, historical, disciplinary, political and ideological positionings. They edit and evoke participant ‘voices’ but ultimately tell their story about the data: ‘social research cast through voices typically involves carving out unacknowledged pieces of narrative evidence that we select, edit, and deploy to border our arguments’ (Fine 1992, 218). And positivist-empiricist reporting practices, like the passive voice (of the objective scientist), and indeed appeals to demonstrating ‘coding reliability’ – for ‘accuracy’ – can obfuscate our responsibility for the ways we interpret participants’ accounts (Clarke and Braun 2019). Our language use is never neutral, even in apparently descriptive reporting.

둘째, TA를 낮은 수준의 서술적 방법으로 개념적으로 환원시키면 반사적 TA가 갖는 가능성의 범위가 모호해진다. 무엇보다 TA의 깊은 해석적, 이론화된 분석의 잠재력을 평가절하하게 된다. 그러한 TA의 가능성과 잠재력을 인식하고 충분히 인식한다면, 연구자들은 그들의 TA를 '확장'하기 위해 또 다른 (아마도 더 해석적인) 방법을 추가하는 것을 중단할 수 있다. 그러한 mash-ups는 종종 단지 불필요할 뿐만 아니라, 설득력도 없고, 심지어 문제가 되기도 한다.
Second, the conceptual reduction of TA to a low-level descriptive method obscures the range of possibilities reflexive TA holds – most particularly its potential for deeply interpretative, theorised analyses. If such possibilities and potentials were recognised and fully appreciated, researchers could stop adding another (supposedly more interpretative) method to ‘extend’ their TA – such mash-ups are often not just unnecessary, but unconvincing or even problematic.

해석은 (TA) 분석 과정에 내재되어 있으며, TA 방법에서는 단순히 요약적이거나 기술적으로 만드는 것이 없다. 해석의 깊이는 방법이 아니라 분석가의 기술에 있다. 학생/대학원생 연구를 지도하는 연구자들은 학생들에게 이 점을 유용하게 강조할 수 있다. (우리는 TA가 정교함이 부족하고 무이론적이고 순진하며 서술적인 방법이기 때문에 대학원 및 특히 박사 학위 연구에 적합하지 않다는 말을 들은 불안한 학생들로부터 많은 이메일을 받는다.)

The take away … Interpretation is inherent to the (TA) analytic process, and there is nothing in the method of TA that renders it simply summative or descriptive. Interpretative depth lies in the skill of the analyst, not the method. Researchers supervising (postgraduate) student research can usefully emphasise this point to students. (We get many emails from anxious students who have been told that TA is unsuitable for postgraduate and especially doctoral research because it lacks sophistication and is only an atheoretical, [naïve] realist, descriptive method.)

문제 7: 코드와 테마를 혼동합니다.
Problem seven: confusing codes and themes

성찰적 TA는 코드와 테마를 구별하지만, TA 방법 전반에 걸쳐 코드와 테마의 절대적인 차이는 없다. 많은 TA 접근법에서 이 용어들은 서로 교환적으로 사용되거나, 코딩은 [사전에 정해진 테마에 데이터를 할당하는 과정]으로 개념화된다.

  • 성찰적 TA에서 코드는 [연구자가 (초기) 테마를 개발하기 위해 사용하는 분석 단위 또는 도구]로 개념화된다. 여기서 코드는 (최소한) 하나의 관측치를 캡처하고, (보통) 하나의 면을 표시하는 엔티티로 생각할 수 있다.
  • 대조적으로 테마는 다면적 크리스탈과 같다. 즉, 여러 관찰 또는 측면을 포착합니다. (때로는 풍부하고 복잡하고 다면적인 코드가 [Charmaz 2006] 테마로 '승진promoted'될 수 있는데, IPA에서는 'subsumption'이라고 불리는 과정이다.

Reflexive TA makes a distinction between codes and themes, but there is no absolute distinction between codes and themes across TA methods. In many TA approaches, these terms are used interchangeably, or coding is conceptualised as a process of allocating data to predetermined themes.

  • In reflexive TA, a code is conceptualised as an analytic unit or tool, used by researcher to develop (initial) themes. Here, codes can be thought of as entities that capture (at least) one observation, display (usually just) one facet;
  • themes, in contrast, are like multi-faceted crystals – they capture multiple observations or facets (occasionally, rich, complex and multifaceted codes might be ‘promoted’ to themes [Charmaz 2006], a process called ‘subsumption’ in IPA [Smith, Flowers, and Larkin 2009]).

수많은 '테마'가 제시되는 TA 논문에서 '테마'는 종종 1차원적이고 의미가 얇다.

  • 예를 들어, Fornells-Ambrojo 외 연구진(2017)은 서비스 사용자가 중증 정신 질환 서비스에 대한 심리 치료 접근성을 개선하기 위해 일상적인 결과 모니터링(ROM)을 경험한 것을 혼합된 방법으로 연구했다.
  • 이 보고서는 7개의 '중요한'/'상급superordinate' 주제 및 18개 주제를 보고했다. (참고로 '상급superordinate'이란 표현은 TA가 아니라 IPA와 관련한 표현이다).
  • 가장 중요한 주제는 1) 도움이 되는 측면과 2) 도움이 되지 않는 측면의 ROM이라는 두 가지 제목 아래에 내포되었다. 
  • 제시된 정보에서 테마는 각각 사용자의 인식에 대한 [하나의 의미적 관찰 또는 통찰력을 포착]하는 것으로 나타났다(예: 나의 감정을 표현, 이해받음).
  • 이러한 것들은 (반사적 TA에서는) [코드]라고 개념화하는 편이 더 맞다. 가장 중요한 주제나 상위 주제들은 모두 비슷한 수준으로 '얄팍했고thin', 대부분 한 단어(예: 형식, 괴로움, 혐오)로 명명되었다.

In TA papers where numerous ‘themes’ are presented, the ‘themes’ are often one dimensional and meaning-thin; they tend to capture only one (small) observation or facet of meaning (and quite often they are named with just one word).

  • For example, Fornells-Ambrojo et al. (2017), in mixed methods research on service users’ experiences of routine outcome monitoring (ROM) in an improving access to psychological therapies for severe mental illness service,
  • reported seven ‘overarching’/‘superordinate’ themes (‘superordinate’ is associated with IPA [Smith et al. 2009] not TA) and 18 themes.
  • The overarching themes were nested under two headings: 1) helpful and 2) unhelpful aspects of ROM.
  • From the information presented, the themes appeared to each capture a single semantic observation or insight about users’ perceptions (e.g. expressing my feelings, being understood).
  • These are better conceptualised as (reflexive TA) codes. The overarching or superordinate themes were similarly ‘thin’, and mostly named with one word (e.g. format, distressing, disliked).

이는 또한 '분석적 조기종결'을 시사한다. 즉, 추가 분석 작업을 통해 이러한 '테마'(코드) 중 여러 개를 특정 의미나 경험의 여러 측면을 드러내는 더 풍부하고 복잡한 테마로 끌어모은 공유 의미의 기본 패턴을 식별할 수 있었을 것이다. (분석의 사전 정의된 목적이 ROM의 긍정적 측면과 부정적 측면을 식별하는 것이었으므로, 패러다임적 포지셔닝에 따라서는 TA에 대한 [코드북] 또는 [코딩 신뢰성] 접근법이 연구의 목적에 더 부합할 수 있었다. 왜냐하면 이 경우 연구가 평가자 간 신뢰성을 측정하는 것이 실증주의자에 더 가깝기 때문이다.)

This also illustrates ‘analytic foreclosure’ (Connelly and Peltzer 2016) – with further analytic work, underlying patterns of shared meaning could have been identified that drew together several of these ‘themes’ (codes) into richer, more complex themes that revealed multiple facets of a particular meaning or experience. (As a pre-defined purpose of the analysis was to identify positive and negative aspects of ROM, a codebook or coding reliability approach to TA might have been more in keeping with the purpose of the study, depending on paradigmatic positionings, which in the study leant towards the positivist, as inter-rater reliability was measured.)

코드인가, 테마인가? 어떤 코드와 테마가 무엇을 나타내는지, 분석에서 어떤 역할을 하는지를 명확히 하는 것이 중요하다. 연구자들은 임시 주제 또는 후보 주제가 1차원인지 다차원인지 여부를 고려하고 개념 프레임워크와 분석 결과 보고가 사용하는 TA 버전과 일치하는지 확인해야 한다.

The take away … Is it a code, or is it a theme? Clarification of what codes and themes represent, and what role they play in analysis, is important. Researchers should consider whether their provisional or candidate themes are one- or multi-dimensional and ensure their conceptual frameworks and reporting of analytic outputs align with the version of TA they are using.

8번 문제: 주제와 토픽을 혼동합니다.
Problem eight: confusing themes and topics

이는 아마도 발표된 TA 연구에서 가장 흔한 문제 중 하나일 것이다. TA에서 단 하나의 널리 동의하고 채택된 테마의 개념화가 없기 때문에, 테마가 개념화되는 방법에 대한 혼란 때문이기도 하다.(DeSantis & Ugarriza, 2000). 우리는 이후 '주제'에 대한 개념화를 명확히 했는데, 이는 테마를 '일부 수준의 패턴 있는 반응 또는 의미'(Braun and Clarke 2006)를 포착하는 것으로 정의한 것이 분명했기 때문이다. 성찰적 TA에서 '주제'는 [중심 개념 또는 아이디어로 결합된 공유된 의미의 패턴]이다(Braun and Clarke 2013; Braun et al. 2014). 즉, 주제는 겉보기에 다소 이질적으로 보이는 데이터를 한데 모을 수 있습니다. 앞서 언급한 바와 같이, 주제는 다면적이기도 하다. 우리는 테마를 이야기, 즉 데이터에 대한 이야기로 생각하는 것을 좋아합니다
This is probably one of the most common problems in published TA research, and it hinges on confusion around how themes are conceptualised, as there is no one widely agreed on and adopted conceptualisation of a theme in TA (DeSantis & Ugarriza, 2000). We have subsequently clarified our conceptualisation of themes, because it was evident that our initial definition of a theme as capturing ‘some level of patterned response or meaning’ (Braun and Clarke 2006) left too much room for confusion. Themes in reflexive TA are patterns of shared meaning, united by a central concept or idea (Braun and Clarke 2013; Braun et al. 2014). This means themes might draw together data that on the surface appear rather disparate. As previously noted, themes are also multifaceted. We like to think of themes as stories – stories we tell about our data.

이렇게 볼 때, 데이터 토픽(도메인이라고도 함)은 주제가 아니다. 데이터 토픽은 인터뷰(말하기)에서 논의된 것들로서, 인터뷰 가이드의 질문으로부터 유도될 수 있다. 참가자는 하나의 토픽을 중심으로 다양하고 이질적인 답변을 제공하는 경우가 꽤 많지만, 토픽이나 영역의 요약이 테마로 제시되는 것이 일반적이다. 이처럼 토픽을 주제화한 것data-topics-as-themes에서는 참가자들의 반응이 요약되어 있지만, '중심 개념'도 '공유된 의미'도 없고 '공유된 '토픽''만 있을 뿐이다.

Data topics (sometimes called domains) are not themes in this way – they are things discussed in (say) an interview, perhaps introduced in a question from the interview guide. Participants quite often provide divergent and disparate responses around a topic, but it is common for summaries of topics or domains to be presented as themes. In these data-topics-as-themes, the participants responses are summarised, but there is no central concept, no shared meaning, only a shared topic.

예를 들어, 센더스 외 연구진(2016)은 다발성 경화증 치료에서 스트레스가 어떻게 해소되는지에 대한 환자의 인식을 탐구하는 연구에서, '브라운 & 클라크에 따른 TA'(p. 1678)를 사용했다고 언급하였으나, 코드북과 합의 코딩도 사용하였으며, 두 가지 주제(1) 촉진자 및 2) 의료 방문 시 스트레스에 대한 대화 장벽)를 보고했다. 각각의 테마는 각각 스트레스에 대한 의사소통을 촉진하거나 억제하는 의료 시스템, 임상의 행동 및 환자 행동의 세 가지 하위 테마를 통합했다. 보고된 내용은 예를 들어 촉진제 또는 장벽과 의료 시스템과 관련된 일련의 관찰이다. 이러한 유형의 분석은 [코드북 TA] 또는 [코딩 신뢰성 TA]에 더 적합한 것으로 보이는데, 이러한 유형의 TA에서는 분석 전에 테마를 미리 결정할 수 있고 테마가 데이터 도메인의 요약으로 구성될 수 있기 때문이다. 

To give an example, Senders et al. (2016), in research exploring patient perceptions of how stress is addressed in medical treatment for multiple sclerosis, which used TA ‘according to Braun & Clarke’ (p. 1678), but also involved the use of codebooks and consensus coding, reported two themes: 1) facilitators and 2) barriers to talking about stress in the medical visit. Each theme incorporated the same three sub-themes: the medical system, clinician behaviour and patient behaviour, that each facilitated or inhibited communication about stress. What is reported is a series of observations related to the topics of, for instance, facilitators or barriers and the medical system. This type of analysis seems better suited to a codebook or coding reliability TA, in which themes can be predetermined prior to analysis and themes may consist of summaries of data domains. 

공유 의미 주제shared meaning themes에 대한 명확한 예를 제공하기 위해, Tischner(2019)는 체중 감량 동기와 건강의 구성을 탐구하는 이야기 완성 연구에서 '모든 여성에게 좋은 체중 감량 활동'이라는 제목의 주제를 포함하여 다섯 가지 주제를 제시했다. 제목만으로도 이것이 중앙 조직 개념 주제와 함께 공유된 의미임을 분명히 전달한다. 즉, 테마 이름 지정의 중요성을 강조하고 있다.(Braun and Clarke 2013). 티슈네르의 주제는 [체중 감량]이 [여성의 외모를 개선하는 방법]으로 긍정적으로 프레임되며, 모든 여성이 원할 뿐만 아니라 바람직한 것이라는 의심받지 않는 지위를 차지하고 있으며, 모든 여성이 삶의 어느 시점에 필연적으로 참여하게 되는 것이라는 것을 포착하였다.
To provide a clear example of shared-meaning themes, Tischner (2019), in her story completion study exploring constructions of weight loss motivations and health, presented five themes, including one entitled ‘weight-loss activity as good for every woman’. The title alone clearly conveys that this is a shared meaning with a central organising concept theme – this highlights the importance of naming themes well (Braun and Clarke 2013). Tischner’s theme captured the way weight loss was positively framed as a way of improving appearance for women and occupied a mostly unquestioned position as desired and desirable by and for every woman, and something all women would inevitably engage in at some point in their lives.

의심할 여지 없이 혼란스러운 것은, 일부 TA 접근법, 특히 [코딩 신뢰성]과 [코드북 접근법]이 토픽 요약topic-summary을 주제theme로 취급한다는 것이다. 실제로는 이 둘은 주제-의미 패턴의 이해라는 측면에서 상당히 다르다. 제로, 테마가 분석과 코딩에 앞서 개발된다면, (코드로부터 만들어진 코딩의 결과인) 주제적 패턴thematic pattern의 유형을 상상하는 것이 어렵기 때문에, 주제 요약 이상의 것이 될 수 있을 것 같지 않다. [테마]가 [중심 개념에 의해 뒷받침되는 공유된 의미의 패턴]이 되려면, 입력input이 아닌 분석적 출력analytic output이어야 한다. '무엇이 테마인가'에 대한 개념적 혼란 외에도 [토픽을 테마로 사용하는 것]도 [분석적 조기종결]의 또 다른 예가 될 수 있다(Connelly and Peltzer 2016).

What is no doubt confusing is that some TA approaches, particularly coding reliability and codebook approaches, treat such topic summaries as themes, when these are quite different from understandings of patterns of thematic-meaning. Indeed, if themes are developed prior to any analysis and coding, it is unlikely they can be much more than topic summaries, as it’s difficult to conceive of the type of thematic patterning that is the outcome of coding, built from codes, being fully anticipated in advance of any or much analytic work taking place. For themes to be patterns of shared meaning underpinned by a central concept, they must be analytic outputs, not inputs. In addition to the conceptual confusion around ‘what is a theme’, the use of topics as themes can also be another example of analytic foreclosure (Connelly and Peltzer 2016).

우리는 연구자들이 주제에 대한 이해를 반성하고, '공유된 의미로서의 주제'와 '공유된 토픽으로서의 주제'를 knowingly and reflectively하게 사용하고, 성찰적 TA에서 토픽 요약을 '주제'로 사요한 경우, 그 이유를 명확히 정당화하도록 권장한다.

The take away … We encourage researchers to reflect on their understanding of themes, to use themes-as-shared-meaning and themes-as-shared-topic knowingly and reflexively, and to clearly justify any use of topic summaries for ‘themes’ in reflexive TA.

문제 9: 새로운 테마 – '기존 분석으로서의 주제'와 '분석의 결과로서의 주제'를 혼동
Problem nine: emerging themes – confusing ‘themes-as-pre-existing analysis’ with ‘themes-as-the-outcome of analysis’

일부 연구자와 방법론자들이 주제에 대해 쓰는 방식을 보면, 그들은 주제를 개념화할 때, 분석 이전에 데이터 세트에 이미 숨어 있었던 무언가로 개념화하는 것처럼 보인다. 이러한 개념화 하에서 연구자의 임무는 보고를 위해 이러한 테마를 찾고 검색하는 것입니다. 이러한 주제는 [데이터에 대한 해석적 관여를 통해 능동적으로 만들어낸 것]이라기 보다는 연구자가 찾아낸 ['모래에 흩어진 다이아몬드'] 같은 것으로 본다. 이것은 게스트, 번스, 존슨 (2006:66)이 더빙한 것처럼 사실상 '주제적 발견thematic discovery'이다. 
The way some researchers and methodologists write about themes, they appear to conceptualise them as entities that pre-exist analysis, lurking about in the dataset. The researcher’s task is to locate and retrieve these themes, for reporting. Such themes are ‘diamonds scattered in the sand’ (Braun and Clarke 2016, 740), found by the researcher, rather than actively created by them through their interpretative engagement with data. This is effectively ‘thematic discovery,’ as Guest, Bunce and Johnson (2006: 66) dubbed it.

테마가 모래 속의 다이아몬드라는 개념은 수많은 TA 논문 저자들이 사용하고 TA와 같은 질적 방법의 비평가들에 의해 테마 개발의 과정으로 떠오른 '테마가 떠올랐다themes emerged'라는 구절에서 분명하게 나타난다. 우리는 'emergent themes'라는 개념이 IPA(그리고 때로는 TA)와 같은 접근법에 사용되어 테마의 귀납적 생성을 반영한다는 것은 받아들이지만, 우리는 '테마가 나타났다'는 주장의 함축으로 인해 골머리를 앓고 있다. 이 표현은, 일단 주제가 (잠재적으로 불투명한) 데이터 깊이에서 자신의 모습을 드러낸 경우, [연구자의 개입이라고는 추출extraction외에는 거의 없이 데이터에 주제가 존재한다는 것]을 암시하는 과정을 떠오르게 한다.

This notion of themes as diamonds in the sand is evident in the phrase ‘themes emerged’, used by countless authors of TA papers, and evoked by critics of qualitative methods like TA, as the process of theme development (e.g. ‘thematic analysis in which themes somehow miraculously emerge from the data’; St. Pierre 2019, 4). We appreciate that the concept of ‘emergent themes’ is used in approaches such as IPA (and sometimes TA) to reflect the inductive creation of themes, but we are troubled by the implications of the claim ‘themes emerged’. The phrasing evokes a process that suggests that themes present from data with little intervention from the researcher other than extraction, once the themes reveal themselves from the (potentially murky) data depths.

우리는 2006년 논문에서 '테마가 나타난다themes emerge'라는 언어에 대해 다음과 같이 비판했습니다. '주제의 출현'이나 '발견됨discovered'에 대한 설명은 [분석 과정에 대한 수동적인 설명]으로, 패턴/테마를 파악하고, 관심사를 선정해 독자에게 보고하는 과정에서 [연구자가 늘 하는 적극적인 역할을 부정]한다'(80쪽). 우리는 엘리 외 연구진(1997, 205–6)을 인용했다. Ely는 '테마가 어디엔가 존재reside한다면, 그것들은 [우리의 데이터에 대해 우리가 생각하고]과 [우리가 이해하는 대로 연결을 만드는] [우리의 머릿속]에 존재하고 있을 것이다.' 우리의 주장은 특별히 설득력이 없었던 것 같다. 왜냐하면 많은 연구자들이 우리의 논문을 인용하고 우리의 접근법을 따르고 있다고 주장했지만, 그들은 데이터에서 'the themes that emerged'를 언급했기 때문이다. (이것은 의심할 여지 없이 문제 2와 연결된다). 
We were critical of the language of ‘themes emerge’ in our 2006 paper: ‘An account of themes “emerging” or being “discovered” is a passive account of the process of analysis, and it denies the active role the researcher always plays in identifying patterns/themes, selecting which are of interest, and reporting them to the readers’ (p. 80). We quoted Ely et al. 1997, 205–6) who argued that ‘if themes “reside” anywhere, they reside in our heads from our thinking about our data and creating links as we understand them.’ It seems that our argument was not particularly persuasive, as so many researchers citing our paper and claiming to follow our approach, refer to ‘the themes that emerged’ from their data (this connects, no doubt, to Problem two). 

우리는 성찰적 TA의 세 번째 단계인 '테마 검색searching'이라고 이름붙인 대한 우리의 (초기) 표현 때문에 [데이터에 이미 존재하는 entities]로 주제를 개념화하는 혼란을 야기했을 가능성이 높다는 것을 인정한다. 이러한 이유로, 우리는 이 단계에 '초기 테마 생성generating'이라고 레이블을 다시 붙여서, 주제 생성theme creation에 대한 연구자의 적극적인 역할과 처음 개발할 때 테마의 잠정성provisionality을 강조하였다. 주제를 '이미 존재하는 것의 분석'으로 개념화하는 것은 [토픽으로서의 주제]와 [분석적 입력으로서의 주제]에 더 잘 들어맞을지도 모른다. 일부 TA 지지자들은 테마를 [entities that pre-exist analyisis]로 개념화하는 듯 보이지만, 이는 반사적 TA와 일치하지 않는다.

We acknowledge that our (initial) phrasing of the third phase of reflexive TA – ‘searching for themes’ – has likely contributed to confusion around the conceptualisation of themes as pre-existing entities that reside in data. For this reason, we have, for now, relabelled this phase ‘generating initial themes’ to highlight the active role of the researcher in theme creation and the provisionality of themes when first developed. A ‘pre-existing analysis’ conceptualisation of themes can perhaps be reconciled with conceptions of topics as themes and themes as analytic inputs, and some TA proponents do appear to conceptualise themes as entities that pre-exist analysis, but this does not align with reflexive TA.

우리는 반사적인 TA를 사용하는 연구자들이 [테마 생성]창의적이고 적극적인 과정으로 서술하며, 테마들이 생겨났다emerged고 주장하는 것은 언제나 지양할 것을 권고한다.3

The take away … We encourage researchers using reflexive TA to write about theme generation as a creative and active process, one they are central to, and to always avoid claiming that themes emerged.3

10번 문제: 우리가 말하는 것에 대한 비판적인 수용
Problem ten: uncritical acceptance of what we say

우리가 강조하고 싶은 마지막 문제는, 정말로 절차주의라고 불릴 수 있다. 그러나 우리는 '비판적이고 사고력 있는 연구자이자 작가가 되라'는 암묵적이고 명시적인 우리의 메시지가 10번 조언과 모순되는 것으로 보이지 않길 바란다. 퀄리티에 대한 우리의 강조는 맹종적인 것, 생각 없이 절차를 고수하는 것을 단념시키는 것을 의미한다. 오히려, 우리는 이론적으로 알고 반사적이며 '생각하는aware' TA 사용을 권장한다. 우리는 TA의 다양성과 유연성, 분석 및 품질 절차가 패러다임 및 인식론적 가정을 반영하는 방법을 이해하는 연구자에게 과제를 준다. 우리는 질적 연구자에게 이론적으로 민감하고 창의적인 연구를 위한 유연한 '시작점'을 제공하려는 것이며, 그들이 자신만의 연구를 할 수 있도록 초대하려는 것이다. 성찰적 TA를 잘 수행하기 위해서는, [이론, 데이터 지향 등과 관련한 선택을 내려야 하며], 이것을 [명확하며, 일관성 있게 집행enacted]하여야 한다.
The final problem we want to highlight could, indeed, be called proceduralism. But we hope our implicit and explicit message to ‘be a critical, thinking researcher and writer’ makes this point not seem contrary. Our emphasis on quality involves discouraging slavish or unthinking adherence to procedures, and any accusation of that represents a misconceptualisation of our articulation of TA (and qualitative research more widely). Rather, we encourage theoretically-knowing, reflexive and ‘aware’ use of TA; we task researchers with appreciating the diversity and flexibility of TA, and the ways analytic and quality procedures reflect paradigmatic and epistemological assumptions. We offer qualitative researchers reflexive TA as a flexible ‘starting point’ for theoretically sensitive and creative research and invite them to make it their own. To do good reflexive TA, choices related to theory, data orientation and more must be made, articulated and coherently enacted.

사려 깊은 연구자가 되어라; 방법론 작가들의 말을 맹종적으로 따르지 마라. 우리는 완전한 풀-패키지를 제공하는 것이 아니다; 우리는 당신의 모험을 항해할 수 있는 나침반과 지도를 제공하려는 것이다. 그리고 우리는 연구자들이 성찰적 TA든, 코딩 신뢰성 TA든, 코드북 TA이든 연구자의 철학적 헌신과 연구의 분석 목적에 가장 적합한 TA가 무엇일지 성찰할 것을 권장한다.

The take away … Be a thoughtful researcher; do not just slavishly follow what methodology writers say. We do not provide a full holiday package; we provide a compass and a map to navigate your adventure (Braun, Clarke, and Hayfield 2019b). And we encourage researchers to reflect on whether it is a reflexive, coding reliability or codebook version of TA that is best suited to their philosophical commitments and the analytic purpose of their research.

검토자 및 편집자를 위한 평가 도구 소개
Introducing our evaluation tool for reviewers and editors

TA를 하는 연구자들은 그들이 할 수 있는 최고의 양질의 연구를 해야 할 중요한 책임이 있습니다. 그러나 출판된 작업은 또한 동료 검토, 편집자의 의사 결정 및 지침과 같은 품질 보증 프로세스를 거치며, 이러한 단계는 품질을 보장하는 데에도 중요합니다. 불행하게도, 우리는 개인적인 경험을 통해 그것들이 (위에서 논의된 10가지 중 일부를 포함한) 문제들이 슬금슬금 들어오거나, 심지어 (학술지에 의해서) 요구될 수 있는 지점이 될 수 있다는 것을 안다. 저자들은 검토 과정을 진행하면서 곤란한 입장에 처할 수 있다. 검토자나 편집자가 문제가 되는 것을 제안하거나 요구할 경우 저자들은 다음을 수행해야 한다.
Researchers who do TA have an important responsibility to do the best quality research they can. But published work also goes through quality assurance processes – peer review, and editorial decision making and guidance – and these steps are also important for ensuring quality. Unfortunately, we know from personal experience they can also be the points at which problems (including some of the 10 discussed above) can either creep in, or even be demanded. Authors can be in a tricky spot navigating the review process. If reviewers or editors suggest or demand something problematic, authors have to:

  • 1) 문제가 있다는 것을 인지한다.
  • 2) 해쳐나갈 방법을 찾습니다.
  • 1) recognise that it is problematic; and
  • 2) find a way to navigate through it.

우리가 이 논문을 시작한 것과 같은 검토자나 편집자의 논평에 직면했을 때 반사적인 TA 연구의 저자는 무엇을 해야 하는가? 그들은 반사적인 TA를 뒷받침하는 가정인 TA의 복수성에 대해 검토자와 편집자를 '교육'하도록 시도해야 하는가? 그들은 모든 질적 분석 접근방식을 포괄하는 단일 품질 표준의 부족을 강조해야 하는가? (Levitt et al. 2018) 그렇다! 우리는 저자들이 본 논문과 다른 곳에서 제공하는 정보를 사용하여 [편집자와 검토자의 요청 또는 요구사항에 대한 문제제기challenges]를 정당화하기 위해 [자기 연구의 가치를 설명하고 방어할 것]을 권장한다. 우리는 리뷰와 편집 피드백에 대한 우리의 반응을 '모범 사례' 문헌에 포함시켜야 합니다.

What is the author of a reflexive TA study to do, when faced with a reviewer or editor comment like the one we started this paper with? Should they attempt to ‘educate’ reviewers and editors about the plurality of TA, the assumptions underpinning reflexive TA? Should they highlight the lack of a single quality standard that cuts across all qualitative analytic approaches? (Levitt et al. 2018) Yes! We encourage authors to explain and defend their research values, using the information provided in this paper and elsewhere to justify their challenges to requests or requirements from editors and reviewers. We should embed our responses to reviews and editorial feedback in ‘best practice’ literature. 

그러나 저자는 여기까지만 할 수 있을 뿐이다. 궁극적으로는 편집자와 리뷰어가 광범위한 연구 커뮤니티에서 논의되고 개발된 품질 표준의 집행(또는 집행실패)에 대한 책임을 진다. 양질의 TA의 출판을 용이하게 할 수 있는 몇 가지 기본 편집 관행이 있다. 

  • 편집자는 자신의 방법론적 한계뿐만 아니라 이론적/개념적, 방법론적 가정 및 가치를 이해해야 한다.
  • 편집자는 TA 원고를 심사할 수 있는 적절한 방법론적 전문지식을 갖춘 심사자를 적어도 한 명 선택해야 한다(Levitt 등 2018).
  • 편집자는 저널의 편집 위원회가 적절한 검토자 선택을 안내하는 데 도움이 될 수 있는 광범위한 전문 지식을 가진 질적 방법론자를 한 명 이상 포함하도록 보장해야 한다.

However, authors can only argue so far … And editors and reviewers hold ultimate responsibility for enacting (or failing to enact) the quality standards debated and developed in the wider research community. There are some basic editorial practices that can facilitate the publication of good quality TA:

  • editors should understand not just their own methodological limits, but their theoretical/conceptual and methodological assumptions and values;
  • editors should select at least one reviewer with appropriate methodological expertise to review TA manuscripts (Levitt et al. 2018); and
  • editors should ensure the journal’s editorial board includes at least one qualitative methodologist with wide-ranging expertise who can help guide appropriate reviewer selection

– 편집자가 질적 방법론자가 아닌 경우 마지막 요점은 매우 중요합니다. 편집자가 선택한 '전문가' 검토자 중 한 명이라도 TA에 대한 매우 광범위하고 깊이 있는 지식을 가지고 있지 않다면, 어떻게 형편없는 연습이 질문이나 도전을 받지 않는지, 그리고 우리가 문서화한 문제들이 그렇게 흔해졌는지 쉽게 알 수 있다.
– this latter point is vital if the editor is not a qualitative methodologist. Unless at least one of the ‘expert’ reviewers chosen by the editor has very wide-ranging and in-depth knowledge of TA, it is easy to see how poor practice is not questioned or challenged, and how the problems we have documented have become so common.

TA와 관련하여 더 나은 편집(및 검토자) 관행을 촉진하기 위해 TA와 관련된 주요 긴장 및 모범 사례 중 일부를 제시하는 편집자와 검토자를 위한 평가 질문 목록을 개발했다(표 1 참조). 이러한 중요한 질문들은 적어도 우리가 보는 몇몇 공개된 문제들을 빠르고 쉽게 해결할 수 있다. 예를 들어 저널에 제출할 때 TA 저자가 편집자의 주의를 끌도록 권장한다.
To facilitate better editorial (and reviewer) practice in relation to TA, we have developed a list of evaluation questions for editors and reviewers that lay out some of the key tensions and best practices related to TA (see Table 1). These critical questions can offer a quick and easy resolution to at least some of published problems that we see. We encourage TA authors to bring these to editors’ attention, for instance, when submitting to a journal.

마지막으로 저널 편집자가 TA 및 기타 질적 논문에 대해 더 원고 길이를 더 길게 할 수 있도록 제공할 것을 권고한다(Levitt et al. 2018, 2017). 짧은 단어 수는 TA 연구가 보고되는 방법을 상당히 제약할 수 있으며, 이는 모든 종류의 방법으로 명백히 더 나쁜 관행을 야기할 수 있다. 레빗 외 연구진(2018)이 주장한 것처럼, 품질 기대와 맥락화, 연구 성찰성, 데이터 추출물을 통한 발견 사례화는 더 많은 원고 페이지를 요구한다. 저널이 주로 디지털화되면서 확장의 폭이 넓어졌습니다. 그러나 우리는 데이터나 방법론적 해설이 품질 판단 및 프로세스에 필수적인 것으로 보기 때문에 2차 표 또는 추가 온라인 부록으로 밀려나는 솔루션을 옹호하지 않을 것이다(Braun and Clarke 2019b).
Finally, we recommend that journal editors provide longer page limits for TA – and other qualitative – papers (Levitt et al. 2018, 2017). Short word counts can significantly constrain how TA research is reported, which can contribute to apparently poorer practice, in all sorts of ways. As Levitt et al. (2018) argued, quality expectations and contextualisation, research reflexivity and illustrating findings with data extracts demand more manuscript pages. As journals are now primarily digital, the scope for expansion is increased. But we would not advocate for a solution where data or methodological commentary are relegated to secondary tables or additional online appendices, because we see these as integral to quality judgements and process (Braun and Clarke 2019b).

결론
Conclusion

TA의 품질을 논의하기 위해, 우리는 TA에 대한 성찰적 접근 방식을 인용하거나 따르고 있다고 주장하는 발표된 TA 연구에서 10가지 일반적인 문제를 설명했다. TA가 하나의 접근법이라고 가정하는 이들 중 첫 번째 문제는 다른 대부분의 문제의 기초가 된다. 그리고 실제로, TA의 다양성과 다원성 - TA가 실증주의에서 비판적 질적 패러다임에 이르기까지 - TA 연구의 품질 표준을 규정하는 데 있어 질적 연구 커뮤니티의 핵심 과제를 제시하며, 이는 광범위한 질적 논의를 지속해 온 문제이다.

In order to discuss quality in TA, we have delineated ten common problems in published TA research that cites, or claims to follow, our reflexive approach to TA. The first of these – assuming TA is one approach – underlies most of the other problems. And indeed, it is the diversity and plurality of TA – that TA ranges from positivist to critical qualitative paradigms – that presents a key challenge for the qualitative research community in demarcating quality standards for TA research, an issue that has dogged wider qualitative quality discussions. 

출판되는 TA의 품질을 향상시키기 위해, 우리는 연구자들이 양질의 실천quality practice를 포함하여, 분석적 실천과 연구의 존재론적 및 인식론적 기반 사이의 관계를 성찰하고, TA를 knowingly, deliberatively and reflexively 사용할 것을 권장한다. 우리는 이를 실현하기 위해 연구 품질에 대한 효과적인 중재자인 검토자 및 편집자를 지원합니다. 이를 위해 TA 원고를 검토하거나 편집할 때 고려해야 할 중요 질문 20개를 제공했습니다.

To improve the quality of published TA, we encourage researchers to reflect on the relationship between analytic practices, including quality practices, and the ontological and epistemological foundations of their research, and to use TA knowingly, deliberatively and reflexively. We task reviewers and editors – who are effective arbiters of research quality – with supporting researchers in realising this. To this end, we provided twenty critical questions to consider when reviewing or editing TA manuscripts. 

하지만 우리가 TA에 대해 쓰는 모든 것들과 마찬가지로, 이것은 우리의 "현재" 생각을 반영할 뿐이며, 모든 것은 변한다. 따라서 반사적이든 다른 접근법이든 TA를 사용하는 모든 사람에게 가장 중요한 조언은 단순히 접근법에 대한 '주요 참조'가 아니라 [가장 최신]에 나온 글과 저자의 조언을 읽는 것이다. 그리고 마지막으로 TA는 [모든 목적에 적합한 방법]이 아님을 강조합니다! 적절하지 않을 때는 프로젝트에 적합하게 만들기 위해 노력하는 대신, 프로젝트에 어떤 다른 훌륭한 질적 분석 방법을 제공할 수 있는지 살펴보십시오.

But like everything we write about TA, this reflects our current thinking, and things change. So, our most vital piece of advice for anyone using TA, whether reflexive or another approach, is to read the most up-to-date writing and advice from authors, rather than just the ‘key reference’ for an approach. And finally, we emphasise that TA is not a method for all purposes! Instead of trying to make it fit, when it does not, explore what the many other wonderful qualitative analytic approaches might offer your project instead.

 


ABSTRACT

Developing a universal quality standard for thematic analysis (TA) is complicated by the existence of numerous iterations of TA that differ paradigmatically, philosophically and procedurally. This plurality in TA is often not recognised by editors, reviewers or authors, who promote ‘coding reliability measures’ as universal requirements of quality TA. Focusing particularly on our reflexive TA approach, we discuss quality in TA with reference to ten common problems we have identified in published TA research that cites or claims to follow our guidance. Many of the common problems are underpinned by an assumption of homogeneity in TA. We end by outlining guidelines for reviewers and editors – in the form of twenty critical questions – to support them in promoting high(er) standards in TA research, and more deliberative and reflexive engagement with TA as method and practice.

다중 비교에 관한 팩트와 픽션(J Grad Med Educ, 2021)
Facts and Fictions About Handling Multiple Comparisons
Gail M. Sullivan, MD, MPH
Richard S. Feinn, PhD

 











한 가지 측면은 많은 비교를 이용한 분석과 관련이 있다. 다중 독립 비교를 고려하지 않는 교육자와 연구자는 다음과 같은 검토자의 의견을 받을 수 있다. 

  • 얼마나 많은 비교를 할 계획이었나요? 
  • 이러한 다중 비교를 위해 어떻게 조정했습니까? 또는 
  • 다중 비교가 통계적 추론에 어떤 영향을 미칩니까? 

One aspect concerns analyses using many comparisons. Educators and researchers who do not take into account multiple independent comparisons may receive reviewer comments such as:

  • Where did you prespecify how many comparisons you planned to make?
  • How did you adjust for these multiple comparisons? or
  • How do the multiple comparisons affect your statistical inferences?

다중 비교를 고려하지 않으면 내부 타당성에 대한 의문이 제기될 수 있습니다(즉, 이러한 결과가 실제로 사실입니까?). 또한 검토자와 저자의 관점에서 저자에 대한 신뢰도를 낮출 수 있다(이 작가들은 그들이 뭘 하는지 알고 있을까? )임상의와 교육자로서 우리는 이러한 문제와 투명하고 잘 다루지 않을 경우 연구나 논문을 파멸시킬 수 있는 방법에 대해 잘 알지 못할 수 있다.

Not considering multiple comparisons can raise questions of internal validity (ie, are these findings actually true?). It can also lower, in the minds of reviewers and authors, confidence in the authors: Do these authors know what the heck they're doing? As clinicians and educators we may be less aware of these issues and how they can doom a study or paper if not handled transparently and well.

정량적 논문을 고려할 때 다음과 같은 3가지 질문이 즉시 제기된다. 

  • (1) 본 논문은 내 환경 또는 교육생(외부 타당성, 일반화 가능성)에 적용되는가? 
  • (2) 연구 대상 전체 모집단에 대한 우연 또는 사실로 인한 발견인가(위양성 대 실제 양성 발견) 및 
  • (3) 소견의 크기 또는 의미(효과 크기)는 어느 정도인가?1  

이 사설은 많은 작가들에게 성배인 두 번째 이슈에 대해 간략하게 소개합니다: 상당한 P 레벨입니다.


When considering a quantitative paper, 3 questions immediately arise:

  • (1) Does this paper apply to my setting or trainees (external validity, generalizability);
  • (2) Are the findings likely due to chance or true for the overall population being studied (false vs true positive finding); and
  • (3) How large or meaningful are the findings (effect size).1  

This editorial provides a brief introduction to the second issue, the holy grail for many authors: a significant P level.

기본으로 돌아가기
Back to Basics

왜 우리는 P 레벨을 소중히 여기는가? 두 평균을 비교하는 단일 비교부터 시작합시다. 내과 레지던트 그룹이 고가의 이사회 검사 준비 과정을 수강했지만 유사한 레지던트 그룹이 수강하지 않았다고 가정하고, 그룹 간 이사회 점수 평균을 비교하여 이 과정을 계속 진행해야 하는지 여부를 결정하려고 합니다. 귀무 가설이 참이라고 가정하면(즉, 그룹 간에 차이가 없다), P 값은 선택된 거주자(모든 전공의의 무작위 표본)가 적어도 발견된 크기의 두 가지 이사회 점수 수단에서 차이를 생성할 확률이다.
Why do we cherish P levels? Let's start with a single comparison, comparing 2 means. Suppose a group of internal medicine residents took an expensive board examination prep course and a similar group of residents did not, and we want to compare board score means between groups to determine if the course should be continued. If we assume that the null hypothesis is true (ie, there is no difference between the groups), the P value is the probability that our selection of residents—a random sample of all residents—produced a difference in the 2 board score means of at least the size found.

제1종 오류(alpha)는 연구팀이 합당하다고 인정하는 오류의 수준으로, 통계시험을 실시하기 전에 이를 선택해야 한다. 즉, 실제로 차이가 없을 때 그룹 간에 차이가 존재한다고 결론을 내릴 확률이다. 통계 테스트의 P 수준이 선택한 오류 수준보다 작은 경우(보통 5%(0.05)), 테스트 차이는 보드 준비 과정이 아니라 전공의의 선택으로 인해 발견된 차이(전체 모집단을 연구할 수 없기 때문에)일 5%의 확률만 갖는 것으로 본다. (즉, 시험 점수 차이가 우리 연구를 위해 선택된 거주자 때문에 발생할 5% 확률, 즉 우연에 의해서만 발생).

Type I error (alpha) is the error level deemed reasonable by the research team, who must select it before conducting the statistical test. It is the probability of committing a false positive error: in other words, of concluding that a difference between groups exists when there is truly no difference. If the P level from the statistical test is less than the selected error level, usually 5% (.05), we view the test difference as having only a 5% chance that the difference found is due to the selection of residents (as we cannot study the entire population) rather than the board prep course (ie, a 5% chance that the test score difference is due to the residents selected for our study, ie, by chance alone).

하지만 이 값비싼 이사회 준비 과정의 대상이 누구인지를 이해하는 데 중요한 추가 요소를 살펴보려면 어떻게 해야 할까요? 예: 교육 중 시험 점수, 레지던트 나이 및 성별, 미국 의대 졸업자 대 국제 의대 졸업자, 레지던트 중 마일스톤 등급(Milestones leveling) 또는 선호되는 아침식사 음료? 우리가 환자를 위한 많은 실험실 검사를 주문할 때도 이러한 문제가 발생할 수 있습니다.

But what if we wish to look at additional factors that might be important to understanding who should be targeted for this expensive board prep course? For example: in-training examination scores, resident age and gender, US medical graduate vs international medical graduate, Milestones ratings during residency—or preferred breakfast drink? These issues can occur when we order many lab tests for a patient, too.

 알파 또는 I형 오류 수준이 비교 시마다 0.05로 유지되면 하나 이상의 "통계적으로 유의한" 결과가 나올 확률은 5% 이상 증가합니다(그림 참조). 예를 들어, 10개의 비교의 경우 검사 중인 요인이 아닌 랜덤하게 선택된 주민 모집단(즉, 우연히)으로 인해 적어도 하나의 "통계적으로 유의한"(P < .05) 비교를 찾을 확률이 40%로 증가합니다. 
13개의 독립적인 비교의 경우, 우연히 "유의한" P 수준을 찾을 확률은 50%로 증가합니다.2  이러한 값을 familywise error rate이라고 하며, 이는 family of comparison에 의해 발생한다. 

If the alpha or type I error level remains at .05 for each comparison, the probability of at least one finding being “statistically significant” increases above 5% (see Figure). For example, for just 10 comparisons, the probability rises to 40% that you will find at least one “statistically significant” (P < .05) comparison that is due to the population of residents randomly selected rather than the factor under examination—that is, by chance. For 13 independent comparisons, the probability of finding a “significant” P level by chance increases to 50%.2  These are called family-wise error rates, for a family of comparisons.

아침 식사로 차를 마시는 전공의가 이 보드 준비 과정을 수강하는 데 가장 적합한 대상이라고 잘못 결론을 내릴 수 있는 것이다.

You could erroneously conclude that residents who drink tea for breakfast are the best target for taking this board prep course—and create tortured explanations for this finding in your Discussion section.

 

 

통계적 유요성은 허용 오차 수준(알파 또는 유형 I 오류)에 의해 결정되며, 표본 모집단이 전체 모집단과 유사할 가능성(예: 여러 기관에서 2020-2021년 내과 레지던트들이 모든 내과 레지던트들과 유사)을 반영한다는 점을 기억하라. 이 다중 비교 문제는 95% 신뢰 구간과도 관련이 있습니다. 다중 비교를 수행하고 각 비교에 대해 평균 차이의 95% 신뢰 구간을 생성하면 모든 구간에 평균의 실제 차이가 포함될 확률은 95% 미만입니다.
Remember that statistical significance is determined by the level of error accepted (alpha or type I error) and reflects the likelihood that the sampled population resembles the entire population (eg, that internal medicine residents in 2020–2021 at several institutions resemble all internal medicine residents). Note that this issue of multiple comparisons also pertains to 95% confidence intervals. If multiple comparisons are performed and a 95% confidence interval of the difference in means is created for each comparison, the probability that all the intervals will contain the true difference in means will be less than 95%.

극단적인 예로, 게놈 전체 연관 연구(GWAS)를 수행하는 연구자들이 다중 테스트에 적응하지 않았다고 가정해 보자. GWAS는 질병과의 연관성에 대해 100,000개의 다른 위치를 검사할 수 있다. 각 위치에 0.05의 알파 수준을 사용한 경우 위양성 값이 많이 나올 수 있습니다.

As an extreme example, imagine if researchers conducting genome-wide association studies (GWAS) did not adjust for multiple testing. GWAS may test 100 000 different loci for an association with a disease. If an alpha level of .05 was used for each locus you can guarantee there would be numerous false positives.

낚시 원정대 및 P-해킹
Fishing Expeditions and P-Hacking

낚시 탐험대 또는 [P-해킹]이라는 용어는 연구자들이 독립변수와 종속변수의 관계에 대한 모든 가능한 비교에 대해 그들의 데이터를 검사할 때를 가리킨다. 

  • 독립 변수(예: 인구통계학적 요인, 대학원생 수준, 전문성, 학부 위치, 레지던트 순환) 
  • 종속 변수(예: 웰빙 지수, 번아웃 지수, 번아웃 서브그룹 요소, 워라밸 지수) 

더 많이 비교할수록 P 수준 < .05가 비교 대상으로 발견될 가능성이 높으며, 귀무 가설(즉, 차이 없음)은 부정확하게 기각될 수 있다. 이 용어들은 일반적으로 경멸적이며, 예를 들어 논문의 요약 또는 결과 섹션과 같이 중요한 결과만 보고되는 경우를 위해 남겨둔다.
The terms fishing expedition or P-hacking refer to when researchers examine their data for every possible comparison of independent variables (eg, numerous demographic factors, postgraduate year levels, specialties, undergraduate locations, residency rotations) and/or dependent variables (eg, well-being index, burnout index, burnout subgroup elements, work-life balance index). The more comparisons, the more likely a P level of < .05 will be found for a comparison, and the null hypothesis (ie, no difference) may be rejected inaccurately. These terms are generally pejorative and reserved for when only the significant findings are reported, for example in the Abstract or Results section of a paper.

이 문제는 [흥미로운 발견을 어디서 찾을 수 있을지에 대한 기대 없이 완전히 새로운 질문을 탐구할 때]에는 피할 수 없을지도 모른다. 그러나 의학 교육에서 이것은 거의 사실이 아니다; 우리는 보통 이전의 연구나 그럴듯한 이론에 근거한 가설을 가지고 있다. '낚시'가 나타나는 것을 피하려면 '방법' 섹션에서 자신의 접근 방식에 대한 문헌과 이론적 틀을 바탕으로 계획된 비교를 미리 규정하는 것이 최선이다. 이 fishing의 문제는 임상시험에서 충분히 자주 발견되어 이제 연구자들이 데이터를 수집하고 분석하기 전에 주요 결과물을 공공 사이트(clinicaltrials.gov)에 게시하는 것이 의무화 되었다. 데이터를 본 후에는 분석을 추가하고 싶은 유혹을 이겨내십시오!
This problem may be inevitable when exploring entirely new questions with no expectation of where the interesting findings may lie. However, in medical education this is rarely true; we usually have hypotheses based on prior work or plausible theory. To avoid the appearance of “fishing,” it is best to prespecify, based on the literature and theoretical framework for your approach, your planned comparisons in the Methods section. This fishing problem was found often enough in clinical trials that it is now mandatory for researchers to post the primary outcome(s) on a public site (clinicaltrials.gov) before the data are collected and analyzed. Resist the temptation to add additional analyses after you have seen the data!

그럴듯한 사전 가설이 없는 경우 많은 비교를 수행하고, 관련된 P 수준 및 신뢰 구간과 함께 모든 가설을 보고하고, 방법 절에 탐색 가설이며, 이러한 이유로 다중 비교를 조정하지 않았다고 기술할 수 있습니다. 검정 횟수가 증가함에 따라 모임별 오류율도 증가하므로 이러한 상황에서는 추론을 그리는 데 주의해야 합니다.
When there are no plausible prior hypotheses, it can be acceptable to make many comparisons, report all of them with the associated P levels and/or confidence intervals, and state in your Methods section that these were exploratory hypotheses and that no adjustment for multiple comparisons was made for this reason. Be cautious in drawing inferences in these situations: as the number of tests expands, so does the family-wise error rate.

비교 및 사전 계획 분석을 제한하는 이유
Why to Limit Comparisons and Pre-Plan Analyses

프로젝트를 준비하기 위한 첫 번째 단계는 문헌에 대한 심층적인 검토입니다.

  • 다른 연구자들은 어떤 방법을 사용했나요?
  • 어떤 이론이 다른 접근법을 뒷받침할 수 있는가?
  • 우리의 지식에는 어떤 gap이 있을까요?

In preparing for a project, the first step is a deep dive into the literature:

  • What methods did other researchers use?
  • What theories may support different approaches?
  • What gaps remain in our knowledge?

종종 이전 작업은 다음 단계로 구체적인 방향이나 질문을 제공합니다. 따라서 계획된 데이터 분석뿐만 아니라 데이터 수집도 제한할 수 있습니다. 데이터가 이미 수집되었다면(예: 의학대학원 교육 인증 위원회 및 국가 프로그램 관리자 그룹에는 방대한 데이터 수집이 있다), 질문에 답변하는 데 필요한 사항을 신중하게 선택하십시오.

Often prior work will provide you with specific directions or questions as next steps. This in turn will help you limit the collection of data as well as planned analyses of the data. If data were already collected (eg, Accreditation Council for Graduate Medical Education and national program director groups have enormous data collections to explore), choose carefully what you need to answer your question(s).

여기 문제가 있다: 다중 비교를 수정하지 않으면 복제 스터디에서 다른 연구자는 발견하지 못하는 위양성 결과를 찾을 위험이 있습니다. 다중 비교를 수정하면 실제로 존재하는 차이를 찾을 수 있는 통계적 검정력이 손실됩니다(위음성). 따라서, 당신의 질문에 가장 적합한 것으로 당신의 비교를 제한하세요.
Here's the conundrum: If you don't correct for multiple comparisons, you risk finding “significant” results that are false positives and that will not be found by others in replication studies. If you do correct for multiple comparisons, you lose statistical power to find differences that actually exist (false negatives). Ergo, limit your comparisons to what fits your questions best.

비교에 대한 수정이 필요하지 않은 경우도 있습니다. 예를 들어, [새로운 경험적 오리엔테이션 프로그램]이 현재 [미국 정신건강의학 인턴]에서 [6개월째에 집계된 전문직업성 마일스톤]에 미치는 영향을 보고 있다고 생각해 보십시오. 인턴들 중 절반은 새로운 일주일간의 체험 오리엔테이션을 받고, 나머지 절반은 대규모 그룹 오리엔테이션과 가상 오리엔테이션을 병행한다. 경험적 오리엔테이션 프로그램을 받은 사람들은 P < .05 수준에서 유의미하게 더 높은 점수를 받는다.
Correction for a comparison may not be needed in some instances. For example, consider that you are looking at the effects of a new experiential orientation week on intern performance on aggregated professionalism milestones at 6 months, in current US psychiatry interns. Half of the interns receive the new week-long experiential orientation, and the other half receive a combination of large group and virtual orientation sessions. Those with the experiential orientation score significantly (and meaningfully) higher at the P < .05 level.

아래의 하위그룹에 대해서 이차 분석을 계획합니다.

  • 국제 의학 졸업생 대 미국 의학 졸업생,
  • 남자 대 여자,
  • 나이가 많은(30세) 대 어린(31세),
  • USMLE 1단계 5분위수 및
  • 대학 기반 프로그램과 비대학 기반 프로그램의 사용자.

You plan secondary analyses to look at subgroups:

  • international medical graduates vs US medical graduates,
  • male vs female,
  • older (> 30) vs younger (< 31 years),
  • USMLE Step 1 quintile, and
  • those at university-based vs non-university-based programs.

이 예에서는 2차 분석에서는 다중 비교를 위해 조정이 필요할 수 있지만, 1차 분석에서는 correction이 필요하지 않다.
In this example, it is not necessary to correct for the primary analysis, although the secondary analyses may require adjustment for multiple comparisons.

다중 비교 처리 전략
Strategies for Handling Multiple Comparisons

계획 중인 가장 중요한 비교를 고려한 후 여러 개 이상의 비교를 수행할 경우 다중 비교를 반영하도록 분석을 조정하는 것을 고려해야 합니다. 비교할 항목을 결정하기 전에 데이터를 살펴본다면 이미 다중 비교를 수행한 것입니다. 우리는 당신이 진정으로 탐구적인 연구를 수행하는 것이 아니라면 이것을 하지 말 것을 제안합니다.
After considering the most important comparisons you plan to make, if you have more than a few, you should consider adjusting your analysis to reflect the multiple comparisons. (Remember that if you look at your data before deciding what comparisons to make, you have already made multiple comparisons. We suggest not to do this unless you are performing truly exploratory research.)

고려해야 할 많은 방법들이 있고, 전문은 물론 수많은 글들이 잘 묘사되어 있다. 이 가운데 본페로니 교정은 의학 교육에 많이 쓰인다. 본페로니 교정은 알파를 계획된 비교 횟수로 나누어 알파 수준(오류)을 하향 조정한다. 10개 비교의 경우 유형 I 오차가 0.05인 경우 수정된 알파 수준은 .05/10 또는 .005입니다. 이를 비교 오류율이라고도 합니다. 본페로니 교정은 기억하기 쉬워서 인기가 있지만, 특히 협회가 사실 서로 독립적이지 않을 경우 지나치게 보수적이다. 따라서 유형 II 오류(위음성)로 이어질 수 있다. 이 일반적인 접근법에는 많은 수정 사항이 있으며, 일부는 덜 보수적인 조정을 사용한다(예: 벤자미니-호흐버그 방법)은 일차 가설과 이차 가설의 알파 수준을 변화시키거나 모든 검정의 알파 수준을 더 낮은 알파 수준으로 변화시킨다(예: 0.05 대신 0.01).

There are many methods to consider, and full texts as well as numerous articles describe them well. Of these, the Bonferroni correction is often used in medical education. The Bonferroni correction adjusts the alpha level (error) downward by dividing alpha by the planned number of comparisons. For 10 comparisons, with a type I error of 0.05, the corrected alpha level is .05/10 or .005. This is sometimes termed the comparison-wise error rate. The Bonferroni correction is easy to remember and thus popular, but it is overly conservative, especially if the associations are not in fact independent of each other. Thus, it can lead to a type II error (falsely accepting the null hypothesis of no association). There are many modifications of this general approach; some include using a less conservative adjustment (eg, Benjamini–Hochberg method), varying the alpha level for primary and secondary hypotheses, or switching to a lower alpha level for all tests (eg, .01 instead of .05).

하지만 우리가 비교하고자 하는 다양한 비교가 서로 독립적이지 않다면 어떨까요? 아니면 우리가 25와 같이 많은 수의 비교를 한다면 어떨까요? 독립 변수 및 종속 변수가 상관관계가 있는 경우와 수많은 검정이 수행되는 상황에 대한 방법이 있습니다. 이 소개 기사의 범위를 벗어나, 독자들이 다중 비교와 방법을 지원할 수 있는 다양한 접근 방식에 대해 자세히 알아볼 수 있는 좋은 자료가 많이 있습니다(자료 참조).
But what if the various comparisons we want to make are not independent of each other? Or what if we are making a large number of comparisons, such as 25? There are methods for when independent and/or dependent variables are correlated and situations where numerous tests are performed. While beyond the scope of this introductory article, there are many good resources for readers to learn more about multiple comparisons and the various approaches that can support your methods (see Resources).

제한 사항에 대해 논의하는 방법
How to Discuss in Limitations

지금까지 살펴본 바와 같이, 데이터를 조사하기 전에(최적으로 데이터를 수집하기 전에) 결정을 내려야 하며, 이러한 결정이 결과의 "진실truth"에 영향을 미칠 수밖에 없습니다. 방법 섹션에서 비교 및 알파 오차 수준을 선택하여 추론을 명확하게 제시합니다. 그런 다음 토론 섹션에서 잘못된 긍정(우연히 관측된 차이) 또는 잘못된 부정(존재하나 찾지 못한 차이) 중 어느 방향으로든 결정이 결과에 영향을 미칠 수 있는 방법을 고려하십시오. 이 후자의 문제는 유형 II 오류(베타)의 결과로 더 자주 발생하며, 우리는 이를 다음 논의를 위해 저장해 둘 것이다. 방법의 결정으로 인한 잠재적 효과를 투명하게 나열하면 검토자, 편집자 및 독자의 관점에서 신뢰성이 향상되며, 장황할 필요도 없습니다. '지나친' 투명성은 '너무 적게'은 투명성보다 좋고, 과도한 단어는 개정 과정에서 싹쓸이할 수 있다.
As you have seen, decisions must be made before examining your data—optimally before even collecting your data—that will inevitably affect the “truth” of your findings. Clearly present your reasoning in choice of comparisons and alpha error levels in the Methods section. Then, in the Discussion section, consider how your decisions may have affected your findings in either direction: false positives (differences observed that are actually due to chance) or false negatives (no difference found when one does exist). This latter problem more often occurs as a result of a type II error (beta), which we will save for another discussion. Laying out the potential effects of your methods' decisions in a transparent way enhances credibility in the eyes of reviewers, editors, and readers, and does not have to be lengthy. It's better to have “too much” transparency vs “too little,” and any excess words can be trimmed away in the revision process.

결론들
Conclusions

이 기사는 의학교육연구에서 다중비교라는 주제를 거의 다루지 않는다. 교육자와 연구자들이 발표나 출판을 위해 기사를 읽고, 분석을 고려하고, 작품을 작성할 때 이 문제를 염두에 둘 수 있도록 인지도를 높였으면 한다. 가장 중요한 항목:
This article barely scratches the surface of the topic of multiple comparisons in medical education research. We hope to raise awareness so that educators and researchers keep this issue in mind when reading articles, considering analyses, and writing up their work for presentations or publications. Most important:

  • 시작할 때 비교를 미리 계획합니다. 아직 분석하지 않았지만 분석을 수행하기 전에 데이터를 검토한 경우에는 이러한 사후 분석을 가능한 모든 비교로 간주하십시오.
  • 비교가 서로 독립적일 가능성이 높은지 또는 일부 비교가 서로 관련이 있을 수 있는지 판단합니다.4 
  • 여러 가지 비교를 위해 알파 수준(오차)을 조정하는 것을 고려해 보십시오.
  • 방법 섹션에서 결정을 명확하게 제시합니다.
  • 자신의 방법이 토론에서 발견한 내용에 어떤 영향을 미쳤는지 토론합니다.
  • 의심스러울 때는 친절한 생물통계학자 한 명에게 물어보세요.
  1. Preplan your comparisons at the start. If you have not, but have examined the data before deciding which analyses to make, consider these post-hoc analyses as all possible comparisons.
  2. Decide if your comparisons are likely independent of each other or if some may be related to each other.4 
  3. Consider adjusting your alpha level (error) for more than a few comparisons.
  4. Present your decisions clearly in the Methods section.
  5. Discuss how your methods may have affected your findings in the Discussion.
  6. When in doubt, ask a friendly biostatistician.

 


A general introduction to adjustment for multiple comparisons

Shi-Yi Chen,1 Zhe Feng,2 and Xiaolian Yi3

Abstract

In experimental research a scientific conclusion is always drawn from the statistical testing of hypothesis, in which an acceptable cutoff of probability, such as 0.05 or 0.01, is used for decision-making. However, the probability of committing false statistical inferences would considerably increase when more than one hypothesis is simultaneously tested (namely the multiple comparisons), which therefore requires proper adjustment. Although the adjustment for multiple comparisons is proposed to be mandatory in some journals, it still remains difficult to select a proper method suitable for the various experimental properties and study purposes, especially for researchers without good background in statistics. In the present paper, we provide a brief review on mathematical framework, general concepts and common methods of adjustment for multiple comparisons, which is expected to facilitate the understanding and selection of adjustment methods.

Introduction

The statistical inference would be a critical step of experimental researches, such as in medicine, molecular biology, bioinformatics, agricultural science, etc. It is well acceptable that an appropriate significance level α, such as 0.05 or 0.01, is pre-specified to guarantee the probability of incorrectly rejecting a single test of null hypothesis (H0) no larger than α. However, there are many situations where more than one or even a large number of hypotheses are simultaneously tested, which is referred to as multiple comparisons (1). For example, it is common in clinical trials to simultaneously compare the therapeutic effects of more than one dose levels of a new drug in comparison with standard treatment. A similar problem is to evaluate whether there is difference between treatment and control groups according to multiple outcome measurements. Due to rapid advances of high-throughput sequencing technologies, it is also common to simultaneously determine differential expression among tens of thousands of genes.

The statistical probability of incorrectly rejecting a true H0 will significantly inflate along with the increased number of simultaneously tested hypotheses. In the most general case where all H0 are supposed to be true and also independent with each other, the statistical inference of committing at least one incorrect rejection will become inevitable even when 100 hypotheses are individually tested at significance level α=0.05 (Figure 1). In other words, if we simultaneously test 10,000 true and independent hypotheses, it will incorrectly reject 500 hypotheses and declare them significant at α=0.05. Of course, estimation of error rate would become more complex when hypotheses are correlated in fact and not all of them are true. Therefore, it is obvious that the proper adjustment of statistical inference is required for multiple comparisons (2). In the present paper, we provide a brief introduction to multiple comparisons about the mathematical framework, general concepts and the wildly used adjustment methods.

 

Mathematical framework

For a simultaneous testing of m hypotheses, the possible outcomes are listed in Table 1. Let’s suppose that the number of true H0 is m0, which is an unobservable random variable (0≤m0≤m). After performing statistical inferences we totally found R H0 being rejected and declared significant at the pre-specified significance level; and herein R is an observable random variable (0≤R≤m). Among the statistically rejected hypotheses of R, when R>0, we suppose that there are U H0 that have been incorrectly rejected. Similar to m0, U is also an unobservable random variable with equal to or larger than 0. Accordingly, counts of other possible outcomes could be deduced, including the correctly rejected H0 (R- U), correctly retained H0 (m0-U), and incorrectly retained H0 (m-R-m0+U).

Type I and II errors

For the statistical inference of multiple comparisons, it would commit two main types of errors that are denoted as Type I and Type II errors, respectively. The Type I error is that we incorrectly reject a true H0, whereas Type II error is referred to a false negative. Because the exact numbers of Type I and Type II errors are unobservable (as denoted in Table 1), we would intend to control the probability of committing these errors under acceptable levels. In general, the controlled probabilities of committing Type I and Type II errors are negatively correlated, for which therefore we must determine an appropriate trade-off according to various experimental properties and study purposes. If a significant conclusion has important practical consequence, such as to declare an effective new treatment, we would control Type I error more rigorously. On the other hand, we should avoid committing too many Type II errors when it intends to obtain primary candidates for further investigation, which is very common in studies of genomics. Here, we specially address the controlling of Type I error because it considerably increases for multiple comparisons.

 

Adjusted P value or significance level

In statistical inference, a probability value (namely P value) is directly or indirectly computed for each hypothesis and then compared with the pre-specified significance level α for determining this H0 should be rejected or not (3). Therefore, there are two ways for adjusting the statistical inference of multiple comparisons.

  • First, it could directly adjust the observed P value for each hypothesis and keep the pre-specified significance level α unchanging; and this is herein referred to as the adjusted P value.
  • Second, an adjusted cut-off corresponding to the initially pre-specified α could be also computationally determined and then compared with the observed P value for statistical inference.

In general, the adjusted P value is more convenient because in which the perceptible significance level is employed. However, it would be difficult or impossible to accurately compute the adjusted P value in some situations.

Measures accounting for Type I error

According to possible outcomes of multiple comparisons (Table 1), all efforts would be paid to the control of variable U, for which therefore various statistical measures have been proposed to account (4). Certainly, each of these measures has differential applications with respective strengths and weaknesses.

A simple and straightforward measurement is the expected proportion of variable U among all simultaneously tested hypotheses of m, which is referred to as the per-comparison error rate (PCER):

If each hypothesis is separately tested at significance level α, PCER will be equal to α when all H0 are true and independent with each other. Obviously, it becomes PCER=αm0/m≤α when not all H0 are true in fact. However, control of PCER would be less efficient because we would obtain at least one false positive at significance level α=0.05 when 20 true H0 are simultaneously tested.

In practical applications, it is more reasonable to jointly consider all hypotheses as a family for controlling Type I error; and therefore the most stringent criterion is to guarantee that not any H0 is incorrectly rejected. Accordingly, the measure of familywise error rate (FWER) is introduced and defined as the probability of incorrectly rejecting at least one H0:

The control of FWER has been widely used especially when only a few or at most several tens of hypotheses are simultaneously tested. However, FWER is believed to be too conservative in cases that the number of simultaneously tested hypotheses reaches several hundreds or thousands.

Another popular measure for controlling Type I error of multiple comparisons is the false discovery rate (FDR), which is defined as the expected proportion of incorrectly rejected H0 among all rejections:

Therefore, FDR allows the occurrence of Type I errors under a reasonable proportion by taking the total number of rejections into consideration. An obvious advantage of FDR controlling is the greatly improved power of statistical inference, which would be useful when a large number of hypotheses are simultaneously tested.

Common methods for adjustment

Suppose that there are m hypotheses of H1, …, Hm being simultaneously tested, which correspond to the initially computed P values of p1, …, pm. Accordingly, the adjusted P values of multiple comparisons are denoted as p′1, …, p′m. The pre-specified and adjusted significance levels are further denoted as α and α’, respectively. Furthermore, we assume that all hypotheses are ordered as H(1), …, H(m) according to their observed P values of p(1)...p(m); and the associated P values and significance level are denoted as p(i), p′(i) and α′(i) for the ith ordered hypothesis of H(i). We here provide an illustrative example for demonstrating differences among various adjustment methods. Let m=6 and α=0.05; and the initially computed P values corresponding to six hypotheses are p1=0.1025, p2=0.0085, p3=0.0045, p4=0.0658, p5=0.0201 and p6=0.0304, respectively.

Bonferroni adjustment

Bonferroni adjustment is one of the most commonly used approaches for multiple comparisons (5). This method tries to control FWER in a very stringent criterion and compute the adjusted P values by directly multiplying the number of simultaneously tested hypotheses (m):

Equivalently, we could let the observed P values unchanging and directly adjust the significance level as α′ = α/m = 0.05/6. For our illustrative example the adjusted P values are compared with the pre-specified significance level α=0.05, and the statistical conclusion is obviously altered before and after adjustment (Figure 2). Bonferroni adjustment has been well acknowledged to be much conservative especially when there are a large number of hypotheses being simultaneously tested and/or hypotheses are highly correlated.

Holm adjustment

On the basis of Bonferroni method, Holm adjustment was subsequently proposed with less conservative character (6). Holm method, in a stepwise way, computes the significance levels depending on the P value based rank of hypotheses. For the ith ordered hypothesis H(i), the specifically adjusted significance level is computed:

The observed P value p(i) of hypothesis H(i) is then compared with its corresponding α′(i) for statistical inference; and each hypothesis will be tested in order from the smallest to largest P values (H(1), …, H(m)). The comparison will immediately stop when the first p(i) ≥ α′(i) is observed (i=1...m) and hence all remaining hypotheses of H(j) (j=i,…,m) are directly declared non-significant without requiring individual comparison (Figure 3). Alternatively, it could directly compute the adjusted P value for each hypothesis and produce same conclusion (Figure 2).

Hochberg adjustment

Similar to Holm method, Hochberg adjustment employs same formula for computing the associated significance levels (7). Therefore, the specifically adjusted significance level for ith ordered hypothesis H(i) is also computed:

However, Hochberg method conducts statistical inference of hypothesis by starting with the largest P value (H(m), …, H(1)). When we first observe p(i) < α′(i) for hypothesis H(i) (i=m,…,1), the comparison stops and then concludes that the hypotheses of H(j) (j=i,…,1) will be rejected at significance level α. The adjusted P values of Hochberg method are shown in Figure 2. It is also known that Hochberg adjustment is more powerful than Holm method.

Hommel adjustment

Simes (1986) modified Bonferroni method and proposed a global test of m hypotheses (8). Let H={ H(1), …, H(m)} be the global intersection hypothesis, H will be rejected if p(i) ≤ iα/m for any i=1, …, m. However, Simes global test could not be used for assessing the individual hypothesis Hi. Therefore, Hommel (1988) extended Simes’ method for testing individual Hi (9). Let an index of j=max{i{1...m}:p(mi+k)>kα/i for k=1...i} be the size of the largest subset of m hypotheses for which Simes test is not significant. All Hi (i=1,…,m) are rejected if j does not exist, otherwise reject all Hi with pi≤α/j. Although straightforward explanation for computing the adjusted P values of Hommel method would be not easy, this task could be conveniently performed by computer tools, such as the p.adjust() function in R stats package (http://cran.r-project.org).

Benjamini-Hochberg (BH) adjustment

In contrast to the strong control of FWER, Benjamini and Hochberg [1995] introduced a method for controlling FDR, which is herein termed BH adjustment (10). Let be the pre-specified upper bound of FDR (e.g., q=0.05), the first step is to compute index:

If k does not exist, reject no hypothesis, otherwise reject hypothesis of Hi (i=1,…,k). BH method starts with comparing H(i) from the largest to smallest P value (i=m,…,1). The FDR-based control is less stringent with the increased gain in power (Figure 2) and has been widely used in cases where a large number of hypotheses are simultaneously tested.

Benjamini and Yekutieli (BY) adjustment

Similar to BH method, a more conservative adjustment was further proposed for controlling FDR by Benjamini and Yekutieli [2001], and this method is also termed BY adjustment (11). Let again q be the pre-specified upper bound of FDR, the index k is computed as:

If does not exist, reject no hypothesis, otherwise reject hypothesis of Hi (i=1,…,k). BY method could address the dependency of hypotheses with increased advantages.

Conclusions

Although substantial literature has been published for addressing the increased Type I errors of multiple comparisons during the past decades, many researchers are puzzling in selecting an appropriate adjustment method. Therefore, it would be helpful for providing a straightforward overview on the adjustment for multiple comparisons to researchers who don’t have good background in statistics. Of course, there are many theoretical topics and methodological issues having not been addressed yet in the present paper, such as resampling-based adjustment methods, choice of significance level α, and specific concerns for genomics data. It is also beyond the scope of this paper to discuss the sophisticated mathematical issues in this filed.

 

 


J Grad Med Educ. 2021 Aug;13(4):457-460.

 doi: 10.4300/JGME-D-21-00599.1. Epub 2021 Aug 13.

Facts and Fictions About Handling Multiple Comparisons

Gail M Sullivan 1Richard S Feinn 2

Affiliations collapse

Affiliations

  • 1is Editor-in-Chief, Journal of Graduate Medical Education (JGME), and Associate Director for Education, Center on Aging, and Professor of Medicine, University of Connecticut Health Center.
  • 2is Statistical Editor, JGME, and Associate Professor of Medical Sciences, Quinnipiac University.

통계학개론 (Adv Health Sci Educ Theory Pract. 2019)
Statistics 101

Geoff Norman1

간단한 사전 테스트를 준비했습니다. 그건 이런 식이다:
I have devised a simple pretest. It goes like this:

  • 대학원생 중 한 명이 최근 연구 결과를 보여 줍니다. 이것은 간단한 두 그룹 비교입니다 – 세부 사항은 중요하지 않습니다. 독립적인 표본 t 검정을 사용하여 두 그룹 평균을 비교했는데, 이는 단지 기호화 –> p = .0498인 것으로 밝혀졌다.
    One of your graduate students shows you the findings from her latest study. It is a simple two group comparison – the details do not matter. She compared the two group means using an independent sample t test, which turned out to be just significant –> p = .0498.
  • 동네 술집에서 축하를 하고 나면, 당신은 최근 복제 불가능에 대한 모든 홍보에 시달립니다. 그래서 다음 날 당신은 그녀가 확실히 하기 위해 연구를 반복해야 한다고 주장합니다. 그녀는 전에 했던 것처럼 똑같이 합니다. 디자인은 바뀐 것이 없습니다.
    After due celebration at the local pub, you are haunted by all the recent publicity about non-replication. So the next day you insist that she repeat the study just to be sure. She does it exactly like she did before. Nothing has changed in the design.
  • 질문: 순전히 통계적인 근거로, 두 번째 연구에서 동일한 결론에 도달할 확률, 즉 귀무 가설을 두 번 기각할 확률은 얼마입니까?
    QUESTION: On purely statistical grounds, what is the probability that you will arrive at the same conclusion in the second study; that is, you will reject the null hypothesis a second time?

다음 페이지의 각주1에서 정답을 찾을 수 있을 것입니다. 정답을 맞힌 사람은 올바른 이유(어떻게 나올지에 대한 정당한 논리적 주장)로 다음 섹션을 건너뜁니다. 나머지는, 계속 읽어보세요. 
You will find the correct answer in the footnote1 on the next page, just to keep you from peeking. For those who got it right, for the right reasons (a legitimate logical argument as to how it comes out that way), skip the next section. For the remainder, read on.

1 귀무 가설을 두 번째로 기각할 확률은 0.50입니다.
1 The probability that you will reject the null hypothesis a second time is 0.50


통계논리학의 기초
A primer of statistical logic


복습할 시간이에요. 통계 추론의 기본 논리는 이제 약 100년 정도 되었고(RIP 로날드 경), 반복된 도전(Cohen 2016)을 견뎌냈지만 여전히 살아있다. 효과 크기, 신뢰 구간 및 승산비를 추가했지만, 좋든 싫든 마법의 "p < .05"가 없으면 정량적으로 게시하는 데 어려움이 있을 것입니다. 
It’s time for a review. The basic logic of statistical inference is now about 100 years old (RIP Sir Ronald), and has withstood repeated challenges (Cohen 2016), but lives on. We’ve added effect sizes and confidence intervals and odds ratios, but like it or not, you still will have trouble publishing anything quantitative without the magical “p < .05”. 

그러니 그것이 무엇인지 그리고 우리에게 말하지 않는 것을 명확히 하자. 쉽게 설명하려면 이 책에서 가장 간단한 예를 들어 샘플을 모집단에 비교하는 경우를 살펴보겠습니다. 예를 들어, 우리는 "광도"와 소아과 유사점을 찾았다고 가정해 봅시다(그런데 광도는 작동하지 않습니다). 노화에 따른 인지력 저하를 줄이는 대신, 우리는 다른 쪽 끝에서 일할 것입니다. 그리고 유동적인 지능의 흐름을 조금 더 좋게 만들고 아이들의 IQ를 높이기 위해 고안된 온라인 개입인 윤활성을 고안할 것입니다. 
So let’s be clear on what it is and is not telling us. To make it easy, let’s take the simplest case in the book—comparing a sample to a population. Suppose, for example, we have come up with a pediatric analog to “Luminosity” (which does NOT work, by the way). Instead of reducing cognitive decline with aging, we’re going to work at the other end, and devise an online intervention, Lubricosity—designed to make fluid intelligence flow just a bit better, and raise IQ of kids (that doesn’t work either, but let’s pretend it does for now). 

그러나, 우리는 그 반대로 시작하여 "null 가설"을 설정한다. 
However we begin by doing the opposite and setting up a “null hypothesis”, which in contracted form is: 

H0 pop 모평균(모양성) = 모평균 = 100. 
H0 ∶ Population mean(lubricosity) = Population mean = 100. 

기본적인 논리는 간단하다. 만약 우리 연구 아이들이 12세 모두의 집단에서 무작위로 추출된 샘플이고, 만약 치료법이 효과가 없다면, 그리고 만약 우리가 연구를 수 천 번 하고 모든 샘플의 평균 IQ를 표시한다면, 그들은 치료받지 않은 집단의 평균 IQ인 100 정도 정규 분포를 따를 것입니다. 
The basic logic is simple: If our study kids are a random sample from the population of all 12 year olds, and if the treatment doesn’t work, and if we did the study a zillion times and displayed all the sample mean IQ’s, they would be normally distributed around 100, the mean IQ in the untreated population. 

그래서 우리는 무작위로 100명의 6살짜리 아이들을 표본으로 추출하여 3개월 동안 프로그램에 등록한 후 그들의 IQ를 측정합니다. 중요한 것은 표본 크기 100에서 계산된 평균의 분포를 살펴보기 때문에, 정규분포의 width는, 평균의 표준오차라고 하며, 이는 원래 점수의 표준편차를 평균의 제곱근으로 나눈 1.5가 된다는 것입니다. 데이터는 그림 1a)와 비슷할 것이며, 여기서 우리는 IQ를 Z 점수로 변환하여 모든 것을 표준 오차 단위로 표현했다.  
So we randomly sample 100 6 year olds, enrol them in the program for 3 months, then measure their IQ. Critically, because we re looking at the distribution of means computed from sample size 100, the width of the normal distribution of means, the standard error of the mean, would be the standard deviation of the original scores (15 for IQ) divided by the square root of the sample size (√100 = 10), or 1.5. The data would look like Fig. 1a), where we have also converted the IQ to a Z score, expressing everything in standard error units.  

논리의 다음 단계는 연구의 표본 평균이 이 (null 가설) 분포에서 왔다면 우연히 발생할 가능성이 충분히 없는 경우, 귀무 가설을 기각하고 관측된 차이가 통계적으로 유의하다고 선언하는 것이다. 그리고 "비슷하게"는 항상 같은 방식으로 정의된다; 발생 확률은 100분의 5 미만이다. 
The next step in the logic is to declare that, if the sample mean of the study is sufficiently unlikely to have arisen by chance if it came from this (null hypothesis) distribution, we will reject the null hypothesis and declare that the observed difference is statistically significant. And “unlikely” is always defined the same way; a probability of occurrence of less than 5 in 100. 

그런 다음 꼬리 확률이 .05 미만인 분포에 임계값을 설정하며, 이는 일반적으로 "알파"라고 불린다. 간단한 z 테스트의 경우, 그림과 같이 Z가 1.96일 때 발생합니다. 즉, H0을 거부(수용)하지 못하는 [임계값의 왼쪽에 있는 영역]과 H0을 거부(수용)하지 못하는 [임계값의 오른쪽에 있는 영역]입니다. 
This then establishes a critical value out on the distribution beyond which the tail probability is < .05, which is conventionally called “alpha”. For the simple z test, this arises at a Z of 1.96, as shown in the figure. In turn, this defines two zones: one to the left of the critical value, where we fail to reject (accept) H0, and one to the right, where we reject H0. (Again, because this is a two-tailed test, there is a similar zone on the left side of the graph, but we’ll ignore this). See Fig. 1a). 

이제 중요한 부분이 왔다. 만약 우리가 H0을 거부한다면, 우리는 논리적으로 그것이 다른 분포인 H1 분포에서 왔다고 선언한다. 데이터가 나오기 전에 이 모든 것을 가정한다면, H1은 거의 모든 곳에 중심이 맞춰질 수 있습니다. 따라서 표본 크기 계산은 항상 올바른 값을 산출합니다! 그러나 연구가 끝나면 H1 분포가 있을 수 있는 위치, 정확히 관찰한 위치에 대한 정보를 얻을 수 있습니다. 따라서 "작업"한 두 번째 연구 집단은 새로운 모집단 평균인 관측된 표본 평균에 대한 "최상의 추측"에 초점을 맞춘 분포를 가지고 있다고 가정한다. 또한 해당 분포가 치료되지 않은 모집단과 동일한 표준 편차를 갖는다고 가정한다. 
Now comes the critical part. If we reject H0, we then logically declare it comes from a different distribution, the H1 distribution, somewhere to the right of the critical value. Now, if we were doing all this hypothetically before we had the data, H1 could be centered almost anywhere (which is why sample size calculations always come up with the right number!) But once the study is over, we have information about where the H1 distribution might be—exactly where we observed it. So we assume that the second population of studies that “worked” has a distribution centered on our “best guess” of the new population mean, the observed sample mean. We also assume the distribution has the same standard deviation as the untreated population (“homoscedasticity”, if you want to sound intellectual). 

연구 평균이 104.5로 H0 평균보다 3 표준 오차 위에 있다고 가정합시다. 그러면 곡선은 그림 1b와 같다.
Let’s assume we found that the study mean was 104.5, 3 standard errors above H0 mean. Then the curve looks like Fig. 1b):

이제 중요한 비트는 임계값 왼쪽의 H1 곡선 영역입니다. 즉, 4.5의 IQ 포인트 차이가 있다는 대립 가설 하에서 유의한 차이를 선언하지 않을 가능성인 베타입니다. 이 경우 0.15입니다. 그리고 (1-베타)는 차이가 있는 경우 이를 검출할 수 있는 가능성으로, 이를 검정력이라고 합니다. 이 값은 (1–.15) =.85입니다. 
Now the important bit is the area of the H1 curve to the left of the critical value. That is beta, the likelihood that you would not declare a significant difference, under the alternative hypothesis that there was a difference of 4.5 IQ points. In this case, it’s 0.15. And (1-beta) is the likelihood of detecting a difference if there was one, which is called “power”. This is (1–.15) = .85 

분명히 하자면, 이 연구는 0.0001의 p 값에 해당하는 Z = 3.0의 차이를 발견했지만 유의미한 차이를 반복할 확률은 여전히 85%에 불과하다는 것을 의미합니다. 
To be very clear, what this means is that even though this study found a difference of Z = 3.0, corresponding to a p value of 0.0001, the chance of replicating the finding of a significant difference is still only 85%. 

그리고 그것은 우리에게 프라이머의 시작 부분에서 제기되는 질문으로 이어집니다. p-값을 정확히 0.05로 계산하면, 이것은 Ho 분포의 Z = 1.96에서 표본 평균에 해당합니다. 즉, H1 분포가 임계값에 바로 중심을 맞춘다는 뜻입니다. 분포의 절반은 임계값의 왼쪽에 있고 절반은 오른쪽에 있습니다. 유의한 차이의 원래 발견을 반복할 가능성은 50%에 불과합니다! 
And that brings us to the question posed at the beginning of the primer. If we computed a p-value of exactly .05, this corresponds to a sample mean at Z = 1.96 on the Ho distribution. That means the H1 distribution is centred right on the critical value. Half of the distribution lies to the left of the critical value and half to the right. The likelihood of replicating the original finding of a significant difference is only 50%! 

그림 2에서, 나는 계산된 p 값의 함수로 복제 가능성을 표시했다. 그것은 0.50에서 0.97까지이다. 
In Fig. 2, I’ve plotted the likelihood of replication as a function of the calculated p value (for “significant” results). It goes from .50 to .97. 



이제 시작 부분에 제시된 세 가지 시나리오로 돌아가겠습니다. 
Now let’s return to the 3 scenarios posed at the beginning: 

1. "Power analysis이 제시되지 않았습니다. 실험 설계의 일부로 포함되어야 한다." 
1. “There is not [sic] power analysis presented. Should be included as part of experimental design.” 

위에서 설명한 바와 같이, 통계적 검정의 검정력은 (즉, 데이터가 H1 분포에서 나온 경우) 하나일 때 유의한 차이를 찾을 확률이다. 연구에서 우리는 모든 중요한 차이가 0.001에서 0.0001 사이의 p 값을 갖는다고 보고했다. 유의한 차이를 찾을 확률은 1.0이었는데, 그 이유는 우리가 유의한 차이를 발견했기 때문입니다. Power analysis는 아무것도 더하지 않습니다. 
As we described above, the power of a statistical test is the probability of finding a significant difference when there is one present (i.e. when the data come from the H1 distribution). In the study we reported all the critical differences had p values ranging from 0.001 to 0.0001. The probability of finding a significant difference was 1.0, because we did find a significant difference. The power calculation adds nothing. 

검정력 계산은 차이가 예상되지만 발견되지 않을 때 추정된 크기의 차이를 찾을 가능성을 추정하는 데 유용합니다. 차이가 감지되면 가치가 없습니다. 
Power calculations are useful when a difference is expected but was not found, to estimate the likelihood of finding a difference of some presumed magnitude. They have no value when a difference was detected. 



2. 복제 비복제에 대한 Pashler의 해결책은 피험자당 시행 횟수를 증가시켜 (표본 크기를 증가시켜) 연구에 더 큰 통계적 power을 부여하는 것이었다. 
2. Pashler’s solution to non-replication was to build greater statistical power into the studies by increasing the number of trials per subject (increasing sample size). 

밝혀진 바와 같이 표본 크기가 증가하면 복제되지 않는 문제가 줄어들지 않을지는 유의미한 효과의 원래 결과가 참이었는지 아닌지에 대한 믿음에 달려 있습니다. 
As it turns out, whether increased sample size will or will not reduce problems of non-replication depends on your belief that the original finding of a significant effect was true or not. 

복제와 비복제에 대한 대부분의 문헌은 원래의 결과가 위양성false positive이라는 견해를 가지고 있는 것으로 보인다. (존 외 2012; 마시캄포 및 랄랑드 2012; 시몬스 외 2011). 만약 그렇다면, 우리가 설명한 개념 논리는 알파가 처음부터 0.05로 설정되기 때문에 거짓 양의 가능성은 항상 0.05라는 것을 보여준다. (이 주장을 할 때, 우리는 의도적으로 참고 문헌 목록 중 일부에서 논의된 많은 잠재적인 조사자 편향을 무시하고 단지 이론적 확률을 보고 있다.) 
It would appear that most of the literature on replication and non-replication holds the view that the original finding is a false positive; the effect is really not there. (John et al. 2012; Masicampo and Lalande 2012; Simmons et al. 2011). If this is the case, then the conceptual logic we have described demonstrates that the likelihood of a false positive is always 0.05, because alpha is set at .05 from the outset. No amount of increase in sample size changes that. (In making this claim, we are deliberately ignoring the many potential investigator biases discussed in some of the references in the bibliography, and are simply looking at the theoretical probability). 

그러면 샘플 크기를 늘리면 어떤 효과가 있을까요? 도함수로 돌아가면, 평균의 표준 오차는 감소하므로 두 곡선은 원래 척도에서 더 멀리 이동한다. 겹치는 부분overlap이 감소하면 검정력이 증가하지만, 이는 실제 차이를 탐지할 가능성에만 영향을 미칩니다. 즉, 증가된 검정력은 실제 효과가 있는 경우 점점 더 작은 효과의 탐지를 허용하지만, 효과가 유의하다고 잘못 선언될 가능성은 바꾸지 않는다. 

So what does increased sample size achieve? Going back to the derivation, as sample size increases, the standard error of the mean decreases, so the two curves move further apart on the original scale. Power increases as the overlap decreases, but this only impacts on the likelihood of detecting a true difference. In other words, increased power will permit detection of smaller and smaller effects if they are real, but does not change the likelihood that an effect will be falsely declared significant. 



3. 다중 문항 조사에서 얻어진 문항수준에서의 상관 관계.
3. Correlations at item level from a multi-item survey.

연구 설계가 알파에 미치는 영향의 연장선상에서, 다중 검정이 전체 알파 수준에 미치는 영향에 대한 관심이 부족하다. 다중 항목 목록에서 관찰된 차이의 분석은 적어도 두 가지 이유로 인해 타당하지 않다. 첫째, 검정 횟수가 증가할수록 유의한 차이를 관측할 가능성이 커집니다. 예를 들어, 알파가 0.05인 경우 5개의 검정을 통해 적어도 하나의 유의한 차이(위양성)를 찾을 확률은 0.23, 10개의 검정에서는 0.40, 20개에서는 0.65, 50개에서는 0.92입니다. 거짓과 실제 긍정을 구별하는 것은 불가능하다. 게다가, 수백 명의 참여자들이 참여하기 때문에, 심지어 작은 상관관계도 통계적으로 중요한 것으로 나타날 것이다. 한 가지 해결책은 기존의 알파를 제안된 테스트 수로 나누는 본페로니 보정이다. 발표된 예에서, 논문에 있는 약 40개의 중요한 결과는 본페로니 보정을 통해 3으로 떨어집니다. 

As an extension of the effect of study design on alpha, there is insufficient attention to the effect of multiple tests on the overall alpha level. Analysis of differences observed in a multi-item inventory is rarely sensible, for at least two reasons. First, as the number of tests increases, the likelihood of observing a significant difference increases. As a simple example, using an alpha of .05, the likelihood of finding at least one significant difference (false positive) with 5 tests is .23; with 10 tests, .40; with 20, .65 and with 50, .92. It is not possible to distinguish false from real positives. Moreover, with several hundred participants, which is not uncommon in surveys, even tiny correlations will emerge as statistically significant. One solution is a Bonferroni correction, dividing the conventional alpha by the number of proposed tests. In the published example, the approximately 40 significant results in the paper drops to 3 with a Bonferroni correction. 

그러한 접근법이 유용하지 않은 두 번째 이유가 있다. 다중문항인벤토리를 사용하는 것의 핵심은, 하나의 문항만으로는 신뢰할 수 있는 결과를 산출하기에 충분히 신뢰성이 없다는 것을 인식하는 것이다. 실제로 요인분석은 기초 치수를 식별하기 위한 항목별 판매 생성 지침을 제공하기 위한 것이며, 전체적인 내부 일관성 계산은 모든 항목이 동일한 기초 치수를 측정한다는 가정에 기초한다. 따라서 분석은 항목item 수준이 아닌 척도scale 또는 하위척도subscale 수준에서 진행되어야 합니다. 

There is a second reason why such an approach is not useful. The whole point of a multi-item inventory is recognition that a single item is not sufficiently reliable to yield credible results. Indeed a factor analysis is directed at providing guidance for creating subscales to identify underlying dimensions, and an overall internal consistency calculation is based on the assumption that all items are measuring the same underlying dimension. So analysis should be conducted at the scale or subscale level, not the item level. 

결론
Conclusion


다양한 방법론적 편향에 기초한 복제 실패의 이해를 위한 광범위한 문헌이 있지만(Francis 2013; Schulz 등 1995), 비복제가 피셔 통계 추론의 구조적 특징이라는 사실에 대한 인식과 동일하다고 생각한다.
While there is an extensive literature directed at understanding failure to replicate based on various methodological biases (Francis 2013; Schulz et al. 1995), there is, I think inadequate recognition of the fact that non-replication is an architectural feature of Fisherian statistical inference.

Cohen, J. (2016). The earth is round (p < . 05). In What if there were no significance tests? (pp. 69–82). Routledge.

Norman, G. (2017). Generalization and the qualitative–quantitative debate. Advances in Health Sciences Education, 22(5), 1051–1055. XXX

 

 

 

 


Adv Health Sci Educ Theory Pract. 2019 Oct;24(4):637-642.

 doi: 10.1007/s10459-019-09915-3.

Statistics 101

Geoff Norman 1

Affiliations collapse

Affiliation

  • 1McMaster University, Hamilton, ON, Canada. norman@mcmaster.ca.

모두에게 맞는 사이즈는 없다: 보건전문직교육 연구에서 개인-중심 분석(Perspect Med Educ, 2020)
‘One size does not fit all’: The value of person-centred analysis in health professions education research 
Rashmi A. Kusurkar · Marianne Mak-van der Vossen · Joyce Kors · Jan-Willem Grijpma · Stéphanie M. E. van der Burgt · Andries S. Koster · Anne de la Croix 

 

도입
Introduction


의료 교육 저널을 빠르게 스캔한 결과, 보건 직업 교육(HPE)에서 수행된 연구는 주로 변수-중심 분석variable-centred analysis [1]이라고 할 수 있는 것을 채택하고 있음을 알 수 있습니다. [주어진 표본에서 두 개 이상의 변수 간의 관계]를 조사하는 이러한 유형의 분석은 HPE 연구의 변수가 서로 어떤 영향을 미칠 수 있는지를 이해하는 데 중요합니다. 그러나 [많은 연구가 단지 몇 가지 변수에만 초점을 맞추고 있지만, 교육적 실천은 복잡하고 상황에 의존적이며 지저분할 수 있기 때문에], 교육자는 그러한 분석에 근거하여 실천 방식을 적용하거나 바꾸기가 어려울 수 있다. 
A quick scan of medical education journals shows that the research conducted in health professions education (HPE) predominantly employs what can be called variable-centred analysis [1]. This type of analysis, which investigates the relationships between two or more variables in a given sample, is important in understanding how variables in HPE research can influence one another. However, it can be hard for educators to adapt or change their practice on the basis of such analysis, as many studies focus only on a few variables and educational practice can be complex, context-dependent and messy. 

[사람 중심 분석]은 하위집단subgroup 전체에 걸쳐 변수가 서로 어떻게 관련되는지를 기반으로 [개인의 하위집단subgroup이 어떻게 만들어질 수 있는지]를 조사하는 추가 접근법입니다 [1]. 개인 중심 분석은 교육자에게 개인별 실천 이니셔티브를 위한 도구를 제공할 수 있는 결과를 생성합니다. 

Person-centred analysis is an additional approach, which investigates how subgroups of individuals can be made based on how variables are related to each other across sub-groups [1]. Person-centred analysis generates findings that could provide educators with tools to personalize practice initiatives. 

사람 중심 분석이란 무엇입니까?
What is person-centred analysis?

주어진 데이터 집합에서 [독립 변수에 대해 유사한 특성 또는 유사한 점수를 가진 사람들이 함께 군집화]하는 방식으로 [사람 그룹groups of people]을 만들 수 있다 [2]. 이는 [사례 기반 분석case-based analysis]의 한 유형으로, 즉 유사한 특성을 가진 개인 또는 사례에 대한 분석입니다. 이를 위해 일반적으로 변수 중심 분석에 사용하는 것과 다른 유형의 파일을 만들 필요가 없습니다. 유일한 차이점은 분석이 수행되는 방식입니다. 
In a given dataset we can create groups of people in such a way that people with similar characteristics or similar scores on the independent variables are clustered together [2]. This is a type of case-based analysis, i.e. analysis of individuals or cases with similar characteristics. For this, we do not need to create a different type of file than what we would normally use for a variable-centred analysis. The only difference is the way the analysis is carried out. 

종속 변수와의 연관성을 독립 변수로 간주하여 계산한다면, 특정 특성(예: 높은 공감과 높은 복원력)을 가진 그룹 1이 종속 변수(학업 성과)와 어떤 연관성을 가지는지를 보여주고, 그룹 2(예: 낮은 공감과 높은 복원력)가 보이는 종속 변수(학업성적)와의 연관성이 (그룹1과) 다르거나 유사하다는 것을 보여줍니다.

If the associations with the dependent variables are computed by considering group membership as the independent variable, we demonstrate that group 1 with certain characteristics (e.g. high empathy and high resilience) shows a certain type of association with the dependent variables (academic performance), group 2 (e.g. low empathy and high resilience) shows a different or similar association with the dependent variables (academic performance), and so on. 

[사람 중심 분석]에서는 데이터의 패턴을 기반으로 '덜 명확한' 범주를 찾으려고 시도합니다. 통계적으로 말하면, 우리는 총 변동성을 '군간' 변동성과 '군내' 변동성‘between-group’ variability and ‘within-group’ variability으로 나누고 그룹 간의 차이를 해석하는 데 더 집중함으로써 데이터의 '잡음'을 줄이려고 합니다. 그런 다음 이러한 연구 결과에서 도출된 실제적인 의미는 특정 요구에 따라 [서로 다른 그룹에 맞게 커스터마이징]될 수 있습니다.
In person-centred analysis, the attempt is to find the ‘less obvious’ categories on the basis of patterns in the data. Statistically speaking we try to reduce the ‘noise’ in the data by splitting the total variability into ‘between-group’ variability and ‘within-group’ variability, and further concentrating on interpreting the differences between groups. The practical implications derived fromthese research findings can then be customized for the different groups as per their specific needs.

[사람 중심 분석]은 [[전체 표본] 또는 [인구통계학적 특성에 기반한 표본의 부분군]에 대해서 변수 간의 연관성을 찾는 변수 중심 분석]을 보완합니다. 

Person-centred analysis complements variable-centred analysis, in which we look for associations between variables for the entire sample or subgroups in the sample made on the basis of demographic characteristics. 

변수 중심 분석 [3]과 사람 중심 분석 [2]을 비교하는 예는 그림 1을 참조하십시오.
See Fig. 1 for an example comparing variablecentred [3] and person-centred analyses [2].



표 1은 예제 연구 질문에 대한 변수 중심 분석과 사람 중심 분석이 서로 어떻게 비교되고 보완되는지를 보여준다.

Tab. 1 illustrates how variable and person-centred analyses for an example research question compare with as well as complement each other.



문헌의 구체적인 사례를 포함한 사람 중심 분석 수행 방법
How to conduct person-centred analysis including concrete examples fromthe literature


전자 보완 자료에서 찾을 수 있는 본 문서의 부록에는 이 세 가지 방법, 이 방법을 사용한 분석 수행 방법에 대한 실제 단계 및 분석 결과를 해석하는 방법에 대한 세부 사항이 포함되어 있습니다. 자세한 내용에 관심이 있는 독자는 온라인 부록을 참조하시기 바랍니다.
In the Appendix of this paper, which can be found in the Electronic Supplementary Material, we have included details on these three methods, practical steps on how to conduct analyses using these methods, and how to interpret the findings of such analyses. We encourage the readers who are interested in more details to consult the online Appendix.

군집 분석
Cluster analysis


군집 분석 [4]은 [두 개 이상의 변수의 조합]에 대한 점수 또는 결과에 따라 연구 참가자를 함께 그룹화하는 방법입니다. 이 방법은 모든 종류의 샘플 크기에 사용할 수 있습니다. 이는 '그룹 내' 변동성을 줄이고 '그룹 간' 변동성을 극대화하여 데이터의 노이즈를 줄이려고 합니다. 
Cluster analysis [4] is a method in which study participants are grouped together based on their scores or results on a combination of two or more variables. This method can be used with all kinds of sample sizes. It tries to reduce noise in the data by reducing ‘within-group’ variability and maximizing ‘betweengroup’ variability. 

제이콥스 외 연구진[5] 이 연구의 목적은 COLT(학습 및 교육에 대한 교사 개념) 사이의 패턴을 탐구하는 것이었다. 저자들은 COLT의 3가지 차원 즉 교사 중심, 능동적 학습의 감사, 전문적 실무에 대한 오리엔테이션에 대한 참가자들의 점수를 이용하여 클러스터 분석을 실시했다. 이들은 5개의 클러스터로 구성된 클러스터 솔루션을 수용했습니다. 이러한 5가지 COLT 프로파일은 전송기, 조직자, 중간자, 촉진자 및 개념 변경 에이전트로 분류되었습니다. 

Jacobs et al. 2014 [5] The aimof this study was to explore patterns among teachers’ conceptions for learning and teaching (COLT). The authors ran a cluster analysis using the participants’ scores on the three dimensions of the COLT: teacher-centredness, appreciation of active learning and orientationto professional practice. They accepted a cluster solution comprising five clusters. These five COLT profiles were labelled as transmitters, organizers, intermediates, facilitators and conceptual change agents. 

Kusurkar et al. 2013 [2] 본 연구는 학생들의 [동기 부여와 성과] 사이의 관계를 조사하는 것을 목표로 하였다. 본 연구에서는 1~6학년 의대생들의 내적 및 통제된 동기 부여에 대한 점수를 바탕으로 프로필을 만들었다. 고유 저조 제어, 고유 고조 제어, 저 고유 고조 제어 및 저 고유 저조 제어로 분류된 네 가지 프로파일이 발견되었습니다. 그런 다음 이러한 프로파일과 학습 및 성과 결과의 연관성을 조사했습니다. 이러한 프로파일 각각은 이러한 결과와 서로 다른 연관성을 가지고 있었으며, [높은 내인성 낮은 통제] 프로파일은 더 많은 학습 시간, 심층 학습 전략, 우수한 학업 성과 및 낮은 학업 피로 측면에서 최상의 결과를 나타냈다. 사실 [높은 내인성 낮은 통제] 프로파일은 학업으로부터의 높은 소모와 연관지어 [높은 내인성 높은 통제] 프로파일과 차이가 있을 뿐이었고, 이는 연구 결과에 중요한 뉘앙스였다. 이러한 프로필은 모니터링 및 멘토링의 다른 방법이 필요하다는 권고 사항이었습니다. 

Kusurkar et al. 2013 [2] This study aimed to investigate the relationship between student motivation and performance. In this study, profiles of medical students fromyear 1-6 were created on the basis of their scores on intrinsic and controlled motivation. Four profiles were found which were labelled as high-intrinsic low-controlled, high-intrinsic high-controlled, low-intrinsic high-controlled and low-intrinsic low-controlled. The associations of these profiles with learning and performance outcomes were then explored. Each of these profiles had different associations with these outcomes and the high intrinsic low controlled profile had the best outcomes in terms of more study hours, deep learning strategy, good academic performance and low-exhaustion from study. In fact the high intrinsic low controlled profile only differed from the high intrinsic high controlled profile in its association with higher exhaustion from study, which was an important nuance in our findings. Recommendations were that these profiles would need different ways of monitoring and mentoring. 


Orsini et al. 2018 [6] 이 연구의 목적은 치과 학생들의 동기 부여와 그 학업 결과를 조사하는 것이었다. 저자들은 학생들의 본질적이고 통제된 동기를 바탕으로 프로필을 만들었습니다. 
Orsini et al. 2018 [6] The purpose of this study was to investigate dental students’ motivation and its academic outcomes. The authors created profiles of students on the basis of their intrinsic and controlled motivation. 

잠재 클래스 분석
Latent class analysis


잠재 클래스 분석[10](LCA)은 연구에 포함된 표본의 부분군(클래스, 클러스터)을 구성하는 것을 목표로 하는 [탐색적 통계 기법]이며, 이러한 표본의 관측된 지표를 기반으로 합니다. LCA는 범주형 데이터와 함께 사용할 수 있습니다. LCA의 출력output은 [지표의 조합에 기초한 가설적 그룹화hypothesized grouping]입니다. 
Latent class analysis [10] (LCA) is an exploratory, statistical technique that aims at forming subgroups (classes, clusters) of the samples included in a study, based on observed indicators of these samples. LCA can be used with categorical data. The output of LCA is a hypothesized grouping based on a combination of indicators. 

보스카딘 외 연구진[11] 이 연구는 교정조치에 대한 학생을 식별하고 교정조치에 대한 최선의 방법론적 접근법에 대한 합의에 기여하는 것을 목표로 했다. LCA는 임상성과검사에서 의대생 147명의 점수를 분석하는 데 사용되었다. 성능이 낮은 두 개의 하위 그룹을 포함하여 세 가지 뚜렷한 성능 프로파일이 식별되었습니다. [낮은 성과 부분군]을 두 그룹으로 구분하는 것은 의미가 있었는데, 이 두 그룹이 보여준 [성과 지표 집합]이 달랐기 때문이다. 첫 번째 하위그룹은 임상지식과 [모든 종류의 임상기술]에서 모두 결손이 나타났고, 두 번째 하위그룹은 주로 [의사소통 능력]에서 결손이 나타났다. 
Boscardin et al. 2012 [11] This study aimed to identify students for remediation and to contribute to consensus about the best methodological approach for remediation. LCA was used to analyze scores of 147 medical students on the Clinical Performance Examination. Three distinct performance profiles were identified, including two low performing subgroups. Distinguishing two different low performing subgroups had significant implications, as the two groups had low scores on contrasting sets of performance indicators. The first subgroup of students showed deficits in both clinical knowledge and all kinds of clinical skills, while the second subgroup mainly displayed a deficit in communication skills. 

Mak-Van der Vossen et al. 2016 [12] 본 연구의 목적은 의과대학에서 만족스럽지 못한 전문적 행동 평가를 받은 의대생들의 행동 패턴을 식별하고 이러한 패턴의 분류에 사용할 수 있는 변수를 정의하는 것이었다. 잠재적 그룹의 수에 대한 다양한 선택권을 가진 잠재 클래스 모형이 반응 데이터에 적합되었습니다. 이 경우, 응답 데이터는 앞서 문헌 검토에 기초한 템플릿에 요약된 바와 같이 109개의 비전문적 행동 각각을 학생 평가 보고서에서 '관찰됨' 또는 '관찰되지 않음'으로 기술했는지 여부를 나타냈다. LCA는 불만족스러운 전문 행동 보고서를 받은 학생 중 '신뢰성 저하', '신뢰성 저하 및 통찰력 저하', '신뢰성 저하, 통찰력 저하 및 적응성 저하' 등 3개 계층classes을 발표했다. 
Mak-van der Vossen et al. 2016 [12] The purpose of this study was to identify patterns in the behaviours of medical students who received an unsatisfactory professional behaviour evaluation in medical school, and to define a variable that could be used for the categorization of these patterns. A latent class model with various choices for the number of latent groups was fitted to the response data. In this case, the response data indicated whether each of 109 unprofessional behaviours, as earlier summarized in a template based on a literature review, was described as ‘observed’ or ‘not observed’ in student evaluation reports. LCA yielded three classes of students who received unsatisfactory professional behaviour reports: ‘poor reliability’, ‘poor reliability and poor insight’, and ‘poor reliability, poor insight and poor adaptability’. 


Lambe & Bristow 2011 [13] 이 연구의 초점은 학생 수행의 '유형학' 모델을 식별하는 것이었다. LCA는 선행 학업성취도 측정, 의과대학 입학 당시 면접등급, 과정 전반의 후속 성과 측정치를 바탕으로 학생 하위그룹을 만드는 데 사용되었다. LCA는 학생 시험 성과의 '유형'을 나타내는 구별되는 하위집단의 세 가지 클래스 모델을 식별했다. 
Lambe & Bristow 2011 [13] The focus of this study was to identify a model of ‘typologies’ of student performance. LCA was used to make subgroups of students based on measures of

  • prior academic achievement,
  • interview rating at the time of medical school admission and
  • outcome measures of subsequent performance across the course.

LCA identified a three class model of distinct subgroups representing ‘typologies’ of student examination performance. 

 

Q-정렬 분석
Q-sort analysis

Q 방법론은 [주관성] 연구(예: 관점, 아이디어 및 의견)에 적합하다[16–18]. 참가자가 동의에 따라 순서를 매겨야 하는 자극(일반적으로 진술 형식)을 사용한다. 요인 분석의 특별한 형태를 사용하여 연구 대상 주제에 대해 비슷하게 생각하는 참가자를 그룹화한다.
Q-methodology is suitable for the study of subjectivity (e.g. viewpoints, ideas and opinions) [16–18]. It uses stimuli (usually in the form of statements) that participants need to rank order according to agreement. A special form of factor analysis is used to group participants who think similarly about the topic under study. 

Fokkema et al. 2014 [19] 이 연구는 산부인과 레지던트 및 담당 의사의 작업장 기반 평가에 대한 인식을 결정하는 것을 목표로 했다. 36개의 진술과 65명의 참가자들이 있었다. 저자들은 열정, 규정 준수, 노력, 중립성, 회의의 다섯 가지 유형의 인식을 발견했습니다. 이 다섯 가지 프로파일의 기본 문제는 혁신의 의도된 목표, 적용 가능성 및 실제 영향에 대한 아이디어였습니다. 그들은 이 연구가 '동료들이 혁신에 대한 서로의 반응을 이해하는 데 도움이 될 수 있다'고 느꼈다. 
Fokkema et al. 2014 [19] This study aimed to determine the perceptions of obstetrics-gynaecology residents and attending physicians about workplacebased assessment. There were 36 statements and 65 participants. The authors found five types of perceptions: enthusiasm, compliance, effort, neutrality, and scepticism. The issues underlying these five profiles were ideas about intended goals of the innovation, its applicability, and actual impact. They felt that the study ‘may help colleagues understand one another’s responses to an innovation’. 

Dotters-Katz et al. 2016 [20] 본 연구는 미국 의대 졸업생들의 교육 태도와 동기 부여에 초점을 맞췄다. 47개의 문장이 사용되었다. 편의 표본추출을 통해 '다양한 전문분야 및 대학원생 수준의 전공의 107명'이 연구에 참여했으며, Q 정렬과 사후면접은 디지털 방식으로 진행됐다. 이들의 분석 결과 열정, 거부감, 보상이라는 세 가지 프로파일이 나왔습니다. 이러한 연구결과는 '교육을 촉진하고 교육생들의 교육 동기를 개선하는 태도 강화 및 장려'를 위한 교사로서의 레지던트 프로그램 설계 변경 사항을 알리기 위해 사용되었다. 
Dotters-Katz et al. 2016 [20] This study focused on US medical graduates’ attitudes and motivation for teaching. Forty-seven statements were used. Through convenience sampling, 107 residents ‘from a wide variety of specialties and postgraduate year levels’ joined the study, and the Q-sorting and post-interview were done digitally. Their analysis yielded three profiles: enthusiasm, reluctance and rewarded. These findings were used to inform modifications in the design of resident-as-teacher programmes that ‘reinforce and encourage attitudes that promote teaching as well as improve trainees’ motivation to teach’, 


Berkhout 등[21] Berkhout 및 동료들은 임상 환경에서 학생들의 자기조절 학습 행동 패턴을 찾는 것을 목표로 했다. 그들은 이론과 학생 인터뷰를 통해 52개의 진술문를 만들었습니다. 서로 다른 병원의 11개 임상실습에 속해 있는 4명의 학생이 진술서를 분류했다. 온라인 데이터 수집 절차를 사용했으며 '실시간' 분류후post-sorting 면접은 없었다. 그들의 분석은 참여적이고, 비판적으로 기회주의적이며, 불확실하고, 절제되고, 노력적인 다섯 가지 학습 패턴으로 이어졌다.

Berkhout et al. 2017 [21] Berkhout and colleagues aimed to find patterns in students’ self-regulated learning behaviours in the clinical environment. They created 52 statements from theory and student interviews. Four students in 11 different clinical clerkships, in different hospitals, sortedthe statements. An online data collection procedure was used and there was no ‘live’ post-sorting interview. Their analysis led to five patterns of self-regulated learning behaviour, which they called engaged, critically opportunistic, uncertain, restrained and effortful.

 

 

사람 중심 분석을 위한 세 가지 방법의 비교, 장점 및 단점
Comparisons, advantages and disadvantages of the three methods for person-centred analysis


세 가지 분석 방법의 구체적인 장점과 단점은 표 3에 비교 요약되어 있다.
The specific advantages and disadvantages of the threeanalysismethodsarecomparedandsummarized in Tab. 3.



개인 중심 분석의 한계 및 윤리적 고려 사항
Limitations and ethical considerations of personcentred analysis

표본에서 발견되는 부분군은 [문화적으로 민감하고 맥락 의존적culturally sensitive and context-dependent]일 수 있습니다. 따라서 이 분석의 프로파일과 결과는 다른 모집단으로 일반화하기가 어려울 수 있다. 실제 개입을 설계하는 데 사람 중심 분석 결과를 사용하려면 [지역 대상 모집단local target population]의 프로파일 구조를 조사하는 것이 좋습니다. 사람 중심 분석은 변수 중심 분석을 대체하는 것이 아니라 보완 분석입니다. [특정 집단에 대한 오명stigmatization]을 남길 수 있다는 게 사람 중심 분석의 위험이다. 이러한 위험을 최소화하려면 다음과 같은 것이 중요합니다. 
Subgroups found in samples may be culturally sensitive and context-dependent. The profiles and findings from this analysis could thus be difficult to generalize to other populations. To use the results of personcentred analyses for designing practical interventions, it is better to investigate the profile structure in the local target population. A person-centred analysis is not a replacement for variable-centred analysis, but a complementary analysis. A risk of person-centred analysis is that it can lead to stigmatization of certain groups. To minimize this risk, it is important that: 

A. 개인 중심 분석을 사용하는 연구원들은 윤리 승인을 신청하고 연구 결과를 발표하는 경우 다음 작업을 수행합니다.
A. Researchers using person-centred analysis always do the following while applying for ethical approval and publishing their research:

– 이러한 분석을 수행한 배경과 근거를 설명합니다.
– Explain the background and rationale for conducting such an analysis;

– 분석 결과를 어떻게 해석해야 하는지 설명하며, 특히 상황에 유의해야 합니다.
– Explain how the results of this analysis should be interpreted, especially keeping in mind its context; and

– 이러한 연구 결과는 특정 그룹에 오명을 남기지 않고 사용자 개입을 맞춤화하는 건설적인 방법으로 사용되어야 한다고 선언합니다.
– Make a declaration that the results of such research should be used in a constructive way to customize interventions and not to stigmatize certain groups.

B. 윤리검토위원회는 항상 다음 사항을 고려한다.
B. Ethical Review Boards always consider the following:

– 연구진이 사람 중심 분석을 사용할 수 있는 충분한 근거를 제시했습니까?
– Have the researchers provideda goodrationale for using person-centred analysis?

– 연구자들이 실제로 생성된 프로파일을 맞춤형 또는 맞춤형 개입에 사용하고 있습니까?
– Are the researchers actually using the generated profiles for tailor-made or personalized interventions?

– 연구원들은 이 분석 결과를 어떻게 처리할 것인지 명확히 설명했습니까?
– How have the researchers clarified how they will treat the findings from this analysis?

 

 

 

 

 


 

Methodological details of cluster, latent class and Q-sort analyses

Cluster analysis1 - This analysis can be done quite easily using SPSS. Two ways of conducting this analysis are K-means clustering and hierarchical clustering. In SPSS, an additional ‘Two Step’ clustering procedure can be used to suggest an optimal cluster number.

K-means clustering is the most commonly used data clustering method. The methods sorts cases in a predefined number of clusters. The number of clusters can be based on theoretical (existing literature) or practical (applicability) considerations. Initial k-cluster centers are selected and then iteratively refined assigning each data point to its closest cluster-center and updating each cluster-center to be the mean of its constituent data points. An acceptable cluster solution should explain at least 50% of the variance in the variable scores and have an incremental effect over the cluster solution with (k-1) groups.

Hierarchical clustering is an approach in which all data points are clustered hierarchically until only one cluster is left. The optimal cluster solution is decided on the basis of a hierarchical diagram called a dendrogram, a taxonomy or hierarchy of data point. This is a convenient representation which answers questions such as: ‘How many useful groups are present in this data?’ and ‘What salient interrelationships are present?’.2

Hierarchical clustering techniques are fundamentally different from K-means clustering. K-means tries to find compact clusters, where cluster members are similar (as far as possible). Hierarchical clustering leads to a tree of clustering, where it remains arbitrary at what level you want to set the borders between clusters.

After using one of the cluster methods, the cluster solutions can be tested for stability using a double split cross validation procedure in which the sample is divided into two and the cluster solution with the same cluster centers is tested in each sample. For a stable cluster solution, the Cohen’s kappa values, derived from this procedure, should be as close to 1 as possible.3

For use on categorical data, this data needs to be treated first (e.g. with Homogeneity analysis using alternating least squares - HOMALS).4

Practical steps for K-means cluster analysis:
- Prepare your data file in SPSS just like for any other analysis.
- Compute standardized scores (z-scores) for the variable which you would like to use to make the clusters.
- Exclude outliers from the data as cluster analysis is sensitive to outliers.
- Use the command “Classify” and enter the number of clusters (“n”)that you would like to test (start with 2 and then go on with 3 and more), choose “save assigned cluster”.
- Then repeat the process with “n+1”, “n+2”, “n+3” clusters.
- Check for the percentage of variance explained by the 2-cluster, 3-cluster, 4-cluster, etc. solutions. Using a benchmark of at least 50% variance explained, choose the cluster that explains a significant amount of variance The optimal number of clusters can be selected on the basis of statistical parameters and interpretability.
- Once you have chosen a cluster solution, create two new files splitting your sample into two random subsamples. Run the clustering analysis on each subsample and see if you get similar clusters in both. Compute the Cohen’s kappa for checking the stability of the cluster solution.
- Use cluster membership as the independent variable and run t-tests or Analysis of Variance or Multiple Analysis of Variance for the dependent variables of interests to see the relationship of the different clusters with the outcome measures.

Interpretation of findings:

- Try to understand the meaning of the clusters based on your hypothesis, theoretical framework and the scores on the variables used for clustering.
- If possible label the clusters (without being judgemental) and provide a description of each cluster so that your interpretation becomes clear to the readers or practitioners.
- Try to understand how the cluster characteristics are associated with outcome variables.
- Before ascribing any meaning to the clusters, it is important to establish the cluster stability mentioned above.
- Be cautious in projecting your findings to other contexts and cultures.

 

Latent Class Analysis5 – This is also called Latent Partition Analysis (LPA). This is done in a manner that the samples in the study are homogeneous within, and heterogeneous between the formed subgroups. It is a flexible method, as the best fitting model is established by testing several combinations of numbers of classes. This can be done using the software programmes R6 or Latent Gold7.

LCA can be used if there exists a still-unknown, so called ‘latent’ variable that can be used to make subgroups of the samples under investigation. This newly emerging variable can be identified as a distinguishing factor for the content of the subgroups. The researchers then determine if the distinguishing factor has practical relevance, and attribute a meaningful description and name to it.

LCA has an advantage over other clustering methods because it can reveal patterns, i.e. combinations of indicators within a sample, that cannot easily be detected by other methods. LCA is a probabilistic method. It means that there is no one-to-one relationship between a class and the occurrence of an indicator within that class, but each class is composed of a subgroup that is more likely to display a certain pattern than the subgroup belonging to a different class. A similar classification process is applied in diagnosing a disease: The presence or absence of a certain symptom in a patient (indicator in a sample) does not always lead to one specific diagnosis (class), but a certain combination of symptoms (pattern) makes this diagnosis more likely. Thus, instead of making a black-and-white decision on the subgroups of samples as cluster analysis does, LCA defines the probability of certain patterns in the samples, and thus sketches a more attenuated picture.

LCA has the possibility of defining ‘prototypes’ in each subgroup. To achieve this, LCA specifies for each class a probability of a sample belonging to that class. The probabilistic statement indicates the certainty of the assignment of a sample, based on a certain combination of indicators, to that class. In particular, samples that have a high, say >90%, probability of belonging to a certain class could be considered as prototypes of that class.

Practical steps for Latent Class Analysis:
- Conduct thematic or content analysis of your descriptive data.
- Convert the categorical data into binary response data, e.g. presence/absence of the indicator in each sample (SSPS or Excel file).
- Put your binary data into one of the abovementioned software programmes.
- Test different numbers and properties of classes.
- Determine the best fit for the number and properties of classes by considering the following:
  · the statistical information indicating between class differences and within class homogeneity.
  · the practical relevance of the content of the classes.
  · the number of cases per class.
- Define prototypes for each class by taking the samples that have the highest probability to belong to that class (e.g. the top 10).
- Provide the prototypes of each class with narrative information from your descriptive data to generate profile descriptions for each class.

Interpretation of findings:

- Try to understand the meaning of the classes based on the practical relevance of the content of the classes and the descriptions of the prototypes.
- Identify the latent variable that distinguishes the classes from each other, and give this variable a meaningful name.
- Be aware that the samples are clustered into hypothetical patterns (the classes) based on the chance that they display a combination of indicators.
- Be cautious in projecting your findings to other contexts and cultures.
 

 

Q-sort analysis8-10- Although there is considerable flexibility in Q-methodology, there are some common practices. A Q-methodological study starts with the development of a set of statements on a topic (the Q-set). This set of statements can be created as a result of interviewing stakeholders, looking at teaching evaluations, theories and literature, focus groups, etc. This initial Q-set is often piloted and refined before use in a study.

Each participant sorts statements in a Grid (the Q-sort), with most statements placed in the middle, and the fewest placed at the edges (i.e. bell-curve shaped). These edges have 'strongly agree' or 'very important' on one side, and 'strongly disagree' or 'not at all important' on the other. This ranking process is called ‘Q-sorting’ and forces participants to make choices based on their own opinions and experiences. Usually the Q-sorting procedure is followed by a post-sorting interview or survey questions. In this post-sorting (often semi-structured) interview, or in some open survey questions, the participant elaborates on the reasons and stories behind the Q-sort, to enrich the data collected from the Q-sort.

Q-sorts are then compared to identify groups of individuals (profiles) who have similar attitudes on the subject of interest. This is often done using using Q-sort analysis software called PQmethod.11 The ranking scores are analysed statistically to lead to different factors10 using Q-sort analysis software. The number of profiles are dependent on how the participant scores 'load' onto a specific profile, similar to factor analysis. The qualitative data can aid the decision for the number of factors/profiles. The profiles are finalized through a combination of statistical, methodological and qualitative data analysis from a post Q-sort interview or survey questions. A description of the prototype of each profile is constructed by the researchers while constantly consulting the data.

Practical steps for Q-sort analysis:
- Develop a set of statements from the literature and pilot them with some study participants, refine them and your Q-set will be ready. 
- Select participants using theoretical sampling strategies, in order to include participants with diverse viewpoints.
- Ask participants to sort the statements into the Q-grid, and ask participants to elaborate on their choices.
- Enter the Q-sort of each participant into the abovementioned software and run the Q-sort analysis.
- Check the different solutions for predetermined statistical criteria. At the minimal , you should take into account the percentage of variance explained by different solutions, eigenvalues, and number of Q-sorts per factor, total number of Q-sorts loading significantly on one factor, and Q-sorts loading on more than one factor or no factor at all.
- Check the different solutions for methodological criteria: are the factors coherent, differentiated and recognizable?
- Check if the qualitative data (from post-sorting interview) corroborates the factor solution.
 
Interpretation of findings:
- Try to understand the meaning of the profiles based on your research question and theoretical framework.
- Combine the result from the factor analysis with the answers the post-sorting questions to create a rich and accurate profile description.
- Label the profiles to capture their essence and improve the reader’s capability of comparing and contrasting the findings.
 

 

 

 



10. Vermunt JK, Magidson J. Latent class cluster analysis. In: HagenaarsJ,McCutcheonA,editors. Appliedlatentclass analysis. Cambridge: Cambridge University Press; 2002. pp. 89–106.


Perspect Med Educ. 2021 Aug;10(4):245-251.

 doi: 10.1007/s40037-020-00633-w. Epub 2020 Dec 7.

'One size does not fit all': The value of person-centred analysis in health professions education research

Rashmi A Kusurkar 1 2Marianne Mak-van der Vossen 3 4Joyce Kors 3 4Jan-Willem Grijpma 3 4 5Stéphanie M E van der Burgt 6Andries S Koster 7Anne de la Croix 3 4

Affiliations collapse

Affiliations

  • 1Amsterdam UMC, Faculty of Medicine, Vrije Universiteit Amsterdam, Research in Education, Amsterdam, The Netherlands. R.Kusurkar@amsterdamumc.nl.
  • 2LEARN! Research Institute for Learning and Education, Faculty of Psychology and Education, Vrije Universiteit Amsterdam, Amsterdam, The Netherlands. R.Kusurkar@amsterdamumc.nl.
  • 3Amsterdam UMC, Faculty of Medicine, Vrije Universiteit Amsterdam, Research in Education, Amsterdam, The Netherlands.
  • 4LEARN! Research Institute for Learning and Education, Faculty of Psychology and Education, Vrije Universiteit Amsterdam, Amsterdam, The Netherlands.
  • 5LEARN! Academy, Faculty of Behavioural and Movement Sciences, Vrije Universiteit Amsterdam, Amsterdam, The Netherlands.
  • 6Center for Evidence Based Education, Amsterdam UMC-location AMC, Amsterdam, The Netherlands.
  • 7Department of Pharmaceutical Sciences, Utrecht University, Utrecht, The Netherlands.
  • PMID: 33284407
  • DOI: 10.1007/s40037-020-00633-wAbstractKeywords: Person-centred analysis; Personalized approach; Research method.
  • Health professions education (HPE) research is dominated by variable-centred analysis, which enables the exploration of relationships between different independent and dependent variables in a study. Although the results of such analysis are interesting, an effort to conduct a more person-centred analysis in HPE research can help us in generating a more nuanced interpretation of the data on the variables involved in teaching and learning. The added value of using person-centred analysis, next to variable-centred analysis, lies in what it can bring to the applications of the research findings in educational practice. Research findings of person-centred analysis can facilitate the development of more personalized learning or remediation pathways and customization of teaching and supervision efforts. Making the research findings more recognizable in practice can make it easier for teachers and supervisors to understand and deal with students. The aim of this article is to compare and contrast different methods that can be used for person-centred analysis and show the incremental value of such analysis in HPE research. We describe three methods for conducting person-centred analysis: cluster, latent class and Q‑sort analyses, along with their advantages and disadvantage with three concrete examples for each method from HPE research studies.

이론을 명시적으로 만들기: 의학교육 연구자는 이론과의 연계성을 어떻게 기술하는가(BMC Med Educ, 2017)
Making theory explicit - An analysis of how medical education research(ers) describe how they connect to theory
Klara Bolander Laksov1,2*, Tim Dornan3,4 and Pim W. Teunissen4,5

 

 

배경
Background


10년 이상, 명확한 이론적 근거가 결여된 의대 교육 연구 간행물에 대한 우려의 표현이 있어왔다[1–5]. 의학 교육에서 이론의 활용이 증가하는 징후[6]가 있지만, 문제를 식별하는 것뿐만 아니라 문제를 더 잘 이해하고 해결하는 것이 흥미롭다. 이 논문의 목적은 과거에 사람들이 어떻게 해왔는지 살펴보고 다른 사람들이 미래에 어떻게 할 수 있는지를 제시함으로써 연구자들이 이론을 더 잘 활용할 수 있도록 돕는 것이다. 우선, 우리가 '이론'이란 단어로 무엇을 의미하는지 더 자세히 설명해야 합니다. 
For over a decade, there have been expressions of concern about medical education research publications lacking an explicit theoretical basis [1–5]. Although there are signs of an increase in use of theory in medical education [6], it is of interest to not only identifying the issue, but to better understand and remedy it. The aim of this paper is to help researchers make better use of theory by examining how people have done so in the past and suggesting how others might do so in the future. First, this requires an elaboration of what we mean by theory. 

이론의 일반적인 설명은 [어떤 현상을 설명하기 위한 아이디어의 체계]라는 것이다. 이론에 대한 이러한 관점은 생물 의학 및 물리 연구에서 종종 받아들여지는 견해와 일관되며, 이론과 반복적으로 시험될 수 있는 것으로 명확하게 연결되어 있어 모든 경우에 활동을 안내합니다. 
A general description of theory is that it is a system of ideas intended to explain a phenomenon. This perspective on theory is consistent with the view that is often taken in biomedical and physical research and is clearly linked to theory as something that can be repeatedly tested, and hence guide activity in all cases. 

그러나 의대교육의 이론은 생의학과 다른 시각으로 볼 필요가 있다. [7] [입증의 필요성]을 강조하기 보다는, 출발점은 조사가 수행된 특정 렌즈를 가지고 [현상에 대한 서로 다른 설명을 둘러싼 과학적 대화에 참여]하는 것이며, 이는 이론 생성[8]을 초래할 것이다. 
However, theory in medical education needs to be viewed as different from the biomedical view. Rather than emphasising an imperative of proof [7], the point of departure is the participation in scientific dialogue around different explanations of phenomena with a specific lens through which the inquiry was conducted, which will result in theory generation [8]. 

리브스와 동료(ibid.)는 이론을 다음과 같이 정의했다: [의미 있는 전체]로서 소통되는 일련의 이슈에 대한 조직화된, 일관성있는, 체계적인 설명
Reeves and colleagues (ibid.) define theory as: an organized, coherent, and systematic articulation of a set of issues that are communicated as a meaningful whole”.

교육에서 이론의 개념화는 역사적으로 [20세기 초기의 고수준의 이론에서부터, 1960년대의 중범위 이론, 1900년대 말까지 개인실천 이론에 이르기까지] 추상화abstraction의 여러 수준에 따라 연속체상에 배치될 수 있다.
The conceptualisation of theory in education can be placed historically during the 20th century [9] at a continuum that covers different levels of abstraction ranging from high level theories at the turn of the 20th century, to middle range theories in the 1960s, and personal practice theories by the end of the 1900s.



[고차원 이론high level theories]은 시스템의 근본적인 변수를 제시하고, 마르크스주의 이론처럼 높은 수준의 추상성을 포함합니다. 예를 들어, 경험적 연구나 직접 이끌지 않는 범위 내에서 '설명할 대상과 무관함'(사회적 투쟁)이다. 이러한 수준의 이론은 실증적 연구empirical research로부터 유래한 것은 아니며, (시험 가능한 아이디어나 가설을 통해) 실증적 연구로 직접 이끌지lead는 않지만, 경험적 조사empirical enquiry를 위한 지침guidance은 제공할 수 있습니다.
High level theories state the fundamental variables of systems and include a high level of abstractness, like Marxist theory, which are ’independent of the thing to be explained’ (social struggle, for example) to the extent that they might not arise from empirical research or lead directly, via testable ideas or hypotheses, to empirical research, however it can provide guidance for empirical enquiry. 

반세기 전, Merton(1968)은 [중간 범위의 이론]이 있다는 아이디어를 도입했다. [중범위 이론]이란 다음의 사이에 놓여있다 - [일상적 연구에서 풍부하게 발전하는, 작지만, 필요한 작업 가설들]과 [사회 행동, 사회 조직, 그리고 사회 변화의 모든 관찰된 획일성을 설명할 통일 이론을 개발하기 위한 전면적인 체계적 노력]
In a seminal paper half a century ago, Merton (1968) introduced the idea that there are middle range theories – theories that lie between the minor but necessary working hypotheses that evolve in abundance during day-to-day research and the all-inclusive systematic efforts to develop a unified theory that will explain all the observed uniformities of social behavior, social organization, and social change ([10]p. 39.). 

가장 자세하고 개별적인 수준에서 '개인적 이론'[12]은 우리 모두의 일상적인 활동을 안내합니다. 예를 들어, 학생들의 성과에 대한 피드백을 제공하는 방법에 대한 우리의 선택은 대부분 성과를 전달하고 평가하는 방법에 대한 매우 개별적인 이론에 의해 이끌어집니다. 이 이론은 [비록 학생과의 관계에서 무엇을 어떻게 말해야 하는지만 말해준다 하더라도],(경험적 관찰과 쌍방 관계에 있는) 개인의 이론personal theory이다.  
At the most detailed and individual level, ’personal theories’ [12] guide the day-to-day activities of every one of us. Our choice of how to feedback on student performance, for example, is most often guided by a highly individual theory of how to communicate and appraise performance. It is a personal theory, which is in a two-way relationship with empirical observations, even if it only tells us when to say what and how in relation to the student. 

교육 분야에서 Donald Schön(1991)의 연구는 이른바 사용중인 이론(theory-in-use)에 초점을 맞췄다. 이는, 교사가 일상적인 교육에 적용하는 것이다. 또한 이것이 '옹호된 이론espoused theory'와 어떻게 관련되는지를 보았는데, 이는 피드백 및 커뮤니케이션 패턴에 대한 미드레인지 이론일 수도 있고, 교수개발 과정에서 학습했을 수 있는 과정 설계가 관련될 수 있습니다.
In education, Donald Schön’s (1991) research has focused on these so called theories-inuse, that teachers apply in everyday teaching, and how they relate to their ’espoused theory’, which could be midrange theories of feedback and communication patterns together with course design that might have been learned in a faculty development course.

이론 개발에 대한 기여는 학계 커뮤니티가 '실제적 목적적합성을 달성하기 위해 얼마나 효과적으로 연구 프레임워크를 통합하느냐'에 달려 있기 때문에, 이 논문의 초점은 중범위 이론을 어떻게 명시할 수 있는지에 있다[13]. 
The focus of this paper is on how middle-range theory can be made explicit, since the contribution to development of theory depends on how effectively the community of scholars ‘integrates inquiry frameworks to achieve practical relevance’ [13]. 

어떤 패러다임이든, 연구의 이론적 가정에 대해 명확히 하는 것은 가치를 더한다. 사람들이 의학 교육 연구를 더 잘 이론화해야 한다고 요구할 때, 그들은 연구자들에게 그들의 연구를 어떤 명시적인 이론적 틀 안에서 포지셔닝하고, 그들이 그렇게 한 방법과 이유를 정당화할 수 있고, 그 틀에서 도출된 통찰력을 사용하여 경험적 관찰을 해석할 수 있도록 요청하고 있다.
Whatever one’s paradigm, being clear about the theoretical assumptions that underly research adds value to it. When people call for medical education research to be better theorised, they are asking researchers to

  • position their work within some explicit theoretical framework,
  • be able to justify how and why they did so, and
  • use insights derived from the framework to help interpret empirical observations.

철학적 고려에서 좀 더 실용적인 고려로 넘어가면서, Bordage (2009)는 교육 연구자들이 [개념적 체계conceptual framework]를 '문제나 연구에 대한 사고 방식, 또는 복잡한 사물이 어떻게 작용하는지를 표현하는 방법'으로 어떻게 사용할 수 있는지를 설명했다. 이러한 개념적 프레임워크는 연구자들이 특정한 방법으로 문제를 검토하도록 유도하거나 시험할 가설을 생성할 수 있으며[14] 따라서 이론과 경험적 데이터 사이의 연관성에 있어 매우 중요하다. 그것들은 그들 자신의 연구나 타인의 연구로부터 발생할 수 있고 개념적 체계는 특정 이론에서 도출될 수 있다. 한 이론이 많은 다른 연구자들에 의해 채택된다면, 그 분야는 비로소 개별 연구가 진행되었던 조건을 넘어 전이될 수 있는transferable 일관된 연구결과집합체body of work를 구축하게 된다.
Moving from philosophical considerations to more practical ones, Bordage (2009) explained how education researchers can use conceptual frameworks as ‘ways of thinking about a problem or study, or a way of representing how complex things work.’ Such conceptual frameworks may guide researchers to look at problems in particular ways or generate hypotheses to be tested [14] and are thus crucial in the linkage between theory and empirical data. They may arise from their own or other people’s research and the conceptual framework can be derived from a specific theory. When theories are adopted by many different researchers, they help the field build up a coherent body of work, which is transferable beyond the conditions in which individual studies were conducted.

교육 연구 방법론 교사로써, 석사과정 학생, 박사과정 학생, 의대신입학 연구자들이 이론에 관여하기 어려운 주제라는 것을 꾸준히 발견해 왔습니다.

As teachers of education research methodology, we have consistently found that Masters students, PhD students, and new medical education researchers find theory a difficult topic to engage with.

방법
Methods


개념적 지향
Conceptual orientation


이 연구는 사회적 구성주의 접근법을 따랐다. 사회구성주의social constructivism는 집단이나 공동체가 그들의 [상호작용의 결과로 공유된 의미를 창출한다]고 가정한다. 이러한 [공유된 의미shared meaning]는 저널이나 직책, 직책과 같은 '인공물artefacts'이라 불리는 사물로부터 기인할 수 있으며, 이것들이 모여 [공유된 문화shared culture]를 이룬다

A social constructivist approach [15] guided our research [16–18]. Social constructivism assumes that groups or communities create shared meaning as a result of their interactions. These shared meanings can be attributed to things, which are called ’artefacts’, such as a journal or a position or title, and together contribute to a shared culture.

이번 프로젝트에서는, [출판물]을 의학교육계의 협업으로 제작된 인공물artefacts으로 보았다는 점에서 본 연구는 "사회적social"이었다. 한편, 세 저자 사이의 데이터 분석과 이론 개발의 반복적인 과정을 통해 우리가 데이터로 포함시킨 출판물에 개념적 프레임워크에 대한 연결이 어떻게 형성되고 사용되는지에 대한 해석을 구성할 수 있었다는 점에서 "구성주의적constructivist"이였다. 

In this project, the research was social in that we regarded publications as artefacts produced by the collaborative efforts of the medical education community. It was constructivist in that an iterative process of data analysis and theory development between the three authors allowed the construction of an interpretation of how connections to conceptual frameworks were formed and used in the publications we included as data. 

데이터 수집 절차
Data collection procedure


이 프로젝트의 데이터 집합은 의학 교육 분야에서 영향력이 있다고 여겨지는 발표된 논문 집합으로 구성되었습니다. 
The dataset for this project consisted of a set of published papers that were deemed influential in the medical education domain. 

선정된 연구진은 연구 pp주제, 성별, 지리뿐만 아니라 자체 연구에 일반적으로 적용되는 방법론적 선호도 변화에서 차이를 보였다(표 1 참조). 그들은 다음과 같은 요청을 받았다. 
The selected researchers differed in their variation of methodological preferences usually applied in their own research as well as research topic, gender and geography (see Table 1). They received the following request:

의학 교육 분야에서 영향력이 있다고 생각되는 약 5개의 연구 논문을 지명해 주십시오. 각 논문마다 왜 그것을 선택했는지에 대해 몇 개의 문장을 써주세요. 
Please nominate approximately 5 research papers you consider as influential in the field of medical education. For each paper, please write a few sentences saying why you chose it.

"영향력있는"이라는 단어의 의미를 우리는 "[의학 교육 관행이나 연구에서 전반적인 영향]을 미쳤거나, 혹은 [응답자 개인의 연구 또는 교육 관행]에 영향을 미쳤던 연구 논문"으로 명확히 했습니다. 
By influential we clarified that it could be “research papers that have, in your opinion, impacted medical education practice or research in general or your own research or educational practice”. 

분석
Analysis


주요 분석을 안내하는 4가지 주요 질문의 공식화:
the formulation of four main questions to guide the main analysis:

1) "이 논문의 출발점starting point은 무엇이었습니까?" 그 출발점은 예를 들어 실용적 문제 또는 이론적 문제 또는 이전 연구의 발견일 수 있습니다.
1) ”What was the starting point of this article?” The starting point could be, for instance, a practical or theoretical problem, or the findings of previous research.

2) "문제에 접근하기 위해 어떤 개념적 체계conceptual framework를 사용하였는가?" 이것이 우리가 이론적인 개념이나 프레임워크와 다소 명백한 연관성을 볼 수 있는 곳입니다.
2) ”What conceptual framework was used to approach the problem?”.This is where we could see a more or less explicit linkage to theoretical concepts or frameworks.

3) "이 논문은 방법론적으로 문제를 어떻게 다루었는가?" Guba & Lincoln의 [20] 유형 방법론적 접근법이 우리의 분석을 이끌었다.
3)”How did the paper address the problem methodologically?”;Guba & Lincoln’s [20] typology of methodological approaches guided our analysis.

4) "이 기사가 이론에 어떤 기여를 했는가?"
4)”How did the article contribute to theory?”. 

 

1. 저자들의 출발 지점은 무엇이었습니까?
a) 문제는 어디에서 발생하였는가(예: 실제 문제, 이전 논문, 이론 문제, 이론에 근거한 가설)?
1. What was the authors’ point of departure?
a) Where did the problem come from (e.g. practical issue, previous papers, theoretical problem, hypothesized based on theory)?

2. 저자들은 어떤 경로를 택했는가?
a) 이슈는 어떻게 문제화되고 개념화되었는가?
b) 질문 1과 2의 답변은 서로 어떤 관련이 있습니까?
c) 저자들은 자신의 문제를 다루기 위해 어떤 방법론을 사용했으며, 선택권을 얼마나 명확히 고려했는가?
2. What route did the authors take?
a) How was the issue problematized and conceptualized?
b) How do the answers to questions 1 and 2 relate to each other?
c) What methodology did the authors use to tackle their problem and how explicit were they in considering their options?

3. 저자들은 어디에 도착했나요?
a) 조사 중인 문제를 해결하는 데 어떻게 기여했다고 제안했습니까?
b) 이 과학적 여정의 여러 요소들 사이의 명백한 관계는 무엇인가?
3. Where did the authors arrive?
a) How did they suggest they had contributed to addressing the problem under investigation?
b) What is the apparent relationship between the different components of this scientific journey?

 

결과
Results

초청연구가 15명 중 남성 6명, 여성 4명 등 10명이 총 41편의 논문을 내정했다. 두 명은 초대를 거절했고 세 명은 응답하지 않았다. 논문은 추가 파일 1: 부록 1에 나열되며 경험적 논문부터 검토, 개념적 논문 및 사설까지 다양합니다. 
Ten of the 15 invited researchers, six men and four women, nominated a total of 41 papers. Two declined the invitation and three did not reply. The papers are listed in Additional file 1: Appendix 1 and ranged from empirical papers, to reviews, conceptual papers and editorials. 

근접 탐사
Close-up exploration


여기서 연구자들은 전공의들이 실제 경험을 통해 배우는 방법 등 몇 가지 [구체적인 현상을 설명하는 것]을 목표로 했다. [국지적 이슈]에 의해 촉발되거나, [다른 연구에서 제기된 이슈]를 바탕으로, 그들은 이러한 [현상에 대한 현재의 이해를 더할 필요성이나 기회]를 포착하였다. 이를 통해 그들은 구체적인 질문을 하고, 연구 계획을 결정하고, 연구를 착수할 수 있었다. 중범위이론은 이들이 질문, 방법, 연구 진행 환경 등을 선택할 수 있도록 도움으로써 기여했고, 그 결과 관심 주제에 대한 보다 명확하고 참신한 이해를 쌓을 수 있었다.
Here, researchers aimed to explain some specific phenomenon, such as how residents learn from practical experience. Either instigated by a local issue or issues raised in other studies, they recognized a need or opportunity to add to the current understanding of this phenomenon. This allowed them to formulate a specific question, decide on a research plan, and set out to do the research. Middle range theory contributed to this process by helping them choose questions, methods, and a setting in which to conduct the research, which would contribute to building a clearer or novel understanding of the topic of interest. 

Example 1

이 범주의 연구 예는 Lingard 외 연구진들의 연구이다. (2004). Lingard와 동료[21]는 수술실의 커뮤니케이션 장애를 조사하면서 이전 연구에서 비롯된 문제를 출발점으로 삼았다.
An example of a study in this category is a study by Lingard et al. (2004). Examining communication failures in operating rooms, Lingard and colleagues [21] took as their point of departure an issue stemming from previous research:

최근의 증거는 오류로 인한 부작용은 입원환자 환경에서 수용할 수 없을 정도로 높은 비율로 발생하며 팀 구성원 간의 비효율적이거나 불충분한 의사소통이 종종 기여 요소임을 시사한다(330페이지). 
Recent evidence suggests that adverse events resulting from error happen at unacceptably high rates in the inpatient setting and that ineffective or insufficient communication among team members is often a contributing factor. (p.330) 


의료 분야에서 팀워크와 안전의 관계, 연구 방식의 동향에 관한 문헌의 증가 추이를 언급함으로써, 지식의 격차를 확인했다.
By referring to a growing body of literature regarding the relationship between teamwork and safety in health care, and trends in the way it had been studied, the route taken by Lingard et al. identified a gap of knowledge:

이러한 모델은 효과적인 팀 기능에서 의사소통의 중요성을 강조해 왔지만, 다차원성은 커뮤니케이션의 개별 변수에 대한 깊은 관심을 배제합니다.
While these models have reinforced the importance of communication in effective team function, their multidimensionality precludes in depth attention to the individual variable of communication. (p.330) 


저자들은 "표준화와 팀 통합의 부족"이라고 공식화한formulated 수술실의 특정 맥락에서의 의사소통에 관한 연구 결과를 언급하며 계속했다. 여기서, 그들은 항공 산업에서의 의사소통에 대한 사고 방식(즉, 다른 분야에서의 이론화)을 언급함으로써, 당면한 이슈를 프레이밍(의사소통 실패)하였고, 문제 극복을 위한 개입을 선택하였다.
The authors continued by referring to the findings from studies on communication in the specific context of operating rooms, formulated as ”lack of standardization and team integration”. Here, they referred to the ways of thinking about communication in aviation industry (i.e. theoretization from another field) both as a way to frame the issue at hand (communication failures) and to choose interventions to overcome the problem:

OR 팀 커뮤니케이션의 기술된 약점에 대한 하나의 잠재적 해결책은 항공 산업에서 체계적인 비행 전 팀 커뮤니케이션을 위해 현재 사용 중인 체크리스트 시스템을 조정하는 것이다… 우리는 세심하게 조정된 체크리스트 시스템이 OR 팀에서 더 안전하고 효과적인 커뮤니케이션을 촉진할 수 있을 것으로 예상한다. (p.330)
One potential solution to the described weaknesses in OR team communication is to adapt the checklist system currently in use for systematic preflight team communications in the aviation industry … we anticipate that a carefully adapted checklist system could promote safer, more effective communications in the OR team. (p.330)


방법 섹션은 논문 초기에 식별된 방법론적 격차에 맞춰 조정되었으며 관찰된 커뮤니케이션의 현장 노트를 분석하기 위해 이론 기반의 프레임워크를 사용했다. 이를 통해 연구진은 의사소통 장애의 특성을 파악하고 탐구 중인 주제에 대한 보다 자세한 이해를 할 수 있었습니다. 이를 통해 시스템, 프로세스 및 환자 수준에서 이러한 장애를 분석하고 조사 중인 환경, 즉 수술실에서의 커뮤니케이션을 자세히 이해할 수 있었습니다.
The methods section aligned with the methodological gap identified at the outset of the paper and used a theory-based framework for analysis of the fieldnotes taken of the communication that was observed. This enabled the researchers to approach and identify the characteristics of communication failures and arrive at a more detailed understanding of the topic under exploration. It allowed them to analyse these failures in relation to the effects at system, process, and patient level and arrive at a detailed understanding of the landscape under investigation: communication in the operating room.

Example 2

첫 번째 범주의 또 다른 예는 Van Zanten의 연구이다[22]. 의사 인종과 관련된 환자 만족 주제에 대한 기존 지식의 개요로 시작합니다. 저자들은 다른 사람들이 발견한 것을 요약합니다. 과학적 풍경을 재개념화하기 위해서가 아니라 자신이 탐구하고자 하는 부분과 발견하기를 기대하는 부분을 설명하기 위해서입니다.

Another example of the first category is the study by Van Zanten [22]. It starts with an overview of existing knowledge on the topic of patient satisfaction in relation to physician ethnicity. The authors summarize what other people have discovered, not to reconceptualise the scientific landscape but to explain what part of it they want to explore and what they expect to find:

특정 관점
A specific perspective

이 범주에는 의도적으로 선택된, 고정된 유리한 지점에서 [이론 구축theory building을 추가하기 위한 연구]가 포함되었습니다. 연구자들은 심리, 사회, 인류학 또는 철학적 영역에서 도출된 특정 연구 관점을 의료 교육 분야의 이슈에 적용할 수 있는 장점을 주장했다. 
This category included research that intended to add to theory buiding from a deliberately chosen, fixed vantage point. Researchers argued for the advantages of applying a particular research perspective derived from psychological, sociological, anthropological, or philosophical domains to an issue in the field of healthcare education. 

Example 1

Example 2

Kerosuo와 Engestrom[23]에 의해 해결된 현실적 문제는 다중 전문 그룹multi-professional groups에 의한 돌봄care 제공이었다. 그들은 조직 내 사람들이 [어떻게 집단적으로 일하는 법을 배웠는지] 검토하기 시작했다. 그들은

  • [인간의 활동을 체계적이고 사회적으로 자리잡은 현상으로 이해]하고, 이에 따라 [개인 주체와 사회적 현실의 차이를 메워주고],
  • 그들이 일하고 있는 [의료 환경을 이해하고 변화시키기 위한 이론]인,

...활동 이론(Activity Theory)에 의해 inform된, 변화 연구실 접근법Change Laboratory approach을 취했다. 
The practical problem addresssed by Kerosuo and Engeström [23] was provision of care by multi-professional groups. They set out to examine how people in organisations learned to work collectively. They took a Change Laboratory approach, informed by Activity Theory, a theory that seeks

  • to understand human activities as systemic and socially situated phenomena and hence bridges the gap between the individual subject and the social reality,
  • to understand and change the health care environments they were working in. 



거리두기 관점
A distanced perspective


이 세 번째 범주는 비교적 [추상적인 수준]에서 운영된다. 학자들은 연구 영역을 스캔하여 다른 연구자들이 이전에 매핑한 내용을 종합하고 모순과 추가 탐사가 필요한 영역을 식별합니다. 특정 현상에 대한 면밀한 탐사를 하거나 특정 관점에서 문제를 살펴본 연구자들의 노력이 없었다면 이런 유형의 작업은 불가능했을 것이다. 그러나 때로는 한 발짝 물러서서 정보의 일부가 어떻게 서로 들어맞는지 살펴봐야 합니다. 일반적으로 이 세 번째 범주의 논문들은 새로운 경험적 데이터를 보고하지 않고, 그 대신 이전의 연구 결과가 그들의 데이터이다.
This third category operates at a relatively abstract level. Scholars scan an area of research, piecing together what others had previously mapped and identifying contradictions and areas that need further exploration. It would not be possible to do this type of work were it not for the efforts of researchers who have done close up explorations of specific phenomena or looked at the issue from a specific perspective. However, sometimes one needs to take a step back and look at how the pieces of information fit together, or not. Typically, papers in this third category do not report new empirical data; instead, previous research findings are their data.


Example 1

Steinert 등[24]의 교수진 개발에 대한 체계적인 검토는 수많은 교수진 개발 프로그램이 효과의 차이를 명확히 이해하지 못한 채 제공되었다는 관찰에서 시작되었습니다. 다른 학자들이 만들어낸 수많은 지식들을 스캔함으로써, 저자들은 이 조각들이 어떻게 서로 맞고 겹쳐지고 발견되지 않은 부분들을 정리할 수 있었다. 이것은 이전의 연구에 의해 생성된 지식을 종합하는 개념적 프레임conceptual framework으로 이어졌다.

A systematic review by Steinert et al. [24] on faculty development started from the observation that a myriad of faculty development programs had been delivered without any clear understanding of differences in their effectiveness. By scanning the numerous pieces of knowledge produced by other scholars, the authors were able to map out how these pieces fitted together, overlapped, and left areas undiscovered. This led to a conceptual framework that synthesized the knowledge generated by previous research.

이 프레임워크에서는 교수진의 다양한 역할을 인정하며, 교육teaching은 그 중 하나이다. 이 프레임워크는 특정 교수개발 활동을 넘어서는 많은 중재 요인이 교사의 효율성에 영향을 미칠 수 있으며, 그 결과는 여러 수준에서 관찰될 수 있다는 사실을 강조한다(p.500).
This framework acknowledges the different roles of faculty members, of which teaching is one. It also highlights the fact that many mediating factors beyond specific faculty development activities can influence teacher effectiveness, and that outcome can be observed at a number of levels. (p.500)


저자들은 교수 발달에 대한 증거를 이용하여 사람들의 행동에 대한 사고에 기여하는 틀을 만들었습니다.
The authors used evidence about faculty development to produce a framework that contributes to people’s thinking about their actions.

Example 2

이 예는 Schmidt, Norman & Boshuizen[25]에 의해 제공되며, 그는 임상 역량에 대한 문헌 검토에서 다음과 같이 결론지었다.
This example is provided by Schmidt, Norman & Boshuizen [25], who concluded from a review of literature on clinical competence:

…임상 역량의 성격에 대한 몇 가지 근본적인 가정에 의문을 제기하면서 여러 가지 반복적인 문제가 나타났습니다. (p.611) 
…a number of recurrent problems emerged, casting doubt on some of the fundamental assumptions about the nature of clinical competence. (p.611) 

 

고찰
Discussion

그러나 세 가지 접근방식은 우리의 주요 데이터(논문)와 구별되었지만, 하나의 범주로만 쉽게 분류할 수 없는 논문도 있었다. 이는 대부분 이 논문들이 이론적 출발점을 명확히 밝히지 않았기 때문이다.
However, although the three approaches were discerned from our primary data (the papers), there were papers that could not easily be categorized into only one of the categories. This was mostly due to the fact that these papers had not made their theoretical point of departure explicit. 

범주화뿐만 아니라, 우리의 분석은 은유를 만들어냈고, 우리는 이것이 이론이 어떻게 사용되는지를 설명하는 데 도움이 되기를 바란다. 이 비유는 해안 풍경을 탐험하고 싶은 사람이 배, 등대, 비행기로부터 탐험할 수 있다는 것이다. 해안의 풍경은 사람들의 행동과 함께 탐구 영역을 구성하는 사회적 과정을 나타낸다. 보트, 등대, 비행기는 세 가지 관점, 세부 수준, 조도 유형을 제공합니다. 이 '이야기'는 아래와 같다.
As well as a categorisation, our analysis has produced a metaphor, which we hope will help explain how theory is used. The metaphor is of a person wanting to explore a coastal landscape and being able to do so from a boat, a lighthouse, or a plane. The coastal landscape represents the people, their behaviour, and the social processes that together constitute a field of inquiry. The boat, lighthouse, and plane provide three different perspectives, levels of detail, and types of illumination of the landscape. This ’story’ is outlined below. 

이 논문에서 사용되는 은유 체계를 설명하는 서술
A narrative explaining the system of metaphors used in this paper

멀리 떨어져 있는 섬을 도표로 만들어야 한다고 상상해 보세요. 그곳에는 먼 옛날에 살았던 사람들이 만든 조잡하고 부정확한 지도들이 있다. 섬의 좋은 지점vantage point에 등대의 외딴 잔해가 서 있다. 그 섬에는 [귀중한 광물 퇴적물]이 있을 수 있기 때문에 조사되고 있다. 세 가지 방법으로 자유롭게 조사할 수 있습니다. 를 타고 바위 해안으로 접근하거나, 등대 꼭대기에서 측량하거나, 상공 비행을 할 수 있습니다.
Imagine you have to chart a far-off island. There are some crude, inaccurate maps of it made by people who lived there in the distant past. At a vantage point on the island stand the solitary remains of a lighthouse. The island is being surveyed because there may be valuable mineral deposits there. You have, at your disposal, three ways of surveying it. You can approach its rocky coast by boat, you can survey it from the top of the lighthouse or you can overfly it.

이 비유에 따르면,

  • [섬]은 연구 주제입니다.
  • [귀중한 광물 퇴적물]은 그것을 조사하기 위한 목적이다.
  • [지도]는 주제에 대한 지식 상태를 나타냅니다.
  • 보트, 등대, 비행기는 지도를 정교화하는 [세 가지 다른 방법]이다. 즉, 근접 탐사(보트), 특정 관점(등대), 개요(비행).

According to this metaphor,

  • the island is a research topic.
  • The valuable mineral deposits are a purpose for surveying it.
  • The map represents the state of knowledge of the topic.
  • The boat, lighthouse, and plane represent the three different ways theory can help refine the map discussed in the finding section:
    • theory as close-up exploration (boat);
    • theory as a specific perspective (lighthouse); and
    • theory as overview (plane).

당신은 그것들로부터 매우 다양한 종류와 세부사항, 그리고 바위 경관에 대한 관점을 얻을 수 있을 것입니다. 마찬가지로, 여러분이 물려받은 [조잡한 지도]도 땅을 조사한 관점의 영향을 받았을 것이며, 여러분이 앞으로 생산할 [정교한 지도]도 마찬가지로 여러분이 선택한 관점의 영향과 섬의 위상학적 특성에 영향을 받을 것입니다. 
You would get very different types and levels of detail, and perspectives on the rocky landscape from them. In the same way, the crude map you inherited was influenced by the perspective from which the land was surveyed and the sophisticated map you produce will, likewise, be influenced by the perspective you have chosen as well as the topographical features of the island.

이 은유법은 연구에 대한 기본적인 원리를 보여준다. 하나의 주제를 아는 단 하나의 논쟁의 여지가 없는 방법은 없다. 마치 한 풍경을 아는 데 논쟁의 여지가 없는 방법은 없는 것과 같다. 우리가 그것을 인정하든 말든, "진리"는, 지도와 마찬가지로, 그것이 얻어진 이론적인 관점에 의해 영향을 받습니다. 궁극적으로, 원근법과 거리가 지도에 지워지지 않는 흔적을 남기는 것과 마찬가지로, 이론은 여러 가지 방법으로 우리의 연구에 스며든다. 광물 퇴적물처럼 탐구할 가치가 있는 주제라는 결정도 이론의 영향을 받는다. 하지만 그 세 가지 관점과 목표를 달성하는 데 어떻게 도움이 될 수 있는지는 지켜보자. 
This metaphor illustrates a fundamental principle about research. There is no single, incontrovertible way of knowing a topic, just as there is no incontrovertible way of knowing a landscape. Whether we acknowledge it or not, “truths”, like maps, are influenced by the theoretical perspective from which they were gleaned. Ultimately, theory permeates our research in many ways, just as perspective and distance leaves their indelible marks on a map. Even the decision that a topic is, like mineral deposits, worth exploring is influenced by theory. But let’s stick with those three different perspectives and how they can help you achieve your goal. 

보트는 풍경 가까이 다가갈 수 있게 해줍니다. 심지어 만질 수도 있습니다. 아주 미세한 디테일을 얻을 수 있습니다. 예를 들어, 귀중한 광물을 수출하는 선박을 위한 선착장을 어디에 지을지 계획한다면 매우 값진 일일 것입니다. 하지만 섬 전체를 일관된 시각으로 바라보는 데는 그리 좋지 않을 것이다. 연구용어로, 이러한 이론의 사용은 특정한 관심 영역을 식별하고, 그곳에서부터 지도의 특정 부분을 조사하는 것을 의미합니다. 주제 전체의 일관성 있는 지도를 작성하는 것보다는, 주제 일부를 세부적으로 설명하는 목적에 더 좋습니다. 보트만으로 측량하면 관심 분야에 대해서 [해결되지 않은 상반된 결과]가 동반된 짜깁기 지도가 나올 수 있습니다.
The boat allows you to come close to the landscape; even touch it. You can get very fine detail. It would be invaluable if, for example, you wanted to plan where to build a dock for ships exporting the valuable mineral. But it would not be so good for putting the entire island into a coherent perspective. In research terms, this use of theory means identifying a specific area of interest, getting out there and investigating a specific piece of the map. It is better at giving fine detail of part of a topic than producing a coherent map of the topic as a whole. Surveying solely by boat could produce a patchy map of the field of interest with unresolved, conflicting results.

만약 [등대]가 위치한 [고정된 유리한 지점]으로 인해, 광산에서 물결치는 경관을 가로질러 선착장으로 가는 경로를 선택할 수 있다면 등대를 선택할 수 있습니다. 마찬가지로, 이론은 여러분이 [의도적으로 선택한, 고정된 유리한 위치]에서 진화하는 과학 지식의 지도에 정보를 추가하는 데 도움을 줄 수 있습니다. 여러분은 특정한 심리학적, 사회학적, 인류학적 또는 철학적 입장을 선택할 수 있습니다. 왜냐하면 [그 입장][이 주제]에 대해 어떤 것을 말해 줄지 알고 싶기 때문입니다. 등대에서 그렇게 하다 보면 배에서 관찰한 것과 같은 세부 수준은 아니지만 주제에 대한 가치 있는 새로운 시각을 갖게 될 것입니다. 
You would choose the lighthouse if its fixed vantage point helped you, for example, choose the route from the mineral mine to the dock across an undulating landscape. Likewise, theory can help you add a piece of information to the evolving map of scientific knowledge from the deliberately chosen, fixed vantage point. You might choose some specific psychological, sociological, anthropological or philosophical stance because you want to know what that stance will tell you about the topic. Having done so from the lighthouse, you would shed a valuable new perspective on a topic, though perhaps not at the same level of detail as if you had surveyed it from a boat. 

혹은 비행기를 타고 전체 풍경을 둘러볼 수 있다. 이로서, 탐구자들이 이전에 보트 및 등대를 사용하여 기울였던 노력을 어느 정도 적합한 전체로 통합할 수 있습니다. 연구자로서 비행기의 관점은 잘못된 표현이나 추가 탐사가 필요한 지역을 식별하는 데 도움이 될 수 있지만, 등대나 보트처럼 세부적으로 주제를 조사할 수는 없습니다. 지금까지의 지도 상태에 대한 귀중한 통찰력을 제공하고 향후 연구 의제를 추진하는 데 도움이 되는 새로운 통찰력을 제공할 수 있습니다. 
A plane allows you to overview the entire landscape and, for example, pull together the previous efforts of surveyors in boats and lighthouses into a more or less fitting whole. As a researcher, the plane perspective could help you identify misrepresentations or areas that need further exploration, though it would not allow you to examine topics in the same detail as either a lighthouse or a boat. It could give you valuable insights into the state of the maps so far and provide new insights that help drive future research agendas. 

의학 교육 연구에서 이론의 다양한 이용 방법에 첨부된 은유와 약점을 밝혀낼 수 있습니다. 예를 들어, 보트는, 탐색 범위를 제한하는 한계가 있다. 보트는 잘 정의된 영역에서 한 번에 하나의 질문에 집중할 때 가장 효과적입니다. 여러 연구자들이 서로 다르지만 관련 질문에 답하려고 노력한 결과는, [잘 정의된 영역과 사각지대와 상반된 조사 결과]가 뒤섞여서, 해당 분야에 대한 [짜깁기 지도patchy map]로 이어질 수 있다. 등대의 관점은 다양한 지역을 관찰하고 그 특이점을 연구하는데 활용될 수 있다.
By applying the metaphors, strengths and weaknesses attached to different ways of using theory in medical education research can be uncovered. Being in a boat limits, for example, the scope of the quest; it works best when focusing on one question at a time in a well-defined area. The result of many researchers trying to answer different but related questions is a patchy map of the field of interest, with areas that are well defined, blind spots, and conflicting findings. The lighthouse perspective can be used to look at different areas and study their peculiarities. 

이전에 보트로 연구했던 지역들을 재조명할 수 있고, 이는 가치 있는 깨달음으로 이어질 수 있다. 하지만 등대에서 세계를 연구하려면 유연성의 희생이 따른다. [등대]는 보트처럼 연구주제를 중심으로 움직일 수 없기 때문에, [선택한 시각]이라는 빛이 도달하지 않는 지역은 탐사가 불가능하다. 따라서 등대 연구진이 관점을 철저히 설명하고, 다른 관점(또는 빛)을 사용했다면, 다른 연구 결과를 이끌어 냈을 수도 있음을 인정하는 것이 필수적이다. 

Areas that were previously researched by boat can be re-examined and this can lead to valuable enlightenment. However, researching the world from a lighthouse comes at the expense of flexibility. Areas on which the chosen perspective does not shed light cannot be explored because the lighthouse cannot move around a research topic like a boat can. It is thus essential that lighthouse researchers describe the perspective thoroughly and acknowledge that using a different perspective (or light) might have been brought forward different findings.

[비행기 접근법]은 다른 사람의 작업을 일반화 및 구축하거나 비평함으로써 연구 커뮤니티에 중요한 자원을 제공합니다. 그러나 관심 영역으로부터의 거리를 두었기 때문에 세부 정보를 잃게 됩니다. 반면에 비행기를 타면서 얻게 되는 감시는 지금까지의 지도 상태에 대한 [중요한 윤곽]을 이끌어낼 수 있고, 심지어 미래의 연구 의제를 주도하는 새로운 통찰을 낳을 수도 있다. 

The plane approach provides an important resource to the research community by generalising and building on or critiquing different people’s work. However, the distance from the area of interest results in loss of detail. On the other hand, the oversight one gets from being in a plane can lead to valuable outlines of the state of the map so far and even result in new insights that drive future research agendas. 



이 연구가 추가하는 내용
What this study adds


그렇다면, 어떻게 이론이 만들어지는지에 대한 세 가지 관점이 이론에 대한 우리의 이해를 어떻게 알려줄까요? 이론은 경험적 연구의 자동화된 결과가 아니며, 연구자 쪽에서 선택하는 것이다 [26]. 이론을 (연구 아이디어를 창출하고 경험적 연구의 결과를 예측하는 도구로 기능하는) 생물 의학 연구에 적용되는 실증주의 패러다임에서 이론의 사용과 달리, 본 연구에서 우리가 가지고 있는 실증적 연구에서는 세 가지 접근법에 의해 이론의 사용을 예로 들었다. 
So, how do the three perspectives of how theory is made explicit inform our understanding of theory? Theory is not an automated result of empirical research but emerges from a choice on the part of the researcher [26]. In contrast to theory use in the positivist paradigm applied in biomedical research, where the function of theory is as a tool in generating research ideas and predict outcomes in empirical studies we have in this study exemplified the use of theory in medical education by the three approaches. 


이론에 어떻게 접근했는지를 분석함으로써 우리는 접근법의 변화를 볼 수 있었다.

  • 첫째, 포함된 연구들은 미시 수준micro-level 이론에서 중간 범위 이론에 접근했다는 것을 알 수 있었습니다 [10].
  • 두 번째로 우리는 각 논문에서 어떤 현상을 더 잘 이해하기 위해 이론을 어느 정도로 쓰는지에 차이가 있음을 보았다. 한 쪽 끝에는 [(이론으로부터) 연구 질문, 방법론 및 해석을 생성]하는 것이 있다면, 다른 쪽 끝에는 [(자료 분석의 귀납적 과정의 결과로) 이론에 기여]하는 연구가 있었다.

By analysing how theory was approached in the articles we could see a variation in approaches.

  • Firstly, we could see that the included articles approached theory ranging from micro-level theory to mid-range theory [10].
  • Secondly we saw a difference in the degree to which the articles worked with theory to better understand a phenomenon, i.e. generated research questions, methodology and interpretation at one end, or contributed to theory as a result of an inductive process of data analysis, at the other.

여러 논문이 실제적인 문제에 근거하고 있었기 때문에, 이 특정한 질문에 대한 해답을 특별히 목표로 했으며, 의도적으로 중거리 이론에도 기여하지 않았다. 여기서, 종종, 이론은 이전의 연구에서 나온 발견으로만 여겨졌습니다. 그러나 이론과 관련하여 연구문제를 틀에 넣은 사례도 있는데, 연구문제가 특정 이론에 근거한 것이며, 논문은 그 이론과 관련된 논쟁의 예이며, 따라서 이론토론에 대한 기여도 있다. 

As several of the papers were based on a practical problem, the paper specifically aimed to answer this specific question, and did not intentionally also contribute to mid-range theory. Here, often, theory was only viewed as findings from previous research. However, there were also examples where the research question was framed in relation to theory, where the research question was based on particular theories, and the paper is an example of an argumentation in relation to that theory, and as such is a contribution to a theoretical discussion.

마지막으로 논문에서 이론이 도입된 방식에는 차이가 있었다. 이것은 [매우 미묘하거나 암묵적인 이론적 입장]을 도입한 것부터, [이론적 관점에 대한 매우 명확하고 개념적인 설명]에 이르기까지 다양했습니다. 배경[8]에 언급된 이론의 정의로 돌아가자면, 이론을 명시적으로 드러내지 않으면 덜 도움이 됩니다. 일부 저자들이 취한 이론적인 입장의 관점에서 행간을 읽는 것은 가능했지만, 이론을 명백하게 밝힌 논문들은 (어떤 것의 증거를 발견했다고 주장하기 보다는) 특정한 렌즈로 과학적인 대화에 참여하고 있다는 것이 분명해졌다. 

Finally there was a difference in the way in which theory was introduced in a paper. This ranged from very subtle or implicit introduction of theoretical stance, to very clear and conceptual explanations of the theoretical perspective. If we go back to the definition of theory referred to in the background [8] it is less helpful when theory is not made explicit. Although it was possible to read between the lines in terms of the theoretical stance taken by some authors of the publications, it became clear that papers where theory was made explicit were participating in a scientific dialogue with a specific lens, rather than claiming to having found proof of something, in a technical sense. 

서로 다른 분야나 과학 전통에 있어서 서로 다른 접근법이 필요하고 다른 수준으로 작용하고 있습니다. 의학 교육에 적용해보자면, 비록 사회 과학이기는 하지만, [객관적인 진리를 정립하려는 목표]가 오랫동안 연구를 지배해 온 것으로 보이는데, 이는 여기서 예로 든 (후기) 실증주의 전통의 관점에서 이뤄진 연구로부터 확인할 수 있다. 그러나, 이 연구에 포함된 여러 논문들은 이러한 견해에 이의를 제기하였고, 해석적hermeneutic 지식과 해방적 지식 모두를 포함한 논문들도 포함되었다. 
Different approaches are necessary and in play to different degree in different disciplines or scientific tradtions. Adapted to medical education, it seems that although to a large degree being a social science, the aim for establishing objective truths has for a long time dominated the research, something that is also part of our findings as exemplified by studies written in a (post) positivist tradition. However, several of the papers included in this study challenged this view and papers including both hermeneutic and emancipatory knowledge interests were also included. 

의학교육연구 분야에 초보자 연구자를 대상으로 한 안내 논문은 이미 다수 존재한다. 그러한 논문 중 하나가 '연구 나침반'[30]인데, 여기서 독자들은 탐구, 실험, 관찰 및 번역 연구의 네 가지 범주를 통해 안내된다. 핵심은, 연구는 [일반화된 지식]으로 이어지고, [실질적으로 관련이 있는 연구 가능한 문제]에 관한 것이어야 한다는 것이다.

간단한 질문을 하고 간단한 방법을 사용함으로써, [면밀한 탐구로서의 이론] 및 [구체적인 관점으로서의 이론] 접근은 교수와 학습의 발전에 대한 학문적 접근(scholarship of teaching and learning)을 제공한다는 점에서 모두 중요한 역할을 한다. 한편 [개괄overview로서의 이론]을 사용될 때에는 더 높은 수준에서 이론의 발전을 위한 기초를 제공합니다.

A number of guiding articles to researchers who are new to the field of medical education research already exist. One such article is ’The research compass’ [30], in which readers are guided through four categories of research approach; explorative, experimental, observational and translational studies. A main point made in that paper is that research should be about researchable problems that lead to generalisable knowledge and are practically relevant. By asking simple questions and use simple methods, the approaches theory as close-up exploration and theory as specific perspective play a crucial role both in terms of providing a scholarly approach to the development of teaching and learning (scholarship of teaching and learning), and in providing the basis for the development of theory at higher level as when theory is used as overview. 

마지막으로, Thomas [26]는 교육적 탐구에서 더 많은 'bricolage'가 필요하다고 주장하며, 연구 분야를 탐구하는 데 있어 다양한 이론적 접근 방식을 사용할 수 있는 여지를 제공합니다. 이러한 다양한 관점의 필요성은 최근 의학교육의 증가 [27]로 언급되었으며, 의학교육에서 이론을 특정 관점으로 하는 연구가 증가하고 있다는 우리의 견해와 일치한다. 

Finally, Thomas [26] argues for the need for more ’bricolage’ in educational enquiry, giving room for multiple theoretical approaches in exploring the field of research. This need for multiple perspectives was recently commented as increasing in medical education [27] and it is in line with our view that research with theory as a specific perspective is increasing in medical education. 

방법론적 고려
Methodological considerations


결론
Conclusion


의료교육 연구를 이론적 근거가 부족한 분야로 지속적으로 비판하는 것은 명분이 낮아질 수밖에 없다. 복수의 학문적, 패러다임적 배경을 가진 연구자들이 진행하는 연구가 특징인 만큼 의학 교육 연구의 이론 문제를 어떻게 다룰지에 대한 가정은 연구에 가져오는 관점에 따라 논쟁이 될 것으로 보인다. 최소한 이론의 사용은 분명히 해야 한다고 우리는 주장한다. 
The continuous criticism of medical education research as a field that lacks theoretical basis is subject to decreased justification. As it is an area characterized by research carried out by researchers from multiple disciplinary and paradigmatic backgrounds the assumptions of how to treat the issue of theory in medical education research will probably be contentious depending on the perspective one brings to research. At a minumum, we argue, theory use needs to be made explicit. 


 


BMC Med Educ. 2017 Jan 19;17(1):18.

 doi: 10.1186/s12909-016-0848-1.

Making theory explicit - An analysis of how medical education research(ers) describe how they connect to theory

Klara Bolander Laksov 1 2Tim Dornan 3 4Pim W Teunissen 4 5

Affiliations collapse

Affiliations

  • 1Department of Learning, Informatics, Management and Ethics (LIME), Karolinska Institutet, Stockholm, Sweden. Klara.bolander.laksov@edu.su.se.
  • 2Department of Education, Centre for the Advancement of University Teaching, Stockholm University, Stockholm, Sweden. Klara.bolander.laksov@edu.su.se.
  • 3Dentistry and Biomedical Sciences, School of Medicine, Queen's University Belfast, Belfast, UK.
  • 4School of Health Professions Education (SHE), Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, NL, Netherlands.
  • 5Department of Obstetrics & Gynecology, Gynaecologist at VU University Medical Center, Amsterdam, The Netherlands.

Free PMC article

Abstract

Background: As medical education develops into a varied and well-developed field of research, the issue of quality research anchored in or generating theory has gained increasing importance. Medical education researchers have been criticized of not connecting their work to relevant theory. This paper set out to analyse how researchers can connect to theory in medical education. The goal of this paper is to provide an accessible framework for those entering medical education research, regarding how theory may become an integral part of one's work.

Methods: Fifteen purposefully selected researchers in medical education were asked to nominate papers they considered influential in medical education. Through this process 41 papers were identified and included in the study.

Results: The papers were analysed with thematic content analysis, which resulted in three approaches to the use of theory: as close-up exploration; as a specific perspective; and as an overview. The approaches are exemplified by quotes from the papers included in our dataset and further illuminated by a metaphoric story.

Conclusions: We conclude by pointing at the importance of making explicit how theory is used in medical education as a way to collaboratively take responsibility for the quality of medical education research.

문헌고찰: 양질의 의학교육연구를 위한 초석(J Grad Med Educ. 2016)
The Literature Review: A Foundation for High-Quality Medical Education Research
Lauren A. Maggio, PhD, MS (LIS) Justin L. Sewell, MD, MPH Anthony R. Artino Jr, PhD

 

의학 교육1의 발표된 학술연구가 급증하고 교육 연구를 출판하는 저널의 급속한 성장에도 불구하고 원고 acceptance rate은 계속 떨어지고 있다.2 [중요한 문제를 식별하고 연구를 맥락에 배치하는 철저하고 정확하며 최신의 문헌 검토를 실시하지 않는 것]은 일관되게 rejection의 가장 큰 이유 중 하나이다.
Despite a surge in published scholarship in medical education1 and rapid growth in journals that publish educational research, manuscript acceptance rates continue to fall.2 Failure to conduct a thorough, accurate, and up-to-date literature review identifying an important problem and placing the study in context is consistently identified as one of the top reasons for rejection.3,4

문헌 검토 정의
The Literature Review Defined


의학 교육에서, 어떤 조직도 연구 논문의 문헌 검토에 대한 공식적인 정의를 명확히 하지 않았습니다. 따라서, 문헌 검토는 여러 가지 형태를 취할 수 있습니다. 기사의 유형, 대상 저널 및 특정 주제에 따라 이러한 형태는 방법론, 엄격성 및 깊이에서 다양합니다. 
In medical education, no organization has articulated a formal definition of a literature review for a research paper; thus, a literature review can take a number of forms. Depending on the type of article, target journal, and specific topic, these forms will vary in methodology, rigor, and depth. 

우리는 그러한 문헌검토를 [기존의 지식 내에서 (현재 연구의 위치를 포함하여) 연구하려는 주제에 대해 알려진 것과 알려지지 않은 것의 종합적 검토와 요약]으로 정의한다. 이러한 유형의 문헌 검토는 체계적인 검토에 의해 요구되는 집중적인 검색 과정을 요구하지 않을 수도 있지만, 신중하고 엄격한 접근 방식을 사용할 가치가 있습니다.
We define such a literature review as a synthetic review and summary of what is known and unknown regarding the topic of a scholarly body of work, including the current work’s place within the existing knowledge. While this type of literature review may not require the intensive search processes mandated by systematic reviews, it merits a thoughtful and rigorous approach.

문헌검토의 목적과 중요성
Purpose and Importance of the Literature Review

현재 문헌에 대한 이해는 연구 연구의 모든 단계에서 매우 중요하다. 링가드9는 최근 자신의 연구가 더 큰 의학교육 대화에 어떻게 적합한지를 이해하기 위해 "대화로서의 저널" 은유를 사용했다. 그녀는 이렇게 묘사한다.

당신이 사교 행사에서 대화에 참여하는 것을 상상해 보세요. 무슨 말을 하는지 알기 위해 엿듣고 있다가(이것이 문헌 검토가 '대화conversational'에 해당하는 것이다), 당신이 주제에 대한 공통 관심사를 가지고 있으며, 이미 말한 내용에 대한 지식이 있고, 자신의 의도를 나타내며 대화에 참여한다.

  
An understanding of the current literature is critical for all phases of a research study. Lingard9 recently invoked the ‘‘journal-as-conversation’’ metaphor as away of understanding how one’s research fits into the larger medical education conversation. As she described it:

‘‘Imagine yourself joining a conversation ata social event. After you hang about eavesdropping toget the drift of what’s being said (the conversational equivalent of the literature review), you join the conversation with a contribution that signals your shared interest in the topic, your knowledge of what’s already been said, and your intention.’’9 


문헌 검토는 [맥락을 제공하고, 방법론을 알려주며, 혁신을 식별하고, 중복 연구를 최소화하며, 전문적 기준을 충족]하도록 함으로써 모든 연구자가 '대화에 참여'할 수 있도록 도와줍니다. 현재의 문헌에 대한 이해는 또한 Boyer가 제안한, 학문적 작업을 평가해야 하는 6가지 기준 중 5가지에 기여함으로써 장학금을 증진시킨다.11 구체적으로, 문헌 검토는 연구자에게 다음과 같은 도움을 준다.
The literature review helps any researcher ‘‘join the conversation’’ by providing context, informing methodology, identifying innovation, minimizing duplicative research, and ensuring that professional standards are met. Understanding the current literature also promotes scholarship, as proposed by Boyer,10 by contributing to 5 of the 6 standards by which scholarly work should be evaluated.11 Specifically, the review helps the researcher

  • (1) 명확한 목표를 명시한다.
  • (2) 적절한 준비의 증거를 보여준다.
  • (3) 적절한 방법을 선택한다.
  • (4) 관련 결과를 전달한다.
  • (5) 성찰적 비평에 참여한다.  

 

  • (1) articulate clear goals,
  • (2) show evidence of adequate preparation,
  • (3) select appropriate methods,
  • (4) communicate relevant results, and
  • (5) engage in reflective critique.  


수준 높은 문헌 검토를 수행하지 못한다면, [반복적이고, 이론에 기초하지 않으며, 방법론적으로 취약하고, 단일 설정 이상으로 지식을 확장하지 못하는 것] 등과 같이 의학 교육 문헌에서 확인된 여러 문제로 이어진다.12 실제로 많은 연구가 이미 출판된 연구의 반복 작업을 수행한 것이고 새로운 지식에는 거의 기여하지 않는다고 의료 교육 학자들은 불평한다. 명백한 원인은 적절한 문헌 검토를 수행하지 못했기 때문이다.3.4 
Failure to conduct a high-quality literature reviewis associated with several problems identified in the medical education literature, including studies that are repetitive, not grounded in theory, methodologically weak, and fail to expand knowledge beyond asingle setting.12 Indeed, medical education scholars complain that many studies repeat work already published and contribute little new knowledge—alikely cause of which is failure to conduct a proper literature review.3,4 

마찬가지로, 이론적인 기초나 개념적 프레임워크가 결여된 연구는 연구 설계와 해석을 어렵게 만든다.13 의학 교육 연구에 이론이 사용될 때, 종종 피상적인 수준에서 호출된다. Norman14가 지적한 바와 같이, 이론이 적절하게 사용될 때, 그것은 [함께 연결될 수 있는 변수]와 그 이유를 명확히 표현하는데 도움을 주고, 연구자가 [가설을 세우고 연구의 맥락과 범위를 정의]할 수 있게 해준다. 
Likewise, studies that lack theoretical grounding or a conceptual framework make study design and interpretation difficult.13 When theory is used in medical education studies, it is often invoked at asuperficial level. As Norman14 noted, when theory isused appropriately, it helps articulate variables that might be linked together and why, and it allows the researcher to make hypotheses and define a study’s context and scope. 

또 다른 문제는 많은 의학 교육 연구가 방법론적으로 취약하다는 것이다.12 좋은 연구를 위해서는 관련 교육을 받은 연구 조사자 질문이 필요한데, 이들은 관심 변수를 운영적으로 정의하고 특정 연구 질문에 대한 최선의 방법을 선택할 수 있다.
Another problem is that many medical education studies are methodologically weak.12 Good research requires relevant trained research investigators questions, who can articulate operationally define variables of interest, and choose the best method forspecific research questions.

마지막으로, 의대 교육에 관한 많은 연구들은 "일회성one-offs"이다. 즉, 기회가 현지에서 나타났기 때문에 수행되는 단일 연구이다. 이러한 연구는 종종 다른 환경에 대한 점진적인 구축과 일반화를 지향하지 않습니다. 문헌에 대한 확실한 이해는 연구에 대한 프로그램적 접근을 장려할 수 있다.  
Finally, many studies in medical education are‘‘one-offs,’’ that is, single studies undertaken because the opportunity presented itself locally. Such studies frequently knowledge are not oriented toward progressive building and generalization to other settings. A firm grasp of the literature can encouragea programmatic approach to research.  

문헌 검토 접근 중
Approaching the Literature Review

문헌 검토를 계획하려면 저널에 따라 크게 달라지는 저널 요건을 이해해야 합니다(표 1). 저자들은 문헌 검토의 결과 보고와 관련된 일반적인 문제점을 주목하는 것이 좋다. 표 2는 우리가 작가, 검토자, 편집자로서 직면했던 가장 일반적인 문제들을 열거합니다.  
Planning the literature review requires understanding of journal requirements, which vary greatly by journal (TABLE 1). Authors are advised to take note of common problems with reporting results of the literature review. TABLE 2 lists the most common problems that we have encountered as authors, reviewers, and editors.  

 


문헌 찾기 및 구성
Locating and Organizing the Literature


인적 자원
Human Resources


의학 사서는 연구 관심사를 효과적인 검색 전략으로 변환하고, 이용 가능한 정보 리소스를 연구자에게 익숙하게 하며, 정보를 정리하는 데 필요한 정보를 제공하고, 새롭게 부상하는 연구에 최신 정보를 제공하기 위한 전략을 도입할 수 있습니다. 종종, 사서들은 또한 그들의 기관 전반에 걸친 연구에 대해 알고 있고 비슷한 관심사를 가진 연구원들을 연결할 수 있을 것이다. 동료들에게 제안을 구하면 연구원들이 레이더에 없을 자원을 빠르게 찾는 데 도움이 될 수 있다.
A medical librarian can help translate researchinterests into an effective search strategy, familiarize researchers with available information resources, provide information on organizing information, and introduce strategies for keeping current with emerging research. Often, librarians are also aware of research across their institutions and may be able toconnect researchers with similar interests. Reaching out to colleagues for suggestions may help researchers quickly locate resources that would not otherwise be on their radar.  

이 과정에서 연구자들은 다른 연구자들이 자신들의 주제에 대해 쓰고 있는 것을 확인할 것으로 보인다.연구자들은 이러한 관련 연구자들의 출판물 검색을 고려해야 한다(검색 전략은 표 3 참조). 또한 기관 웹사이트에는 해당 교직원의 교육과정 이력서, 도서장, 논문, 기술보고서 등 어려운 자료를 포함하여 해당 교직원의 전체 위치 간행물, 기록물 등을 포함할 수 있다. 
During this process, researchers will likely identifyother researchers writing on aspects of their topic.Researchers should consider searching for the publications of these relevant researchers (see TABLE 3 for search strategies). Additionally, institutional websites may include curriculum vitae of such relevant faculty with access to their entire locate publication publications, record, including difficult to such asbook chapters, dissertations, and technical reports. 




검색 도구 및 관련 문서
Search Tools and Related Literature


의학교육 연구는 다양한 학문으로 이루어지기 때문에, 연구원들은 [의학을 넘어서는 범위](예: 심리학, 간호학, 교육학, 인류학)와 보고서, 기준집, 학술대회 초록, 단행본 서적과 같은 [여러 출판 유형]을 다루는 검색 도구를 포함해야 한다(여러 정보 자원은 BOX 참조). 많은 검색 도구에는 선택한 기사의 인용문을 보기 위한 옵션이 포함되어 있습니다. 인용된 참조를 검토하면 검토를 위한 추가 기사와 선택한 기사가 해당 필드에 미치는 영향에 대한 느낌을 얻을 수 있습니다. 
Because medical education research draws on avariety of disciplines, researchers should include search tools with coverage beyond medicine (eg, psychology, nursing, education, and anthropology) and that cover several publication types, such as reports, standards, conference abstracts, and book chapters (see the BOX for several information resources). Many search tools include options for viewing citations of selected articles. Examining cited references provides additional articles for review and a sense of the influence of the selected article on its field. 

참고문헌 정리하기
Getting Organized

앞서 언급한 리소스는 엄청난 양의 정보를 제공할 가능성이 높기 때문에 잘 정리하는 것이 매우 중요합니다. 연구자들은 어떤 세부사항이 그들의 연구에 가장 중요한지 결정하고(예: 참가자, 설정, 방법, 결과) 그러한 세부사항을 체계적이고 접근 가능하도록 유지하는 전략을 만들어야 한다. 연구자들이 Evernote와 같은 디지털 도구를 사용하여 이러한 정보를 캡처하고 있으며, 이를 통해 디지털 작업 공간 및 검색 기능에 액세스할 수 있습니다. Citation manager의 사용은 인용문을 저장하기 때문에 유용할 수 있으며, 경우에 따라 참고 문헌을 작성할 수 있다(표 4).
As the aforementioned resources will likely provide a tremendous amount of information, organization is crucial. Researchers should determine which details are most important to their study (eg, participants, setting, methods, and outcomes) and generate a strategy for keeping those details organized and accessible. Increasingly, researchers utilize digital tools, such as Evernote, to capture such information, which enables accessibility across digital workspaces and search capabilities. Use of citation managers can also be helpful as they store citations and, in some cases, can generate bibliographies (TABLE 4).

언제 말해야 하는지 알기
Knowing When to Say When


연구자들은 종종 citation이 충분하다는 것을 어떻게 알 수 있는지 묻는다. 안타깝게도 마법의 숫자나 이상적인 숫자는 없습니다. 문헌 취재를 점검하는 전략 중 하나는 관련 논문의 참고 문헌을 점검하는 것이다. 연구자들이 참고 문헌을 검토하면서 새로운 문헌이 거의 나타나지 않고, 동일한 문헌이 반복되는 것을 알아차리기 시작할 것이다. 이것은 연구자가 특정 주제에 관한 문헌을 (충분히) 다루었음을 나타낼 수 있다.
Researchers often ask how to know when they have located enough citations. Unfortunately, there is no magic or ideal number of citations to collect. One strategy for checking coverage of the literature is to inspect references of relevant articles. As researchers review references they will start noticing a repetition of the same articles with few new articles appearing. This can indicate that the researcher has covered the literature base on a particular topic.

모두 합치기
Putting It All Together


연구논문 작성을 준비할 때는 어떤 citation을 포함시킬지, 그리고 introduction과 discuttion에 어떻게 활용inform할지 고민하는 것이 중요하다. 대상 저널에 대한 'Instructions to Authors'은 종종 문헌 검토(또는 소개)와 각 기사 범주에 허용되는 총 인용 횟수에 대한 지침을 제공한다. 
In preparing to write a research paper, it is important to consider which citations to include and how they will inform the introduction and discussion sections. The ‘‘Instructions to Authors’’ for the targeted journal will often provide guidance on structuring the literature review (or introduction) and the number of total citations permitted for each article category. 

Introduction에 대한 참고문헌을 선택할 때에는, 핵심 배경 이론 및 방법론 개념뿐만 아니라 [최근에 발표된 관련 연구]를 설명하는 것을 고려한다. 서론에서 제시하는 참고문헌은 사용 가능한 문헌의 너저분한 목록이나 단순 서술이 아니라, 현재 연구에 대한 맥락을 제공하고, 연구가 채우려는 문헌의 격차를 파악하기 위한 [종합적 요약]이므로, 간략해야 한다. 논의를 위해 현재 연구의 조사 결과를 현재 문헌과 비교 및 대조하고 현재 연구가 어떻게 필드를 발전시키는지를 나타내기 위해 citation을 신중히 선택해야 한다. 
When selecting references for the introduction consider those that illustrate core background theoretical and methodological concepts, as well as recent relevant studies. The introduction should be brief and present references not as a laundry list or narrative of available literature, but rather as a synthesized summary to provide context for the current study and to identify the gap in the literature that the study intends to fill. For the discussion, citations should be thoughtfully selected to compare and contrast the present study’s findings with the current literature andto indicate how the present study moves the field forward. 

결론
Conclusion

 

 

 

 

 


J Grad Med Educ. 2016 Jul;8(3):297-303.

 doi: 10.4300/JGME-D-16-00175.1.

The Literature Review: A Foundation for High-Quality Medical Education Research

Lauren A MaggioJustin L SewellAnthony R Artino Jr

Free PMC article

No abstract available

 

 

The Green Lumber Fallacy 

fs.blog/2016/11/green-lumber-fallacy/?s=09

"말하는 기술과 행동하는 기술을 동일시하는 것은 엄격하지 않다.”
— 나심 테일브
“Clearly, it is unrigorous to equate skills at doing with skills at talking..”

— Nassim Taleb


"반짝이는 모든 것이 금은 아니다"라는 속담이 있다. 사물의 미학은 종종 우리를 속인다. 우리가 무식하다고 부르는 사람들은 무식하지 않을지도 모른다. 우리가 똑똑하다고 부르는 사람들은 똑똑하지 않을 수도 있다. 녹색 목재 오류는 현실 세계가 항상 우리의 이야기와 일치하지 않는다는 것을 가르쳐준다. 성공의 진짜 원인 요인은 종종 우리에게 숨겨져 있다.

“All that glitters is not gold,” the saying goes. The aesthetics of things often fool us. People we call ignorant might not be ignorant. People we call smart might not be smart. The Green Lumber Fallacy teaches us that the real world doesn’t always match our stories. The real causative factors of success are often hidden from us.

***

진화 이론에 익숙하다면, 유기체의 개체군은 끊임없이 "선택 압력"을 받는다는 것을 알 것입니다. 어떤 특성들이 선호되고 그들의 자손에게 전해지고 다른 것들은 진화 쓰레기통에 버려지게 되는 그들 환경의 혹독함입니다.
If you’re familiar with evolutionary theory, you know that populations of organisms are constantly subjected to “selection pressures” — the rigors of their environment which lead to certain traits being favored and passed down to their offspring and others being thrown into the evolutionary dustbin.

생물학자들은 이러한 장점들을 번식의 "적합성"이라고 부른다. 기린 목의 길이가 길어진 것이 그들의 환경에 더 큰 "적합성"을 가져다 주었지요. 왜냐하면 그것이 그들이 높은 곳에 닿고, 손대지 않은 잎에 도달하도록 도와주었기 때문입니다. 적합성은 일반적으로 상대적인 개념입니다. 유기체는 부족한 자원을 얻기 위해 경쟁해야 하기 때문에, 그들의 적합성은 서로에 대한 생식적 우위를 준다는 의미에서 측정된다.
Biologists dub these advantages in reproduction “fitness” — as in, the famously lengthening of giraffe necks gave them greater “fitness” in their environment because it helped them reach high up, untouched leaves. Fitness is generally a relative concept: Since organisms must compete for scarce resources, their fitnesses is measured in the sense of giving a reproductive advantage over one another.

한 환경에서 뛰어난 적합성을 제공할 수 있는 특성은 쓸모없거나 다른 환경에서 불리할 수 있습니다. (연못에서 물을 뺀다고 가정해 보십시오: 정말 믿을 수 없는 물고기가 가지고 있는 어떤 건강상의 이점도 물 없이는 즉시 가치가 없어집니다.) 특성은 또한 환경과 관련이 있다. 한 번에 장점은 다른 한 가지 단점이 될 수 있고 그 반대도 마찬가지입니다. 자연은 논쟁하지 않고, 그저 반복해서 시험할 뿐입니다.
A trait that might provide great fitness in one environment may be useless or even disadvantageous in another. (Imagine draining a pond: Any fitness advantages held by a really incredible fish becomes instantly worthless without water.) Traits also relate to circumstance. An advantage at one time could be a disadvantage at another and vice versa. Nature doesn’t argue, it just tests over and over.

이것은 적합성을 생물학에서 가장 중요한 개념으로 만든다. 특성은 주어진 환경 내에서 유기체에 적합성을 제공하는 경우에 선택된다.

This makes fitness an all-important concept in biology: Traits are selected for if they provide fitness to the organism within a given environment.

블랙 스완의 작가 나심 탤브는 피트니스와 현실세계에서의 선택에 대해 흥미로운 견해를 가지고 있다: "잘 하는 사람doers"과 "잘 말하는 사람talkers"이 다른 특성으로 선택되는 경우가 많다. 그것들을 섞지 않도록 조심해라.
The Black Swan author Nassim Taleb has an interesting take on fitness and selection in the real world that boils down to: People who are good “doers” and people who are good “talkers” are often selected for different traits. Be careful not to mix them up.

그의 저서 Antifragile에서, Taleb는 이 아이디어를 월가의 상인들을 고용할 때 사용했던 경험적 발견을 발현하기 위해 사용합니다.
In his book Antifragile, Taleb uses this idea to invoke a heuristic he’d once used when hiring traders on Wall Street:

누군가가 하는 말이 더 흥미롭고, 더 교양 있을수록, 그 사람이 실제 사업에서 하는 일도 더 효과적이라고 생각하게 될 것이다. (심리학자들이 후광 효과라고 부르는 것, 스키에서의 기술이 도자기 공방이나 은행을 관리하는 기술로 실패하지 않는다고 생각하는 실수) 훌륭한 체스 선수가 실생활에서 훌륭한 전략가가 될 것이라는 것을 의미한다.
The more interesting their conversation, the more cultured they are, the more they will be trapped into thinking that they are effective at what they are doing in real business (something psychologists call the halo effect, the mistake of thinking that skills in, say, skiing translate unfailingly into skills in managing a pottery workshop or a bank department, or that a good chess player would be a good strategist in real life).
분명히, 말하는 기술과 하는 기술을 동일시하는 것은 허술하다unrigorous. 훌륭한 실무자들에 대한 제 경험은, 그들도 완전히 incomprehensible하다는 것입니다. 그들은 통찰력과 내부 일관성을 우아한 스타일과 서사로 바꾸는 데 많은 에너지를 쏟을 필요가 없습니다. 기업가는 사상가가 아닌 행동가이며, 행동가는 말을 하지 않으며, 토크 부서에서 그들을 측정하는 것은 불공평하고, 잘못되고, 완전히 모욕적일 것이다.
Clearly, it is unrigorous to equate skills at doing with skills at talking. My experience of good practitioners is that they can be totally incomprehensible–they do not have to put much energy into turning their insights and internal coherence into elegant style and narratives. Entrepreneurs are selected to be doers, not thinkers, and doers do, they don’t talk, and it would be unfair, wrong, and downright insulting to measure them in the talk department.


기업가에 대한 선택압력은 기업 경영자나 관료에 대한 압박과는 매우 다르다. 기업가와 위험부담자는 [대화와 설명, 합리화 능력]에 따라 성공하거나 실패하지 않는다. 그들은 군중으로부터 advantageously diverge되어 일을 처리하는 능력에 따라 성공하거나 실패한다. 말하는 것과 행하는 것이 함께 갈 수도 있지만, 보통은 그렇지 않습니다.
The selection pressures for an entrepreneur are very different from those on a corporate manager or bureaucrat. Entrepreneurs and risk-takers succeed or fail not so much on their ability to talk, explain, and rationalize as their ability to advantageously diverge from the crowd and get things done. While talking and doing can go together, they frequently don’t.

반드시 훌륭한 지적 능력과 훌륭한 행동이 함께 있어야 할 이유는 없습니다: 놀라운 코드 조각들을 함께 해킹할 수 있다는 것은 여러분이 훌륭한 이론적인 컴퓨터 과학을 하는 동안 아마도 학계에서 더 나은 적합성을 갖게 해 줄 것입니다. 그 두 기술은 연관될 필요가 없다. 대부분 위대한 경제학자라고 훌륭한 투자자는 아니다.  그러나 우리는 종종 두 영역을 혼동한다.

When you think about it, there’s no reason great intellectualizing and great doing must go together: Being able to hack together an incredible piece of code gives you great fitness in the world of software development while doing great theoretical computer science probably gives you better fitness in academia. The two skills don’t have to be connected. Great economists don’t usually make great investors.  But we often confuse the two realms.

특히 배관, 프로그래밍, 트레이딩 또는 마케팅과 같은 일부 "좁은" 분야에서의 성공은 지적이지 못한 사람들에 의해 달성되는 경우가 많습니다. 그들의 진화적 적합성은 [말하는 능력]에서 오는 것이 아니라 [행동하는 능력]에서 오는 것이다.

Success, especially in some “narrow” area like plumbing, programming, trading, or marketing, is often achieved by rather non-intellectual folks. Their evolutionary fitness doesn’t come from the ability to talk but do.

녹색 목재 오류
The Green Lumber Fallacy

Taleb는 이 차이를 "녹색 목재 오류"라고 부릅니다. "100만 달러를 잃으면서 배운 것"이라는 책에 나오는 이야기입니다.
Taleb calls this divergence the Green Lumber Fallacy, after a story in the book What I Learned Losing a Million Dollars.

Taleb이 Antifragile에서 설명한 것처럼 
As Taleb describes it in Antifragile:

금융 분야에서는 드물게 "백만 달러를 잃으면서 배운 것"이라고 불리는 noncharlantanic 서적 중 하나에서 주인공은 큰 발견을 합니다. 그는 "녹색 목재"라고 불리는 상품에서 가장 성공한 무역업자 중 한 명인 조 시겔이라는 사람이 실제로 그것이 (마르지 않았기 때문에 새로 깎은 목재보다는) 녹색으로 칠해진 목재라고 생각했다. 그리고 그는 이걸 거래하는 것을 그의 직업으로 삼았습니다! 한편 narrator는 위대한 지적 이론과 원자재의 가격을 움직이게 한 것에 대한 내러티브에 빠져서 파산했다.
In one of the rare noncharlatanic books in finance, descriptively called What I Learned Losing a Million Dollars, the protagonist makes a big discovery. He remarks that a fellow named Joe Siegel, one of the most successful traders in a commodity called “green lumber,” actually thought it was lumber painted green (rather than freshly cut lumber, called green because it had not been dried). And he made it his profession to trade the stuff! Meanwhile the narrator was into grand intellectual theories and narratives of what caused the price of commodities to move, and went bust.

그것은 단지 성공적인 목재 전문가가 "녹색"이라는 명칭과 같은 중요한 문제들에 대해 무지했던 것만은 아니다. 그는 또한 어떤 전문가도 중요하지 않다고 생각하는 목재에 대한 것들을 알고 있었다. 우리가 무식하다고 부르는 사람들은 무식하지 않을지도 모른다.

It is not just that the successful expert on lumber was ignorant of central matters like the designation “green.” He also knew things about lumber that nonexperts think are unimportant. People we call ignorant might not be ignorant.

목재에서의 순서 흐름 예측과 일반적인 서술이 외부에서 가정할 세부 사항과 거의 관련이 없다는 사실은 중요하다. 현장에서 일을 하는 사람들은 정해진 시험set exam을 보지 않는다. 그들은 가장 서술적이지non-narrative 않은 매니저 중에서 선발된다. 말을 잘하는 것은 별 차이가 만들지 못한다. 진화는 내러티브에 의존하지 않습니다. 인간도 마찬가지입니다. 진화론에는 파란색에 대한 단어가 필요하지 않다.

The fact that predicting the order flow in lumber and the usual narrative had little to do with the details one would assume from the outside are important. People who do things in the field are not subjected to a set exam; they are selected in the most non-narrative manager—nice arguments don’t make much difference. Evolution does not rely on narratives, humans do. Evolution does not need a word for the color blue.

그래서 녹색 목재 오류라고 부르죠. 어떤 사람이 [눈에 보이는 지식의 원천]을 잘못 알고 있는 상황입니다. 여기서는 목재가 띄고 있는 녹색빛greenness이 그것이다. 외부에서는 잘 보이지 않고, 덜 다루기 쉽고, 덜 이야기하기 쉽기 때문입니다.
So let us call the green lumber fallacy the situation in which one mistakes a source of visible knowledge — the greenness of lumber — for another, less visible from the outside, less tractable, less narratable.

 

핵심은 [진짜 원인 요인]은 종종 우리에게 숨겨져 있다는 것이다. 우리는 녹색 재목의 복잡한 점을 아는 것이 주문 흐름을 예의 주시하는 것보다 더 중요하다고 생각합니다. 우리는 우리 스스로를 지성의 영향을 과대평가하도록 유혹하고 왜 "이단"이 앞서나가고 있는지 궁금해한다.
The main takeaway is that the real causative factors of success are often hidden from us.
 We think that knowing the intricacies of green lumber are more important than keeping a close eye on the order flow. We seduce ourselves into overestimating the impact of our intellectualism and then wonder why “idiots” are getting ahead.


그러나 "스킨 인 더 게임"에서는, [선택과 진화]가 결과로 변환되지 않는 한, 훌륭한 이야기와 아이디어에 신경 쓰지 않습니다. 이 때는 [당신이 알고 있는 것]보다 [당신이 하는 것]에 더 신경을 쓴다. 위험관리 이론에 대한 폭넓은 지식보다는 실제로 위험을 피하는 것에 신경을 쓴다. (물론, 현대의 많은 분야에서는 게임 속에 피부가 없기 때문에 대화와 합리화가 선택될 수 있고 자주 선택된다.)
But for “skin in the game” operations, selection and evolution don’t care about great talk and ideas unless they translate into results. They care what you do with the thing more than that you know the thing. They care about actually avoiding risk rather than your extensive knowledge of risk management theories. (Of course, in many areas of modernity there is no skin in the game, so talking and rationalizing can be and frequently are selected for.)

Taleb가 그의 고용 휴리스틱에서 그랬던 것처럼, 우리에게 좋은 말을 하는 사람들을 액면 그대로 받아들이는 것에 대해 약간 회의적이어야 함을 가르쳐준다. 또한 우리가 "그다지 똑똑하다"고 생각하는 사람에게서 "설명할 수 없는" 성공을 볼 때 약간 회의적이 되도록 가르쳐야 한다. 설화에 유혹되어 보이지 않는 단절이 있을 수 있다. (리콴유 같은 사람이 오로지 어떤 일에만 집중해서 피한 문제)
As Taleb did with his hiring heuristic, this should teach us to be a little skeptical of taking good talkers at face value, and to be a little skeptical when we see “unexplainable” success in someone we consider “not as smart.” There might be a disconnect we’re not seeing because we’re seduced by a narrative. (A problem someone like Lee Kuan Yew avoided by focusing exclusively on what worked.)

우리는 이 지혜의 덩어리를 감상하기 위해 우리의 지적 추구들을 포기할 필요는 없습니다. Taleb의 말이 옳습니다. 하지만 또한 ["실제로 작동하는 것"에 대한 엄격하고 회의적인 지식]과 [세계의 점점 더 발전하는 이론 구조]를 결합하는 것은 모든 것 중에서 가장 좋은 조합일 수 있습니다. 

We don’t have to give up our intellectual pursuits in order to appreciate this nugget of wisdom; Taleb is right, but it’s also true that combining the rigorous, skeptical knowledge of “what actually works” with an ever-improving theory structure of the world might be the best combination of all 

 

징글쟁글 오류

Jingle-Jangle Fallacies

www.brookings.edu/blog/social-mobility-memos/2014/12/19/jingle-jangle-fallacies-for-non-cognitive-factors/

용어적으로 말해서, "비인지적 요인"에 대한 scholarship은 엉망이다. 이 분야 역시 단어가 중요한 분야입니다. 우리는 행동, 기술, 장점 또는 특성을 검토하고 있는가?  우리는 "성격", "사회 정서 학습" 또는 "부드러운 기술"을 장려하고 있는가? 특히 "징글"과 "장글"의 두 가지 오류들이 진전을 방해하고 있다.
Terminologically speaking, scholarship on “non-cognitive factors” is a mess. This is a field where words count, too. Are we examining behaviors, skills, strengths or traits?  Are we promoting “character,” “socio-emotional learning,” or “soft skills?” Two fallacies in particular are impeding progress: the “jingle” and the “jangle”.

징글 오류
 THE JINGLE FALLACY

징글 오류(jingle error)는 상당히 다른 여러 가지를 설명하기 위해 단일 용어를 사용하는 것을 말한다. 이 경우, "비인지적 기술"이라는 문구는 광범위한 기술, 특성, 장점 또는 속성, 즉 본질적으로, 이 용어가 암시하는 바와 같이 인지적으로 기초하지 않은 모든 것을 결합한다. 여기에는 사회적 예절이나 개인적 자신감이 포함될 수 있지만, 만족을 미루거나(때로는 신중함 또는 "신중함"이라고 칭함), 일에 집중하거나, 날씨가 어려운 시기(라벨, 때로는 "기분 회복력"이라고 함) 다른 사람의 문제에 공감할 수 있는 능력도 언급될 수 있다.
The “jingle fallacy” refers to the use of a single term to describe a multiplicity of quite different things. In this case, the phrase “non-cognitive skills” lumps together a vast range of skills, traits, strengths, or attributes: essentially, as the term implies, anything that is not cognitively based. This could include social manners or personal confidence; but it may also refer to the capacity to defer gratification (sometimes referred to as prudence or “grit”), focus on a task, weather difficult times (labeled, sometimes, “resilience”), or empathize with the troubles of another person.

어떤 용어가 그렇게 많은 부분을 포괄하는 데 사용될 때, 그것은 이해하는데 방해가 된다. 전혀 다른 차원을 연구하고 있는 연구원들은 그들이 같은 공간에서 일하고 있다고 거짓으로 믿을 수 있는데, 사실 그들은 천문학자들에게 천체물리학자들보다 더 가깝지 않다. "비인지적"이라는 말을 현역에서 은퇴해야 할 때이다.

When a term is being used to cover so much ground, it gets in the way of understanding. Researchers working on wildly different dimensions can falsely believe they are working in the same space, when in truth they are no closer than astrophysicists to astronomers. It is time to retire the phrase “non-cognitive” from active duty.

장글 오류
THE JANGLE FALLACY

하지만 또 다른 잠재적인 문제가 있습니다. 인지적 요인에 대한 초기 연구도 더럽혀졌습니다. "장글 오류"는 사람들이 같은 것을 설명하기 위해 다른 용어를 사용할 때 발생합니다. 이는 부문 간 협업과 공통 측정 채택에 방해가 될 수 있습니다. 그 문제는 종종 다양한 분야의 다른 어휘들에 의해 복잡해진다. 특정 속성은 경제학자에 의해 "기술"로, 심리학자에 의해 "성격 특성"으로, 교육주의자에 의한 특정한 종류의 "학습" 또는 도덕 철학자에 의한 "인격" 차원으로 분류될 수 있다. 각자 같은 개념을 염두에 두고 있을 수도 있지만 용어의 혼란 때문에 서로의 일이나 의미를 놓친다.
But there’s another potential problem, one that also bedeviled early research on cognitive factors: the “jangle fallacy,” which occurs when people use different terms to describe the same thing. This can get in the way of cross-disciplinary collaboration and the adoption of common measurements. The problem is often compounded by the different vocabularies of various disciplines. A particular attribute may be labeled a “skill” by an economist, a “personality trait” by a psychologist, a certain kind of “learning” by an educationalist, or a “character” dimensions by a moral philosopher. Each may have the same concept in mind, but miss each other’s work or meaning because of the confusion of terms.

심지어 헤크만도 고생한다
EVEN HECKMAN STRUGGLES

이 많은 단어와 의미를 헤쳐나가기 힘들다는 사람은 누구나 그 분야의 최고들조차도 어려움을 겪고 있다는 사실에서 약간의 위안을 얻을 수 있다. 노벨상 수상자 제임스 헤크먼이 NPR 인터뷰에서 "This American Life"에 대해 도전을 받는 것을 들어보십시오. 그가 이런 종종 덧없는 요소들을 묘사하는 데 사용했던 다른 용어들로 말입니다. Heckman은 확실히 경제학의 아버지이며 언어와 라벨링 문제에 많은 생각을 해 왔다. 그는 이제 "성격 기술"을 언급한다.

Anybody finding it difficult to make their way through this thicket of words and meanings can take some comfort from the fact that even the best in the field are struggling. Listen to Nobel prize-winner (and our adviser and friend) James Heckman being challenged in this NPR interview for “This American Life” for the different terms he has used to describe these often ephemeral factors. Heckman is the father of the field, certainly within economics, and has given a great deal of thought to the language and labeling issue. He now refers to “character skills.”

성격 특성, 성격 기술 및 성격 강점
CHARACTER TRAITS, CHARACTER SKILLS AND CHARACTER STRENGTHS

"속성trait"은 일반적으로 유전적으로 영향을 받는 대체로 고정된 속성을 가리킨다. 내향적인 사람들은 외향적인 행동을 보여주는 것을 배우더라도 외향적인 사람이 되지 않는다. 그러나 당면 과제에 집중하는 능력이나 만족을 지연시키는 능력을 포함한 기술은 일생에 걸쳐 달라질 수 있으며, 가르치고 배울 수 있다.
A “trait” typically refers to a largely fixed, often genetically-influenced, attribute. Introverts don’t become extroverts, even if they learn to demonstrate some extrovert behaviors. But skills – including the capacity to focus on a task at hand, or defer gratification – are changeable, may vary through a lifetime, and can be both taught and learned.

따라서 Heckman이 스킬이라는 용어를 사용하는 것은 그의 연구의 초점을 좁히고 가단성malleability을 시사하는 측면에서 도움이 된다. (또 다른 조언자인 Paul Tough도 비슷한 노선을 취한다.) 하지만 여기도 뭔가 없어졌다. 스킬은 몇 가지 중요한 요소를 포착하지 못합니다. 호기심은, 한 가지 예를 들면, 배워야 할 기술인가, 고정된 성격인가, 아니면 둘 사이의 어딘가인가? 우리는 "캐릭터 강점strength"이라는 용어를 기술과 특성 사이의 절충어로 사용하는 경향이 있었다. "강점"이란 단어는 운동 능력을 상기시킨다 – 사람은 일정 수준의 체력을 가질 수 있지만, 체육관에서 충분히 일하면 누구나 100개의 팔굽혀펴기를 할 수 있는 근육을 키울 수 있다.  마찬가지로, 어떤 일에 집중하는 사람의 선천적인 능력은 다를 수 있지만, 집중력도 가르쳐질 수 있다.
Heckman’s use of the term skills is therefore helpful in terms of narrowing the focus of his research and suggesting malleability. (Paul Tough, another advisor, takes a similar line). But something is lost here, too. Skill doesn’t capture some important factors. Is curiosity, to give one example, a skill to be learned, a fixed personality trait, or somewhere between the two? In our own work (including in our report “The Character Factor”) we tend to use the term “character strength” as a compromise between skills and traits. Strength calls to mind athletic abilities – a person may have a predisposition towards a certain level of physical strength, but with enough work at the gym anyone can build up the muscles to do 100 pushups.  Similarly, a person’s innate ability to focus on a task may vary, but focus can be taught as well.

물론 캐릭터라는 용어가 그 자체의 문제가 없는 것은 아니다. Heckman이 'This American Life' 인터뷰에서 말했듯이, "문제는 '성격'이 매우 도덕적으로 들린다는 것입니다. 일요학교를 운영하는 것 같습니다."
Of course the term character is not without its own problems. As Heckman put it in the ‘This American Life’ interview, “The trouble is ‘character’ sounds very moralistic. It sounds like we’re running a Sunday School.”

하지만 그의 해결책은 옳습니다. 캐릭터라는 용어를 사용하는 것에서 물러서지 마세요. 이것은 가장 명확한 전체 레이블입니다. 여러분이 그것에 대해 말할 때 무엇을 의미하는지 구체적으로 말하세요. 특히 이번 토론에서 '징글'(다른 개념에 같은 용어를 사용함)과 '장글'(같은 개념에 다른 용어를 사용함)을 동시에 경계할 필요가 있다.

But his solution is the right one: don’t back away from using the term character, which is the clearest overall label: just be specific what you mean when you talk about it. In particular, we need to be on our guard against both the “jingle” (using the same term for different concepts) and the “jangle” (using different terms for the same concept) in this debate.

 

일반화가능도 이론 간단히: G-studies를 위한 프라이머(J Grad Med Educ, 2019)

Generalizability Theory Made Simple(r): An Introductory Primer to G-Studies
Sandra Monteiro, PhD (@monteiro_meded) Gail M. Sullivan, MD, MPH (@DrMedEd_itor) Teresa M. Chan, MD, MHPE (@TChanMD)

 

 

 

다음과 같이 진행된 사건을 상상해 보십시오.

  • 교육생의 소생술을 평가하기 위해 6개 스테이션 시뮬레이션 목표 구조 임상 검사(OSCE)를 설계했습니다.
  • 각 스테이션에서 연습생은 시나리오와 관련된 전문성, 커뮤니케이션, 리더십 및 기술력에 대해 평가받는다.
  • 이러한 개별 점수는 평균화되어 각 스테이션에 대해 단일 점수를 만듭니다.
  • 평가자가 교육생을 평가하는 방법에 있어 교육생의 성별이 역할을 할 수 있다는 점을 인지하고, OSCE의 신뢰성과 차이의 원인을 검토하여 성별 효과가 역량 결정을 유도하지 않음을 확인하고자 합니다. 

Imagine the sequence of events:

  • You have designed a 6-station simulation objective structured clinical examination (OSCE) to assess the resuscitation skills of your trainees.
  • At each station trainees are assessed on professionalism, communication, leadership, and technical skills relevant to the scenario.
  • These individual scores are averaged to create a singular score for each station.
  • Cognizant that gender of the trainee may play a role in how raters assess trainees, you wish to examine your OSCE for reliability and sources of variance, to ensure that gender effects are not driving competency decisions.

결정을 뒷받침할 수 있는 타당한 증거를 어떻게 수집할 수 있습니까?
How can you gather validity evidence to support your decisions?

G-이론은 정확히 무엇이며 이것은 믿을 만한 접근법인가?
What exactly is G-theory and is this a credible approach?

임상 역량 측정
Measuring Clinical Competence

역량 기반 의료 교육(CBME) 시대에 우리는 점점 더 우리의 평가 프로세스를 기반으로 의사 결정을 내리게 되고, 이것은 우리의 평가의 신뢰성과 타당성을 보장할 필요가 있다.1-3 우리는 점수에 의존하여 실력에 따라 연습생들을 구별할 수 있는가? 그 과정을 믿을 수 있을까? 관련 구성(즉, 임상 역량의 특정 측면)을 측정하기 위해 새로운 평가를 작성하거나 오래된 평가를 수정할 때, 우리는 우리의 평가 데이터가 의사결정에 대한 타당성을 유지하는지 결정해야 한다.

  • 모든 평가는 측정 도구로 간주될 수 있으므로, 우리는 타당성을 검사하기 위해 측정 원칙을 적용할 수 있다.3  
  • 타당성은 측정 도구의 안정적인 특성이 아니기 때문에 측정 오류를 잠재적으로 야기하는 다수의 구성 관련 요인에 의해 위협받을 수 있다.3
  • 마찬가지로 신뢰성은 측정 도구의 안정적인 특성이 아니며 역량 기반 평가의 맥락 변화에 민감하다.

In the age of competency-based medical education (CBME), we increasingly make decisions based on our assessment processes, which necessitate ensuring the reliability and validity of our assessments.13  Can we rely on the score to discriminate between trainees based on competence? Can we trust the process? When we create new or modify older assessments to measure relevant constructs (ie, specific aspects of clinical competence), we must determine whether our assessment data maintain validity for decision-making.

  • Any assessment can be considered a measurement tool; thus, we can apply measurement principles to examine validity.3 
  • As validity is not a stable characteristic of any measurement tool, it can be threatened by a multitude of construct irrelevant factors that potentially introduce measurement error.3 
  • Reliability, similarly, is not a stable characteristic of any measurement tool, and is sensitive to changes in context within competency-based assessments.

측정 오차를 줄이는 방법에 대한 문헌 검토를 수행하면 어지럽게 많은 연구 설계 및 분석 접근법이 나타납니다. 이러한 접근법 중 독자는 측정 신뢰성을 검토하기 위한 크론바흐의 알파에 익숙할 가능성이 높다. 크론바흐의 알파를 계산하면 시험 점수의 신뢰도를 알 수 있지만, [체계적인 평가자 편향이 점수에 영향을 미쳤는지를 보여주지는 않는다]. 즉, trainee의 성별이 평가자가 내린 수행능력 평가에 영향을 주었더라도, 우리는 크론바흐의 알파만으로는 이것을 발견할 수 없었다.3 
If you conduct a literature review regarding methods to reduce measurement error, you will find a dizzying multitude of study designs and analysis approaches. Of these approaches, readers are likely familiar with Cronbach's alpha to examine measurement reliability. A calculation of Cronbach's alpha can inform test score reliability, but not whether systematic rater bias has an influence on scores. That is, if trainee gender influenced a rater's assessment of performance, we could not discover this from Cronbach's alpha alone.3 

신뢰성, 타당성, 연구 설계 요소, 데이터 분석을 알려주는 매우 유용한 이론이 일반화 가능성 이론(G-이론)이다.3-6 G이론은 다양한 관찰이나 등급의 신뢰성을 검토, 결정 및 설계하기 위한 통계적 프레임워크이다.3–6 
A highly useful theory that informs reliability, validity, elements of study design, and data analysis is Generalizability theory (G-theory).36  G-theory is a statistical framework for examining, determining, and designing the reliability of various observations or ratings.36 

G 이론을 사용하여 우리는 평가 점수의 구성을 더 잘 이해하기 위해 일반화 가능성 연구(G-studies)를 설계할 수 있다(즉, OSCE 종료 시 얻는 실제 점수에 기여하는 것). 그런 다음 서로 다른 조건에서 수집된 동일한 데이터의 신뢰성을 예측하는 데 도움이 되는 의사 결정 연구(D-Studies)를 설계할 수 있다.
Using G-theory we can design Generalizability studies (G-studies) to better understand the composition of assessment scores (ie, what contributes to the actual score that you get at the end of an OSCE). We can then design Decision studies (D-studies) to help predict the reliability of the same data collected under different conditions.

수행능력 기반 평가에서 우리는 평가 점수(예: 비율 편향, 항목 또는 스테이션의 상대적 난이도, 평가자 또는 검사자의 주의력 또는 기분, 표준화된 환자의 능력 및 전체 환경)에 대한 잠재적 영향을 고려해야 한다.3.7  

  • G-이론은 이러한 요소들에 의해 야기되는 분산을 정량화하는 방법을 제공한다. 3,5,6  
  • 주어진 면facet의 각 형태form를 조건condition이라고 한다.3  
  • 우리의 예인 vignette에서, 연습생은 면facet이고 그들의 성별은 조건condition이다. (그리고 이 예에서는, 우리는 단지 2개의 성별만을 가정한다.) 위의 예제를 사용하여 표 1의 정의로 보완된 중요한 용어와 개념을 검토해보자.

In performance-based assessments we need to consider potential influences on assessment scores, such as rater bias, relative difficulty of items or stations, the rater's or examinee's attention or mood, the abilities of standardized patients, and the overall environment.3,7  

  • G-theory offers a way to quantify the variance contributed by these factors, which G-theory refers to as facets.3,5,6  
  • Each form of a given facet is called a condition.3  
  • In our example vignette, the trainees are a facet and their gender is a condition (and for this example, we assume only 2 genders). Let's use the above example to review important terminology and concepts, which are supplemented by definitions in table 1.

 

예: G이론의 평가 적용
Example: Application of G-Theory to Assessment

표준 OSCE 설계는 동일한 구조(즉, 임상 기술)의 반복 측정이 있기 때문에 G-연구에 이상적이다. 이는 절단을 하기 전에 측정 테이프를 사용하여 일부 목재(또는 다른 측정 테이프를 사용하는 5명의 평균 측정)를 여러 번 측정하는 것과 유사하다. 동일한 구조의 반복 측정값을 수집하면 신뢰성이 향상되는 것으로 나타났다. 이는 [랜덤 분산]이 동일한 구조의 여러 측정에서 cancel out될 수 있기 때문입니다. 그러나 측정 오류의 [체계적인 원인]이 남아 있을 수 있습니다. 예를 들어, 평가자 인식 문헌은 다른 종류의 평가자 편향과 평가 점수와 결정에 미치는 영향의 예들로 가득 차 있다.8 
A standard OSCE design is ideal for a G-study because there are repeated measurements of the same construct (ie, clinical skills), much like we might use a measuring tape to measure some lumber several times before making a cut (or better yet, taking the average measurement from 5 people using different measuring tapes). Collecting repeated measures of the same construct has been shown to improve reliability. This is because random variance can cancel out in multiple measurements of the same construct. But there may remain systematic sources of measurement error. For example, the rater cognition literature is filled with examples of different kinds of rater bias and its impact on assessment scores and decisions.8 

실험 설계에서 초점은 [그룹 간의 실제 차이를 찾기 위해 모든 유형의 오류를 최소화]하는 데 있다.3,9 G-연구에서 목표는 중요한 측정을 신뢰할 수 있는지 여부를 결정하기 위해 오류 소스(분산이라고 함)를 강조하는 것이다.3  우리의 vignet에서, 6개의 모든 스테이션의 점수는 전체 OSCE의 총 점수를 결정하기 위해 결합되거나 평균적이다.10 복수의 스테이션과 평균 OSCE 점수를 사용하는 것은 평가자에 의해 발생한 측정 오류를 처리하는 방법이다.8  그러나 스테이션 점수는 총점에 대한 차이를 유발합니다. 각 스테이션은 더 또는 덜 lenient하고, 점수에 고유한unique 영향을 미치며, G 이론을 사용하여 이러한 기여도를 정량화할 수 있다

In experimental designs the focus is on minimizing error of all types to find true differences between groups.3,9  In G-studies the goal is to highlight sources of error (called variance) in order to determine if we can trust the critical measurement.3  In our vignette, all 6 stations' scores are combined or averaged to determine the total score for the entire OSCE.10  The use of multiple stations and an average OSCE score is a way to deal with measurement error introduced by raters.8  However, each station score contributes variance toward the total score. Each station is more or less difficult or each rater is more or less lenient and has unique influences on the trainee's score; rather than ignore them, using G-theory we can quantify these contributions.

그림은 이 개념을 보여준다. G이론은 우리에게 레시피를 개발할 수 있게 해준다. 분산은 파이의 한 조각에서 성분의 분포와 같습니다.

  • 때로는 분산이 examinee에게 유리하게 작용할 수도 있고, 때로는 분산이 연습생에게 불리하게 작용할 수 있습니다.
  • 때로는 분산이 예측 가능한 방법(체계적인 오류)으로 작용하고 다른 때에는 예측할 수 없는 방법(랜덤 오차)으로 작용합니다.3  

신뢰도를 완전히 평가하기 위해서는 이러한 분산 측면을 고려하는 것이 필수적이며, 이는 궁극적으로 평가의 유효성(정확도)에 대한 상한을 설정한다.3 

The figure demonstrates this concept. G-theory allows us to develop a recipe. Variance is like the distribution of ingredients in a single slice of pie;

  • sometimes the variance works in an examinee's favor, and sometimes the variance may work against the trainee.
  • Sometimes the variance acts in predictable ways (systematic error) and other times in unpredictable ways (random error).3  

It is essential to consider these aspects of variance in order to fully evaluate reliability, which ultimately sets an upper limit on the validity (accuracy) of the assessment.3 

 

 

우리의 vignette에서, 우리는 G-이론을 사용하여 전문성, 의사소통, 리더십, 그리고 기술 능력의 차이를 고려할 수 있다. 그러나 G 이론의 진짜 힘은 연습생의 성별과 같은 추가적인 분산 원인도 고려할 수 있다는 것이다. 관심이 있다면 하루 중 시간, 다른 표준화된 환자 또는 OSCE 관측소의 수와 같은 분산 원인을 추가할 수 있습니다. 표 2는 vignette의 다양한 면facets을 추적하여, 다양한 용도로 평가할 수 있는 방법을 보여줍니다.

In our vignette, we could use G-theory to consider the variance among scores of professionalism, communication, leadership, and technical skills. However, the real power of G-theory is that we can also consider additional sources of variance, such as the gender of the trainee. We could, if we were interested, add in sources of variance like the time of day, different standardized patients, or number of OSCE stations. Table 2 shows how we can keep track of various facets in our vignette to evaluate them for different purposes.

 

 

G- 연구를 진행하기 위해 [먼저 OSCE에서 소생 기술에 대해 가능한 모든 분산원sources of variance 또는 측면facets을 식별하고 그것들이 고정인지 무작위인지 여부를 결정]한다. G-Study를 수행할 모든 pieces를 확보했는지 판단하려면, 표 2와 같이 데이터가 가장 잘 정리되어 있습니다. 다시 이야기하자면, 우리는 (1) 소생술 OSCE에서 신뢰할 수 있는 평가 데이터를 수집했는지 여부 및 (2) 성별(임상 기술 평가와 무관해야 하는 요소)이 전체 평가에 영향을 미치는지 여부를 결정하는 데 관심이 있다.

To proceed with our G-study, we first identify all likely sources of variance or facets in the OSCE for resuscitation skills and determine if they are fixed or random. In order to ensure we have all the pieces to conduct a G-study, data are best organized as in table 2. As a reminder, we are interested in (1) Determining if we collected reliable assessment data in the resuscitation OSCE, and (2) Whether there is any indication that gender—a factor that should be irrelevant to the evaluation of a clinical skill—contributes any variance to the overall assessment.

일반화 가능성 이론 Generalizability Theory

"개인으로부터 측정되는 모든 측정은 가능한 측정의 우주에서 추출한 샘플로 간주됩니다."11 

“Any one measurement from an individual is viewed as a sample from a universe of possible measurements.”11 

G-이론에서 우리는 먼저 우리가 [일반화하고자 하는 점수와 면scores and facets의 우주]를 정의한다.

  • G-연구에서 고려 중인 면이 고정인지 랜덤인지는 미리 결정되어 있다. 그런 다음 우리는 G-계수를 계산하기 위해 몇 가지 G- 연구를 수행한다. 계산된 각 G 계수는 측정 도구의 [특정 측면(예: 평가자간 신뢰성)의 신뢰성]을 평가한다.
  • D-studies에서 우리는 facet의 레이블 변경의 영향을 평가할 수 있다(예컨대, fixed에서 random으로). 우리는 이러한 계산을 사용하여 유사한 평가 상황에서 퍼포먼스에 대한 예측을 할 수 있다. 예를 들어, 우리는 OSCE station 수를 줄임으로써 G-계수가 어떻게 영향을 받는지 물어볼 수 있다. 또는 station에 늘어난 평가자 수가 G-계수를 증가시킬 수 있는지 물어볼 수 있습니다. 

In G-theory we first define the universe of scores and facets we wish to generalize from and to.

  • In a G-study, the facets being considered are predetermined to be fixed or random. We then conduct several G-studies to calculate G-coefficients. Each calculated G-coefficient evaluates the reliability of a given aspect of the measurement tool, for example, interrater reliability.
  • In D-studies we can evaluate the impact of changing a facet's label, such as from fixed to random. We can use these calculations to make predictions about performance in a similar assessment situation. For example, we can ask how the G-coefficient would be affected by reducing the number of OSCE stations. Or we can ask if multiple raters per station would increase the G-coefficient.

일반적으로 표 3에 표시된 것처럼 여러 스테이션이 신뢰성을 향상시킬 수 있지만 스테이션당 여러 레이터는 큰 영향을 미치지 않습니다.

Typically, as shown in table 3, multiple stations can improve reliability, but multiple raters per station do not have a big impact.

 

 

측정 도구의 신뢰도를 고려할 때, 우리는 다른 분산원이나 오차의 상관 관계를 설명하는 기본 공식으로 시작할 수 있다.3,6 
When considering the reliability of a measurement tool, we can start with a basic formula to describe how different sources of variance or error relate.3,6 

 

파이 비유를 사용하자면, 오류 분산(레시피)이 여러 성분(개별 성분)으로 구성되어 있다고 가정합니다. 다양한 오류 유발 면(예: 측정 컵 정밀도, 물 순도, 베이커리의 고도 등)에 의해 분산이 약간 변경될 수 있습니다. 이러한 면은 각각 결과 파이의 최종 구성 과정에서 오류의 몇 가지 요소를 도입introduce할 것이다.
Using the pie analogy, consider that Error variance (the recipe) is composed of multiple components (individual ingredients). The variance may be slightly altered by various error-inducing facets (eg, the measuring cup precision, water purity, altitude of the bakery, etc). These facets would each introduce some element of error in the final composition of the resulting pie.

우리의 vignette에서, 소생술 OSCE가 한 번에 수행된다고 가정할 때, facet은 연습생, 훈련생의 성별, station(레이터 포함)이 될 것이다. Trainee의 facet은 성별의 facet에 nested되어 있다. (station에 nested된) 평가자는 일반화generalization의 한 facet으로, 한 관측치 또는 한 관측치 또는 점수에서 다른 등급의 점수로 일반화할 수 있기를 희망하고 있다.

In our vignette, assuming that the resuscitation OSCE is conducted on one occasion, the facets would be the trainees, gender of the trainees, and stations (which include raters). The facet of trainee is nested in the facet of gender. Raters (nested in stations) are facets of generalization, as we hope to generalize from one observation or score at one station, or recorded by one rater, to another score from a different rater. 

이 예에서 trainee는 facet of differentiation이다. 왜냐하면 OSCE가 측정한 기술 수준에 따라 개별 연습생 간의 differentiate를 하고 싶기 때문이다다. 이 면facets들은 이 연구에서 알려진 점수의 우주를 묘사한다.

  • 향후 행정에서 OSCE station이나 시나리오가 결코 바뀌지 않을 경우, 우리는 스테이션의 facet이 고정된 것으로 간주할 수 있다.
  • 마찬가지로, 매번 동일한 임상 교수진이 이 OSCE의 평가자로 작용할 것으로 예상한다면, 비율의 측면도 고정된 것으로 간주될 수 있다.

In this example, trainees are the facet of differentiation as we wish to differentiate between individual trainees based on their skill level as measured by the OSCE. These facets describe the known universe of scores in this study.

  • If the OSCE stations or scenarios are never going to change in future administrations, we can consider the facet of station to be fixed.
  • Similarly, if you foresee the same clinical faculty acting as raters for this OSCE every time, the facet of rater may also be considered fixed.

고부담 OSCE에서는 시험 보안상의 이유로 스테이션이 변경됨에 따라 [이러한 두 가지 측면이 모두 무작위적]이라는 점에 유의한다. 프로그램 평가에서, [교수진은 전담 평가 직원이 아니라 일반적으로 자원 봉사자이기 때문에 변경될 수도] 있습니다. Facet이 fixed인지 random인지 여부가 G 계수 계산에 포함되는 분산 성분을 변경합니다(표 4 참조).3–5 

Note that in high-stakes OSCEs both of these facets are random as stations change for test security reasons. In program assessments, faculty also may change as they are typically volunteers and not dedicated assessment staff. Whether a facet is fixed or random changes what variance components are included in the calculation of the G-coefficient (see table 4).35 

 

 

모든 소생술 OSCE 관리에서, 평균 OSCE 점수는 모든 개별 점수를 평가하는 우주 점수 역할을 합니다. G-연구는 표준 편차, 평균 제곱 오차 및 분산을 분산 분석(ANOVA)으로 결정하는 시작점이 같습니다.3-5 표준 분산 분석의 요인부터 시작하여 분산 성분 또는 G-연구의 면으로 계속합니다. 분산 분석ANOVA과의 차이점은 G-이론에서 우리는 그룹 간의 유의한 차이를 확립하는 데 관심이 있는 것이 아니라 오차 분산이 다양한 측면에 어떻게 분포되는지를 결정하는 데 관심이 있다는 것입니다. 목표는 고전적인 신뢰도 계수를 확장하여 측정 대상, 이 경우 연습생으로 인한 분산의 양을 설명하는 것이다. 이상적으로, 가장 큰 분산의 원천은 연습생 자신이며, 이는 능력의 개별적인 차이를 나타낼 것이다. 이러한 요인들이 임상적 역량에 대한 결정에 영향을 미치지 않아야 하기 때문에, 비율자나 성별과 같은 다른 측면에 기인하는 많은 양의 차이는 바람직하지 않다.
For any administration of the resuscitation OSCE, the average OSCE score acts as the universe score against which all individual scores are evaluated. G-studies have the same starting point for determining standard deviation, mean square error, and variance as an analysis of variance (ANOVA).35  We start with factors in a standard ANOVA, but then continue with the variance components, or facets in a G-study. The difference from an ANOVA analysis is that in G-theory we are not as concerned about establishing a significant difference between groups, but rather to determine how error variance is distributed among the various facets. The goal is to extend classical reliability coefficients to describe how much variance is due to the object of measurement, in this case the trainees. Ideally, the greatest source of variance is the trainees themselves, which would indicate individual differences in ability. Large amounts of variance attributed to raters or other facets such as gender are undesirable, as these factors should not influence decisions about clinical competence.

이상적으로, G-연구는 모든 변동 원인 또는 오차를 평가할 수 있습니다. 다만 assessment를 evaluation할 때의 한계는 [알 수 없는 분산 출처]에 대해서는 기여도를 추정할 수 없다는 것이다. 그러나 알려진 많은 중요 변수에 조명을 집중함으로써 무엇이 누락되었는지 이해하기 시작할 수 있습니다.
Ideally, G-studies would assess all sources of variance, or error. The limitation for any evaluation of an assessment is the inability to estimate contributions from unknown sources of variance. However, by focusing a light on as many known important variables, it is possible to begin to understand what may be missing.

다음 번에 G- 연구를 포함하는 기사를 읽을 때, 이 전략은 가장 큰 분산 원인이 (1)테스트 대상(평가를 통해 다양한 연습생 역량을 판단할 것이라는 기대)인지, 또는 (2) 평가자, 하루 중 시간, 테스트 상황 수 또는 기타 요인 등의 다른 요인 때문인지 여부를 결정하는 데 도움이 될 것이라는 점을 기억하십시오.  

Next time you read an article that includes a G-study, remember that this strategy will help determine whether the largest source of variance was the subjects being tested—which we would expect in an assessment to determine different trainee competence—or due to other factors, such as the person rating the trainee, time of day, number of test situations, or other factors.

참고로 G 이론을 사용하여 측정 오류(박스)를 조사하는 3개의 문서를 나열합니다. 여러분만의 평가 프로그램을 만들 때, 여러분 자신의 측정의 신뢰성을 향상시킬 뿐만 아니라 여러분의 작업을 다른 사람들에게 전파할 때 이익을 더하기 위해 G-이론을 사용하는 것을 고려해보세요. G-이론과 신뢰성 연구에 대한 당신의 질문과 의견을 기대합니다.

For reference, we list 3 articles that use G-theory to examine measurement error (box). When creating your own assessment programs, consider using G-theory to understand the role of sources of variance, not only to enhance the reliability of your own measurements, but also to add benefit when disseminating your work to others. We look forward to your questions and comments about G-theory and reliability studies.

 

 

boxArticles Using Generalizability Study Design to Examine Test Properties

  • Lang VJ, Berman NB, Bronander K, Harrell H, Hingle S, Holthouser A, et al. Validity evidence for a brief online key features examination in the internal medicine clerkship. Acad Med. 2019;94(2):259–266. doi:10.1097/ACM.0000000000002506.
  • Monteiro S, Sibbald D, Coetzee K. i-Assess: evaluating the impact of electronic data capture for OSCE. Perspect Med Educ. 20181;7(2):110–119. doi:10.1007/s40037-018-0410-4.
  • Lord JA, Zuege DJ, Mackay P, Roze des Ordons A, Jocelyn L. Picking the right tool for the job: a reliability study of 4 assessment tools for central venous catheter insertion. J Grad Med Educ. 2019;11(4):422–429.

 

 

 

 


J Grad Med Educ. 2019 Aug;11(4):365-370. doi: 10.4300/JGME-D-19-00464.1.

Generalizability Theory Made Simple(r): An Introductory Primer to G-Studies

Sandra MonteiroGail M SullivanTeresa M Chan

    • PMID: 31440326

설문 설계의 단계 따라가기: GME 연구 사례(J Grad Med Educ, 2013)

Tracing the Steps of Survey Design: A Graduate Medical Education Research Example
Charles Magee, MD, MPH Gretchen Rickards, MD Lynn A. Byars, MD, MPH Anthony R. Artino Jr., PhD

 

 

설문조사는 대학원 의학 교육(GME) 환경에서 데이터를 수집하는 데 자주 사용됩니다.1 그러나 GME 설문조사가 엄격하게 설계되지 않은 경우, 결과의 품질은 바람직한 수준보다 낮을 수 있다. 

Surveys are frequently used to collect data in graduate medical education (GME) settings.1 However, if a GME survey is not rigorously designed, the quality of the results is likely to be lower than desirable. 

배경 Background

2010년, 국방부는 워싱턴 DC에 있는 월터 리드 육군 의료 센터와 메릴랜드 주 베데스다에 있는 국립 해군 의료 센터의 통합을 의무화했다. 이러한 통합 이전에 각 병원은 별도의 IM 상주 프로그램을 포함하여 독립적으로 인가된 GME 프로그램을 유지했습니다. 합병하는 동안 이러한 IM 프로그램은 통일된 프로그램에 원활하게 통합되어야 했습니다.

In 2010, the Department of Defense mandated the integration of the Walter Reed Army Medical Center in Washington, DC, with the National Naval Medical Center in Bethesda, Maryland. Prior to this integration, each hospital maintained independently accredited GME programs, including separate IM residency programs. During the merger these IM programs were asked to integrate seamlessly into a unified program.

많은 유사점에도 불구하고, 2개의 IM 프로그램은 성공적인 통합을 방해할 수 있는 중요한 차이를 가지고 있었다. 예를 들어, Walter Reed의 주민들은 프로그램에 강한 경험적 학습 요소를 가져오는 것으로 생각되는 하룻밤, 24시간 당직구조에 익숙했다. 그러나, 이 당직 시스템은 근무 시간 제한을 위반할 위험을 무릅썼다. 국립해군의료원 주민들은 근무시간 위반 위험은 없앴지만 인계인수 건수는 늘린 night-float 제도 아래 근무했다. 이러한 프로그램적 차이를 고려하여, 우리는 두 프로그램의 관련자들이 [프로그램 통합이 IM 레지던스의 미칠 영향에 대해 가지고 있는 생각]을 이해하는 데 관심이 있었다.

Despite many similarities, the 2 IM programs had important differences that might inhibit successful integration. For example, residents at Walter Reed were accustomed to an overnight, 24-hour call structure that was thought to bring a strong experiential learning element to the program. Yet, this call system risked violating work hour restrictions. Residents at the National Naval Medical Center worked under a night-float system that eliminated the risk of duty hour violations but increased the number of handoffs. Given these programmatic differences, we were interested in understanding how individuals in both programs thought the integration would affect the quality of the IM residency.

설문 조사 설계 프로세스
Our Survey Design Process

증거 기반 설계 프로세스를 통해 GME 연구자는 모든 응답자가 동일한 방식으로 해석할 가능성이 높고, 정확하게 대응할 수 있으며, 기꺼이 대답할 의욕과 의욕이 있는 일련의 조사 항목을 개발할 수 있다. 

Evidence-based design processes allow GME researchers to develop a set of survey items that every respondent is likely to interpret the same way, is able to respond to accurately, and is willing and motivated to answer. 

질문 1: 설문조사가 연구 질문에 답변하는 데 도움이 되는 적절한 도구입니까?
Question 1: Is a Survey an Appropriate Tool to Help Answer My Research Question?

설문조사를 작성하기 전에 관심 있는 연구 질문과 연구자가 측정하고자 하는 변수(또는 구조)를 고려하는 것이 중요하다. 예를 들어, 연구 질문이 의도된 청중의 신념, 의견 또는 태도와 관련이 있다면, 조사는 타당하다. 한편, 연구자가 특정 임상 절차에 대한 거주자의 기술 수준과 같이 직접 관찰 가능한 행동을 평가하는 데 더 관심이 있는 경우, 관찰 도구가 더 나은 선택이 될 수 있다.
Before creating a survey, it is important to consider the research question(s) of interest and the variables (or constructs) the researcher intends to measure. If, for example, the research question relates to the beliefs, opinions, or attitudes of the intended audience, a survey makes sense. On the other hand, if a researcher is more interested in assessing a directly observable behavior, such as residents' skill level for a particular clinical procedure, an observational tool may be a better choice.


레지던트 합병의 맥락에서, 우리는 통합 노력이 대학원 의학 교육 인증 위원회(ACGME)에 의해 지정된 주요 GME 품질 요소 및 프로그램 요구 사항에 어떤 영향을 미치는지 이해하고자 했다. 우리는 이러한 요소들을 전공의의 관점에서 이해하면 리더십이 성공적인 통합에 대한 위협과 프로세스 개선을 위한 잠재적 기회를 식별할 수 있을 것이라고 믿었다. 또한, 우리는 설문조사가 적절한 도구라고 생각했다. 왜냐하면 (훨씬 더 나중에 얻을 수 있는 in-service 시험 점수와 board 점수와 같은 더 객관적인 결과를 기다리기보다는) 참가자들로부터 실시간 피드백을 수집할 수 있기 때문이다. 각 프로그램의 전공의들이 우리 조사의 대상 인구로 확인되었다.

In the context of the residency merger, we wanted to understand how the integration effort would have an impact on key GME quality elements and program requirements as specified by the Accreditation Council for Graduate Medical Education (ACGME).2 We believed that understanding these factors from the residents' perspective would enable leadership to identify threats to successful integration as well as potential opportunities for process improvement. Further, we felt a survey was the appropriate tool because it would allow us to collect real-time feedback from participants rather than waiting for more objective outcomes, such as in-service exam scores and board scores, which, although valuable, would occur much later. The residents of each program were identified as the target population for our survey.

질문 2: 과거에 다른 사람들은 어떻게 이 구조물을 다루었는가?
Question 2: How Have Others Addressed This Construct in the Past?

문헌에 대한 철저한 검토는 GME 조사 설계 과정의 다음 단계가 되어야 한다. 이 단계는 이전 연구에서 관심 구인construct가 어떻게 정의되었는지에 대한 정보를 제공한다. 또한 이를 통해 기존 조사 척도를 사용하거나 조정할 수 있는 것을 식별할 수 있다.
A thorough review of the literature should be the next step in the GME survey design process. This step provides information about how the construct of interest has been defined in previous research. It also helps one identify existing survey scales that could be employed or adapted.


우리의 리뷰는 GME 프로그램의 통합에 대해 거의 발표되지 않았다는 것을 보여주었다. 하지만, 우리는 경영 문헌에서 조직 변화와 구조조정의 많은 예를 발견했습니다. 조직 변화의 가장 널리 출판되고 잘 연구된 사례들 중 일부는 William Bridges에 의해 개발되었다.3 Bridges의 몇 가지 설문 조사 도구를 검토하여 설문 조사에 적용할 수 있는 공통 주제와 항목을 파악했습니다. 궁극적으로, 우리는 이 항목들 중 어떤 것도 사용하지 않았다. 대신, 우리는 몇 가지 항목을 수정하고 브리지스의 작업을 사용하여 현재의 만족도, 통합이 훈련 경험에 미치는 영향에 대한 인식, 전환을 위한 훈련 프로그램의 준비성에 대한 믿음 등 개별적이지만 관련 있는 3개의 아이디어로 construct를 better define 했다.

Our review revealed that very little has been published on integration of GME programs. However, we found a number of examples of organizational change and restructuring in the business literature. Some of the most widely published, well-studied examples of organizational change were developed by William Bridges.3 We reviewed several of Bridges' survey instruments to identify common themes and items that might be applicable to our survey. Ultimately, we did not use any of these items verbatim. Instead, we adapted several items and used Bridges' work to better define our constructs of 3 separate but related ideas: current satisfaction, perceptions of the impact of the integration on the training experience, and beliefs about the readiness of the training programs to make the transition.


관련 조사 척도를 찾고 사용 또는 수정하고자 하는 GME 연구자는 대개 저자에게 연락하여 사용을 요청할 수 있다. 그러나 "이전에 검증된" 조사 척도는 특히 초기 조사 대상자와 다른 방식으로 척도가 수정되거나 모집단에 사용되는 경우 특정 연구 맥락에서 [추가적인 신뢰성과 타당성 증거를 수집해야 한다]는 점에 주목할 필요가 있다. 출판을 위해, 이 추가 증거는 "방법"과 "결과" 섹션에 보고되어야 한다.

GME researchers who find and wish to use or modify relevant survey scales can usually contact authors and request such use. It is worth noting, however, that “previously validated” survey scales require the collection of additional reliability and validity evidence in the specific research context, particularly if the scales are modified in any way or used in populations different from the initial survey audience. For publication, this additional evidence should be reported in the “Methods” and “Results” sections.

질문 3: 설문 조사 항목을 어떻게 개발합니까?
Question 3: How Do I Develop My Survey Items?

이 단계의 목표는 응답자가 쉽게 이해할 수 있는 언어로 관심 구성을 적절하게 나타내는 조사 항목을 만드는 것이다. 한 가지 중요한 설계 고려사항은 구조물을 적절히 평가하는 데 필요한 항목 수입니다. 이 문제에 대한 쉬운 해답은 없다. 이상적인 항목 수는 구조의 복잡성과 구조를 평가하고자 하는 수준(때로는 "grain size" 또는 구조가 측정될 추상화 수준level of abstraction이라고도 함)을 포함한 여러 요인에 따라 달라진다.4 일반적으로 최종 규모에서 궁극적으로 필요한 것보다 더 많은 항목을 개발하는 것은 좋은 생각이다. 왜냐하면 일부 문항은 의심할 여지 없이 설계 프로세스 후반에 삭제되거나 수정될 것이기 때문이다.4 
The goal of this step is to create survey items that adequately represent the construct of interest in a language that respondents can easily understand. One important design consideration is the number of items needed to adequately assess the construct. There is no easy answer to this question. The ideal number of items depends on a number of factors, including the complexity of the construct and the level at which one intends to assess the construct (sometimes referred to as the “grain size” or level of abstraction at which the construct will be measured).4 In general, it is a good idea to develop more items than will ultimately be needed in the final scale because some items will undoubtedly be deleted or revised later in the design process.4 

다음 과제는 명확하고 모호하지 않은 항목 집합을 작성하는 것입니다. 좋은 문항을 작성하는 것은 과학이면서 예술이다. 그럼에도 불구하고, 항목 작성 프로세스를 안내하는 데 사용되어야 하는 수많은 항목 작성 지침(증거 기반 모범 사례)이 있다. 1,4–8 이러한 모범 사례를 검토하는 것은 이 사설의 범위를 벗어난다. 그러나, 우리는 독자를 돕기 위해 표 1의 몇 가지 증거 기반 권고 사항에 대한 요약을 제공했다.

The next challenge is to write a set of clear and unambiguous items. Writing good items is as much an art as it is a science. Nonetheless, there is a plethora of item-writing guidance—evidence-based, best practices—that should be used to guide the item-writing process.1,48 Reviewing these best practices is beyond the scope of this editorial; however, we have provided a summary of several evidence-based recommendations in table 1 to assist readers.

 

항목 작성 프로세스를 안내하기 위해 공인 IM 레지던스에서 ACGME가 요구하는 요소를 선택했습니다.2 특히 조직개편의 영향을 받을 가능성이 크고 전공의들에게도 잘 보이는 요소를 선택했다. 우리의 초기 초안에는 잠재적으로 관련된 모든 요소에 대한 질문이 있었습니다; 우리가 너무 많은 항목을 가지고 있다는 것이 금방 분명해졌습니다. 따라서, 우리는 의도된 응답자들과 가장 관련이 있을 가능성이 높은 문제들에 우리의 노력을 다시 집중했다. 이를 통해, 우리는 150개 항목에서 45개 항목으로 설문 조사를 줄일 수 있었습니다.

To guide our item-writing process, we selected elements that the ACGME requires in an accredited IM residency.2 In particular, we chose elements that we felt were likely to be affected by reorganization and were also visible to the residents. Our initial draft had questions about every potentially relevant element; it quickly became clear that we had too many items. As such, we refocused our efforts on those issues most likely to be relevant to the intended respondents. In doing so, we were able to cut down our survey from 150 items to a more manageable 45 items.

조사 개발 프로세스 중에 내린 다른 결정을 설명하기 위해, 우리는 이 사설의 나머지 부분을 교육적 품질 척도에 초점을 맞춘다. 이 규모를 위해, 우리는 참가자들이 합병이 그들의 IM 전공의 경험의 질에 영향을 미칠 것이라고 믿는 정도를 알고 싶었습니다. 예를 들어, 한 항목은 "내과 통합이 아침 보고서의 교육 질에 어떤 영향을 미칠 것으로 생각하십니까?"라고 물었습니다. 우리는 우리의 문헌 검토와 전문가들과의 토론을 바탕으로, 응답자들이 그 영향이 긍정적일 수도 있고 부정적일 수도 있다고 생각할 수도 있다고 믿었기 때문에, 우리는 "긍정적이거나 부정적인 영향"의 중간점을 가진 양극성 척도를 선택했다. 그리고 반응 척도의 낮은 쪽에 대한 "극한 부정적 영향"과 높은 쪽에 대한 "극한 긍정적 영향"의 끝점(표 2)입니다.

To illustrate other decisions we made during the survey development process, we focus the remainder of this editorial on our didactic quality scale. For this scale, we wanted to know the extent to which participants believed the merger would have an impact on the quality of their IM residency experience. For example, one item asked “How do you think the internal medicine integration will impact the educational quality of morning report?” Because we believed, based on our literature review and discussion with experts, that respondents might think the impact could either be positive or negative, we chose a bipolar scale with a midpoint of “neither positive nor negative impact” and endpoints of “extreme negative impact” on the low side of the response scale and “extreme positive impact” on the high side of the response scale (table 2).

 

 

질문 4: 설문 항목이 명확하게 작성되었고 관심 구성 요소와 관련이 있습니까?
Question 4: Are the Survey Items Clearly Written and Relevant to the Construct of Interest?

조사 내용을 평가하기 위해 GME 연구원들은 전문가 그룹에게 항목 검토를 요청해야 한다. 내용 또는 전문가 검증이라고 하는 이 프로세스는 명확성, 구조와의 관련성 및 인지 난이도에 대한 조사 항목 초안을 검토하도록 전문가에게 요청하는 것을 포함한다.9-11 전문가는 또한 품목 개발 중에 누락되었을 수 있는 구조물의 중요한 측면을 식별하는데 도움을 줄 수 있다. "전문가"는 특정 관심구조에 대해 잘 아는 조사 설계 경험자, 국가 콘텐츠 전문가 또는 지역 동료가 포함될 수 있다. 콘텐츠 검증을 수행하는 데 필요한 전문가 수는 일반적으로 적다. 전문가 6명에서 12명 정도면 충분할 것이다.10,11 
To assess survey content, GME researchers should ask a group of experts to review the items. This process, called content or expert validation, involves asking experts to review the draft survey items for clarity, relevance to the construct, and cognitive difficulty.911 Experts can also assist in identifying important aspects of the construct that may have been omitted during item development. “Experts” might include those more experienced in survey design, national content experts, or local colleagues knowledgeable about the specific construct of interest. The number of experts needed to conduct a content validation is typically small; 6 to 12 experts will often suffice.10,11 

당사의 9명의 전문가는 각 IM 프로그램의 직원뿐만 아니라 조사 설계에 대한 전문지식을 갖춘 소속 대학의 교수진을 선발했습니다. 각 전문가는 평가 항목 초안 및 그 또는 그녀가 집중하기를 원하는 조사의 목적과 구체적인 측면을 설명하는 문서와 함께 콘텐츠 검증에 참여하라는 초대를 받았다. 이 과정을 통해 우리의 전문가들은 초점이 잘 맞지 않는 6개의 항목을 찾아냈고, 우리는 이 항목들을 설문조사에서 제거했다. 우리의 전문가들은 스케일 항목에서 콘텐츠 누락을 식별하지 않았으며, ACME 품질 요소 및 프로그램 요건을 고품질 GME 훈련 프로그램의 보편적인 속성으로 사용하는 것에 동의했다. 마지막으로, 전문가들은 해석하기 어렵다고 느끼는 몇 가지 항목을 찾아냈고, 이 항목들은 수정되었다.

Our 9 experts included staff from each IM program, as well as select faculty from our affiliated university who had expertise in survey design. Each expert received an invitation to participate in the content validation, along with the draft survey items and a document outlining our purpose and the specific aspects of the survey on which we wanted him or her to focus. Through this process our experts identified 6 items that were poorly focused; we eliminated these items from the survey. Our experts did not identify any content omissions in the scale items, and they agreed with our use of ACGME quality elements and program requirements as universal attributes of a high-quality GME training program. Finally, our experts identified several items that they felt were difficult to interpret, and these items were revised.

질문 5: 응답자가 내가 의도한 대로 내 항목을 해석할 것인가?
Question 5: Will My Respondents Interpret My Items in the Manner That I Intended?

조사 항목 초안이 전문가 검토를 거친 후에는 대상 인구가 항목 및 대응 옵션을 어떻게 해석할지 평가하는 것이 중요하다. 이를 위한 한 가지 방법은 인지 인터뷰 또는 인지 사전테스트라고 알려진 과정을 통해서이다.12 

  • 인지 인터뷰는 일반적으로 응답자가 각 항목을 소리내어 읽고 특정 응답을 선택하는 데 있어서 자신의 사고 과정을 설명하는 대면 인터뷰를 포함한다. 
  • 이 프로세스를 통해 각 응답자가 연구자가 의도한 대로 항목을 해석하고 정확한 응답을 생성하기 위한 예상 인지 단계를 수행하고 적절한 응답 앵커를 사용하여 응답하는지 확인할 수 있다. 
  • 인지 인터뷰는 대상 모집단을 대표하는 소수의 참가자(일반적으로 4-10명 참가자)와 함께 수행해야 하는 정성적 방법이다. 
  • 이 단계는 잘못된 해석 또는 편향을 초래할 수 있는 질문 또는 응답 문구의 문제를 식별하는 중요한 단계입니다. 인지 인터뷰는 표준화된 방법론을 사용하여 수행해야 하며, 적용할 수 있는 몇 가지 체계적인 접근법이 있다.12 

After the draft survey items have undergone expert review, it is important to assess how the target population will interpret the items and response options. One way to do this is through a process known as cognitive interviewing or cognitive pretesting.12 

  • Cognitive interviewing typically involves a face-to-face interview during which a respondent reads each item aloud and explains his or her thought process in selecting a particular response.
  • This process allows one to verify that each respondent interprets the items as the researcher intended, performs the expected cognitive steps to generate an accurate response, and responds using the appropriate response anchors.
  • Cognitive interviewing is a qualitative method that should be conducted with a handful of participants who are representative of the target population (typically 4–10 participants).
  • This is a critical step to identify problems with question or response wording that may result in misinterpretation or bias. Cognitive interviewing should be conducted using a standardized methodology, and there are several systematic approaches that can be applied.12 

우리의 적은 목표 인구(전체 거주자 약 68명)를 고려하여, 우리는 치프 레지던트와 각 프로그램의 프로그램 및 부 프로그램 책임자와 인지 인터뷰를 수행하기로 선택했는데, 그들은 우리의 목표 모집단과 가장 가까운 유사점을 나타낸다고 느꼈다. 우리는 think-aloud 기술과 소급해서 말하는 탐색 기술을 모두 사용하여 인지 인터뷰를 수행했다.12 Think-aloud 방법에서는 각 참가자가 표준화된 스크립트를 읽는 동안 검토하는 설문조사의 초안 사본을 제공한다. 인터뷰 진행자는 각 항목을 읽고, 그 후에 질문을 처리하고 답변을 선택하는 동안 참가자가 큰 소리로 생각할 수 있도록 초대됩니다. 비록 시간이 많이 걸리지만, 이 인터뷰 방법은 원하는 인지적 반응을 불러일으키지evoke 못하는 항목을 식별하는 데 도움이 된다. 

Given our small target population (approximately 68 residents in all), we opted to perform cognitive interviews with the chief residents and the program and associate program directors of each program, who we felt represented the closest available analogues to our target population. We performed cognitive interviews using both the think-aloud and retrospective verbal probing techniques.12 In the think-aloud method, each participant is provided with a copy of the draft survey, which he or she reviews while an interviewer reads from a standardized script. The interviewer reads each item, after which the participant is invited to think aloud while processing the question and selecting a response. Although time consuming, this method of interviewing is helpful in identifying items that fail to evoke the desired cognitive response. 

[후향적 verbal probing]은 참가자가 전체 설문조사를 완료한 직후 관리하는 스크립트로 작성된 질문으로 구성된 대안 방법이다. 이 접근 방식은 시간을 절약하고 보다 정확한 조사 경험을 제공하지만, 각 질문에 대한 참가자의 기억과 관련된 편견을 도입할 수 있다. 인지 인터뷰를 통해, 우리는 항목 표현, 시각적 디자인 및 설문 레이아웃에 대한 몇 가지 작지만 중요한 문제를 확인했으며, 다음 반복에서 모두 수정되었다.

Retrospective verbal probing is an alternative method that consists of scripted questions administered just after the participant completes the entire survey. This approach conserves time and allows for a more authentic survey experience; however, retrospective verbal probing can introduce bias related to the participant's memory of each question. Through cognitive interviewing, we identified several small but important issues with our item wording, visual design, and survey layout, all of which were revised in our next iteration.

질문 6: 내 설문 조사 항목에서 얻은 점수는 신뢰할 수 있으며, 가설을 세운 다른 조치와 관련이 있습니까?
Question 6: Are the Scores Obtained From My Survey Items Reliable, and Do They Relate to Other Measures as Hypothesized?

앞서 언급한 조사 설계 과정 중 GME 연구원들의 최선의 노력에도 불구하고, 일부 조사 항목은 여전히 문제가 있을 수 있다.4 따라서 추가적인 타당성 증거를 얻으려면 평가기기의 파일럿 테스트를 수행해야 한다. 전면적인 조사를 위해 계획된 조건과 동일하거나 매우 유사한 조건을 사용하여 설문조사를 시범적으로 시험하는 것이 중요하다. 그런 다음 파일럿 테스트의 설명 데이터를 사용하여 개별 항목에 대한 반응 분포를 평가하고 종합 점수를 조정할 수 있습니다. 또한 이러한 데이터를 사용하여 항목 및 복합 점수 상관 관계를 분석할 수 있으며, 이 모든 데이터는 설문의 [내부 구조]와 [다른 변수와의 관계]에 대한 증거입니다. 또한 요인 분석과 같이 더 진보된 다른 통계 기법을 사용하여 조사의 내부 구조를 확인할 수 있다는 점에 주목할 필요가 있다.13 
Despite the best efforts of GME researchers during the aforementioned survey design process, some survey items may still be problematic.4 Thus, to gain additional validity evidence, pilot testing of the survey instrument should be performed. It is important to pilot test the survey using conditions identical or very similar to those planned for the full-scale survey. Descriptive data from pilot testing can then be used to evaluate the response distributions for individual items and scale composite scores. In addition, these data can be used to analyze item and composite score correlations, all of which are evidence of the internal structure of the survey and its relations to other variables. It is also worth noting that other, more advanced statistical techniques, such as factor analysis, can be used to ascertain the internal structure of a survey.13 

우리는 Walter Reed의 IM 프로그램에서 14명의 거주자와 National Naval Medical Center의 IM 프로그램에서 20명의 레지던트를 대상으로 우리의 설문 조사를 시험했다. 이것은 목표 인구의 50%를 나타낸다. 표 2는 특정 항목에 대한 IM 통합의 인지적 영향을 평가하기 위해 고안된 교육적 품질 척도에 대한 우리의 파일럿 테스트 결과를 제시한다.각 교육 프로그램 내의 교육 구성 요소. 척도에는 8개의 질문이 포함되었으며, "극한 부정적 영향"에서 "극한 긍정적 영향"에 이르는 5포인트 리커트 유형의 응답 척도가 사용되었습니다.
We pilot tested our survey on 14 residents from Walter Reed's IM program and 20 residents from the National Naval Medical Center's IM program; this represented 50% of the target population. table 2 presents the results of our pilot test for the didactic quality scale, which was designed to assess the perceived impact of the IM integration on specific didactic components within each training program. The scale included 8 questions and used a 5-point, Likert-type response scale ranging from “extreme negative impact” to “extreme positive impact.”

SPSS 20.0(IBM Corporation, New York)을 사용하여 item-level statistics를 검토한 후 Cronbach 알파 계수를 계산하여 교육 품질 척도에서 8개 항목의 내부 일관성 신뢰성을 평가했다. 크론바흐 알파 계수는 0에서 1 사이의 범위를 가질 수 있으며 척도 항목이 서로 관련되는 정도에 대한 평가를 제공합니다. 첫 번째 사설에서 설명했듯이, 교육 품질을 측정하도록 설계된 8개 항목과 같은 주어진 구성을 측정하기 위해 설계된 조사 항목 그룹은 모두 서로 moderate to strong한 positive 상관 관계를 보여야 한다. 두 항목이 양의 상관 관계가 없는 경우 하나 이상의 항목에 잠재적인 문제가 있음을 나타냅니다.
After reviewing the item-level statistics using SPSS 20.0 (IBM Corp., New York), we calculated a Cronbach alpha coefficient to assess internal consistency reliability of the 8 items in our didactic quality scale. A Cronbach alpha coefficient can range from 0 to 1 and provides an assessment of the extent to which the scale items are related to one another. As we explained in our first editorial, a group of survey items designed to measure a given construct, such as our 8 items designed to measure didactic quality, should all exhibit moderate to strong positive correlations with one another. If they are not positively correlated, this suggests a potential problem with one or more of the items. 

그러나 크론바흐 알파는 스케일 길이에 민감하다. 다른 모든 것들이 동일하면, 일반적으로 더 긴 스케일은 더 높은 크론바흐 알파를 갖는다. 이와 같이 규모의 내부 일관성 신뢰성을 높이는 매우 쉬운 방법은 항목을 추가하는 것입니다. 그러나 크론바흐 알파의 이러한 증가는 [응답자들이 지치게 하는 지나치게 긴 조사]로 인해 더 많은 응답 오류가 발생할 수 있는 가능성과 균형을 이루어야 한다.
It should be noted, however, that Cronbach alpha is sensitive to scale length; all other things being equal, a longer scale will generally have a higher Cronbach alpha. As such, a fairly easy way to increase a scale's internal consistency reliability is to add items. However, this increase in Cronbach alpha must be balanced with the potential for more response error due to an overly long survey that is exhausting for respondents.

내부 일관성 신뢰성에 대한 설정된 임계값은 없지만 일반적으로 알파 β0.75는 허용되는 것으로 간주된다.14 우리의 교육적 품질 척도의 경우 크론바흐 알파는 8.89로 예상대로 8개 항목이 서로 높은 상관 관계를 가지고 있음을 나타낸다. 그런 다음 합성 점수(즉, 8개 항목의 가중치 없는 평균 점수)를 계산하여 교육 품질 변수를 만들고 합성 점수의 기술 통계량과 히스토그램(표 2와 그림 각각)을 검사했습니다. 히스토그램은 정규 분포를 따르며, 이는 응답자들이 반응 척도를 따라 거의 모든 점을 사용하고 있음을 시사합니다.

Although there is no set threshold value for internal consistency reliability, an alpha ≥0.75 is generally considered to be acceptable.14 For our didactic quality scale, the Cronbach alpha was .89, which indicated that our 8 items were highly correlated with one another, as expected. We then calculated a composite score (ie, an unweighted mean score of the 8 items) to create our didactic quality variable, and we inspected the descriptive statistics and histogram of the composite scores (table 2 and figure, respectively). The histogram was normally distributed, which suggested that our respondents were using almost all of the points along our response scale.

 

 


위에서 설명한 항목 및 척도 분석을 수행한 후에는 전면적인 조사 프로젝트로 진행하는 것이 합리적입니다. 물론 시험 결과가 낮은 신뢰도 또는 놀라운 관계를 보이는 경우(즉, 주어진 규모의 하나 이상의 항목이 다른 항목과 예상대로 상관관계가 없는 경우), 연구자는 기존 항목을 수정하거나 성능이 떨어지는 항목을 제거하거나 새로운 항목의 초안을 작성하는 것을 고려해야 한다. 설문조사가 대폭 수정될 경우 개정된 조사의 후속 시범 시험이 실시될 수 있다. 실적이 저조한 품목을 일부 제거하는 등 사소한 수정만 이뤄진다면 직접 본격적인 조사 시행으로 진행하는 것이 타당하다.

After conducting the item- and scale-level analyses, as described above, it is reasonable to advance to the full-scale survey project. Of course, if the pilot results indicate poor reliability and/or surprising relationships (ie, one or more items in a given scale do not correlate with the other items as expected), researchers should consider revising existing items, removing poorly performing items, or drafting new items. If significant modifications are made to the survey, a follow-up pilot test of the revised survey may be in order. If only minor modifications are made, such as removing a handful of poorly performing items, it is reasonable to proceed directly to full-scale survey implementation.

결론 Concluding Thoughts

 


J Grad Med Educ. 2013 Mar;5(1):1-5.

 doi: 10.4300/JGME-D-12-00364.1.

Tracing the steps of survey design: a graduate medical education research example

Charles MageeGretchen RickardsLynn A ByarsAnthony R Artino Jr

    • PMID: 24404217

Free PMC article

N을 어떻게 할까? 포커스그룹 연구에서 샘플 사이즈 보고에 관한 방법론적 연구(BMC Med Res Methodol, 2011)

What about N? A methodological study of sample-size reporting in focus group studies
Benedicte Carlsen1*, Claire Glenton2,3

 

 

 

배경 Background

 

포커스 그룹 또는 포커스 인터뷰는 일반적으로 연구자가 결정한 주제에 대한 참가자의 인식과 경험에 기초하여 moderated 그룹 토론을 통해 연구 데이터를 수집하는 방법으로 정의된다[1-6]. 초점 그룹은 진행자나 연구자와 참가자 사이의 상호작용보다는 [참가자 간의 상호작용에 중점]을 둔다는 점에서 그룹 인터뷰와 다르다[4]. 최근 몇 년 동안, 포커스 그룹은 건강 과학 연구에서 점점 더 인기를 얻고 있다; 1999년 메디라인 검색에서 투하이와 퍼트남[7]은 1985년 이전에는 포커스 그룹 연구가 없었지만 1985년과 1999년 사이에 1000개 이상의 연구를 발견했다. 포커스 그룹은 사람들의 주관적인 경험과 태도를 탐구하는 데 매우 적합하며, 보건 연구원들은 반복적으로 포커스 그룹을 사용하여 보건 서비스를 평가하거나, 주요 이해관계자 또는 의사결정자의 견해를 도출하거나, 우편 설문 조사나 정보에 반응하지 않는 소외 그룹의 견해를 탐구하도록 권장된다.기존 인터뷰 상황에 겁을 먹을 수 있습니다 [2, 5, 7, 8]. 설문 조사 또는 시험 연구의 데이터를 준비하거나 해석하기 위해 사전 또는 사후 스터디로 포커스 그룹 인터뷰도 권장된다.
A focus group or focus interview is commonly defined as a method of collecting research data through moderated group discussion based on the participants' perceptions and experience of a topic decided by the researcher [16]. Focus groups differ from group interviews in that the emphasis is on the interaction between the participants rather than between the moderator or researcher and the participants [4]. In recent years, focus groups have become increasingly popular within health science research; in a Medline search in 1999, Twohig and Putnam [7] found no focus group studies before 1985 but more than 1000 studies between 1985 and 1999. Focus groups are well suited to explore people's subjective experiences and attitudes, and health researchers are repeatedly encouraged to use focus groups to evaluate health services, to elicit the views of key stakeholders or decision makers or to explore the views of marginalised groups that typically would not respond to a postal survey or would be intimidated by a conventional interview situation [2, 5, 7, 8]. Focus group interviews are also recommended as a pre- or post-study to prepare or interpret data from surveys or trial studies.

 

1980년대 이후 보건 과학 저널의 포커스 그룹 연구가 급격하게 증가했음에도 불구하고, 이 방법이 어떻게 사용되고 왜 사용되는지에 대한 지식은 의외로 적다 [1, 9, 10]. 1993년, 포커스 그룹 연구 방법론의 "founding father" 중 한 명인 리차드 크루거는 이 분야가 "설계가 부실하고 보고가 부실하다"고 불평했다[11]. 1996년 이 분야를 검토한 후, 모건은 "현재 포커스 그룹 절차의 보고는 기껏해야 haphazard한 수준"이라고 결론지었다. 1990년대에 수행된 포커스 그룹 연구에 대한 두 개의 상위 및 Putnam의 검토[7]는 그 방법이 어떻게 사용되었는지에 대한 "어마어마한 차이tremendous variation"를 보여주었고 보고가 종종 부적절하다고 결론지었다. 우리는 10년 후 낙관론에 대한 더 많은 이유가 있는지 알아내는 데 관심이 있었다.
Despite this apparent sharp increase in focus group studies in health sciences journals since the 1980 s, there is surprisingly little knowledge about how this method is used and why [1, 9, 10]. In 1993, one of the "founding fathers" of focus group research methodology, Richard Krueger, complained that the field is burdened with "poor design and shoddy reporting" [11]. After reviewing the field in 1996, Morgan concluded that "At present the reporting of focus group procedures is a haphazard affair at best." Twohig and Putnam's review [7] of focus group studies carried out in the 1990 s showed a "tremendous variation" in how the method was used and concluded that reporting is often inadequate. We were interested in discovering whether there is more reason for optimism a decade later.

수행할 그룹의 수를 결정하는 방법에 대한 조언은 방법의 다른 측면에 대한 조언과 비교하여 종종 미묘하다. 실제로, 일부 교재들은 그룹 수를 결정하는 기존의 지침이 없다고 주장한다 [13, 16, 18].
Within this literature, advice on how to decide on the number of groups to conduct is often meagre compared to advice on other aspects of the method. In fact, some teaching books claim that there are no existing guidelines for deciding number of groups [13, 16, 18].

지침의 대부분은 포커스 그룹이 포커스 그룹 연구의 분석 단위여야 한다고 권고한다. 이에 따라 표본 크기는 연구의 총 참여자 수가 아니라 그룹 수를 참조해야 합니다. 그러나 표본 크기에 대한 이 두 가지 측면 사이에는 당연히 본질적인 관계가 있다. 따라서, 일부 저자들은 연구의 참가자 수가 적을 경우, 그룹의 크기를 줄임으로써 그룹의 수를 증가시킬 수 있다고 제안한다 [4]. 그룹 크기에 대한 지침은 일반적이며 그룹당 최소 4명 이상 최대 12명의 참가자를 초과하지 않는다 [2, 5, 6, 13]. 여기서 Fern의 실험 연구는 [4명의 참가자로 구성된 두 그룹 및 8명의 참가자로 구성된 한 그룹을 수행함으로써 더 많은 정보를 얻을 수 있다]는 것을 나타냈다는 것을 주목하는 것이 흥미롭다[19].
Most of this guidance recommends that the focus group should be the unit of analysis in focus group-studies. In line with this, sample size should refer to number of groups and not the total number of participants in a study. However, there is of course an intrinsic relationship between these two aspects of sample size. Thus, some authors suggest that if the number of participants in a study is small, it is possible to increase the number of groups by reducing the size of the groups [4]. Guidance on group size is common and seldom goes beyond a minimum of 4 and a maximum of 12 participants per group [2, 5, 6, 13]. Here, it is interesting to note that Fern's experimental study indicated that more information is obtained by conducting two groups of four participants then one group of eight participants [19].

질적 방법의 강점은 현상의 깊이와 복잡성을 탐구하는 능력이다. 따라서 Sandelowski는 정성적 연구에서 표본 크기에 대한 그녀의 논의에서 너무 적은 그룹이나 너무 많은 그룹 모두 포커스 그룹 연구의 품질을 낮출 수 있다고 강조한다[20]. 양은 질과 균형을 이루어야 하며, 녹음된 자료의 테이프 인터뷰나 페이지가 많을수록 저자가 자료에서 추출할 수 있는 깊이와 풍부함이 줄어듭니다 [21]. 이러한 지식은 최적의 포커스 그룹 수를 달성하는 방법에 관한 조언을 직접적으로 제공하지는 않지만, 작성자가 그룹 수를 결정할 때 알아야 할 문제를 강조합니다.
The strength of qualitative methods is their ability to explore the depth and complexity of phenomena. Thus, Sandelowski, in her discussion of sample size in qualitative research, emphasizes that both too few and too many groups can lower the quality of focus group studies [20]. Quantity must be balanced against quality, and the more hours of taped interviews or pages of transcribed material, the less depth and richness the authors will be able to extract from the material [21]. While this knowledge does not directly offer advice regarding how to achieve the optimal number of focus groups, it does highlight an issue that authors should be aware of when determining number of groups.

포커스 그룹 연구에서 샘플 크기에 대한 대부분의 조언은 "포화점" 또는 "이론적 포화점"을 가리키며, "이론적 포화점"이라는 용어는 1967년 글레이저와 스트라우스[22]에 의해 "근거 이론"의 개요로 도입되었으며, 그 이후로 비록 단순화된 버전이지만 대부분의 질적 연구 환경으로 확산되었다. 일반적으로 "데이터 포화"라고 합니다. 이 접근법에서, 인터뷰는 이론이나 가설을 지속적으로 구성하고 다듬기 위해 "이론적 표본 추출"에 따라 다른 범주의 informants들과 함께 수행되어야 한다. 이 방법은 데이터 수집(즉 모집, 인터뷰 및 분석)이 각 인터뷰가 진행되는 동안 반복적 프로세스로 수행되어야 하므로, 표본 크기를 연속적으로 계산하고 수집된 모든 데이터를 분석하는 기존의 정량적 설계와는 상당히 다른 접근 방식을 나타낸다[23, 24]. 

Most advice about sample size in focus group studies refers to "point of saturation" or "theoretical saturation", The term "theoretical saturation" was introduced by Glaser and Strauss [22] in 1967 in their outline of "grounded theory" and has since spread to most qualitative research environments, albeit in a simplified version, usually referred to as "data saturation". In this approach, interviews should be conducted with different categories of informants following a line of "theoretical sampling" to continuously construct and refine theory or hypotheses. The method requires that data collection, i.e. recruiting, interviewing and analysis, is conducted as an iterative process for each interview, thus representing quite a different approach from the traditional quantitative design of successively calculating sample size beforehand and analysing all data collected [23, 24].

 

포화점 개념은 운용하기에 너무 모호하다는 비판을 받아왔다 [25]

  • 글레이저와 스트라우스는 "각 범주의 이론적인 포화도에 도달할 때까지 표본 추출"을 해야 한다고 제안하고, 
  • 스트라우스와 코빈은 "범주에 관한 새로운 또는 관련 데이터가 나타나지 않을 때까지 데이터를 수집해야 한다"고 말한다. [15] (1990:188) 

그러나 저자들은 "새로운 데이터 또는 관련 데이터"에 대한 정의를 제시하지 않았으며, 연구자가 포화 상태에 이르렀음을 합리적으로 확인할 수 있기 전에 새로운 정보가 필요하지 않은 인터뷰 횟수에 관한 조언을 하지 않았다.
The concept of point of saturation has been criticised for being too vague to operationalise [25].

  • Glaser and Strauss suggest that researchers should: "sample until theoretical saturation of each category is reached" [22](1967:61-62, 11-112) while
  • Strauss and Corbin state that researchers should collect data until "no new or relevant data seem to emerge regarding a category." [15] (1990:188).

However, the authors present no definition of "new or relevant data", and give no advice regarding the number of interviews with no new information that is required before the researcher can be reasonably certain that saturation has been reached.

포커스 그룹 방법론에 대한 보다 실용적인 권위자들은 많은 연구자들이 assignment에 대해 연구하고 있으며 funder들은 그룹 수를 사전 연구로 결정하도록 요구할 수 있다[2, 4, 12]. 그룹 수와 관련된 일반적인 사항에 대한 권장 사항 및 참조는 이러한 텍스트북 내에서 다양합니다. 일반적으로 참가자 범주당 2-5개의 그룹을 추천한다. 그러나 저자는 대개 이러한 것들이 rule of thumb일 뿐이며, 포커스 그룹의 수는 연구 질문의 복잡성과 그룹의 구성에 달려 있다고 강조한다. 종종, 주어진 조언은 rule of thumb을 따르되 약간 더 높은 숫자가 "안전한 쪽에" 있도록 제안하는 것이다. 일부 저자들은 연구자들이 필요한 최종 그룹의 수를 결정하면서 포화점을 사용할 것을 제안한다 [2, 4].
More pragmatic authorities on focus group methodology recognise that many researchers work on assignment and their funders may require that the number of groups are decided pre-study [2, 4, 12]. The recommendations and references to what is common regarding number of groups vary within these text books. In general they recommend from two to five groups per category of participants. However, the authors usually underline that these are only rules of thumb and that the number of focus groups depends on the complexity of the research question and the composition of the groups. Often, the advice given is to follow the rules of thumb but to suggest a slightly higher number to be "on the safe side". Some authors suggest that the researchers then use point of saturation as they go along to decide the final number of groups needed [2, 4].

이 교과서들 중 일부는 여전히 글레이저와 스트라우스를 언급하지만, 다른 책들은 그렇지 않다. 이러한 경우에 이론적 표본 추출과 이론적 포화의 개념과 그 이면의 이론은 ["목적 표본 추출"과 "데이터 포화" 또는 단순히 "포화"라는 less theoretically sustained한 용어로 대체된 것]처럼 보인다. 다만 새로운 필수 정보가 발견되지 않을 때까지 지속적인 데이터 분석과 새로운 데이터 획득 과정을 통해 제보자를 선정하고 그룹 수를 결정하는 기본 절차가 남아 있다.
While some of these text books still refer to Glaser and Strauss, others do not. In these cases the concept of theoretical sampling and theoretical saturation and the theory behind it seem to have been lost on the way and replaced with the less theoretically sustained terms of "purposive sampling" and "data saturation" or merely "saturation". However, the basic procedure of selecting informants and deciding on the number of groups through a constant process of analysing data and obtaining new data until no new essential information is found, remains.

정성적 방법론 분야의 비평가들에 의해 포화 개념이 연구 보고서에서 종종 잘못 사용되고 있다고 주장되어 왔다 [23, 26]. Charmaz [25] (2005:528)는 "연구자들이 종종 작은 표본 - 얇은 데이터를 가진 매우 작은 표본을 정당화하기 위해 포화 기준을 호출한다"고 주장한다. 실제로 이러한 작은 표본 크기는 [시간 부족 또는 자금 부족의 결과]일 수 있습니다. 따라서 '포화'가 차르마즈가 암시하듯 포커스 그룹 보고서에서 잘못된 디자인을 가리는 마법 단어가 되었는지는 아직 조사되지 않았다.
It has been claimed by critics within the field of qualitative methodology that the concept of saturation is often misused in research reports [23, 26]. Charmaz [25] (2005:528) claims that "Often, researchers invoke the criterion of saturation to justify small samples - very small samples with thin data." In reality, these small sample sizes may, in fact, be a result of lack of time or lack of funds. Whether "saturation" has thus become the magic word which obscures faulty designs in focus group reports, as Charmaz insinuates, has yet to be investigated.

일반적으로 포커스 그룹 방법이 어떻게 사용되고 작업이 이루어지는지에 대한 경험적 연구는 부족하다. 

In general, empirical research into how focus group methods are used and work is scarce. 

목표 Objectives

방법 Methods

자격기준 Eligibility criteria

언급한 바와 같이, 포커스 그룹 인터뷰의 정의는 일반적으로 주어진 주제에 대한 토론을 용이하게 할 목적으로 연구자가 시작한 소규모 그룹의 모임을 가리킨다. [1, 4–6] 그러나, 우리는 작성자 자신이 데이터 수집 방법을 참조하기 위해 "초점 그룹"이라는 용어를 사용한 모든 연구를 포함했다. 포커스 그룹만을 사용한 연구와 혼합 방법을 사용한 연구를 포함했다. 우리는 2009년 리뷰 작업을 시작하고 그 분야의 최신 기술을 검토하고 싶어 2008년에 발표된 연구를 선택했습니다. 게다가 우리는 2003년과 1998년, 즉 5년과 10년 전에 그 분야의 확장에 대한 조잡한 견제로 같은 조사를 반복했다.
As mentioned, definitions of focus group interviews usually refer to researcher-initiated gathering of a small group of people with the aim of facilitating discussion about a given topic [1, 46]. However, we included any study where the authors themselves used the term "focus group" to refer to their method of data collection. We included studies using focus groups only and studies using mixed methods. We chose studies published in 2008 as we started working with the review in 2009 and wanted to review the state of the art in the field. In addition we repeated the same search for 2003 and 1998, i.e. five and ten years earlier as a crude check on the expansion of the field.

 

Search methods for identification of studies

 

Data selection, extraction and analysis

 

We extracted data about the following aspects as numerical data:

  1. Number of focus groups in each study
  2. Maximum and minimum number of participants in the focus groups in each study
  3. Total number of participants
  4. Whether any explanation for number of groups was given
  5. Whether this explanation was tied to:
    • Practical issues (such as convenience when recruiting or limited resources to conduct interviews)
    • Recommendations in the literature (pragmatic guidelines to number of focus groups)
    • Saturation
    • Capacity when analyzing, i.e. balancing between depth and breadth of data

결과 Results

포커스 그룹 스터디의 샘플 크기 현재 상태
The current status of sample size in focus group studies

전자 데이터베이스 검색을 통해 우리는 2008년에 발표된 240개의 논문을 확인했다. 이에 비해, 1998년과 2003년에 대한 우리의 연구는 각각 23건과 62건의 연구를 낳았다.
Through our electronic database search we identified 240 papers published in 2008. In comparison, our search for 1998 and 2003 resulted in 23 and 62 studies respectively.

우리는 검토에 포함시키기 위해 2008년부터 240편의 논문 각각에 대한 전체 텍스트 버전을 고려했다. 본문 전문을 읽고 20편의 논문이 제외되었다 이 중 6건은 기획연구여서 제외됐고, 4건은 인터넷 기반이라 제외됐고, 3건은 1차 연구가 아니어서 제외됐으며, 7건은 추상화에도 '초점집단'이라는 용어가 등장했는데도 실제로는 보고하지 않아 제외됐다. (이들 중 일부는 보고된 연구에서 평가된 개입의 일부로 포커스 그룹을 언급했습니다.)
We considered the full text version of each of the 240 papers from 2008 for inclusion in the review. Twenty papers were excluded after reading the full text version. Of these, six were excluded because they were planned studies, four were excluded because the focus groups were Internet-based, three were excluded because they were not primary studies and seven were excluded because they did not, in fact, report the results of focus group studies even though the term "focus groups" appeared in their abstracts. (Some of these referred to focus groups as part of an intervention that was evaluated in the reported study).

220개의 논문이 우리의 포함 기준에 부합했다. (포함된 스터디 목록은 추가 파일 1을 참조하십시오.) 이것들은 117개의 다른 학술지에 발표되었습니다. 61%는 혼합 데이터 수집 방법을 사용한 반면 39%는 포커스 그룹만 사용한 적이 있다.
Two hundred and twenty papers met our inclusion criteria. (See Additional file 1 for a list of included studies.) These were published in 117 different journals. Sixty-one percent had used mixed methods of data collection, while 39% had used focus groups only.

220개의 논문 중 많은 논문들이 표본 크기에 대한 불충분한 보고로 특징지어졌다.

  • 22(10%)가 포커스 그룹 수를 보고하지 않음
  • 42명(19%)은 총 참여자 수를 보고하지 않았다.
  • 102명(46%)이 포커스 그룹의 최소 및 최대 참가자 수를 보고하지 않았다.

 

Many of the 220 papers were characterised by an insufficient reporting of sample size:

  • 22 (10%) did not report number of focus groups
  • 42 (19%) did not report total number of participants
  • 102 (46%) did not report minimum and maximum number of participants in the focus groups

 

또한, 이 정보가 때때로 논문의 다른 섹션에 보고되었기 때문에 포커스 그룹과 참가자 번호를 찾기가 때때로 어려웠다(예: [28, 29 참조). 혼합 방법 연구의 경우, 다른 데이터 수집 방법에 대한 표본 크기 정보를 구분하기가 어려운 경우가 있었다(예: [30] 참조).
In addition, it was sometimes difficult for us to find focus group and participant numbers as this information was sometimes reported in different sections of the papers (See for example [28, 29]. For mixed method studies, it was sometimes difficult to separate between sample size information for different data collection methods (See for example [30]).

그룹 및 참가자 수를 보고한 논문은 이 숫자에 큰 범위를 보였지만 데이터 분포는 오른쪽으로 꼬리가 길었다. 즉, 포커스 그룹 숫자가 적은 연구가 많았고, 포커스 그룹 숫자가 많은 연구는 거의 없었다(표 1).

Those papers that did report numbers of groups and participants showed a great range in these numbers, but data distribution was positively skewed, i.e. there were many studies with a few focus groups and few studies with high numbers of focus groups (Table 1).

 

 

 

포커스 그룹 수에 대한 작성자 설명
Authors' explanations for number of focus groups

수행된 포커스 그룹의 수를 결정하거나 결정하게 된 방법에 대한 저자들의 설명은 다양했지만, 명확하지 않거나 완전히 결여된 경우가 많았다(예: [31, 32]. (표 2 참조) 저자들이 혼합 방법을 사용할 때, 연구의 정량적 부분에 대한 표본 크기에 대한 설명은 종종 꼼꼼한 반면, 포커스 인터뷰의 표본 크기는 종종 불분명하고 피상적이었다.
Authors' explanations of how they had decided on or ended up with the number of focus groups carried out varied, but were often unclear or completely lacking (e.g. [31, 32]). (See Table 2.) When authors used mixed methods, explanations of sample size for the quantitative part of the study were often meticulous, while the sample size of the focus interviews in contrast was often unclear and superficial, as in this example:

 

 

- 필요한 숫자에 도달할 때까지 객관적인 샘플링이 수행되었다[33].
- purposive sampling was undertaken till the necessary number was attained
 [33].

 

포함된 220개의 연구 중 183개(83,2%)는 포커스 그룹의 수에 대해 아무런 설명도 하지 않았다(즉, 37개는 어떤 종류의 설명을 하지 않았다). 종종 저자들은 포커스 그룹의 수보다는 참가자의 수를 설명했다 [34, 35]. 이러한 경우에 대표적인 것은 임상 개입 연구와 함께 포커스 그룹 연구가 수행되고 저자가 포커스 그룹 인터뷰에 참여하도록 개입 연구의 모든 참가자를 초대한 상황이었다 [34, 36]. 이 경우 포커스 그룹의 수보다 참여자의 수를 설명하므로, 이는 "설명 없음"으로 분류되었다.
Of the 220 studies included, 183 (83,2%) gave no explanation for number of focus groups (i.e. 37 did give some type of explanation). Often, authors explained the number of participants rather than the number of focus groups [34, 35]. Typical for these cases were situations where focus group studies were carried out alongside clinical intervention studies and where the authors had invited all participants from the intervention study to participate in the focus group interviews [34, 36]. As these accounts explain the number of participants rather than the number of focus groups, this was categorised as "no explanation".

표 2에서 우리는 데이터 품질과 수량(데이터를 분석할 수 있는 용량)의 균형을 유지해야 한다는 점을 언급하여 그룹 수를 정당화하는 연구는 없다는 것을 알 수 있다. 이 표에는 또한 표본 크기에 대한 모든 설명이 포커스 그룹이 두 개에서 13개 사이인 연구에서 발견되었음을 보여줍니다. 포커스 그룹의 수와 수행된 그룹 수(Pearson 상관 관계)에 대한 설명의 존재 사이에 상관 관계가 있는지 테스트했다. 선형 관계를 찾을 수 없습니다. 11개의 단일 그룹 연구 중 어느 것도 한 그룹이 충분한 이유를 정당화하려고 시도하지 않았다. 이러한 연구는 모두 [혼합된 방법]을 사용했으며, [설문지 등을 개발하기 위해 일반적으로 포커스 그룹 연구를 파일럿으로 사용]했다.
From Table 2 we also see that no study justified the number of groups by referring to the need to balance data quality and quantity (capacity to analyse data). The table also shows that all the explanations for sample size were found in studies that had between two and 13 focus groups. We tested if there was any correlation between the presence of an explanation for number of focus groups and the number of groups conducted (Pearson correlation). We found no linear relationship. None of the eleven single-group studies attempted to justify why one group was sufficient. These studies all use mixed methods and the qualitative assessment showed that they typically used the focus group study as a pilot for developing questionnaires etc.

지적한 바와 같이, 13개 이상의 그룹을 포함하는 연구 중 표본 크기에 대한 설명을 제공하는 것은 없으며 정성적 평가에서 높은 수의 그룹을 연구 한계로 지칭하는 연구도 없었다. 반대로, 저자가 표본 크기가 상대적으로 높다고 판단했을 때, 이는 다음과 같은 이점이 있었다.
As noted, none of the studies that included more than 13 groups gave any explanations for sample size and the qualitative assessment showed that none of the studies referred to a high number of groups as a study limitation. On the contrary, when authors considered their sample size to be relatively high, this was seen as advantageous:

시설 직원의 상당한 단면도로 다수의 포커스 그룹을 수행함으로써, 코딩 중 단일 포커스 그룹 또는 방법론적 선택에 의해 결과가 크게 영향을 받을 가능성을 줄였다[37].

By conducting a large number of focus groups with a significant cross-section of the facility's employees, we reduced the possibility that results would be dramatically affected by a single focus group or methodological choice during coding [37].


한편, 저자들이 소수의 포커스 그룹만을 포함했을 때, 그들은 종종 이것을 한계로 묘사했다. 그러나 이러한 여러 연구에서 저자들은 포커스 그룹의 수가 데이터 포화에 의해 결정되었다고 주장하였다. 이것은 이론적으로 포커스 그룹의 수가 사실 적절했다는 것을 암시해야 한다. (예: [38–43]을 참조하십시오.) 그러나 저자들은 종종 적은 수의 포커스 그룹을 약점으로 설명했지만, 여러 연구는 포커스 그룹이 심층적으로 다루고 문제에 대한 두꺼운 설명을 제공하기 위해 제공한 가능성을 참고하여 그들의 방법 선택을 정당화했다.

On the other hand, when authors had included only a small number of focus groups, they frequently described this as a limitation. However, in several of these studies, authors also claimed the number of focus groups had been determined by data saturation. This should, in theory, imply that the number of focus groups was, in fact, appropriate. (See for example [3843]). But while authors often described a small number of focus groups as a weakness, several studies justified their choice of method with reference to the possibilities that focus groups gave to go in depth and provide a thick description of the issue.

 

포화 Saturation

 

포커스 그룹의 수에 대한 설명을 한 37개 연구 중 28개는 포화 상태에 이르면 중단했다고 주장했다. 그러나 이러한 설명의 절반 이상(28개 중 15개)은 포화 상태로 끝난 데이터 수집 및 분석을 포함하는 반복 프로세스가 발생했다는 것을 확신하게 보고하지 않았다. 그 이유는 주로 방법론적 절차에 대한 설명의 불일치가 주된 원인이었다. 한 가지 일반적인 예는 포화점에 대한 레퍼런스에도 불구하고, 포커스 그룹의 수가 미리 결정되었다는 것이다([44, 45] 참조).
Among the 37 studies that did give an explanation for the number of focus groups, 28 claimed that they had stopped once they had reached a point of saturation. However, more than half of these explanations (15 of 28) did not report convincingly that an iterative process, involving data collection and analysis that ended with saturation, had taken place. The reason for this was mainly inconsistencies in the description of the methodological procedures. One common example was that, despite their reference to point of saturation, their number of focus groups was pre-determined, as the extraction below shows (See also [44, 45]):

특정 커뮤니티의 주민과 함께 세 개의 포커스 그룹이 수행되었다. 그것은 작은 공동체였고, 세 개의 포커스 그룹 후에 그들의 장벽과 제안된 해결책에 대한 포화점이 있을 것이라고 결정되었다[46].
Three focus groups were conducted with residents of a specific community. It was a small community, and it was determined that after three focus groups, there would be a saturation point regarding their barriers and suggested solutions [46].

포화도 주장이 근거 없는 것으로 보이는 다른 일반적인 예로는 (목적적 또는 이론적 표본 추출 대신) 편의 표본 추출을 사용한 경우, 또는 참여를 자원한 모든 사람이 포함된 연구였으며, 분석 전에 모든 데이터가 수집된 것으로 보였다(예: [41, 42, 47–49].
Other common examples where claims of saturation appeared unsubstantiated were studies that used convenience sampling, and included everyone who volunteered to participate, instead of purposive or theoretical sampling, and where, in addition all data seemed to have been gathered before the analysis (See for example [41, 42, 4749]).

 

또한 포화 상태에 도달했다고 판단되기 전에 새로운 관련 정보가 없이 수행된 포커스 그룹의 수를 보고하거나 논의한 저자는 없다는 점에 주목했다. 반대로, 작가들은 대개 포화 상태에 도달하는 과정에 대해 피상적이고 막연한 언급을 했는데, 그들 중 많은 사람들은 이 시점에 도달했다는 "느낌"을 언급한다.
We also noted that no author reported or discussed the number of focus groups that had been conducted with no new relevant information before it was decided that a point of saturation had been reached. On the contrary, authors normally gave superficial and vague references to the process of reaching point of saturation, many of them referring to a "feeling" of having reached this point:

포커스 그룹은 "포화"(새로운 테마가 확인되지 않음)에 도달해다고 느낄 때까지 수행되었다. [41]
Focus groups were [...] conducted until we felt "saturation" (no new themes identified) was reached [41].

다섯 번째 포커스 그룹이 끝날 때, 우리는 주제의 포화가 충족되었다고 느꼈고, 그래서 우리는 모집을 중단했다. [50]
At the end of the fifth focus group, we felt that theme saturation had been met, so we stopped recruitment... [50]

우리는 또한 포화점에 관한 적절한 보고의 몇 가지 예를 발견했다

  • 예를 들어 바리마니 외 연구진[51]은 근거 이론의 사용을 설명하고 이론적 포화도가 충족될 때까지 경험적 소견과 이론 간의 끊임없는 비교가 샘플링 절차를 어떻게 안내했는지를 설명했다. 그러나 이 논문은 이례적으로 9000단어 정도 길었다. 
  • 또 다른 예는 슈발 외[52]이다. 저자들은 약 3000단어의 논문에서 "포화"라는 용어를 구체적으로 언급하지 않았지만 표본 추출 절차와 포화가 어떻게 충족되었는지에 대한 명확한 설명을 제공했다.

We also found some examples of adequate reporting regarding point of saturation.

  • For example Barimani et al [51] explained their use of grounded theory and described how a constant comparison between empirical findings and theory had guided their sampling procedure until theoretical saturation was met. This paper was, however, unusually long, around 9000 words.
  • Another example is Shuval et al [52]. In their paper of around 3000 words, the authors have not specifically referred to the term "saturation" but have offered a clear description of the sampling procedure and how saturation was met:

우리는 주요 정보 제공자를 선정하고(연구자의 지인에 기초하여), 그룹 상호 작용을 촉진하고 참가자의 다양한 특성(즉, 성별, 연령, 거주 환경, 민족/종교 및 자체 보고 소득)을 포착하기 위해 [패튼 1990 참조] 목적적 샘플링을 사용했다. 우리가 접근한 모든 학생들은 포커스 그룹에 참여하기로 동의했습니다.

We used purposeful sampling [with reference to Patton 1990] to select key informants (on the basis of researchers' acquaintance), promote group interaction, and capture the diverse characteristics of participants (i.e., sex, age, living environment, ethnicity/religion, and self-reported income). All students whom we approached agreed to participate in focus groups.

새로운 테마가 나타나지 않을 때까지 포커스 그룹을 개최하였다(9). [...] 연구자들은 각 세션을 검토하기 전에 각 세션을 반영하여 후속 세션에서 새롭게 식별된 개념을 검토할 수 있게 되었다. [52]

Focus groups were held until no new themes emerged (9). [...] Researchers reviewed the transcripts to reflect on each session before conducting the next, thereby enabling newly identified concepts to be examined in subsequent sessions [52].

문헌상의 권고사항
Recommendations in the literature

 

포커스 그룹의 수에 대해 명시적인 설명을 한 37개의 연구 중 6개는 문헌에서 rule of thumb을 언급했다. 이들은 대부분 포화 상태에 도달하기 위해 필요한 그룹 수에 대한 실용적인 지침을 참조했다(예: [53]). 아래 예에서 알 수 있듯이, 저자들은 필드에 일관된 지침이 없다고 보고했습니다.
Six of the 37 studies that gave an explicit explanation for the number of focus groups referred to rules of thumb in the literature. These were mostly references to pragmatic guidelines of how many groups are necessary to reach a point of saturation (e.g. [53]). As the example below illustrates, authors reported that the field lacks consistent guidelines.

포커스 그룹 수와 표본 크기에 대한 권장 사항은 서로 다릅니다. 권장 세션 수는 연구 설계의 복잡성과 목표 표본의 구별 수준에 따라 달라집니다 [18–21]. 스튜어트 외 연구진. (2007) 사회과학에서 수행되는 3-4개 이상의 포커스 그룹이 드물다는 것을 관찰했다. 우리는 각 사이트의 두 그룹이 단일 그룹 또는 사이트에서 볼 수 있는 편견을 제한하고 그룹 간에 공통되는 테마를 검토할 수 있다고 느꼈다 [54].
Recommendations for both the number of focus groups and sample size vary. The number of recommended sessions depends on the complexity of the study design and the target sample's level of distinctiveness [1821]. Stewart et al. (2007) observed that rarely are more than 3-4 focus groups conducted in the social sciences. We felt that two groups at each site would limit bias that might be seen in a single group or site and allow us to examine themes common across groups [54].

그러나 확인해본 바, 레퍼런스가 항상 정확한 것은 아니었다. 예를 들어, Gouterling 등의 경우 세 개의 포커스 그룹을 수행하고 숫자를 다음과 같이 설명합니다.
However, when we checked with the literature, referrals to recommendations were not always accurate. For example Gutterling et al, conducted three focus groups and explain the number thus:

좋은 결과를 얻기 위해서는 데이터가 포화 상태가 되고 처음 몇 개의 그룹 이후에 새로운 정보가 거의 나타나지 않기 때문에 소수의 포커스 그룹만으로도 충분합니다 [Morgan 96] [55].
For good results, just a few focus groups are sufficient, as data become saturated and little new information emerges after the first few groups [Morgan 96] [55].

Morgan[1]을 찾아보면, 대부분의 연구에서 4~6개의 그룹이 포화 상태에 도달하기 때문에 사용된다고 주장하지만, 참가자의 범주가 더 많고 질문의 표준화가 덜 될수록 포커스 그룹의 수가 더 많다는 점도 강조합니다.

Looking up Morgan [1], we found that he claims that most studies use four to six groups because they then reach saturation, but he also underlines that the more categories of participants and less standardisation of questions, the higher number of focus groups.

 

현실적 이유
Practical reasons

37건의 연구 중 3건은 수행된 포커스 그룹의 수에 대한 현실적 이유를 보고했다. 예를 들어, 이 설명에서는 다음과 같이 채용 제약 조건에 대해 제공된 정보가 불완전합니다.
Three of the 37 studies reported practical reasons for the number of focus groups conducted. The information offered regarding recruitment constraints was incomplete as, for example, in this explanation:

이용 가능한 참가자 수는 제한되었고 따라서 포커스 그룹의 수는 적었다 [56].
The number of available participants was limited and the number of focus groups was therefore few [56].

두 가지 설명은 참가자를 추가 그룹으로 모집하는 어려움과 관련이 있는 것으로 보였고 [56, 57], 한 명은 제한된 자원("예산 및 인력 제약")을 언급했다. 이런 이유로 연구자는 사전 연구를 통해 5개 포커스그룹을 결정하게 되었다[38]. 이 마지막 연구에서도 포화 상태에 이르렀다고 주장했습니다(그룹 수 결정 절차로 명시하지 않음).
Two of the explanations appeared to be tied to difficulties in recruiting participants to additional groups [56, 57], while one mentioned limited resources ("budgetary and staffing constraints") which led the researchers to decide pre-study to conduct five focus groups [38]. This last study also claimed to have reached saturation (without stating this as the procedure for deciding number of groups):

그러나 데이터 분석에 따르면 모든 테마가 포화 상태에 이르렀으며, 이는 추가 참가자가 상위 응답의 깊이 또는 폭을 추가하지 않았을 가능성이 크다는 것을 의미한다[38].
However, data analysis indicates that all themes reached saturation, meaning additional participants would likely not have added to the depth or breadth of parent responses [38]

추가 8개 연구에서도 모집 한도에 대해 기술했지만, 참가자가 몇 개의 그룹으로 나뉘었는지에 대한 설명이 아닌 전체 참여자 수에 대한 설명으로만 기술했다. 이들 연구에서는 교과서 추천으로 그룹 규모가 사전에 결정된 것으로 보여 그룹별 참여자 수를 이미 모집한 총인원으로 나눈 그룹 수를 정했다.

An additional eight studies also described recruitment limitations, but only as an explanation for the total number of participants, not for how many groups the participants were divided into. In these studies, the size of the groups seems to have been decided beforehand, due to text book recommendations, and thus the number of groups was given by the total number of already recruited participants divided by the number of participants per group.

 

고찰 Discussion

 

1998년, 2003년 및 2008년의 검색 결과는 지난 10년 동안 포커스 그룹 연구가 증가했다는 주장을 뒷받침한다. 2008년에 포커스 그룹 연구를 발행하는 건강 저널의 광범위한 범위는 이 방법이 현재 널리 받아들여지고 있음을 나타낸다. 동시에, 많은 저널이 일년에 한두 개의 포커스 그룹 연구를 발표한다는 사실 또한 포커스 그룹 연구를 평가하기 위한 편집자와 검토자 사이의 방법론적 역량이 부족함을 의미할 수 있다.
The results from our searches from 1998, 2003 and 2008 support the claims that there has been an increase in focus group studies over the last ten years. The wide range of health journals publishing focus group studies in 2008 indicates that this method is now widely accepted. At the same time, the fact that many journals publish only one or two focus group studies a year could also mean that the methodological competence among editors and reviewers to assess focus group studies is lacking.

우리가 등록한 포커스 그룹의 수에서 큰 variation는 놀랍고, 교재나 교과서의 저자들이 추측하는 것보다 더 넓었다wider. 예를 들어 Stewart 외 연구진[13](2007:58)은 "대부분의 포커스 그룹 애플리케이션은 한 개 이상의 그룹을 포함하지만 세 개 또는 네 개 이상의 그룹을 포함하는 경우는 거의 없다"고 주장한다. 또한 Two high 및 Putnam은 1차 치료 연구에서 포커스 그룹 연구의 검토에서 훨씬 더 좁은 변동을 발견했으며, 연구당 2 - 8 그룹의 범위를 가지고 있다[7].
The great variation in the number of focus groups that we registered was surprising, and was wider than authors of teaching materials and text books assume. For example Stewart et al [13] (2007:58) claim: "Most focus group applications involve more than one group, but seldom more than three or four groups." Twohig and Putnam also found a much narrower variation in their review of focus group studies in primary care research, with a range of two to eight groups per study [7].

전반적으로, 표본 크기에 대한 보고와 이 크기에 대한 설명은 부실했습니다. 설명이 제공된 경우, 주로 데이터 포화의 개념의 지배적인 역할을 확인했다.
Overall, reporting of sample size and explanations for this size was poor. Where such explanations were given, our study confirms the dominant role of the concept of data saturation.

우리는 또한 모든 설명이 두 개에서 13개 그룹의 연구에서 발견되었다는 것을 발견했다. 이러한 연구의 일부는 이 지침에서 권장되는 범주당 2-5개의 포커스 그룹이 연구에서 총 2-5개의 그룹이 된 것처럼 보이지만, 그들의 수를 정당화하기 위해 기존의 실용적인 지침을 참조한다. 어쩌면 [rule of thumb에 어긋나는 숫자인 하나의 포커스 그룹]만 사용하는 연구는 정당화하기가 너무 어렵고, 따라서 설명이 회피된다고 추측할 수 있다
We also discovered that all explanations were found in studies of between two and 13 groups. Some of these studies refer to existing pragmatic guidelines to justify their numbers, although the two to five focus groups per category recommended in these guidelines sometimes appear to have become two to five groups in total in the studies. We could speculate that studies using only one focus group, a number that goes against the rules of thumb offered by these guidelines, is simply too hard to justify and explanations are therefore evaded.

또한 모든 단일 그룹 연구는 혼합 방법 연구였으며, 포커스 그룹은 일반적으로 연구의 조사 부분에 대한 설문지를 개발하거나 테스트하기 위해 파일럿으로 사용되었다. 이러한 예에서 포커스 그룹이 연구의 주요 부분보다 덜 주의를 기울인다는 것은 이해할 수 있다. 척도의 다른 쪽 끝에서, 표본 크기가 두 자리 숫자에 도달하면, 큰 N이 양의 자산으로 간주되어 정당화하기에 덜 중요한 "양적 연구의 논리"가 시작된다고 가정할 수도 있다.

Also, all the single group studies were mixed methods studies, where the focus group typically was used as a pilot to develop or test a questionnaire for the survey part of the study. In these examples, it is understandable that the focus group is offered less attention than the main part of the study. At the other end of the scale, one could also speculate that when the sample size reaches two-digit numbers, a "quantitative study logic" kicks in where a big N is seen as a positive asset and therefore less important to justify.

 

데이터 포화를 포커스 그룹의 수에 대한 설명으로 언급한 연구의 약 절반은 접근법의 사용에 일관성이 없는 것으로 보였다. 이러한 결과는 해당 분야의 초기 검토와도 부합한다.

  • 투하이(Twohigh)와 푸트남(Putnam)[7]도 포커스 그룹 연구의 절차와 보고의 variation에 놀랐고,
  • 간호 연구에서 포커스 그룹 연구를 검토한 웹과 케번[58]은 저자들이 "근거 이론"과 같은 용어를 non-rigorous한 방식으로 사용했다는 것을 발견했다.
  • 또한 연구자들이 전체적으로 동시적 데이터 생성 및 분석, 또는 "반복적 프로세스"와 같은 포화 상태에 도달하기 위한 기본적인 전제를 따르지 않았다고 결론짓는다[15].

우리의 연구는 동일한 경향을 보여주며, 의료 연구에서 포커스 그룹의 사용이 증가했다고 보고의 질이 향상되지는 않았음을 시사한다.
Roughly half of the studies that referred to data saturation as an explanation for number of focus groups did not appear to be consistent in their use of approach. These findings support earlier reviews of the field.

  • Twohig and Putnam [7], were also startled by the variation in procedures and reporting of focus group studies, and
  • Webb and Kevern [58], who reviewed focus group studies in nursing research, found that authors used terms such as "Grounded theory" in non-rigorous ways.
  • These authors also conclude that researchers, on the whole, did not follow basic premises for reaching saturation such as concurrent data generation and analysis, or an "iterative process" [15].

Our study shows the same tendencies, and suggests that the increased use of focus groups in health care studies has not led to an improvement in the quality of reporting.

 

우리는 또한 우리가 찾지 못한 것에 충격을 받았다. 포커스 그룹 연구에 대한 우리의 경험에서, [모집recruitment 문제]는 이 검토가 나타내는 것보다 훨씬 더 흔하다. 또한 제한된 비용과 시간을 포함하여 수행된 포커스 그룹의 수를 제한할 수 있는 여러 가지 현실적인 한계가 발생한다. 자원 제약이 제기된 한 연구를 제외하고, 언급된 유일한 실질적인 제한은 더 많은 참여자를 모집하는 데 어려움이 있었다. 

We were also struck by what we did not find. In our own experience with focus group research, recruitment problems are much more common than this review indicates. In addition, a number of practical limitations arise that can limit the number of focus groups conducted, including limited money and time. Excepting one study, where resource constraints were brought up, the only practical limitations mentioned were difficulties in recruiting more participants.

또 다른 'non-finding'은 [많은 수의 포커스 그룹]을 연구의 잠재적 한계로 논의한 연구가 없다는 것이다. 이러한 연구에서 데이터의 풍부함과 깊이를 도출하기 위한 정성적 방법론의 장점에 대한 빈번한 언급을 고려할 때, 저자들이 다수의 포커스 그룹의 데이터를 철저히 분석하기 어렵다는 주장을 전혀 사용하지 않은 이유는 명확하지 않다.

Another non-finding was that none of the studies discussed a large number of focus groups as a potential limitation of the study. Given frequent references in these studies to the advantages of qualitative methodology for eliciting richness and depth of the data, it is not evident why the authors never used the argument that data from a large number of focus groups is difficult to analyse thoroughly.

 

잘못된 보고는 어떻게 설명할 수 있는가?
How can poor reporting be explained?

 

연구에 나타난 부적절한 보고는 [대부분의 건강 과학 저널이, 질적 연구자들에게 구체적인 보고 기준을 요구하지 않는다는 사실]을 반영할 수 있다. 그러나, 이러한 저자들 사이의 부실한 보고는 또한 포커스 그룹 기반 데이터 수집을 수행하고자 하는 연구자들에게 적절하게 기술되고 일관된 조언이 부족함을 반영하는 포커스 그룹의 수를 언제 어떻게 결정해야 하는지에 대한 혼란을 나타내는 것 같다.
The inadequate reporting indicated in our study could reflect the fact that most health science journals do not require specific standards of reporting from contributors presenting qualitative research. However, the poor reporting among these authors also seem to indicate confusion about when and how to decide the number of focus groups, which may reflect a lack of properly described, consistent advice to researchers wishing to carry out focus group-based data collection.

teaching material에서 표본 크기에 대한 주의의 부족은 표본 크기가 그러한 연구에서 중요하지 않다는 표시로 쉽게 인식될 수 있다. 게다가, 제공되는 조언은 혼란스럽고 때로는 상충되기도 한다.

  • 글레이저와 스트라우스의 이론적 포화 절차는 저자들에게 이론적인 표본 추출을 사용하고 포화 상태가 될 때까지 반복적으로 데이터를 분석하고 수집하도록 지시하지만, 이 접근법을 어떻게 운용할지에 대한 자세한 해석을 제공하지 않는다.
  • 한편, 포커스 그룹 방법론에 관한 "how to do" 문헌은 [포화점에 도달하기 전에 연구자들이 수행하기를 기대해야 하는 그룹의 수]에 관한 실용적인 조언을 제공하지만, [실제 포화점을 어떻게 결정할지]는 명확히 하지 않는다. 따라서 이 조언은 연구자들이 그룹 수에 대한 그들의 제안을 따르고, 모든 데이터를 수집한 후에 분석을 하도록 유혹할 수 있다. 그런 다음 데이터가 포화 상태에 이를 것으로 예상함에 따라 포화 상태에 대한 결론을 도출할 때 비판적 감각이 저하될 수 있습니다.

The lack of attention to sample size in the teaching material could easily be perceived as an indication that sample size is unimportant in such studies. In addition, the advice that is offered is confusing and sometimes conflicting.

  • While the Glaser and Strauss's procedure of theoretical saturation instructs authors to use theoretical sampling and to analyse and collect data iteratively until saturation is achieved, it does not offer a detailed interpretation of how to operationalise this approach.
  • The "how to do" literature on focus group methodology, on the other hand, offers pragmatic advice regarding the number of groups that researchers should expect to conduct before point of saturation is reached, but do not clarify how to decide about point of saturation in practice. This advice may thus tempt researchers to follow their suggestions for number of groups and do the analysis after collecting all data. Then, as they expect data to be saturated, their critical sense could be undermined when drawing conclusions about saturation.

데이터 포화 개념의 실제 적용 문제가 있음에도, '데이터 포화'는 질적 건강 연구에서 무언가 이상적인 것이 된 것 같다. 이는 비록 제대로 운영되지 않았지만, 필요한 정확한 인터뷰 수에 대한 조언을 제공하는 유일한 이론이기 때문일 수 있다. 전통적으로 건강 연구의 긍정적인 영역에서 편집자들은 정확한 수의 그룹에 대한 설명을 선호하는 경향이 있을 것이다. 실무적 한계, 특히 경제적 또는 자원적 한계에 대한 명시적 언급은 허용되지 않을 수 있다.
Despite problems associated with the practical application of the concept of data saturation, it seems to have become something of an ideal in qualitative health research. This could be due to the fact that it is the only theory that offers advice, albeit, poorly operationalised, about the exact number of interviews needed. It is plausible that editors in the traditionally positivistic realm of health research are inclined to prefer explanations for exact number of groups. Practical limitations might not be as acceptable, especially not explicit references to economic or resource limitations.

이러한 연구의 방법론 논의에서 저자들은 종종 질적 연구에서 작은 표본 크기가 합법적이라고 지적한다. 동시에, 그들은 종종 항상 연구 한계로 간주되는 작은 표본 크기를 정당화해야 할 필요성을 느낀다. 이것은 질적 연구가 보건 과학 저널에서 여전히 소수라는 사실의 결과일 수 있다. 실증주의적 관점에서는 "지나치게 많은 그룹"이라는 것이 가능하다는 주장을 어렵게 만든다. 그럼에도 불구하고, 질적연구의 품질은 데이터의 깊이와 풍부성 및 분석에 따라 달라진다. 따라서 [포커스 그룹의 수]와 [설명의 thickness] 사이의 tradeoff에 대한 레퍼런스는 (제한된) 표본 크기에 대해 허용 가능한 설명이어야 한다. 표본 규모에도 윤리적 측면이 있다: 과도한 인터뷰는 추가적인 과학적 가치에 의해 정당화되지 않고, 환자나 의료 종사자들에게 부담을 주는 것을 의미하므로 비윤리적인 것으로 간주될 수 있다.

In the methodology discussions of these studies, authors often point out that small sample sizes are legitimate in qualitative studies. At the same time, they often feel the need to justify small sample sizes which they invariably see as a study limitation. This may be a consequence of the fact that qualitative studies are still in a minority in health science journals. Here, more positivistic traditions may make it difficult to argue that a qualitative study can have too many groups. Nevertheless, the quality of qualitative studies does depend on the depth and richness of the data and its analysis. Reference to the trade-off between number of focus groups and the thickness of our description should therefore be an acceptable explanation for (a limited) sample size. There is also an ethical side to sample size: an excessive number of interviews means placing a burden on patients or health workers that is not legitimised by added scientific value and can thereby be seen as unethical.

 

강점 및 제한 사항 연구
Study strengths and limitations

 

우리의 연구의 한계는 우리의 샘플이 오픈 액세스 저널에서 채취되었다는 것이었다. 이를 통해 관리 가능한 연구 샘플에 쉽고 즉시 액세스할 수 있고 독자가 결과를 쉽게 확인할 수 있지만, 열린 액세스 필터 없이 빠르게 검색하면 2008년에 발표된 모든 포커스 그룹 연구의 20% 미만을 나타내는 샘플이다. 우리는 우리의 샘플이 사용 가능한 연구의 나머지 80%와 어떻게 다를 수 있는지에 대해 상대적으로 거의 알지 못한다. 현재 연구에 따르면 개방형 저널에 게재된 기사는 다른 기사보다 더 자주 인용된다[59]. 따라서 우리가 평가한 논문은 다른 비개방형 기사보다 더 높은 프로파일일 수 있으며 다른 연구자의 예로서 사용될 가능성이 더 높을 수 있다. 우리는 우리의 연구 결과가 주로 개방형 접근 연구에 유효하다는 것을 강조하지만, 따라서 이러한 보고서의 품질을 확보하는 것이 더욱 중요해 보인다.
A limitation of our study was that our sample was taken from open-access journals. While this gave us easy and immediate access to a manageable sample of studies and also allows our readers to easily check our results, a quick search without the open access filter indicates that our sample represents less than 20% of all published focus group studies in 2008. We know relatively little about how our sample might differ from the remaining 80% of available studies. Current research does suggest that articles published in open-access journals are more often cited than other articles [59]. It is therefore possible that the articles we evaluated are of a higher profile than other non-open-access articles and may be more likely to serve as examples for other researchers. While we emphasise that our findings are primarily valid for open access studies, it therefore seems all the more important to secure the quality of these reports.

우리는 포커스 그룹 인터뷰가 종종 주로 정량적 설계의 일부인 혼합 방법 연구도 포함시켰다. 그러한 연구에서 저자들은 질적 연구를 보고하기 위한 표준을 준수하는 것을 목표로 하지 않을 수 있다. 한편, 포커스 그룹을 사용했다고 보고한 연구자들은 그러한 연구에 대한 방법론적 기준을 준수해야 한다고 주장할 수 있다.
We have therefore also included mixed method studies, where the focus group interviews are often part of a predominantly quantitative design. In such studies the authors may not aim to adhere to standards for reporting qualitative studies. On the other hand, it could be argued that researchers who report that they have used focus groups should adhere to the methodological standards for such studies.

결론
Conclusions

연구자들은 사용된 방법에 대해 항상 정확하고 상세한 정보를 제공해야 하지만, 우리의 연구는 포커스 그룹 샘플 크기에 대한 불충분하고 일관되지 않은 보고를 보여준다. 

While researchers should always provide correct and detailed information about the methods used, our study shows poor and inconsistent reporting of focus group sample size. Editorial teams should be encouraged to use guidelines for reporting of methods for qualitative studies, such as RATS http://www.biomedcentral.com/info/ifora/rats.

우리의 연구는 또한 잘못된 보고가 최적의 표본 크기를 달성하는 방법에 대한 명확하고 증거 기반 지침의 부족을 반영할 수 있다는 것을 보여준다. 이러한 상황을 수정하기 위해서는, (경험적 연구에 기초한) 교재와 교과서를 포커스 그룹 방법론에 사용해야 하며, 적용 가능하고 정확한 권고사항이 필요하다. 아이러니하게도 [고품질 방법론 연구]의 한 가지 장애물은 현재와 같은 [일차 연구 저자들의 부적절한 보고]이다.

Our study also indicates that poor reporting could reflect a lack of clear, evidence-based guidance about how to achieve optimal sample size. To amend this situation, text books and teaching material based on empirical studies into the use of focus group methodology and applicable and precise recommendations are needed. Ironically, one barrier to high-quality methodological studies is the current lack of proper reporting by authors of primary studies.

 

 

 


BMC Med Res Methodol. 2011 Mar 11;11:26.

 doi: 10.1186/1471-2288-11-26.

What about N? A methodological study of sample-size reporting in focus group studies

Benedicte Carlsen 1Claire Glenton

Affiliations collapse

Affiliation

  • 1Uni Rokkan Centre, Nygårdsgt 5, N-5015 Bergen, Norway. benedicte.carlsen@uni.no
    • PMID: 21396104

 

 

Free PMC article

Abstract

Background: Focus group studies are increasingly published in health related journals, but we know little about how researchers use this method, particularly how they determine the number of focus groups to conduct. The methodological literature commonly advises researchers to follow principles of data saturation, although practical advise on how to do this is lacking. Our objectives were firstly, to describe the current status of sample size in focus group studies reported in health journals. Secondly, to assess whether and how researchers explain the number of focus groups they carry out.

Methods: We searched PubMed for studies that had used focus groups and that had been published in open access journals during 2008, and extracted data on the number of focus groups and on any explanation authors gave for this number. We also did a qualitative assessment of the papers with regard to how number of groups was explained and discussed.

Results: We identified 220 papers published in 117 journals. In these papers insufficient reporting of sample sizes was common. The number of focus groups conducted varied greatly (mean 8.4, median 5, range 1 to 96). Thirty seven (17%) studies attempted to explain the number of groups. Six studies referred to rules of thumb in the literature, three stated that they were unable to organize more groups for practical reasons, while 28 studies stated that they had reached a point of saturation. Among those stating that they had reached a point of saturation, several appeared not to have followed principles from grounded theory where data collection and analysis is an iterative process until saturation is reached. Studies with high numbers of focus groups did not offer explanations for number of groups. Too much data as a study weakness was not an issue discussed in any of the reviewed papers.

Conclusions: Based on these findings we suggest that journals adopt more stringent requirements for focus group method reporting. The often poor and inconsistent reporting seen in these studies may also reflect the lack of clear, evidence-based guidance about deciding on sample size. More empirical research is needed to develop focus group methodology.

질적 면담 연구에서 샘플 사이즈: 정보력에 의하여 (Qual Health Res, 2016)

Sample Size in Qualitative Interview Studies: Guided by Information Power
Kirsti Malterud1,2,3, Volkert Dirk Siersma1, and Ann Dorrit Guassora1

 

 

 

 

배경 Background

 

정성적 연구자는 연구를 계획하는 동안 표본 크기를 먼저 평가한 다음, 연구 과정에서 표본 크기를 지속적으로 평가하여 최종적으로 분석 및 최종 출판에 적합한지를 확인할 수 있는 도구가 필요하다(Guest, Bunce, & Johnson, 2006; Morse, 1995; Sandelowski, 1995). 정량적 연구에서 검정력 계산은 개입에 따른 특정 크기의 효과를 입증하는 데 필요한 표본 크기(N)를 결정합니다. 질적 인터뷰 연구의 경우 표본 크기를 평가하기 위한 유사한 표준은 존재하지 않는다. 
Qualitative researchers need tools to evaluate sample size first while planning a study, then during the research process to appraise sample size continuously, and finally to ascertain whether the sample size is adequate for analysis and final publication (Guest, Bunce, & Johnson, 2006; Morse, 1995; Sandelowski, 1995). In quantitative studies, power calculations determines which sample size (N) is necessary to demonstrate effects of a certain magnitude from an intervention. For qualitative interview studies, no similar standards for assessment of sample size exist.


리뷰에 따르면 정성적 연구자가 보이는 [표본 크기와 이에 대한 기본 논거에 관한 투명성]은 낮다(Carlsen & Glenton, 2011; Mason, 2010). 종종, 저자들은 포화가 달성되었다고 주장하면서, 더 많은 참여자들의 추가는 포화가 어떻게 평가되었는지에 대한 그들의 이해를 명시하지 않고 분석에 아무것도 추가하지 않았다고 추론한다. 포화 개념은 원래 Glaser와 Strauss(1999)에 의해 기초 이론(GT) 분석에서 지속적 비교constant comparison의 특정 요소로 만들어졌다. GT 프레임워크 내에서 샘플 크기는 모든 새로운 관측치를 이전 분석과 비교하여 유사점과 차이점을 식별하는 진행 중인 분석의 한 요소로 평가됩니다. 그러나 포화 개념은 GT가 아닌 맥락에서 개념을 어떻게 이해해야 하고 참여자 수를 정당화하는 데 어떻게 기여해야 하는지에 대한 설명 없이 다른 분석 접근법에 기초한 연구에서 반복적으로 주장된다.
Reviews indicate that qualitative researchers demonstrate a low level of transparency regarding sample sizes and the underlying arguments for these (Carlsen & Glenton, 2011; Mason, 2010). Often, the authors just claim that saturation was achieved, inferring that addition of more participants did not add anything to the analysis, without specifying their understanding of how saturation has been assessed. The saturation concept was originally coined by Glaser and Strauss (1999) as a specific element of constant comparison in Grounded Theory (GT) analysis. Within the GT framework, sample size is appraised as an element of the ongoing analysis where every new observation is compared with previous analysis to identify similarities and differences. The saturation concept is, however, again and again claimed in studies based on other analytic approaches, without any explanation of how the concept should be understood in this non-GT context and how it serves to justify the number of participants.


정성적 연구에서 표본 크기를 결정하는 일반적인 원칙은 N이 연구의 목적을 설명하기에 충분히 크고 다양해야 한다는 것이다(Kuzel, 1999; Marshall, 1996; Patton, 2015). 비록 경험이 풍부한 연구자들이 책임 있는 분석에 도달하기 위해 이전의 비교 연구에서 필요했던 대략적인 단위 수에 대한 자체적 규칙을 따르는 것처럼 보이지만, 이 원칙은 계획을 위한 가이드를 제공해주지는 않는다(Mason, 2010).
A commonly stated principle for determining sample size in a qualitative study is that N should be sufficiently large and varied to elucidate the aims of the study (Kuzel, 1999; Marshall, 1996; Patton, 2015). However, this principle provides no guidance for planning, although experienced researchers seem to follow their own rules of thumb about approximate numbers of units that were needed in previous comparable studies to arrive at a responsible analysis (Mason, 2010).


우리는 계획 수립을 위해 표본 크기의 근사치가 필요한 반면, 최종 표본 크기의 적합성은 연구 과정 동안 지속적으로 평가되어야 한다는 전개념을 공유한다. 정성적 연구에서 표본 크기의 원칙을 검토하면서, 우리는 공식이나 인식된 중복성에 의해 표본 크기를 예측할 수 없다고 주장할 것이다.
We shared the preconception that an approximation of sample size is necessary for planning, while the adequacy of the final sample size must be continuously evaluated during the research process. Reviewing principles of sample size in qualitative studies, we shall below argue that sample size cannot be predicted by formulae or by perceived redundancy.

 

표본 크기를 안내하는 도구는 특정 분석 방법의 절차에 의존해서는 안 되며, 적절한 단위, 사건 또는 참가자의 수를 추정하기 위한 공유된 방법론적 원칙shared methodological principles에 의존해야 한다. 이를 위해 정보력information power라는 개념을 제안한다. 표본이 보유한 정보력이 클수록 N이 낮아져야 하며, 그 반대도 마찬가지이다.
Tools to guide sample size should not rely on procedures from a specific analysis method, but rest on shared methodological principles for estimating an adequate number of units, events, or participants. For this purpose, we propose the concept information power. The larger information power the sample holds, the lower N is needed, and vice versa.

방법 Method

 

우리는 유도적으로 모델을 개발하고 정교하게 만들었다. 먼저, 우리는 가상의 연구로 제시된 사례를 스케치했습니다. 이 연구는 계획되거나 시행된 것은 아니지만 우리의 논의와 조사의 구체적인 참고 자료로 이용되었다. 그런 다음, 우리는 이 사례를 출발점으로 삼아 이 특정 연구에서 정보력과 표본 크기에 영향을 미치는 것으로 간주한 조건을 검토했다. 마지막으로, 우리는 허구 연구의 특정 맥락을 넘어 인터뷰 연구로 이전될 수 있도록 의도된 항목 및 그 차원을 모델로 개념화했다.
We have developed and elaborated the model inductively. First, we sketched a case presented as a fictional study. This study has neither been planned nor conducted but served as a specific reference for our discussions and elaborations. Then, we took this case as our point of departure for a review of conditions we considered to have an impact on information power and sample size in this specific study. Finally, we conceptualized the items and their dimensions as a model, intended to be transferable to interview studies beyond the particular context of the fictional study.

 

 

사례: 당뇨성 족궤양 체험에 관한 인터뷰 연구
The Case: Planning an Interview Study on Diabetic Foot Ulcer Experiences

우리는 이 경우를 자가 치료 이론에 기여하고 보건 전문가에 대한 환자의 관행을 설명하는 것이 전반적인 목표인 박사 연구의 세 가지 하위 프로젝트 중 첫 번째 프로젝트로 위치시켰다. 이번 하위프로젝트의 목적은 환자가 궤양을 치료하기 위해 수행하는 활동과 이를 위한 동기를 설명함으로써 당뇨병성 발궤양 환자의 자기관리를 탐구하는 것이었다. 박사과정 학생은 서술적 교차사례 분석이 실시된 이전 프로젝트의 질적 연구에 이미 약간의 경험이 있는 젊은 MD였다. 참가자는 최근 첫 궤양 진단을 받은 당뇨병 외래환자 중 한 명이다. 추가 표본 추출 전략과 기준은 반구조 개별 인터뷰를 통한 데이터 수집과 함께 단계적 분석을 통해 통보될 것이다.
We situated the case as the first of three subprojects of a PhD study where the overall objective was to contribute to theories of self-care and to describe patients’ practices for health professionals. The aim of the present subproject was to explore self-care among patients with diabetic foot ulcers by describing activities performed by patients to treat the ulcers and their motivation for doing so. The PhD student was a young MD who already had some experience with qualitative research from a previous project where descriptive cross-case analysis had been conducted. Participants would be recruited among patients in a diabetes out-patient clinic who had recently been diagnosed with their first ulcer. Further sampling strategies and criteria would be informed by stepwise analysis along with data collection by means of semi-structured individual interviews.

 

이 과정 중에 언제 모집을 중단해야 하는지는 초보 연구자에게 간단한 결정이 아닐 것이다. 연구비 제안서는 연구의 목적을 설명하고 데이터 수집에 얼마나 많은 시간이 필요한지에 대한 아이디어를 얻기 위해 얼마나 많은 참가자가 필요한지 계획하기 위해 인터뷰 횟수의 사전 추정치를 요청했다. 이전의 조사로부터, 그녀의 상사는 이 프로젝트에 필요한 참가자 수에 대한 몇 가지 생각을 가지고 있었다. 그러나 학생은 자신의 연구를 계획하고 책임 있는 분석을 수행하는 데 얼마나 많은 참가자가 필요할지에 대한 몇 가지 기준에 따라 결정을 내리는 것을 선호할 것이다. 아래에서는 서로 다른 방식으로 샘플의 정보 파워를 결정하는 5가지 주요 항목을 평가하여 샘플 크기를 평가하는 도구로 개발한 모델을 제시합니다.

When to stop recruitment during this process would not be a simple decision for the novice researcher. The grant proposal requested an advance estimate of the number of interviews to plan how many participants were needed to elucidate the aim of the study and to get an idea of how much time the data collection would require. From previous research, her supervisor had some ideas about the number of participants needed for this project. The student would, however, prefer to plan her study and make her decisions on the basis of some standards about how many participants she would need to conduct a responsible analysis. Below, we present the model we developed as a tool to appraise sample size by appraisal of five major items that in different ways determine the information power of the sample.

정보 파워에 영향을 미치는 항목
Items Having an Impact on Information Power

그러나 실제 생활에서는 아이템이 서로 연관되어 있고 상호 영향을 미친다.
In real life, however, the items are related and have a mutual impact on each other.

연구 목표—좁습니까? 넓습니까?
Study Aim—Narrow or Broad?

 

적절한 표본 크기를 안내하는 정보 파워는 연구 목적과 관련이 있다. 광범위한 연구 목표는 충분한 정보 전력을 제공하기 위한 좁은 목표보다 더 큰 샘플이 필요하다. 왜냐하면 연구 중인 현상이 더 포괄적이기 때문이다. 첫 당뇨병성 족궤양 환자가 붕대의 이동을 어떻게 관리하는지 알아보는 것을 목표로 하는 연구는 발궤양 환자가 일상 생활에서 어떻게 자기 관리를 하는지에 대한 연구보다 참여자가 훨씬 더 적게 필요할 것이다.
Information power, guiding adequate sample size is related to the study aim. A broad study aim requires a larger sample than a narrow aim to offer sufficient information power, because the phenomenon under study is more comprehensive. A study aiming to explore how patients with their first diabetic foot ulcer manage shift of bandages would need notably fewer participants than a study about how patients with foot ulcer generally manage self-care in everyday life.

 

우리의 경우, 연구원은 더 크고 목적 있는 샘플을 모집하여 참가자의 수를 늘리거나, 충분한 정보 능력을 유지하기 위해 연구의 목표를 좁히는 것 중 하나를 선택해야 할 것이다. 그러나 이 연구의 목적이 당뇨병성 발궤양을 가진 맹인 환자의 자기 관리와 같은 매우 구체적이거나 드문 경험에 관한 것이라면, 이는 그 자체로 적격 참가자의 수를 제한할 것이다. 연구의 대안적 강조점은 개인 자원이 [당뇨병성 발궤양]의 자기 관리를 어떻게 방해하는지를 탐구하는 것일 수 있다. 만약 그렇다면, 한 명의 단일 참가자나 소수의 참가자와의 인터뷰를 기반으로 한 연구는 높은 수준의 정보 파워로부터 흥미로운 가설에 접근할 수 있다. 인터뷰 연구의 목적을 정의하면서, 연구자는 또한 연구 결과의 전이가능성transferability에 관한 몇 가지 약속을 제공한다. 그 목적을 달성하기 위해서는 샘플의 정보력이 매우 중요할 것입니다.

In our case, the researcher would have to choose between extending the number of participants by recruiting a larger, purposive sample, or narrowing the aim of the study to maintain sufficient information power. If, however, the aim of the study concerns a very specific or rare experience, such as self-care among blind patients with diabetic foot ulcers, this would in itself limit the number of eligible participants. An alternative emphasis of the study could be to explore how individual resources interfere with self-care of diabetic foot ulcers. If so, a study based on interviews with one single or just a few participants might provide access to exciting hypotheses from a high level of information power. Defining the aim of the interview study, the researcher also offers some promises regarding transferability of the findings. The information power of the sample will be critical to achieve the aim.

샘플 특수성—밀도가 높은가, 희소성이 있는가?
Sample Specificity—Dense or Sparse?

 

정보 파워는 또한 샘플에 포함된 참가자 사이의 경험, 지식 또는 속성의 특수성과 관련이 있다. 충분한 정보 파워를 제공하기 위해서는, (희박한 특이성sparse specificity을 가진 참가자를 포함하는 샘플과 비교한다면) [연구 목적에 매우 특정한 특성을 가진 참가자]가 있을 때 덜 광범위한 샘플이 필요하다. 특정 목표 그룹에 속한 참가자는 여기서 탐구해야 할 경험 내에서 일부 변화를 보여준다.
Information power is also related to the specificity of experiences, knowledge, or properties among the participants included in the sample. To offer sufficient information power, a less extensive sample is needed with participants holding characteristics that are highly specific for the study aim compared with a sample containing participants of sparse specificity. Specificity concerns here participants who belong to the specified target group while also exhibiting some variation within the experiences to be explored.

 

[타겟 그룹의 개인이 이전에 설명하지 않은 경험을 보유한 경우] 이러한 샘플도 정보 파워를 향상시킬 수 있다. 예를 들어, 환자 자원에 의해 자가 치료가 제한된다는 것을 알기에, 우리는 [궤양을 다루는 데 있어서의 성공정도의 variation]과 [연령, 성별, 당뇨병 유형에 관한 variation]을 모두 포함하여, 당뇨병 클리닉의 간호사들과의 논의를 통해 식별된 특별한 샘플을 목표로 할 수 있다. 만약 우리가 발궤양 환자만을 포함하도록 모집 절차를 제한하지 않는다면, 우리가 연구한 경험을 가진 사람들을 다루기 위해 훨씬 더 많은 참가자가 필요할 것이다.
A sample including individuals from the target group holding experiences not previously described could also enhance information power. Knowing that self-care is limited by patient resources, we could, for example, aim for an especially specific sample identified by discussions with the nurses at the diabetic clinic including variations of both success in handling ulcers and some variation in age, gender, and type of diabetes. If we do not constrain recruitment procedures to include only patients with foot ulcers, a much larger number of participants would be needed to cover those whose experiences we study.

 

그러나 특정한 변이variation 측면을 염두에 두고 수립된 목적적 표본이 항상 실현 가능한 것은 아니다. 표본 구성에 영향을 주지 않고 이용 가능한 참가자를 수용하는 편의 표본 추출 전략은 더 제한된 특수성의 위험을 의미하므로 더 많은 참가자가 필요하다. 그러한 모집 전략에 따라, 우리는 아마도 궤양과 그들의 근본적인 동기를 치료하기 위해 환자가 수행하는 충분히 광범위한 활동 범위를 얻기 위해 더 많은 인터뷰와 참가자가 필요할 것이다. 하지만, 우리는 운이 좋아서 다양한 경험을 가진 참가자 그룹을 얻을 수도 있습니다. 따라서 표본 특수성은 항상 예측할 수 없지만 적절한 모집에 의해 뒷받침될 수 있다.

Still, a purposive sample, established with specific aspects of variation in mind, is not always feasible. The strategy of convenience sampling, accepting participants who are available, without trying to influence the configuration of the sample, implies the risk of more limited specificity, thereby requiring more participants. Following such a recruitment strategy, we would probably need more interviews and participants to obtain a sufficiently broad scope of activities performed by patients to treat the ulcers and their underlying motivations. However, we might be fortunate and drop into a group of participants with a diversity of experiences. Hence, sample specificity cannot always be predicted but can be supported by suitable recruitment.

확립된 이론—적용 여부?
Established Theory—Applied or Not?

또한 적절한 표본 크기를 안내하는 정보 파워는 연구의 이론적 배경 수준과 관련이 있다. 일반적으로 [제한된 이론적 관점에 의해 뒷받침되는 연구]는 [계획 및 분석에 특정 이론을 적용하는 연구]보다 충분한 정보력을 제공하기 위해 더 큰 샘플이 필요할 것이다. 예를 들어, [전문가들이 행사하는 권위에 대한 사회과학의 이론]은 당뇨병성 발궤양에 대한 자기관리 경험에 대한 우리의 연구의 정보력을 향상시킬 수 있다. 다소 작은 샘플에서도, [특정 자가 치료를 수행하도록 의도하는 professional authority]에 대항하기 위해 환자가 사용하는 전략을 모색한다면, 새로운 지식을 얻을 수 있다. 

Furthermore, information power, guiding adequate sample size is related to the level of theoretical background of the study. A study supported by limited theoretical perspectives would usually require a larger sample to offer sufficient information power than a study that applies specific theories for planning and analysis. Theories from social science about the authority that professionals exercise might, for example, enhance the information power of our study about self-care experiences with diabetic foot ulcers. New knowledge, even from a rather small sample, might be obtained by looking for strategies used by patients to counter professional authority intended to make them perform specific self-care. 

 

이론은 경험적 인터뷰 데이터 이상으로 지식의 출처를 확장할 뿐만 아니라 기존 지식을 통합하는 역할을 한다. 반대로, 이론적 배경이 없는 상태에서 처음부터 시작하는 또 다른 연구는 결론의 근거를 마련해야 한다. 그렇다면 충분한 정보 파워를 부여하기 위해서는 더 큰 표본 크기가 필요할 것이다. 이론적 프레임워크는 경험적 데이터의 다른 측면 간의 관계를 일관성 있는 방식으로 설명할 수 있는 모델과 개념을 제공한다. 아주 적은 수의 경험적 연구도, 이론에 중요한 것을 다루고 설명한다면 변화를 일으킬 수 있다.

Theory serves to synthesize existing knowledge as well as extending the sources of knowledge beyond the empirical interview data. On the contrary, another study starting from scratch with no theoretical background must establish its own foundation for grounding the conclusions. If so, a larger sample size would probably be needed to grant sufficient information power. Theoretical frameworks offer models and concepts that may explain relations between different aspects of the empirical data in a coherent way. Empirical studies with very small numbers can make a difference if they address and elucidate something crucial to theory.

 

대화의 질—강력한가, 약한가?
Quality of Dialogue—Strong or Weak?

 

정보력은 인터뷰 대화의 질과도 관련이 있다. 연구자와 참가자 간의 강력하고 명확한 커뮤니케이션이 있는 연구는 모호한 또는 집중되지 않은 대화를 가진 연구보다 충분한 정보 파워를 제공하는 참가자의 수가 적다. 정성적 연구에서, 경험적 데이터는 연구자와 참여자 사이의 복잡한 상호작용에 의해 공동 구성되며, 정보력이 확립되는 의사소통의 품질을 결정하는 이슈는 여러가지이다. 경험적 자료의 분석적 가치는 인터뷰어의 스킬과 참가자의 명확성, 그 사이의 화학성 등에 따라 달라지며 대화의 질을 미리 예측하기 어렵다.
Information power is also related to the quality of the interview dialogue. A study with strong and clear communication between researcher and participants requires fewer participants to offer sufficient information power than a study with ambiguous or unfocused dialogues. In a qualitative study, empirical data are co-constructed by complex interaction between researcher and participant, and a number of issues determine the quality of the communication from which the information power is established. Analytic value of the empirical data depends on the skills of the interviewer, the articulateness of the participant, and the chemistry between them, and it is difficult to predict the quality of the dialogue in advance.

 

저희 연구에서, 박사과정 학생은 지난 2년 동안 이 분야에서 자신의 지역 가정간호서비스의 컨설턴트로 일해왔기 때문에 당뇨발궤양에 대한 평균 이상의 배경지식을 보유하고 있습니다. 그녀에게 있어서 인터뷰는 주제 영역과의 첫 만남이 아닐 것이며, 그녀는 쉽게 참가자들의 자기 관리 방식에 접근할 것이다. 하지만, 천성적으로, 그녀는 다소 수줍어하고, 신뢰를 쌓고 보고하는 데 시간이 좀 걸립니다. 따라서 그녀는 사전에 추가 인터뷰 교육을 받거나 샘플 크기를 늘려야 할 수도 있다. 그녀의 더 경험이 많은 감독관과 경험 많은 면접관은 그녀의 이전 프로젝트에서 기존 지식에 기여할 수 있는 분석을 위한 적절한 정보 능력을 가진 샘플을 만들기 위해 여섯 번의 인터뷰를 사용했다. 긴장과 상반된 견해와의 인터뷰 상호작용은 친밀한 세부사항에 대해 이야기하는 데 필요한 자신감을 감소시킬 수 있다. 그러나, 연구자가 참여자에게 결코 도전하지challenge 않는다면, 낮은 정보력만 가진 경험적 데이터를 개발할 위험을 가지고 있으며, 그 결과 분석 중에 이전부터 알려진 것만 재현할 수 있다.

In our study, the PhD student holds more than average background knowledge about diabetic foot ulcers, because she has been a consultant for the home nursing service in her area within this field the last 2 years. For her, the interviews would not be her first encounter with the subject area, and she would easily approach the participants’ self-care practices. However, by nature, she is rather shy, and it takes her some time to establish trust and report. It might therefore be necessary for her to obtain some extra interview training in advance, or to increase sample size. Her more experienced supervisor, well read in diabetes complications, and an experienced interviewer, used six interviews to establish a sample with adequate information power for an analysis that could contribute to existing knowledge in her previous project. An interview interaction with tensions and conflicting views may reduce the confidence needed to talk about intimate details. However, a researcher who never challenges his or her participant runs the risk of developing empirical data holding low information power, which, during analysis, only reproduces what is known from before.

 

분석 전략—사례 또는 교차사례?
Analysis Strategy—Case or Cross-Case?

마지막으로, 정보 파워는 특정 프로젝트에서 분석을 위해 선택한 전략과 관련이 있습니다. 탐색적 사례 분석을 위해서는 [소수의 선택된 참가자의 내러티브 또는 담화 세부 정보의 심층 분석을 위한 프로젝트에 비해] 더 많은 참가자가 충분한 정보 파워를 제공해야 한다. 이 프로젝트에서는 일반적인 자가 치료 관행과 그 기초에 대한 현실적이고 실용적인 설명을 임상 실습에 적용할 수 있는 기여로 밝혀내고 싶기 때문에 주제 교차 사례 분석이 수행될 것이다(Malterud, 2012). 따라서 다양한 경험을 가진 6명에서 10명의 참가자를 대상으로 한 객관적인 샘플은 보건 전문가에게 유용한 교훈을 가르치는 다양한 자기 관리 관행에 대한 설명에 충분한 정보 능력을 제공할 수 있다. 
Finally, information power is related to the strategy chosen for analysis in the specific project. An exploratory cross-case analysis requires more participants to offer sufficient information power compared with a project heading for in-depth analysis of narratives or discourse details from a few, selected participants. In this project, a thematic cross-case analysis will be conducted, because we want to uncover realistic and pragmatic descriptions of customary self-care practices and their foundations as a contribution applicable in clinical practice (Malterud, 2012). Referring to the supervisor’s experience, a purposive sample of six to 10 participants with diverse experiences might therefore provide sufficient information power for descriptions of different self-care practices teaching health professionals some useful lessons.

 

탐색적exploratory 분석에서, Ambition은 전체 범위의 현상을 다루는 것이 아니라 연구 목적과 관련된 선택된 패턴을 제시하는 것이다.

  • 의도적으로 선택되고 설명이 잘 된 단일 참가자는 일반적인 사례를 설명할 수 있지만 자가 치료의 변화variation를 보여주지는 않는다.
  • 정반대의 습관을 가진 두 명의 참가자는 연속체의 다른 측면을 설명할 수 있지만 본선에서 벗어나는 불일치를 받아들이기에는 충분하지 않을 것이다.
  • 50명의 참가자는 실제 관행에 관한 일탈뿐만 아니라 모든 충분한 변형을 제공할 수 있다. 그러나 경험적 데이터의 개요를 파악하는 것은 더 어려워질 것이다(개요를 파악하는 것은 잠재적 패턴의 주제분석의 시작점이다). 또한 적절한 상호 주관성 제시하거나 추가 분석을 위해 구성하기도 어려워질 것이다.

Within an exploratory analysis, the ambition is not to cover the whole range of phenomena, but to present selected patterns relevant for the study aim.

  • A single, deliberately chosen and well-articulated participant might illustrate a typical case but not demonstrate variations in self-care.
  • Two participants with diametrically opposite habits might illustrate different aspects of a continuum but would not be sufficient to embrace discrepancies deviating from the main line.
  • Fifty participants might provide all the sufficient variations as well as deviances regarding the actual practices. However, the overview of empirical data, needed as the point of departure for an accountable, thematic analysis of potentially relevant patterns, would become difficult to grasp, to present appropriate intersubjectivity, and to organize for further analysis.

질적 인터뷰 연구에서의 정보력—모델
Information Power in Qualitative Interview Studies—The Model

 

위의 반영으로부터, 우리는 질적 인터뷰 연구에서 일반적으로 샘플 크기를 평가하기 위한 도구로 의도된 모델로 항목과 항목 치수를 개념화했다(그림 1). 이 모델을 사용하여 실제 스터디의 정보 능력에 영향을 미치는 항목에 체계적으로 반영할 수 있습니다.

From our reflections above, we have conceptualized the items and their dimensions as a model intended as a tool to appraise sample size in qualitative interview studies in general (Figure 1). The model can be used to reflect systematically on items with an impact on the information power in the actual study.

Figure 1. Information power—Items and dimensions.

 

모델에 따르면, 연구 목적, 표본 특이성, 이론적 배경, 대화의 질 및 분석 전략에 대한 고려사항은 표본에 포함된 참여자가 더 적거나 더 많으면 충분한 정보력을 얻을 수 있는지 여부를 결정해야 한다. 

According to the model, considerations about study aim, sample specificity, theoretical background, quality of dialogue, and strategy for analysis should determine whether sufficient information power will be obtained with less or more participants included in the sample. 

 

아래의 경우 더 적은 수의 참여자가 필요할 것이다.

  • 연구 목표가 좁을 때, 
  • 참가자 조합이 연구 목적에 매우 구체적일 경우, 
  • 확립된 이론에 의해 뒷받침될 경우, 
  • 인터뷰 대화가 강할 경우, 
  • 분석에 서술어나 담화 세부사항에 대한 종적 심층 탐색이 포함될 경우, 

 

A study will need the least amount of participants 

  • when the study aim is narrow,
  • if the combination of participants is highly specific for the study aim,
  • if it is supported by established theory,
  • if the interview dialogue is strong, and
  • if the analysis includes longitudinal in-depth exploration of narratives or discourse details.

 

다음의 경우 더 많은 참가자가 필요하다. 

  • 연구 목표가 광범위할 때,
  • 참가자의 조합이 연구 질문에 덜 구체적일 경우,
  • 이론적으로 알려지지 않은 경우,
  • 인터뷰 대화가 취약할 경우,
  • 사례 간 분석이 수행될 경우,
  • 특히 연구 현상에 대해 가능한 최대로 광범위한 범위의 다양한 변형을 다루는 것이 목표인 경우

A study will need a larger number of participants 

  • when the study aim is broad,
  • if the combination of participants is less specific for the research question,
  • if it is not theoretically informed,
  • if the interview dialogue is weak, and
  • if cross-case analysis is conducted, especially
  • if the aim is to cover the broadest possible range of variations of the phenomena studied.

 

모형에 포함된 여러 항목 간의 역동적 상호작용은 표본에 더 많은 참여자와 더 적은 참여자를 필요로 하는 조건 간의 절충을 포함한다. 예를 들어, 

  • 좁은 목표를 표현하고 우수한 인터뷰 대화를 달성하는 숙련된 연구자는 작은 샘플로도 충분한 결과의 변이를 가진 교차 사례 분석을 수행할 수 있다. 
  • 그러나 이론적 지식이 제한된 초보 연구자는 목표가 잘 집중되어 있고 면접 대화도 좋지만 새로운 것을 밝히기 위해 더 많은 참여자들이 필요할 수 있다.

The dynamic interaction between the different items included in the model involves a trade-off between conditions that require more versus fewer participants in a sample.

  • For example, an experienced researcher who expresses a narrow aim and achieves an excellent interview dialogue may be able to conduct a cross-case analysis with sufficient variation of results even with a small sample.
  • However, a novice researcher with limited theoretical knowledge may need a larger group of participants to reveal something new although the aim is well-focused and the interview dialogues are good.

 

우리의 모델은 N을 계산하기 위한 체크리스트로서 의도된 것이 아니라 연구 과정의 다른 단계에서 모집에 대해 체계적으로 고려해야 할 사항을 권고하는 것이다. 

  • 우리의 경우에 필요한 정보 제공자의 수에 대한 초기 평가는 연구자가 초보 연구자라는 사실을 고려해야 한다. 
  • 그녀의 개인적인 수줍음은 대화를 잘 하는 그녀의 능력에 영향을 미친다. 
  • 그러나 그녀의 연구는 이론적으로 근거가 있으며, 그녀는 문제의 경험적 문제에 대한 철저한 경험을 가지고 있다. 
  • 그녀는 더 많은 참가자가 필요한 교차 사례 분석을 향해 가고 있으며, 그녀의 연구의 목적은 특별히 넓지도 좁지도 않다. 
  • 간호사들이 그녀의 공부와 관련된 특성을 가진 참가자들을 선발하는데 도움을 줄 것이기 때문에, 참가자들에 대한 필요성은 더 작아질 것이다. 
  • 마침내, 그녀의 노련한 연구 책임자는 작년에 6번의 성공적인 면접에서 나온 두꺼운 자료와 함께 비슷한 연구를 수행했다. 

이러한 고려사항에 기초하여, 잠정적으로 10명의 참가자가 우리의 사례에 대한 신중한 초기 평가의 예가 될 수 있다.

Our model is not intended as a checklist to calculate N but is meant as a recommendation of what to consider systematically about recruitment at different steps of the research process.

  • An initial appraisal of the number of informants needed in our case should consider the fact that the researcher is a novice researcher.
  • Her personal shyness affects her ability to establish a good dialogue (more participants).
  • Her study is, however, theoretically founded, and she has thorough experience with the empirical matters in question (less participants).
  • She is heading for cross-case analysis requiring more participants, and the aim of her study is neither especially broad nor narrow.
  • Because nurses will help her select participants with characteristics specific to her study, the need for participants will be smaller.
  • Finally, her experienced research supervisor conducted a similar study last year, with thick data from six successful interviews.

Based on these considerations, a provisional number of 10 participants could be an example of a cautious initial appraisal for our case.

 

토론
Discussion

특수성의 논리
The Logic of Particularities

 

공식 power calculation은 표본 크기 평가를 위한 정성적 연구에서 비공식적이고 경험적인 rule of thumb에 대한 대안으로 제안되었다(DePaulo, 2000; Guest et al., 2006). 이러한 시도를 뒷받침하는 기본 원칙은 각각 다른 유병률을 가진 일련의 정보(예: 당뇨병성 발궤양 관리를 위한 자가 치료 방법)를 이용할 수 있는 모집단을 가정하며, 목적은 무작위로 선택된 최소 참가자의 수로 가능한 많은 정보를 식별하는 것이다. 우리는 그러한 가정이 적절할 수 있는 상황의 존재를 부인하지 않으나, 대부분의 경우 질적 연구에서는 위반될 것이다. 참가자는 가장 많은 정보를 제공하기 위해 의도적으로 선택되며, 정보는 단순히 존재하는 것이 아니라, (이론으로 supported되면서) 연구자에 의해서 elaborate된다. (Kvale, 1996; Patton, 2015; Sandelowski, 1995).
Formal power calculations have been proposed as an alternative to informal, heuristic rules of thumb in qualitative studies for appraisal of sample size (DePaulo, 2000; Guest et al., 2006). The basic principle behind such attempts assumes a population where a set of information (such as self-care methods for management of diabetic foot ulcers) of some sort is available, each with different prevalence, and the aim is to identify as much of this information as possible with the least number of participants, selected at random. We do not repudiate the existence of settings where such assumptions might be adequate. Most often, however, they will be violated in a qualitative study. Participants are selected purposively as to provide the most information, and information will simply not exist, but is elaborated by the researcher, supported by the theory applied (Kvale, 1996; Patton, 2015; Sandelowski, 1995).

 

성립불가한 가정으로 이뤄진 구속복은 연구 과정에 해를 끼칠 수 있다. (Bacchetti, 2010) McWhinney는 의학 연구자들이 보편적 연구뿐만 아니라 [특수성]에 더 집중해야 한다고 촉구했고(McWhinney, 1989), Sandelowski는 사례 연구(N = 1)가 경험적 데이터의 양과는 무관하게 모든 정성적 연구에서 분석의 기본 단위라고 주장했다(Sandelowski, 1996). 해석적 패러다임에 속하는 정성적 연구에서, [탐구의 논리]는 [정당성의 논리]보다 강조되고, 표본 추출에 대한 다른 가정은 일반적으로 예측하거나 계산할 수 있는 것보다 더 적절하다. (Kunh, 1962; Malterud, 2001; Marshall, 1996; Sandelowski, 1996)
A straightjacket of untenable assumptions may harm the research process (Bacchetti, 2010). McWhinney urged medical researchers to focus more on particularities, not only universals (McWhinney, 1989), and Sandelowski argued that the case study (N = 1) is the basic unit of analysis in any qualitative study, independent of the amount of empirical data (Sandelowski, 1996). In qualitative research, belonging to the interpretative paradigm, the logic of exploration is more emphasized than the logic of justification, and other assumptions for sampling are usually more adequate than what can possibly be predicted or calculated (Kuhn, 1962; Malterud, 2001; Marshall, 1996; Sandelowski, 1996).

 

모델—장점과 한계
The Model—Strengths and Limitations

정보력은 우리 모델의 핵심 개념이다. 우리는 인터뷰 샘플의 정보 파워가 연구 목표, 샘플 특수성, 확립된 이론의 사용, 대화의 질, 그리고 분석 전략과 같은 항목에 의해 결정된다고 주장해왔다. 이러한 각 항목에 대해, 우리는 책임 있는 분석에 필요한 대략적인 참가자를 평가하기 위해 연구자가 자신과 연구를 위치하도록 초대되는 연속체를 따라 치수를 제안했다. 이러한 평가는 연구 과정에 따라 단계적으로 재검토되어야 하며, 확실히 미리 결정되어서는 안 된다고 주장한다. 이러한 방식으로 샘플이 충분한 정보력을 보유한 시점에서 모집이 종료될 수 있습니다. 그럼에도 불구하고, 이 모델은 질적 인터뷰 연구의 초기 계획에서도 지원을 제공할 수 있다.
Information poweris the core concept of our model. We have argued that information power of an interview sample is determined by items such as study aim, sample specificity, use of established theory, quality of dialogue, and analysis strategy. For each of these items, we have proposed dimensions along a continuum where researchers are invited to position themselves and their study to assess an approximate number of participants needed for responsible analysis. We argue that such an assessment should be stepwise revisited along the research process and not definitely decided in advance. In this way, recruitment can be brought to an end when the sample holds sufficient information power. Still, the model may offer support also in the initial planning of a qualitative interview study.

 

우리가 모델에 포함시킨 5개 항목은 상호 배타적이지도 않고 유일한 정보력 결정요인도 아니다. 공통점은 [포괄적인 현상을 탐색하려면 연구자가 선택한 어떤 특질qualities에 대해 적절한 변동이 있는 데이터가 필요하다는 것]이다. 그러나 구현을 위한 실용적 모델은 우선 순위를 요구한다. 따라서 우리가 설명한 유도 개발 경로를 따라, 우리는 정보 전력에 영향을 미치는 치수를 쉽게 식별, 평가 및 제시할 수 있는 제한적이고 실현 가능한 양의 필수 호환 항목을 포함하기로 결정했다.
The five items we have included in our model are neither mutually exclusive nor the only conceivable determinants of information power. A common denominator is that exploration of a comprehensive phenomenon requires data with appropriate variation regarding some selected qualities. However, a pragmatic model intended for implementation calls for prioritization. Following the inductive development path we have described, we therefore decided to include a limited and feasible amount of vital compatible items whose dimensions with an impact for information power could be easily identified, appraised, and presented.

 

모델에 포함될 수 있는 잠재적 리스트에서 [모집문제recruitment issue]가 누락되어있는데, 이는 사실상 역설을 제기하고 있다. 모집이 쉬울 때는 연구자가 자유롭게 목적적합하고 목적적합한 샘플을 선정해 참여인원을 줄일 수 있다. 그러나 많은 잠재적 참가자 중 일부만 자원하는 경우, 표본의 특수성이 저하되어 필요한 참여자의 수가 증가할 수 있다. 그렇다면, 정보력은 감소 이유를 고려하여 강화될 수 있다. 진료소 대신 집에서 인터뷰하는 것과 같은 간단한 절차 변경은 이러한 장애물을 제거하고 참가자가 더 적은 샘플에 기여할 수 있다. 이 다섯 가지 항목은 보편적으로 중요하지는 않으며, 따라서 다섯 항목의 상대적 중요성은 연구 과정에서 프로젝트마다, 그리고 연구 과정에 걸쳐 변할 수 있다.
On a list of potential items to be included in the model, we have omitted the recruitment issue, which actually raises a paradox. When recruitment is easy, the researcher is at liberty to select a relevant and purposive sample and thereby reduce the number of participants. However, if only a few among many potential participants volunteer, the specificity of the sample may be jeopardized and thereby increase the number of participants necessary. If so, information power may be enhanced by considering the reasons for the declines. Simple changes in procedure, such as interviewing at home instead of in the clinic, may remove these obstacles and contribute to a sample where fewer participants are needed. The five items do not have universal importance, and their relative importance may therefore change from project to project and over the course of a research process.

 

모델을 단순하고 쉽게 이해하기 위해, 우리는 샘플 크기에 대한 질문이 일반적으로 참가자의 수를 나타내는 [개별 인터뷰 연구의 맥락]에서 모델을 개발하기로 선택했다. 표본 크기 개념은 아래와 같은 다른 정성적 연구 설계에서는 더 모호하다.

  • 포커스 그룹 연구(그룹 수, 참가자 수 또는 인터뷰 수), 
  • 관찰 연구(기록할 이벤트 수, 포함 인원 수, 방문 사이트 수)
  • 서면 데이터 연구(텍스트 페이지, 문서 수, 조직 수).

To make the model simple and readily understood, we chose to develop it for the context of individual interview studies, where the question of sample size usually refers to the number of participants. The sample size concept is more ambiguous when it comes to other qualitative research designs, such as

  • focus group studies (number of groups, number of participant, or number of interviews),
  • observational studies (number of events to be recorded, number of people to be included, number of sites to visit), or
  • studies with data from written sources (pages of text, number of documents, number of organizations).

 

오래된 것, 새로운 것, 빌린 것, 파란 것...
Something Old, Something New, Something Borrowed, Something Blue . . .

 

우리 모델의 대화 항목은 샘플링을 통한 적정성의 측면으로 논의되는 "좋은 정보원good informants"(Spradley, 1979년)의 개념과 일부 특징을 공유한다. 그러나 우리의 모델은 이러한 차원이 모두 데이터의 접근성을 포함하지만, 주제 속성보다는 대화의 품질을 강조한다는 점에서 다르다. Morse가 논의한 바와 같이 [적절성adequacy]은 데이터의 충분성과 품질과 관련이 있다. 적절성의 개념과 달리, 우리의 모델은 GT의 특정한 절차인 이론 또는 이론적 샘플링의 개발과 관련이 없다. 

The dialogue item in our model shares some features with Spradley’s notion of “good informants” (Spradley, 1979), which is discussed as an aspect of adequacy by sampling (Morse, 1991, 2000, 2015b). Our model differs, however, in that we emphasize the quality of the dialogue rather than the nature of the topic, although these dimensions both cover the accessibility of the data. Adequacy, as discussed by Morse, concerns the sufficiency and quality of data. Unlike the concept of adequacy, our model is not tied to development of theory or theoretical sampling, which are specific procedures of GT. 

 

최상의 질적 분석은 우리가 탐색하고자 하는 현상의 새로운 측면에 대한 풍부하고 다양한 설명을 포함하는 경험적 데이터로부터 수행된다(Morse, 1991년, 2015a; Patton, 2015년). 표본이 너무 작거나 크면 안 됩니다(Kvale, 1996; Sandelowski, 1995). 우리의 경험에서, 리뷰어들은 종종 이러한 특정 인터뷰의 분석 결과를 평가하는 대신 표본이 너무 작다는 것에 더 신경을 쓰는 것처럼 보인다. 우리는 비성찰적으로unreflectedly 너무 큰 샘플로 이어지는 방법론적 이념이나 전략에 대해 경고한다(Chamberlain, 2000). 정보력의 초기 및 연속적 평가를 통해, 연구자는 불필요한 데이터의 수집, 연구의 목적과 관련이 없는 정보의 상세화, 철저한 분석에 필요한 개요overview의 부족을 피할 수 있다. 우리의 모델은 정보 파워가 충분하다면, 다소 적은 수의 참가자로도 이 정보를 얻을 수 있다는 것을 나타낸다.

The best qualitative analysis is conducted from empirical data containing abundant and various accounts of new aspects of the phenomenon we intend to explore (Morse, 1991, 2015a; Patton, 2015). The sample should be neither too small nor too large (Kvale, 1996; Sandelowski, 1995). In our experience, reviewers often seem to be more concerned with samples being too small than being too large, instead of appraising the outcome of analysis from these particular interviews. We would warn against methodological ideologies or strategies unreflectedly leading to too large samples (Chamberlain, 2000). By initial and consecutive assessment of information power, the researcher may avoid waste of time and resources for collection of unnecessary data, elaboration of information that is not relevant for the aim of the study, and lack of overview needed for a thorough analysis. Our model indicates that this can be obtained even with a sample of rather few participants, provided that the information power is sufficient.

 

"포화"를 "정보력"으로 대체해야 합니까?
Should “Saturation” Be Replaced by “Information Power?”

 

질적 연구에서 포화도는 표본 크기에 대한 기준으로 자주 언급된다(Morse, 1995). 이 개념은 경험적 데이터에서 이론을 생성하기 위한 GT의 중심 요소인 constant comparative method의 한 요소로 제시되었다(Glaser & Strauss, 1999). 데이터 수집 중에, 연구자는 범주 속성과 범주 간의 관계에 대한 완전한 포화 상태를 얻을 때까지 순차적으로 추가된 이벤트를 비교한다(Charmaz, 2006). 또한 GT 분석의 포화도가 최종적으로 포화도에 도달하려면 연구에서 개발된 예비 이론에 기초한 이론적 표본 추출이 필요하다. 포화상태는 연구자가 더 이상 개발된 이론에 추가되는 정보를 받지 못할 때 발생한다.
Saturation is often mentioned as a criterion for sample size in qualitative studies (Morse, 1995). The concept has been presented as an element of the constant comparative method, which is a central element of GT, intended to generate theories from empirical data (Glaser & Strauss, 1999). During data collection, the researcher compares sequentially added events until exhaustive saturation of properties of categories and of relations among them is obtained (Charmaz, 2006). Furthermore, theoretical sampling based on preliminary theory developed in the study is required for saturation in a GT analysis to finally arrive at saturation. Saturation occurs when the researcher no longer receives information that adds to the theory that has been developed.

 

그러나 이러한 절차는 모든 정성적 연구의 일부는 아니며, O'Reilly와 Parker(2013)는 일반적인 품질 표시로 포화를 채택하는 것은 부적절하다고 주장한다. 비록 GT가 이론적 포화를 구성하는 것이 무엇인지에 대한 명확한 지침을 가지고 있지만, 다른 정성적 접근법에서 포화의 의미는 명확하지 않다. 저자들은 포화가 달성된 방법에 대해 항상 투명한 것은 아니라고 주장하며, 여러 연구는 실제로 GT의 포화 개념과 호환되지 않는다. 리뷰에 따르면 이 포화라는 개념은 종종 잘 명시되지 않으며, GT의 원래 포화 의미와 분명히 일치하지 않는다(Carlsen & Glenton, 2011).
These procedures are, however, not part of all qualitative studies, and O’Reilly and Parker (2013) argue that adopting saturation as a generic quality marker is inappropriate. Although GT has clear guidance about what constitutes theoretical saturation, the meaning of saturation within other qualitative approaches is not clear. Authors claiming saturation are not always transparent about how it has been achieved (Morse, 2015a), and several studies are actually not compatible with the saturation concept of GT. Reviews reveal that the concept is often poorly specified and definitely not corresponding with the original meaning of saturation from GT (Carlsen & Glenton, 2011).

 

탐색적 연구에서, 우리는 [연구하는 현상의 모든 측면에 대한 완전한 설명]을 향하지 않는다. 연구가 현재 이해에 크게 기여하거나 도전하는 새로운 통찰력을 제공할 때 우리는 대개 만족한다. 또한, 확실한 변형 집합set of variation의 철저한 표본 추출이 얻어지고, 포화 상태에 의해 적용될 수 있다는 [GT의 인식론적 기대]는 대부분의 정성적 연구에서 핵심적 theory of science가 아니다(Malterud, 2012). 확실히 모스는 포화도에 대한 이해를 거부하고 포화 도메인과 같은 범주 내의 특성을 철자로 표기한다. (모르세, 2015a)

For an exploratory study, we do not head for a complete description of all aspects of the phenomenon we study. We are usually satisfied when a study offers new insights that contribute substantially to or challenge current understandings. Furthermore, the epistemological anticipation of GT that exhaustive sampling of a definite set of variations can be obtained and covered by saturation is not the theory of science at the heart of most qualitative research (Malterud, 2012). To be sure, Morse rejects such an understanding of saturation, spelling out characteristics within categories as the domain to be saturated (Morse, 2015a).

 

우리는 이 점에 대한 모스의 정확성을 "모두 들었다heard it all"는 것을 더 자주 언급하는 정성적 연구자들 사이에서 다소 이례적인 것으로 간주한다(Morse, 2015a). [지식이 부분적이고 중간적이며 연구자의 위치적 관점에 종속된 것]으로 간주되는 [사회 구성주의적 뿌리를 가진 연구]는, 질적 연구가 이상적으로 "총량total"의 사실을 구성해야 한다는 생각을 지지하지 않는다(Alvesson & Schöldberg, 2009; Haraway, 1991). 
We consider Morse’s accuracy on this point as rather unusual among qualitative researchers, who more often refers to “heard it all” (Morse, 2015a). Research with social constructivist roots, where knowledge is considered partial, intermediate, and dependent of the situated view of the researcher, does not support an idea that qualitative studies ideally should comprise a “total” amount of facts (Alvesson & Sköldberg, 2009; Haraway, 1991).

 

DePaulo는 정성적 연구의 표본이 부적절하거나 너무 작을 때 중요한 것을 놓칠 위험에 대해 경고한다(DePaulo, 2000). 우리는 그 요점에 동의하지만, 문제의 현상의 모든 범위를 다루려는 그의 야망에는 동의하지 않는다

DePaulo warns against the risk of missing something important when the sample of a qualitative study is inappropriate or too small (DePaulo, 2000). We agree to his point, but not to his ambitions of covering the full range of the phenomenon in question.

 

마지막으로, 적어도 동료 검토자의 관점에서, '포화'는 겉으로 보이는 것만큼 객관적이고 논란의 여지가 없는 것이 아니다. 한 연구원은 사례를 종결된 것으로 간주하고 추가 인터뷰로 지루함을 느낄 수 있는 반면, 다른 동료는 현장에 대한 지식이 부족하거나 변동이 적은 경험적 데이터를 사용하여 추가 데이터를 새로운 정보로 평가할 수 있다(Malterud, 2012; Morse, 1995).

Finally, saturation is not as objective and indisputable as it might appear, at least from a peer reviewer’s perspective. One researcher may regard the case as closed and get bored by further interviewing, while another colleague, perhaps with a less thorough knowledge of the field or with empirical data containing less variation, may assess further data as new information (Malterud, 2012; Morse, 1995).

 

정보력은 여러 측면에서 포화상태와 다른 개념이다. 그러나 우리의 모델은 매우 독창적인 방법론적 아이디어에 기초하지 않는다. 우리는 정보력를 [내부 타당성]의 한 측면으로 보며, (분석 및 이론적 해석을 통해) 새로운 지식에 대한 액세스를 제공하기 위해 사용 가능한 경험적 데이터의 잠재력potential에 영향을 미친다. (코헨 & 크랩트리, 2008; Kvale, 1996) 이러한 점에서, [표본적 적절성, 데이터 품질 및 관련 사건의 variation]이 참가자 수보다 더 중요한 경우가 많다. 따라서 샘플의 정보 파워는 연구의 목적을 설명하기에 충분히 크고 다양하지만 이를 달성하는 방법에 대한 사양으로 간주할 수 있다(Kuzel, 1999; Marshall, 1996; Morse, 1995; Patton, 2015; Sandelowski, 1995).

Information power is a concept that differs from saturation in several respects. Our model is, however, not based on a very original methodological idea. We look on information power as an aspect of internal validity, influencing the potential of the available empirical data to provide access to new knowledge by means of analysis and theoretical interpretations (Cohen & Crabtree, 2008; Kvale, 1996). In this regard, sample adequacy, data quality, and variability of relevant events are often more important than the number of participants. Hence, information power of a sample is not very different from being sufficiently large and varied to elucidate the aims of the study but can be considered a specification of how to accomplish it (Kuzel, 1999; Marshall, 1996; Morse, 1995; Patton, 2015; Sandelowski, 1995).

연구실천에 미치는 영향
Implications for Research Practice

 

정성적 인터뷰 연구는 [참가자의 numerical input]에서 [분석을 통한 새로운 지식의 기여]로 주의를 이동시킴으로써 샘플링 전략의 이점을 얻을 수 있다. 정보력은 실제 연구와 관련된 샘플의 정보가 많을수록 참가자 수가 더 적어야 한다는 것을 나타냅니다. 계획 수립을 위해 샘플 크기의 초기 근사치가 필요한 반면, 최종 샘플 크기의 적합성은 연구 프로세스 동안 지속적으로 평가되어야 합니다. 최종 간행물에 제시된 결과는 실제 표본이 당면한 연구의 목적을 참조하여 새로운 지식을 개발할 수 있는 적절한 정보력을 보유했는지를 입증할 것이다.

Qualitative interview studies may benefit from sampling strategies by shifting attention from numerical input of participants to the contribution of new knowledge from the analysis. Information power indicates that the more information the sample holds, relevant for the actual study, the lower number of participants is needed. An initial approximation of sample size is necessary for planning, while the adequacy of the final sample size must be evaluated continuously during the research process. The results presented in the final publication will demonstrate whether actual sample held adequate information power to develop new knowledge, referring to the aim of the study at hand.

 

 

 

 

 

 


Qual Health Res. 2016 Nov;26(13):1753-1760.

 doi: 10.1177/1049732315617444. Epub 2016 Jul 10.

Sample Size in Qualitative Interview Studies: Guided by Information Power

Kirsti Malterud 1 2 3Volkert Dirk Siersma 1Ann Dorrit Guassora 1

Affiliations collapse

Affiliations

  • 11 University of Copenhagen, Copenhagen, Denmark.
  • 22 Uni Research Health, Bergen, Norway.
  • 33 University of Bergen, Bergen, Norway.
    • PMID: 26613970

 

Abstract

Sample sizes must be ascertained in qualitative studies like in quantitative studies but not by the same means. The prevailing concept for sample size in qualitative studies is "saturation." Saturation is closely tied to a specific methodology, and the term is inconsistently applied. We propose the concept "information power" to guide adequate sample size for qualitative studies. Information power indicates that the more information the sample holds, relevant for the actual study, the lower amount of participants is needed. We suggest that the size of a sample with sufficient information power depends on (a) the aim of the study, (b) sample specificity, (c) use of established theory, (d) quality of dialogue, and (e) analysis strategy. We present a model where these elements of information and their relevant dimensions are related to information power. Application of this model in the planning and during data collection of a qualitative study is discussed.

Keywords: information power; methodology; participants; qualitative; sample size; saturation.

교육 디자인연구(EDR) 수행을 위한 열두 가지 팁(Med Teach, 2020)

Twelve tips for conducting educational design research in medical education
Weichao Chena and Thomas C. Reevesb

 

 

도입 Introduction

의학 교육 연구 분야는 1950년대 이후 꾸준한 성장을 보여 왔다(트레이너와 에바 2010). 오늘날의 의료 전문가들은 다양한 종류의 교육 연구(Eva 및 Lingard 2008)를 수행하는 데 점점 더 많은 투자를 하고 있으며, 해당 기관(Ahmed et al. 2016)의 지원을 받고 있다. 불행히도, 다른 교육적 맥락에서와 마찬가지로 교육적 연구의 영향은 약하다. 결과적으로, 연구와 실제 사이의 차이를 더 효과적으로 메워주는 연구에 대한 요구가 증가하고 있다. 
The field of medical education research has witnessed steady growth since the 1950s (Traynor and Eva 2010). Today’s healthcare professionals are increasingly invested in conducting educational research of various kinds (Eva and Lingard 2008), with efforts often supported by their institutions (Ahmed et al. 2016). Unfortunately, the impact of educational research on medical education practice is weak, just as it is in other educational contexts (Kaestle 1993; Kennedy 1997; Albert et al. 2007; Dolmans and Tigelaar 2012; van Enk and Regehr 2018). As a result, there has been a growing call for studies that more effectively bridge the gap between research and practice.

 

실천에 미치는 영향이 불충분할 뿐만 아니라, 교육 및 학습과 관련된 강력한 이론의 정의와 개선에 적절하게 기여하는 의학 교육 연구 연구는 거의 없다. 쿡 외 연구진(2007)이 2003년과 2004년 사이에 주요 학술지에 발표한 실험 의학 교육 연구를 체계적으로 검토한 결과, 45%의 연구가 개념적 틀을 결여하고 있었다. 
In addition to the insufficient impact on practice, few medical education research studies contribute adequately to the definition and refinement of robust theory related to teaching and learning. According to Cook et al.’s (2007) systematic review of the experimental medical education research published in leading journals between 2003 and 2004, 45% of the studies lacked a conceptual framework. 


'이론 지향적이고 응용과 관련된 두 가지 모두를 다른 사람에게 알리기 위해 사용한다'는 의학적 교육 연구에 대한 수요에 대응하여(Eva 2010, 페이지 4), 본 논문은 이 두 가지 목표를 달성하기 위한 유망한 접근법으로 교육 설계 연구(EDR)를 소개한다. 그림 1은 EDR 프로젝트의 세 가지 주요 단계를 보여줍니다(McKenney 및 Reeves 2019).

Responding to the demand for medical education research that is ‘both theory-oriented and application-relevant, using each to inform the other’ (Eva 2010, p. 4), this paper introduces Educational Design Research (EDR) as a promising approach to accomplishing this twofold objective. Figure 1 illustrates the three major phases of EDR projects (McKenney and Reeves 2019):

 

 

  • '분석 및 탐구'는 중요한 교육 문제에 대한 이해를 얻고 다른 사람들이 어떻게 문제를 해결했는지 조사하기 위해 협력자들과 긴밀히 협력하는 것을 포함한다.
  • '설계 및 시공'은 적절한 설계 원칙을 식별 또는 작성하고 이러한 원칙을 사용하여 프로토타입 개입을 개발하는 데 초점을 맞춥니다.
  • '평가 및 성찰'은 프로토타입 개입을 테스트하고 결과가 미치는 영향을 검토하기 위해 여러 번 반복된 데이터 수집 및 분석으로 구성됩니다.

 

  • ‘Analysis and Exploration’ involves working closely with collaborators to acquire an understanding of a significant educational problem and investigate how others have addressed it;
  • ‘Design and Construction’ focuses on identifying or creating appropriate design principles and using these principles to develop your prototype intervention; and
  • ‘Evaluation and Reflection’ consists of multiple iterations of data collection and analysis to test your prototype intervention and review the implications of the findings.

 

의학 교육 연구자들(Dolmans and Tigelaar 2012; Wolcott et al. 2019)에게 최근에 소개되었지만, EDR은 1990년대 초 다른 교육 환경에서 출현했으며, [교육 연구가 실제에 미치는 영향을 강화]하는 동시에, [이론을 확장 및 정제하는extending and refining 방식]의 하나로서 꾸준히 증가하고 있다. 설계 기반 연구 및 설계 기반 구현 연구와 같은 유사한 접근 방식을 포괄하는 EDR은 2003년부터 현재까지 주요 교육 연구 저널의 여러 특수 이슈에 실렸다. 그림 1은 맥케니와 리브스(2019)가 설명한 EDR의 과정을 보여주고 있다. 

While only recently introduced to medical education researchers (Dolmans and Tigelaar 2012; Wolcott et al. 2019), EDR emerged in other educational settings in early 1990s and has been steadily increasing as a way of enhancing the impact of educational studies on practice while at the same time extending and refining theory (McKenney and Reeves 2019). Encompassing similar approaches such as design-based research and design-based implementation research, EDR has been featured in multiple special issues of leading educational research journals between 2003 and the present. Figure 1 illustrates the process of EDR as delineated by McKenney and Reeves (2019). 

팁 1 EDR 이니셔티브가 학습 및 교육 관련 중요한 문제에 집중되도록 보장
Tip 1 Ensure your EDR initiative is focused on a significant problem related to learning and teaching

무엇보다도, 당신의 EDR 이니셔티브는 교육 및 학습의 실천과 관련된 의미 있는 문제에 초점을 맞추고 이 확인된 과제를 충족시키는 것을 목표로 해야 한다. [중요한 교육 과제를 해결하기 위한 초점]은 EDR을 교육 연구에 대한 많은 다른 접근 방식(McKenney 및 Reeves 2019)과 구별한다. 그림 1에서 설명한 바와 같이, EDR 이니셔티브의

  • 첫 번째 단계인 집중적인 '분석 및 탐색'을 통해 문제에 대한 여러분의 이해도를 알게 되며, 이후
  • 두 번째 단계인 '설계 및 시공'에서 문제에 대한 프로토타입 솔루션을 개발할 수 있게 됩니다. 이 솔루션은 새롭게 계획되거나 강화된
    • 교육 프로세스(예: 혁신적인 교육학적 전략),
    • 프로그램(예: 교직원 개발 노력 강화) 또는
    • 정책(예: 주민 교육 현장의 변화)...의 형태로 '개입'으로 특징지어질 수 있다(Groupen et al. 2018).

First and foremost, your EDR initiative should focus on a meaningful problem relevant to the practice of teaching and learning and aim to meet this identified challenge. This sharp focus on addressing a significant educational challenge distinguishes EDR from many other approaches to educational research (McKenney and Reeves 2019). As illustrated in Figure 1, your understanding of the problem will

  • be informed by intensive ‘Analysis and Exploration’ during the first phase of your EDR initiative and
  • subsequently enable the development of a prototype solution to the problem during the second phase, ‘Design and Construction.’ The solution can be characterized as an ‘intervention’ in the form of newly planned or enhanced
    • educational processes (e.g. innovative pedagogical strategies),
    • programs (e.g. enhanced faculty development efforts), or
    • policies (e.g. changes in training sites for residents) (Gruppen et al. 2018).

 

오늘날 의료 교육자들에게 심각한 문제를 구성하는 것은 무엇인가? 많은 교육적 과제는 모든 수준의 교사들이 경험하는 것과 다르지 않다(예: 능동적 학습 원칙의 통합 또는 고차원적 학습 성과의 달성 증가). 다음과 같이 의학교육에 더 구체적인 것도 있다.
What constitutes serious problems for healthcare educators today? Many educational challenges are not unlike those experienced by teachers at all levels (e.g., increasing the integration of active learning principles or the achievement of higher-order learning outcomes), but others are more specific to medical education, including:

  • 점점 더 유동적인 의료 팀에서 효과적으로 작업할 수 있는 역량을 개발합니다.
  • 환자 및 기타 의료 전문가와 문화적으로 유능한 방식으로 의사소통할 수 있는 기술을 배양합니다.
  • 머신 러닝 알고리듬과 로봇에 점점 더 많이 빠져드는 세상에서 의료 전문가들이 실습을 할 수 있도록 준비한다.
  • 평가 프로토콜 및 피드백 관행을 개선하여 역량 기반 교육을 촉진합니다.
  • 의료 전문가의 임상 추론(CR)을 개선합니다.

 

  • Develop capacities to work effectively in increasingly fluid healthcare teams.
  • Cultivate skills to communicate in a culturally competent manner with patients and other healthcare professionals.
  • Prepare healthcare professionals for practice in a world increasingly infused with machine learning algorithms and robots.
  • Improve assessment protocols and feedback practices to promote competency-based education.
  • Enhance healthcare professionals’ clinical reasoning (CR).

 

의학 교육에서 EDR이 어떻게 수행될 수 있는지를 명확히 하기 위해, 의대생의 임상 추론 강화 문제에 초점을 맞춘 가상의 연구가 다음 팁의 설명에 사용될 것이다. CR이 환자 안전에 중요한 영향을 미치는 의료 실무의 핵심 기술임에도 불구하고, 이러한 기술은 임상 회전 중에 전문 실무자를 관찰하여 개발하는 것으로 여기기 때문에 명시적으로 교육되는 경우는 거의 없다. 학생들의 CR을 향상시키는 것은 의대 교사들에게 분명히 심각한 도전이다(Higgs et al. 2019). 

To clarify how EDR can be conducted in medical education, a hypothetical study focused on the problem of enhancing medical students’ clinical reasoning (CR) will be used in the description of the following tips. Despite the fact that CR is a core skill in medical practice with major implications for patient safety, it is rarely explicitly taught because it is assumed that these skills will be developed by observing expert practitioners during clinical rotations (Gay et al. 2013; Amey et al. 2017). Enhancing the CR of their students is clearly a serious challenge for medical teachers (Higgs et al. 2019).

팁 2 실제 및 이론적 결과를 위해 노력합니다.
Tip 2 Strive for both practical and theoretical outcomes

 

McKenney와 Reeves(2019)에서 설명한 바와 같이, EDR 프로젝트는 [개입의 성숙]과 [강화된 이론적 이해]라는 두 가지 주요 결과를 동시에 추구한다.

  • 그림 1에서 설명한 것처럼, EDR의 실제 결과는 새로운 조건이 진화함에 따라 개입도 진화해야 하기 때문에 [어떤 문제 해결도 최종적이지 않다는 인식]에서 성숙된 개입으로 개념화된다.
  • 그림 1은 EDR의 이론적 기여를 이론적 이해로 지정한다. EDR에서 [이론적 이해]는 보통 '설계 원칙design principle'의 형태로 표현된다. 설계 원칙은 [이전 연구로부터 도출된 모범 사례로서, 프로토타입 솔루션의 작성에 정보를 제공하고, 이후 데이터 수집, 분석 및 반영 활동을 통해 구체화하는 데 사용]된다.

As delineated in McKenney and Reeves (2019), two primary outcomes are sought simultaneously in EDR projects, specifically a maturing intervention and enhanced theoretical understanding.

  • As illustrated in Figure 1, the practical outcome of EDR is conceptualized as a maturing intervention in recognition that no problem solution is ever final because as new conditions evolve, interventions must evolve as well.
  • Figure 1 designates the theoretical contribution of EDR as theoretical understanding. In EDR, theoretical understanding is usually represented in the form of ‘design principles.’ Design principles are the best practices derived from prior research that you will use to inform the creation of your prototype solution and that subsequently, you will refine through your data collection, analysis, and reflection activities.

 

학생들의 CR 기술 향상 도전에 EDR을 적용할 때, [실용적 결과]는 [CR 기술을 향상시키는 교육적 개입]이 될 것이며, [이론적 결과]는 [다른 높은 차원의 성과를 다루는 개입을 개발하기 위한 설계 원칙의 강화]일 것이다.

  • 개입의 성숙의 예로는 학생들이 대화형 피드백과 코칭으로 실제 사례에 CR을 적용하는 데 관여하는 컴퓨터 기반 시뮬레이션이 있을 수 있다.
  • 설계 원리의 예로는 '사례 기반 시뮬레이션은 임상 추론의 형태적 평가가 실제 작업에 포함되고 피드백이 지연되지 않고 즉시 제공될 때 가장 효과적이다'라고 할 수 있다.

 

In applying EDR to the challenge of enhancing students’ CR skills, the practical outcome would be an educational intervention that improves CR skills while the theoretical outcome would be enhanced design principles for developing interventions that address other higher order outcomes.

  • An example of a maturing intervention might be a computer-based simulation that engages students in applying CR to actual cases with interactive feedback and coaching.
  • An example of a design principle might be that ‘A case-based simulation is most effective when the formative assessment of clinical reasoning is embedded in authentic tasks and feedback is provided immediately rather than delayed.’

팁 3 연구 및 개발 프로세스 전반에 걸쳐 이론적 이해를 구합니다.
Tip 3 Seek theoretical understanding throughout the research and development process

EDR 이니셔티브 전반에 걸쳐 (니즈 평가, 문헌 검토, 준 실험과 같은) 다양한 연구 활동이 중요한 문제에 대한 해결책의 주기적인 개발에 통합된다. 이러한 연구 개발 활동은 서로 다른 유형의 [이론적 이해]를 통해 정보를 제공받는다(McKenney 및 Reeves 2019).
Throughout an EDR initiative, various research activities such as needs assessment, literature review, and quasi-experiments are integrated into the cyclical development of a solution to the significant problem. These research and development activities are informed by and in turn yield different types of theoretical understanding (McKenney and Reeves 2019):

 

  • 기술적 이해descriptive understanding는 일반적으로 혁신적인 개입의 실제 개발을 시작하기 전에 '분석 및 탐색' 단계에서 이루어집니다. 문헌 검토나 경험적 탐색을 통해 목표 교육 과제와 관련된 현재 상황에 대한 더 나은 이해를 도출하고, 이는 이후 '설계와 건설' 단계를 알려준다.
  • '평가 및 성찰' 단계에서는 개입의 테스트 및 개선을 통해 원하는 결과에 대한 예측적 이해predictive understading를 구하고, 설계된 개입이 목표 문제를 해결하는지 여부와 어느 정도까지 해결할 수 있습니다.
  • 혁신이 제대로 작동하는지를 평가하는 것은 유용하지만, 혁신이 어떻게, 언제, 그리고 '어떤what' 측면과 '왜' 그것이 발생하였는지를 동시에 연구하는 것도 중요합니다(Regehr 2010). 따라서 설명적 이해explanatory understanding는 개입이 성공하거나 실패하는 방법과 이유를 설명하여 중요한 인과 관계 또는 영향력 있는 상황적 요인을 드러낸다.
  • '평가 및 성찰' 단계에서 개입의 타당성을 조사하는 여러 번의 반복을 통해, 대개 [정교화된 설계 원리refinded design principle]의 형태로 규범적인 이해prescriptive understanding를 도출할 수 있습니다. 이상적으로, 이러한 정교한 설계 원칙은 자신이나 다른 사람이 새로운 교육 맥락에서 유사한 개입의 설계와 실행을 가능하게 할 것이다.

 

  • Descriptive understanding is typically pursued during the ‘Analysis and Exploration’ stage, before starting the actual development of your innovative intervention. Through literature reviews or empirical exploration, you derive a better understanding of the current situation related to the target educational challenge, which subsequently informs the ‘Design and Construction’ stage.
  • At the ‘Evaluation and Reflection’ stage, through the testing and refinement of your intervention, you can seek predictive understanding of the desired outcomes, addressing whether, and to what extent, the designed intervention addresses the target issue.
  • While it is useful to assess ‘if’ your innovation works, it is also important to simultaneously study ‘how,’ ‘when,’ and ‘what’ aspects of it work and ‘why’ that happens (Regehr 2010). Explanatory understanding, therefore, explicates how and why the intervention succeeds or fails, revealing important causal relationships or influential contextual factors.
  • Through multiple iterations of investigating the efficacy of your intervention during the ‘Evaluation and Reflection’ stage, you can derive prescriptive understanding, usually in the form of refined design principles. Ideally, these refined design principles will enable the design and implementation of similar interventions in new educational contexts by yourself or others.

 

가상 환자, 대화형 시뮬레이션, 반응성 매니킨, 질병 스크립트 워크샵, 서비스 학습, 문제 기반 학습, 개념 매핑, 혼합 학습 및 3-D 게임과 같은 의료 학습자의 CR을 향상시키기 위해 수 많은 혁신이 개발되었다. 하지만 이러한 개입 중 어느 것도 이 과제를 제대로 해결하지 못했습니다. 적어도 이 실패의 일부는 [CR에 대한 타당한 이론적 이해 없이 개입을 개발하는 모든 너무 일반적인 관행]과 [이러한 기술을 가르치는 복잡성]에 기인할 수 있다(Rencic 2011). 

Numerous innovations have been developed to enhance the CR of healthcare learners, such as virtual patients, interactive simulations, responsive manikins, illness scripts workshops, service learning, problem-based learning, concept mapping, blended learning, and 3-D games (among others), but none of these interventions has adequately met this challenge. At least part of this failure may be attributed to the all-too-common practice of developing interventions without a sound theoretical understanding of CR and the complexities of teaching these skills (Rencic 2011).

 

팁 4 개념적 프레임워크 식별 및 적용
Tip 4 Identify and apply conceptual frameworks

 

'분석 및 탐색' 단계(그림 1 참조)에는 [연구 및 설계 활동의 계획을 안내하기 위해 가능한 한 일찍 하나 이상의 개념 프레임워크를 식별하는 것]이 포함됩니다. 개념적 프레임워크는 관찰을 기반으로 개발되거나 경험적 연구에 의해 검증되거나 다른 well-grounded theory에서 도출된 이론, 모델 및 실천 원칙을 포함한다. 각 프레임워크는 복잡한 교육 현상을 검토하고 해석하기 위한 렌즈를 제공한다(Bordage 2009). 다시 말해서, 서로 다른 프레임워크는 [대상 문제의 상호 관련되고, 또 종종 복잡한 측면에 주의]를 기울이게 하며, [혁신적 개입에 통합될 수 있는 교육 전략의 유형]에 영향을 미친다.
The ‘Analysis and Exploration’ phase (see Figure 1) includes identifying one or more conceptual frameworks as early as possible to guide your planning of both research and design activities (Yin 2014). Conceptual frameworks include theories, models, and principles of practice that are developed based on observations, validated by empirical research, or derived from other well-grounded theories. Each framework provides a lens for examining and interpreting complex educational phenomena (Bordage 2009). In other words, different frameworks bring attention to interrelated and often complex aspects of the target problem and influence the types of educational strategies that might be integrated into an innovative intervention.

 

  • 학습 이론에서 프레임워크를 식별하면(Zackoff et al. 2019), 학습이 어떻게 발생하고 성공적인 학습을 지원하기 위한 교육 노력을 개선하는 방법에 초점을 맞출 가능성이 높다.
  • 반면에, 만약 시스템 이론으로부터 도출한다면(Barr 2013), 아마도 혁신이 지속되도록 조직의 능력을 향상시키기 위한 [혁신의 확산에 영향을 미치는 요소]들을 조사할 것이다.
  • If you identify a framework from learning theories (Zackoff et al. 2019), you are likely to focus on the process of how learning occurs and how to improve instructional efforts to support successful learning;
  • on the other hand, if you derive your framework from system theories (Barr 2013), you will probably investigate factors that influence the diffusion of your innovation so as to enhance your organization’s capacity to sustain it.

EDR을 수행하는 연구자와 실무자는 의료 학습자의 CR을 향상시키기 위해 서로 다른 학습 이론을 채택했다.

  • 예를 들어, 라마케어스 외 연구진(2012)은 인지 이론을 채택하고 학습자의 인지 이해 구성을 지원하는 실제 사례와 실천을 갖춘 커리큘럼을 구축한 반면, 레게트(2016)는 CR 성능에 '자기조절학습'의 중요성을 강조했다. 그리고 학생들의 자율 학습 능력을 향상시키기 위해 피드백 연습을 강화하려고 노력했다.
  • 반면 코이비스토 외 연구진(2016, 2017, 2018)은 경험이 학습에서 수행하는 중심 역할에 초점을 맞췄다. 학습자의 CR 능력을 높이기 위한 3-D 게임을 개발하면서, 학생들의 학습 과정을 조사하고 향상시키기 위해 경험 학습 이론을 채택했다.
  • 의학 교육의 맥락에서, 학습 이론의 추가 예는 Zackoff et al. (2019, 페이지 137–138)에서 볼 수 있으며, Bar (2013)는 조직 이론과 활동 이론과 같은 시스템 이론의 예를 제공했다.

Researchers and practitioners conducting EDR have adopted different learning theories to enhance healthcare learners’ CR.

  • For example, Ramaekers et al. (2012) adopted cognitive theories and built a curriculum with authentic examples and practice to support learners’ construction of cognitive understanding whereas Leggett (2016) emphasized the importance of ‘self-regulated learning’ on the performance of CR and sought to enhance feedback practice to foster students’ self-regulated learning skills.
  • On the other hand, Koivisto et al. (2016, 2017, 2018) focused on the central role that experience plays in learning. In developing a 3-D game to enhance learners’ CR skills, they adopted the experiential learning theory to investigate and enhance students’ learning process.
  • Within the context of medical education, additional examples of learning theories are available in Zackoff et al. (2019, p. 137–138), and Barr (2013) provided examples of system theories, such as organizational theory and activity theory. 

팁 5 EDR 이니셔티브에 대해 기꺼이 협력할 수 있는 실무자와 연구자를 식별합니다.
Tip 5 Identify practitioners and researchers willing and able to collaborate on the EDR initiative

 

EDR의 특징은 [연구자와 실무자의 긴밀한 협업을 포함]하거나, 의료 교육에서 실무자와 이론적 이해를 개선하기 위한 [장기적 노력에 협력하고자 하는 실무자 그룹을 포함]한다는 것이다. 교육 생태계에 대한 모든 개입의 성공은 시스템의 다른 요소(Zhao 및 Frank 2003)와의 혁신적 상호작용에 의해 결정된다. 다음 이해관계자는 EDR 프로젝트가 수행되는 생태계에서 중요한 역할을 할 수 있다.
A hallmark of EDR is that it involves the close collaboration of researchers and practitioners, or more likely in medical education a group of practitioners willing to engage collaboratively in long-term efforts to improve practice and theoretical understanding. The success of any intervention in an educational ecological system is determined by the innovation’s interaction with other components of the system (Zhao and Frank 2003). 

 

  • 당신의 프로젝트가 다루는 문제와 관련된 핵심 기술 및 주변 기술을 가르치는 일에 관련된 전문가들,
  • 프로그램 평가 및 학습 평가에 전문 지식을 갖춘 전문가
  • 교수 및 직원 개발 및 교육 설계에 전문 지식을 갖춘 전문가
  • 행정, 학술, 학생, 기술 지원 인력 
  • 대상 학습자 모집단의 대표자
  • professionals involved in teaching the core and peripheral skills related to the problem your project addresses,
  • professionals with expertise in program evaluation and learning assessment,
  • professionals with expertise in faculty and staff development and/or instructional design,
  • administrative, academic, student, and technology support personnel, and
  • representatives of the target learner population.

교육 개발 및 연구 모두에서 중요한 역할을 수행해야 하지만, 경험이 풍부한 교육 연구자 또는 평가자를 팀에 한 명 이상 포함시키는 것을 고려하십시오. 성공적인 프로젝트 관리(Huggett et al. 2011)를 통해 다학제적 협업을 통해 학술활동의 질을 크게 높일 수 있습니다(Traynor 및 Eva 2010).

While you should play key roles in both instructional development and research, consider including one or more experienced educational researchers or evaluators on your team. With successful project management (Huggett et al. 2011), multidisciplinary collaboration can significantly advance the quality of scholarship (Traynor and Eva 2010).

 

또한 의대생 스스로 EDR 이니셔티브에 참여하기를 원할 수 있다. 이들이 소규모 평가의 참여자 및 설계 및 구현 아이디어를 위한 견고한 위원회 역할을 할 수 있기 때문이다.

In addition, you might want to engage medical students themselves in the EDR initiative as they can serve as participants in small-scale evaluations and as sounding boards for design and implementation ideas.

팁 6 대상 문제 및 학습자 분석
Tip 6 Analyze the target problem and learners

[개입의 구성construction of an intervention]에 정보를 제공하기 위해서는, 목표 문제와 다른 사람이 목표 문제를 해결하기 위해 사용한 [기존 혁신에 대한 풍부한 설명적 이해]를 얻어야 하며, [목표 모집단과 학습 환경에 대한 자세한 정보]도 얻어야 합니다(Bass and Chen 2016; Hughes 2016). 이러한 종류의 정보는 일반적으로 문헌 검토, 현장 방문 및 관찰, 학습자 및 교육자 조사를 통해 구해진다. 
To inform your construction of an intervention, you must acquire a rich descriptive understanding of the target problem and the existing innovations that others have employed to address your target problem, and you must also garner detailed information about the target population and the learning environment (Bass and Chen 2016; Hughes 2016). This kind of information is typically sought through reviewing the literature, conducting site visits and observations, and/or surveying learners and their educators. 


또한 대상 학습자와 학습 환경에 대한 다음 정보를 명확히 설명해야 합니다(Fink 2013).
Additionally, you should seek to clarify the following information about your target learners and their learning environment (Fink 2013):

 

  • 학습자 및 강사 특성
  • 학습 환경, 기술 및 기타 자원의 설정
  • 사회, 전문직 협회, 소속 기관 같은 외부 기대치
  • 교육내용subject matter의 특성과 내재된 교육학적 도전.
  • learner and instructor characteristics;
  • the setting of the learning environment, technology, and other resources;
  • external expectations from the society, professional associations, and your institute; and
  • nature of the subject matter and inherent pedagogical challenges.

팁 7 정렬된 교육 설계 및 구성
Tip 7 Design and construct an aligned educational design

 

EDR의 '설계 및 시공' 단계는 이전 '분석 및 탐사' 단계에서 습득한 기술 이해를 바탕으로 설계 계획을 수립하기 시작하는 단계입니다(그림 1 참조).
The ‘Design and Construction’ phase of EDR is when you begin constructing your design plan based on the descriptive understanding acquired during the previous ‘Analysis and Exploration’ phase (see Figure 1).

 

첫째, 프로토타입 개입에 대한 설계 원칙을 도출하기 위해 개념 프레임워크 및 유사한 솔루션과 관련된 문헌을 계속 검토하십시오. 이러한 원칙은 설계 계획design plan으로 전환되며, 여기에는 다음의 세 가지 핵심 요소가 포함되어야 합니다(Fink 2013). 

  • 교육 목표,
  • 교육 활동 및 자료,
  • 평가 및 피드백 절차

First, continue to review literature related to your conceptual framework(s) and similar solutions to derive design principles for your prototype intervention. These principles are turned into your design plan, which must include three key elements at a minimum: 

  • educational objectives,
  • instructional activities and materials, and 
  • assessment and feedback procedures (Fink 2013).

내용을 확인하거나 새로운 교육 방법 또는 기술을 탐색하여 혁신을 개발하고자 할 수도 있지만, 교육 목표를 구성하거나 검토하면서 학습자가 교육 개입의 마지막에 무엇을 해야 하는지를 명확하게 설명하는 것으로 시작할 수 있습니다. 이노베이션 개발을 안내하는 명확한 교육 목표를 작성할 때, 나머지 두 가지 주요 설계 요소(교육 활동 및 자료, 평가 및 피드백 절차)를 이러한 목표와 연계할 수 있는 기반을 구축합니다. 이러한 정렬은 학생들이 의미 있는 학습에 참여할 수 있는 기회를 높여 줍니다(Fink 2013). 

While you might be eager to start developing your innovation by identifying the content or exploring a novel teaching method or technology, instead begin by composing or reviewing your educational objectives, clearly describing what learners are expected to do at the end of the instructional intervention. When you write clear educational objectives to guide the development of your innovation, you build the foundation for the alignment of the other two major design elements (instructional activities and materials and assessment and feedback procedures) with these objectives. This alignment enhances your students’ opportunities to engage in meaningful learning (Fink 2013). 


교육 목표를 지정하는 과정은 자연스럽게 다음과 같은 다른 주요 설계 요소를 고려하도록 유도합니다.

  • 학습자의 목표 달성을 지원하기 위한 교육 활동 및 자료를 제작하는 과정과
  • 원하는 학습이 이루어졌음을 입증하기 위한 관련 평가 및 피드백 절차를 개발하는 과정.

The process of specifying your educational objectives naturally prompts you to consider other key design elements,

  • crafting instructional activities and materials to support learners’ achievement of these objectives and
  • developing relevant assessment and feedback procedures to demonstrate that the desired learning has occurred.

MedBiquitous Curriculum Inventory Working Group 표준화 어휘 소위원회(2016)는 의료 교육에서 일반적인 교육 및 평가 방법을 식별한다.

MedBiquitous Curriculum Inventory Working Group Standardized Vocabulary Subcommittee (2016) identifies common instructional and assessment methods in medical education.


'분석 및 탐구' 단계 이후, 여러분과 동료들이 학생들의 CR을 개선하기 위하여, 'flipped classroom'을 활용한 교육적 개입의 설계를 스케치했다고 가정합시다. 반복 설계 프로세스 중에 이러한 각 설계 구성요소를 수정하고 다시 검토하여 해당 구성요소가 서로 일치하고 개입이 제안된 설계 원리에 부합하는지 확인합니다. 다음과 같은 질문을 합니다.
Suppose that after the ‘Analysis and Exploration’ phase, you and your colleagues have sketched out a design of an instructional intervention to enhance students’ CR, specifically a ‘flipped classroom’. During the iterative design process, you will revise and revisit each of these design components to make sure that they are in alignment with each other and that the intervention is congruent with the proposed design principles. Ask questions such as:

 

  • FC 모델은 모든 교육 목표를 효과적으로 다루고 학생들이 학습 평가를 준비하도록 하는가?
  • 평가 활동이 모든 목표를 어느 정도까지 다루고 있는가?
  • 프로토타입 FC 접근 방식에 당신의 설계 원칙이 얼마나 잘 반영되어 있습니까?
  • 대상 학습자, 학습 환경 및 리소스에 대한 이해를 바탕으로 이 혁신을 실제로 구현하는 것이 얼마나 실현 가능합니까?
  1. To what extent does the flipped classroom model effectively address all the educational objectives and prepare students for learning assessments?
  2. To what extent do the assessment activities cover all the objectives?
  3. How well are your design principles reflected in your prototype flipped classroom approach?
  4. Based on your understanding of the target learners, learning environment, and resources, how feasible is it to actually implement this innovation?

팁 8 프로토타입 개입 구현 평가
Tip 8 Evaluate the implementation of your prototype intervention

EDR의 3단계는 '평가와 성찰'을 통해 혁신적인 개입을 개선하고 이론적 이해를 확대 또는 강화한다(그림 1 참조). 주기적인 평가를 수행하여 지역 및 광범위한 제도 생태계에서 개입의 기능을 조사하고 개입의 성공에 영향을 미치는 요인을 식별한다. 권장 질문은 다음과 같습니다.

The third phase of EDR involves ‘Evaluation and Reflection’ to refine the innovative intervention and extend or enhance theoretical understanding (see Figure 1). Conduct periodic assessments to investigate the intervention’s functioning in both the local and the broader institutional ecological systems and identify factors impacting its success. Recommended questions include:

 

  • 선생님과 학습자 모두 여러분의 개입이 그들의 필요와 관련이 있다고 어느 정도 인식했는가?
  • 학습자가 개입에 얼마나 관여하고engaged 있습니까?
  • 당신의 개입이 그것의 의도된 목표를 얼마나 잘 다루고 있는가?
  • 의도하지 않은 결과가 나타날 경우, 긍정적인 결과인가 부정적인 결과인가? 그리고 왜 그런 결과가 나타났는가?
  • 당신의 원래 계획에 어떤 수정이 이루어졌고, 왜 이러한 변경들이 이루어졌는가?

  1. To what extent have both teachers and learners perceived your intervention as relevant to their needs?
  2. How engaged are learners in the intervention?
  3. How well does your intervention address its intended goals?
  4. If any unintended outcomes emerge, are they positive or negative and why have they occurred?
  5. What modifications have been made of your original plan and why were these changes made?

이러한 유형의 질문을 어떻게 해결할 수 있습니까? 관찰, 인터뷰 및 설문지를 포함하여 평가 작업에 사용할 수 있는 다양한 데이터 수집 방법과 도구가 있습니다(Reeves 및 Hedberg 2003).

How can you address these types of questions? There are many different data collection methods and tools that can be used in your evaluative work, including observations, interviews, and questionnaires (Reeves and Hedberg 2003). 

 

학생들의 CR을 향상시키기 위해 뒤집힌 교실 접근법과 같은 교육적 혁신을 구현하기 시작한다고 상상해 보십시오. 혁신이 설계한 대로 구현되는지 여부를 확인하고 해당 설계에 필요한 조정을 수행하는 방법을 결정하기 위해 몇 번의 반복 시험과 개선을 수행할 계획이다.

Imagine beginning to implement an instructional innovation such as a flipped classroom approach to enhance your students’ CR. Plan to conduct several iterations of testing and refinement to see whether the innovation is being implemented as designed and determine how to make any needed adjustments to its design.

팁 9 개입의 결과 평가
Tip 9 Evaluate the outcomes of your intervention

실제 결과와 이론적 결과를 모두 향상시키기 위해 수행하는 '평가 및 성찰'의 반복 횟수에 대해 정해진 규칙은 없지만 대부분의 EDR 연구는 [최소 세 번의 반복]을 포함한다. 각 반복에 대해, 개입의 구현을 평가하는 것 외에도, 의도하지 않은 효과를 포함하여 EDR 이니셔티브의 즉각적인 교육 목표와 장기적인 최종 목표의 성취를 분석한다. 평가할 수 있는 결과의 범위는 Kirkpatrick과 Kirkpatrick(2016)에 의해 네 가지 수준으로 나뉜다.

Although there is no set rule for the number of iterations of ‘Evaluation and Reflection’ you carry out to enhance both your practical and theoretical outcomes, most EDR studies encompass at least three iterations (McKenney and Reeves 2019). For each iteration, in addition to evaluating the implementation of the intervention, analyze the achievement of both the immediate educational objectives and the long-term ultimate goals of the EDR initiative, including unintended effects. A range of outcomes that can be evaluated are divided into four levels by Kirkpatrick and Kirkpatrick (2016):

 

  • 학습자의 학습 경험과 개입의 유용성에 대한 인식에 대한 만족도
  • 학습 평가 결과에 반영되는 개입에서 얻은 학습
  • 행동 변화 또는 새로운 학습의 성과 맥락으로의 전이transference
  • 환자 안전 결과 개선과 같은 개입 이후의 조직 결과.
  1. learner satisfaction with their learning experience and perception of the usefulness of the intervention;
  2. learning acquired from the intervention as reflected in the learning assessment outcomes;
  3. behaviors changes or transference of new learning to a performance context; and
  4. organizational results following the intervention such as improved patient safety outcomes.

실현 가능성, 가용 리소스 및 목표를 기반으로 평가할 결과의 적절한 수준을 결정하고 적절한 평가 방법 및 도구를 사용합니다. 학생들의 CR을 개선하기 위해 FC를 활용한 경우, 적어도 커크패트릭과 커크패트릭(2016)이 설명한 처음 세 단계의 평가를 수행하고자 할 것이다.

  • 레벨 1의 경우 설문지와 관찰을 사용하여 학생들이 FC 방식에 어떻게 반응하는지 확인할 수 있습니다.
  • 레벨 2의 경우, 학습자의 CR 지식과 기술이 이 혁신에 의해 실제로 어느 정도 향상되었는지 평가하도록 한다(Durning et al. 2012).
  • 레벨 3의 경우, 관찰, 인터뷰 및 포커스 그룹을 사용하여 학생들이 실제 또는 가상 환자와 상호작용할 때 새로 습득한 CR 기술을 어느 정도 사용하는지를 평가한다.

Determine the appropriate level(s) of outcomes to evaluate based on feasibility, available resources, and your objectives, and use appropriate evaluation method(s) and instrument(s) (Cook 2010). In the case of a flipped classroom approach to improving students’ CR, you will at least want to carry out evaluations of the first three levels described by Kirkpatrick and Kirkpatrick (2016).

  • For Level 1, you could use questionnaires and observations to determine how students are reacting to the flipped classroom approach.
  • For Level 2, seek to assess to what extent learners’ CR knowledge and skills are actually improved by this innovation (Durning et al. 2012).
  • For Level 3, use observations, interviews, and focus groups to assess the degree to which the students are using their newly acquired CR skills in their interactions with real or virtual patients.

 

대부분의 혁신은 [의도된 구현]과 [실제 구현] 간의 차이를 수반하므로, 학습 결과를 구현 프로세스에 대한 연구 결과와 다시 연관시키십시오(Reeves와 Hedberg 2003). 교육 개입에 대한 반복적인 평가를 실시함으로써, 개입의 실제적이고 이론적 영향을 입증하는 데 필요한 정보가 포착되도록 보장합니다. 이러한 평가 활동은 예측, 설명 또는 규범적 이해의 생성으로 이어져야 한다.

Make sure to relate learning outcomes back to your findings about the implementation process, since most innovations are subject to differences between the intended and actual implementation (Reeves and Hedberg 2003). By conducting iterative evaluations of your educational intervention, you ensure that the information necessary to demonstrate the practical and theoretical impact of your intervention is captured. These evaluation activities should lead to the generation of predictive, explanatory, or prescriptive understanding.

 

팁 10 테크놀로지 도입 시 사용적합성 검토
Tip 10 Examine usability when adopting technologies

 

학생과 교사가 자신의 교육 과제를 효과적이고 효율적으로 수행하고 학습 경험에 진정으로 참여할 수 있도록, 테크놀로지의 손쉬운 사용에 관한 가용성을 통합적으로 고려해야 한다(Asarbakhsh 및 Sandars 2013). [사용적합성 평가]는 기술 기반 개입(Reeves and Hedberg 2003)을 구축하기 전에 수행할 수 있습니다. 
With the increasing use of technologies in medical education, it is necessary to incorporate usability considerations to ensure that students and teachers can easily use the technology to effectively and efficiently accomplish their instructional tasks and truly engage with their learning experience (Asarbakhsh and Sandars 2013). Usability evaluation can be conducted even before you begin constructing any technology-based intervention (Reeves and Hedberg 2003).

 

예를 들어 PowerPoint 또는 기타 그래픽 소프트웨어를 사용하여 몇 가지 프로토타입 화면을 설명하고 대상 학습 시스템의 주요 기능을 나타낼 수 있습니다. 이 프로토타입을 사용하여 대상 학습자를 인터뷰하고, 설계 계획과의 상호 작용을 관찰하고, 시스템의 기능과 '모습과 느낌'에 대한 의견을 물어볼 수 있습니다. 마찬가지로 사용적합성 평가는 사용자의 완료되거나 거의 완료된 제품을 사용하여 수행될 수 있으며, 수집된 피드백은 개입의 개선을 안내한다.

For example, you can use PowerPoint or other graphics software to illustrate a few prototype screens and to represent the target learning system’s main functionalities. You can use this prototype to interview target learners, observing their interaction with the design plan and asking for their opinion about the functions and ‘look and feel’ of the system. Similarly, usability evaluation can be conducted using your completed or nearly completed product, with collected feedback guiding the enhancement of the intervention.


대상 사용자(Sandars 및 Lafferty 2010)로부터 관점을 이끌어내는 것 외에도, 다른 사용자가 사용적합성 원칙에 대해 학습 시스템을 검토하도록 초대할 수 있는데, 이는 [휴리스틱 평가]라고 불리는 방법이다. 다른 사용적합성 평가 방법과 비교할 때, 휴리스틱 평가는 상대적으로 자원이 덜 소비되지만 효과적이다

In addition to eliciting perspectives from target users (Sandars and Lafferty 2010), you can invite others to review your learning system against usability principles, a method called heuristic evaluation (Reeves and Hedberg 2003). Compared with other usability evaluation methods, heuristic evaluation is relatively less resource consuming and yet effective. 

팁 11 반복 시 반성의 힘을 발휘합니다.
Tip 11 Unleash the power of reflection in your iterations

 

[성찰적 사고방식]은 EDR을 수행한 사람들의 주요 특징이다. 사려 깊은 성찰은 [실천와 연구 사이의 격차를 해소]하여,  [실천에 정보를 제공하는 연구 결과의 채택]과 [습득한 경험을 이론적 통찰로 전환하는 것]을 촉진한다. 의미 있는 성찰은 힘을 실어주는 것empowering이다. 성찰은 과거의 경험에 대한 비판적인 검사를 포함하지만, 그것의 초점은 자기 비판이나 단순한 오류 탐지에 있지 않다. 오히려, 이것은 여러분이 실무를 개선하고 이론을 향상시킬 기회를 식별하는 데 도움이 되는 여러분의 경험에 대한 새로운 관점을 발견하게 합니다.
The possession of a reflective mindset is a key characteristic of those who conduct EDR. Thoughtful reflection enables you to bridge the gap between practice and research, facilitating the adoption of research findings to inform your practice and the transformation of acquired experience into theoretical insights. Meaningful reflection is empowering. Although reflection involves a critical examination of past experience, its focus is not on self-criticizing or simply the detection of errors. Rather, it leads you to discover new perspectives on your experiences that will help you identify opportunities to improve practice and enhance theory.


한 가지 아이디어는 다른 관점(Visscher-Voerman 및 Procee 2007, Hong 및 Choi 2011)에서 여러분의 경험에 접근하여 예상치 못한 통찰력을 얻는 것입니다. 예를 들어, 뒤집힌 교실 활동에 참여하는 학습자를 관찰한 후, 여러분이 놀라고, 혼란스럽고, 좌절하거나, 흥분하는 순간을 기억하라. 그런 감정은 어디서 오는 것일까? 주요 이해관계자 또는 다른 연구 또는 실무자 커뮤니티 구성원의 해석을 고려하여 상황에 대한 이해도를 높일 수도 있습니다. 또한 현재 상황을 이상적인 상황과 비교할 수 있으며, 다음과 같은 질문을 할 수 있습니다: 

  • FC 설계 계획의 이상적 구현과 실제 구현 사이에 어떤 불일치가 관찰됩니까? 
  • 다음 번 반복에서는 무엇을 다르게 해야 합니까? 
  • 어떻게 하면 다른 사람들에게 내 개입의 확산을 촉진할 수 있을까?

One idea is to approach your experience from different viewpoints (Visscher-Voerman and Procee 2007; Hong and Choi 2011), yielding unexpected insights. For instance, after observing learners engaging in flipped classroom activities, recall a moment when you feel surprised, confused, frustrated, or excited. From where do such feelings come? Your understanding of the situation can also be enriched through considering the interpretations by some of the key stakeholders or different research or practitioner community members. Further, you might compare the current situation with an ideal one, asking questions such as:

  • What, if any, discrepancies are observed between the ideal and actual implementation of the flipped classroom design plan?
  • What would I do differently during the next iteration?
  • How might I best foster the spread of my intervention to others?

팁 12 다양한 EDR 단계에서 발표나 논문을 통해 전략적으로 결과를 전파하고 확산시킨다.
Tip 12 Strategically disseminate and diffuse outcomes through presentations or papers at different EDR stages

여러분 중 일부는 자신의 연구 프로파일을 만들고 싶어할 수도 있으므로 EDR을 수행하는 것은 혁신이 목표를 달성한 후까지 자신의 연구 결과를 발표하기를 기다려야 한다는 것을 의미할 수도 있다고 우려합니다. 그러나 EDR 프로젝트의 초기 단계부터 연구 결과를 공유할 수 있는 기회를 모색하는 것이 좋습니다. 예를 들어 '분석 및 탐색' 단계 중에 EDR 이니셔티브에 대한 이론적 프레임워크를 설명하는 논문을 작성하거나 EDR이 다루고 있는 문제에 대한 문헌 리뷰를 게시하려고 할 수 있습니다. '평가 및 반영' 단계는 여러 개의 출판 가능한 논문(예: 데이터 수집, 분석 및 개입의 개선의 각 반복마다 하나)을 산출할 수 있다.
Some of you might be eager to build up your research profile and therefore worry that conducting EDR might mean that you have to wait to publish your work until after the innovation has achieved its goals. However, you are encouraged to seek opportunities to share your research findings from the earliest stages of your EDR project. For example, during the ‘Analysis and Exploration’ phase, you might write a paper describing the theoretical framework for your EDR initiative, or you might seek to publish a literature review concerning the problem the EDR is addressing. The ‘Evaluation and Reflection’ phase may yield several publishable papers, e.g., one for each iteration of data collection, analysis, and refinement of the intervention.


연구 활동 및 결과의 성공적인 보급은 프로젝트 추진력을 유지하여 팀원들에게 지속적인 동기를 제공할 뿐만 아니라, 같은 생각을 가진 동료들로부터 피드백을 수집하고 의미 있는 성찰에 참여함에 따라 실용적이고 연구적인 제품을 지속적으로 개선하는 데에도 기여합니다. 이러한 보급 노력은 결과적으로 혁신이 새로운 설정novel setting으로 확산되도록 장려하여 개입의 영향을 확대한다(예: Chen 등 2015). 그러므로 EDR 프로젝트의 궁극적인 목표는 당신이 당신의 지역적 맥락에서의 개입의 성공적인 구현일 뿐만 아니라 당신의 실제적인 아이디어와 이론적 통찰의 성공적인 확산이다, 당신이 당신의 개입을 새로운 맥락에 소개하고 다른 실무자 또는 연구자의 작업에 inform하기 위해 당신의 이론적 이해를 공유하기를 열망하기 때문이다. 이상적으로, 다른 교육자들은 여러분의 노력을 전달하고 여러분의 개입이나 이론적인 연구 결과를 연구하기 위해 EDR을 수행할 것입니다.
Successful dissemination of research activities and results not only helps maintain the project momentum, providing continuous motivation to your team members, but also contributes to the continuous improvement of both practical and research products as you collect feedback from like-minded colleagues, and engage yourself in meaningful reflection. These efforts of dissemination subsequently encourage the diffusion of your innovation into novel settings, extending the impact of your intervention (e.g. Chen et al. 2015). The ultimate goal of an EDR project is, therefore, not only the successful implementation of your intervention in your local context, but also successful spread of your practical ideas and theoretical insights, as you aspire to introduce your intervention to new contexts and share your theoretical understanding to inform the work of other practitioners and researchers. Ideally, other educators will relay your effort and conduct EDR to study the outcomes of implementing your intervention or theoretical findings in their institutes.

 

 

 

 


Med Teach. 2020 Sep;42(9):980-986.

 doi: 10.1080/0142159X.2019.1657231. Epub 2019 Sep 9.

Twelve tips for conducting educational design research in medical education

Weichao Chen 1Thomas C Reeves 2

Affiliations collapse

Affiliations

  • 1Office of Medical Education, School of Medicine, University of Virginia, Charlottesville, VA, USA.
  • 2College of Education, The University of Georgia, Athens, GA, USA.
    • PMID: 31498719

 

Abstract

Despite a steady growth in educational innovations and studies investigating the acceptance and effectiveness of these innovations, medical education has not realized sufficient improvement in practice and outcomes from these investments. In light of this lack of impact, there has been a growing call for studies that more effectively bridge the gap between research and practice. This paper introduces Educational Design Research (EDR) as a promising approach to address this challenge. Twelve tips are provided to inspire and guide medical educators to conduct EDR to achieve the dual goals of tackling a significant educational problem in a specific context while at the same time advancing the theoretical knowledge that may be used to improve practice elsewhere.

 

교육이론을 활용하는 다섯 가지 원칙: HPE 연구를 발전시키기 위한 전략(Acad Med, 2020)

Five Principles for Using Educational Theory: Strategies for Advancing Health Professions Education Research
Anita Samuel, PhD, Abigail Konopasky, PhD, Lambert W.T. Schuwirth, MD, PhD, Svetlana M. King, PhD, and Steven J. Durning, MD, PhD 

 

 

 

 

보건직업 교육(HPE) 문학은 상대적으로 새롭고 성장하고 다양화되고 있다.1 HPE의 교육자와 연구자들은 HPE의 작업을 알리는 다양한 배경의 학자들의 입력input을 중요시한다. 실제로, 이 다양성은 이론이 실제로 어떻게 "작동"하는지를 경험적으로 연구하는 능력과 결합되어, HPE의 강점으로, 다른 탐구분야와 구별짓는 특징이다. HPE 학자들은 학습자의 교육과 국가 보건에 영향을 미치는 [복잡한 과제]에 직면해 있으며, 예를 들어, 근본적인 사회적 영향을 미치는 의료 및 교육의 기술 혁신이 빠르다. HPE에서, 우리는 [복잡한 과제 이면에 존재하는 현상의 메커니즘을 더 잘 이해]하고 이러한 [도전의 실제적 의미를 탐색할 때 안내guide]하는 용도로 이론을 사용한다. 
The health professions education (HPE) literature is relatively new and is growing and diversifying.1 Educators and researchers in HPE value the input of scholars from diverse backgrounds who inform the work of HPE. Indeed, this diversity, coupled with the ability to empirically study how theory “works” in practice, is a strength of HPE that sets it apart from other fields2 of enquiry. An additional point of distinction is that HPE scholars face complex challenges that have an impact on the education of learners and the health care of nations, for example, rapid innovations in technology in health care and education with fundamental societal impacts. In HPE, we use theory to better understand the mechanics of the phenomena underlying these complex challenges and to guide us as we navigate the practical implications of these challenges. 

 

HPE에서 이론을 사용하는 것은 Ostrom이 지적한 바와 같이 균형을 잡는 행위입니다.
Using theory in HPE is a balancing act, as Ostrom notes:

이론이 없다면, 우리는 다른 상황에서 많은 추측에서 작용하는 일반적인 근본적인 메커니즘을 결코 이해할 수 없다. 경험적 퍼즐을 푸는 데 활용되지 않는다면, 이론적인 작업은 경험적 세계를 거의 반영하지 못한 채로, 자기만의 추진력 아래에서 spin off할 수 있다.3
Without theory, one can never understand the general underlying mechanisms that operate in many guises in different situations. If not harnessed to solving empirical puzzles, theoretical work can spin off under its own momentum, reflecting little of the empirical world.3

 

이론에 지나치게 의존하는 것은 그 일의 교육적 실천과의 연관성을 위태롭게 할 위험이 있다. 반대로, HPE 연구가 비-이론적(atheoretical, purely practical순전히 실용적)으로 남아 있는 경우, 비효율적이고 비효율적인 교육 혁신을 추구할 위험이 있다. 이론을 이해하는 것은 '바퀴의 재발명'을 막는 데에도 중요하다.

  • 예를 들어, 신기술의 출현과 함께, 혁신은 때때로 이전의 교육 혁신이 왜 비효율적이었는지에 대한 더 깊은 이론적 이해 없이 구현된다.
  • 예를 들어, 임상 추론의 "스킬"을 평가하기 위해 새로운 기술을 사용하는 것을 생각해보자. [종이 기반의 현명한 솔루션]이 이미 존재하는 상황에서 [가상 현실 솔루션]으로 이동하는 것은, 이것이 충실성fidelity의 문제가 아니라, 임상 추론의 본질이 더 기본적이라는 사실을 무시한다(즉, 우수한 성능이 일반적인 문제 해결 능력에 전적으로 기반을 둔 것은 아님).4

Overreliance upon theory runs the risk of jeopardizing the work’s connection with educational practice. Conversely, if HPE research remains atheoretical (purely practical), there is a risk of pursuing inefficient and ineffective educational innovations. Understanding theory is also important in preventing a reinvention of the wheel.

  • For example, with the advent of new technology, innovation is sometimes implemented without a deeper theoretical understanding of why previous educational innovations were ineffective.
  • Consider the use of new technologies to assess the “skill” of clinical reasoning, for example. Moving from clever, paper-based solutions to virtual reality solutions ignores the fact that the issues are not a matter of fidelity but, rather, are more fundamental to the nature of clinical reasoning (i.e., superior performance is not solely based on some sort of generic problem-solving ability).4

이론을 효과적으로 통합하기 위해서는 그 범위와 한계를 이해해야 한다

To incorporate theory effectively, we must understand its scope and limitations. 

원칙 1: 모든 이론이 동등하게 만들어지지 않았다.
Principle 1: All Theories Are Not Created Equal

[이론]은 우리의 이해를 증진시키고 잠재적인 행동 과정을 안내하기 위해 복잡한 교육 문제를 맥락화하거나 재구성하는 방법이다. 그들은 상황이나 문제를 볼 수 있는 렌즈를 제공하며, 모든 렌즈가 동일한 것은 아니다.

Theories are a way to decontextualize or recontextualize complex educational problems to enhance our understanding and to guide potential courses of action. They provide lenses for viewing a situation or problem, and not all lenses are equal.

 

어떤 이론들은 문제를 보는 일반적인 구조나 발판을 제공한다. 

  • [위치 인식situated cognition]은 그러한 이론의 한 예이다. 그것은 학습이 일어나는 상황에 의해 강하게 영향을 받는다고 주장하며, 연구자가 그 상황의 요소들과 그들이 상호작용하는 방법을 검토하도록 지시한다.
  • 그렇게 함으로써, 만약 이 이론을 적용하지 않았다면 검토되지 않았을 상황의 측면과 그러한 측면들 사이의 연관성이 나타날 수 있다. 그 결과 학습이 효과적인(또는 비효율적인) 것을 더 잘 이해할 수 있게 됩니다. 

Some theories provide a general structure or scaffold to view a problem. 

  • Situated cognition is an example of such a theory. It argues that learning is strongly influenced by the situation in which it occurs and directs the researcher to examine the components of that situation and how they interact.5 
  • In so doing, aspects of the situation and connections among those aspects may emerge that would otherwise have remained unexamined had this theory not been applied. The result is a better understanding of what makes learning effective (or ineffective).

더 일반적인 발판을 제공하는 이론의 또 다른 예는 생태 심리학이다. 이 이론에서는 상황 6(예: 교육 활동)을 일련의

  • 어포던스(즉, 교육 방법의 속성이 교사 및/또는 학습자에게 허용 또는 허용하지 않음)와
  • 효과(즉, 교사 및 학습자가 교육 방법에 있다고 인식하는 비용)로 본다.

Another example of a theory that provides a more general scaffolding is ecological psychology. It views a situation6 (e.g., an educational activity) as a series of

  • affordances (i.e., what the properties of the educational method allow or disallow the teacher and/or learners to do) and
  • effectivities (i.e., those affordances that teachers and learners perceive to be in the educational method). 

 

그러한 "그랜드" 이론 7,8은 학습 상황의 모든 측면을 이론화하려고 하기 때문에 [매크로 레벨 이론]으로 간주될 수 있다. 이러한 유형의 이론은 교육 과정과 관심의 결과에 기여하는 특징들을 식별하고 이해하는 데 도움을 주기 위해 많은 상황에 적용될 수 있다. 그러나, 그들의 성격상, 그들은 주어진 상황에서 일어날 일을 예측하거나 최선의 다음 단계를 결정하는 면에서 종종 효용성이 부족하다. 결과적으로, 이러한 이론은 종종 단일 연구에서 시험될 수 없고 오히려 연구 프로그램이 필요하다(즉, 일관되거나 연결된 조사 라인을 추구하는 다중 연구).9

Such “grand” theories7,8 can be considered as macro-level theories because they attempt to theorize all aspects of a learning situation. This type of theory can be applied to many situations to help identify and understand the features that contribute to the educational processes and outcomes of interest. By their nature, however, they often lack utility in terms of predicting what will happen in a given situation or of determining the best next steps. Consequently, these theories often cannot be tested in a single study but rather require a program of research (i.e., multiple studies pursuing a coherent or connected line of enquiry).9

 

 

 

다른 이론은 [마이크로 레벨]이며, 여기에 해당하는 이론들은 학습 환경의 특정 상황 및/또는 구성 요소에만 적용할 수 있다. 그것들은 더 미세한 시야를 제공하며, 종종 grand theories보다 더 많은 설명과 때로는 더 예측력을 제공한다. 일반화 가능성 이론 10이 한 예이다. 이 이론은 복잡한 상황에서 여러 현상을 설명하는 것을 목표로 하는 것이 아니라 평가 결과 행렬에서 분산 요소를 분리하기 위한 매우 실용적인 접근법이다. 다시 말해서, 일단 연구에 대한 설계가 결정되면, 일반화 가능성 이론은 연구자들이 잠재적 오류 원인을 측정할 수 있게 한다

Other theories are micro level8 and can only be applied to specific circumstances and/or components of the learning environment. They offer a more microscopic view, often providing more explanatory and, at times, predictive power than the grand theories. Generalizability theory10 is one example. This theory does not aim to explain multiple phenomena in complex situations but is a highly practical approach to separate components of variance in an assessment results matrix. In other words, once a design for a study has been determined, generalizability theory allows researchers to gauge potential error sources. 

  • 위치 인식과 같은 [거시 이론]은 연구자들이 더 넓은 현상에 대한 이해를 강화하고 발판을 마련하는데 도움을 주지만,
  • 일반화 이론과 같은 [미시 이론]은 연구자들이 구체적이고, 기능적이며, 방어할 수 있는 주장과 추론을 만들어내기 위해 데이터를 다룰 수 있게 한다.
  • While macro theories, such as situated cognition, help researchers to scaffold and enhance understanding of broader phenomena,
  • micro theories, such as generalizability theory, enable researchers to work with data to create specific, functioning, defensible claims and inferences.

 

미시 이론과 거시 이론을 결합하는 것은 직관적이지 않은 것처럼 보일 수 있지만, 이 접근법은 의학 분야의 관행과 다르지 않다. 예를 들어, 일반적으로 상당히 민감한 매크로 선별 테스트를 사용한 다음 고려 중인 조건에 더 구체적인 후속 확인(마이크로) 테스트를 수행한다. 적절한 이론(즉, 매크로, 마이크로 또는 두 가지 모두의 조합)을 선택하면 이론적 관점을 조사 중인 문제와 더 잘 정렬할 수 있다. 비록 우리가 미시 이론과 거시 이론을 예시적인 예로 선택했지만, 이러한 관점은 이분법으로 존재하지 않고 오히려 연속체를 따라 존재한다.

  • 거시적 관점을 제공하는 이론은 일어나고 있는 것에 대한 대규모 뷰를 얻는 데 특히 유용하며,
  • 마이크로 이론은 후속 실험에 통합하는 데 도움이 된다. 

 

While combining micro and macro theories may seem counterintuitive, this approach is not dissimilar to practices in medicine. For instance, we use macro screening tests that are typically quite sensitive and then perform follow-up confirmatory (micro) tests that are more specific to the condition being considered. When we select an appropriate theory (i.e., macro, micro, or a combination of both), we are better able to align our theoretical perspective(s) with the problem under investigation. Although we have chosen micro and macro theories as illustrative examples, these perspectives do not exist as a dichotomy but, rather, along a continuum.

  • Theories that provide macro perspectives are particularly useful for obtaining large-scale views of what is occurring,
  • while micro theories are helpful to incorporate into subsequent experiments. 

 

원칙 2: 주어진 연구에 복수의 이론을 사용할 수 있다.
Principle 2: Multiple Theories Can Be Used in a Given Research Study

 

하나의 이론이 제시된 연구 문제를 다루기에 불충분한 경우가 있다. 이러한 상황에서 여러 이론을 사용하여 다른 관점에서 조사 중인 현상을 탐색할 수 있다. 예를 들어, 연구자들이 임상 추론과 같은 복잡한 현상을 이해하려고 할 때, 

  • 인지주의 이론은 추론이 학습 경험을 어떻게 장기 기억에 포함시키는지 틀을 짜는 데 도움이 될 수 있다. 
  • 이와 병행하여, 임상적 추론은 사회적 구성주의 이론을 사용하여 검토할 수도 있다. 5,6 

There are times when a single theory may be insufficient to address the research question posed. In these situations, multiple theories can (and should) be used to explore the phenomenon under investigation from different perspectives. When researchers are trying to understand a complex phenomenon such as clinical reasoning, for instance,

  • cognitivist theories11 may help to frame how reasoning incorporates learning experiences into long-term memory.
  • In parallel, clinical reasoning can also be examined by using social constructivist theories.5,6 

이 접근법은 (예를 들어, 주장과 증거의 명확성, 일관성 및 신뢰성에 의해 입증되는) 임상추론의 퀄리티가 학습자와 교사 또는 동료 간의 상호작용을 촉진하여 학습 과정의 품질에 어떻게 영향을 미치는지 이해하는 데 도움이 될 수 있다. 연구자들이 주어진 교육적 개입의 과정과 결과를 더 완전하게 이해하기 위해 [질적 인터뷰 데이터]와 [정량적 평가 데이터]를 결합할 수 있는 것처럼, 그들은 HPE 맥락의 다른 측면과 관점을 이해하기 위해 여러 이론을 사용할 수 있다.

This approach can aid in understanding how the quality of reasoning—judged by, for example, the clarity, coherence, and plausibility of the claims and evidence—promotes interaction between learner and teacher or peers and thus affects the quality of the learning process. Just as researchers might bring together qualitative interview data and quantitative assessment data to more fully understand both the processes and outcomes of a given educational intervention, they can use multiple theories to understand different aspects and perspectives of an HPE context.

 

다시, 이 접근법은 [학제간 의료의 관행]과 유사하다. 만성적이고 양성적인 낮은 요통의 복잡한 현상을 이해하려면 이론적으로 한 가지 이상의 접근법이 필요하다. 이 의료 문제의 모든 측면을 완전히 이해하려면 신경학적, 심리학적, 정형외과적, 물리치료학적, 직업적, 사회적, 그리고 제약적 관점을 고려해야 할 것이다. 마찬가지로, HPE에서, 우리는 학자들이 여러 이론이 어떻게 그들의 연구를 도울 수 있는지를 고려하도록 권장한다. 이론 수준에서 이 삼각측정의 형태는 교육 문제에 대한 우리의 이해를 심화시킬 수 있다. 이 삼각측정은 특히 복잡한 현상을 자주 다루는 분야로서의 HPE의 특성 때문에 관련이 있다.
Again, this approach is similar to the practice of interdisciplinary health care. Understanding the complex phenomenon of chronic, benign low back pain requires more than a single theoretical approach. Gaining a full understanding of all the facets of this medical problem may require consideration of neurological, psychological, orthopedic, physiotherapeutic, occupational, social, and pharmaceutical perspectives. Similarly, in HPE, we encourage scholars to consider how multiple theories can assist them with their work. This form of triangulation, at the theory level, can deepen our understanding of the educational problem. This triangulation is particularly relevant because of the nature of HPE as a field that often deals with complex phenomena.

 

그러나 이 원칙에는 한 가지 주의사항이 있다. 서로 다른 이론들은 동일한 영역8 또는 교육의 패러다임에 속해야 한다.12 이론들 사이에 인식론적 가정과 일치하지 않는 경우(예: 구체적이고 고정된 지식 vs 가변적이고 변화적인 지식), (적절한 혼합방법 프레임워크가 없는 상태에서) 연구 결과를 통합하고 이해 가능한 결과를 생성하는 것은 매우 어려울 것이다.

There is, however, one caveat to this principle: The different theories should belong to the same domain8 or paradigm of education.12 If there is misalignment with the epistemological assumptions between theories (e.g., a view of knowledge as concrete and fixed versus a view of knowledge as malleable and shifting), it may prove very difficult to integrate study findings and generate comprehensible claims without an appropriate mixed methods framework.13

원칙 3: 이론의 명제에서 벗어날 수 있다.
Principle 3: You Can Deviate From a Theory’s Propositions

 

앞에서 논의했듯이, HPE는 interdisciplinary한 탐구분야이다. 이것 때문에 그리고 HPE가 상대적으로 젊기 때문에(심리학이나 사회학과 같은 분야와 비교할 때), 기존의 이론들은 항상 우리 공동체를 위해 설계되는 것은 아니다. 이를 위해서는 연구자들이 이론을 적용하고 사용하는 데 있어 민첩성을 유지해야 한다. 결과적으로, 우리는 HPE 학자들이 작업에 기존의 이론적 제안을 사용할 뿐만 아니라 HPE 설정에 더 잘 적용하기 위해 필요에 따라 이론을 개정할 수 있도록 할 것을 권장한다. HPE의 좋은 박사 논문은 종종 주제에 더 잘 정렬되도록 이론을 수정하거나 연구 중인 현상을 설명하기 위해 둘 이상의 이론을 사용하는 [대안적 이론 모델]을 제안해야 한다. 한 예는 (인지주의 이론에서)14 이전 요소를 사용하여 평가 전문지식의 개발을 이해하는 것이다.
As discussed earlier, HPE is an interdisciplinary field of enquiry. Because of this and because HPE is relatively young (when compared with fields like psychology or sociology), existing theories are not always exclusively designed for our community. This requires researchers to remain agile in their application and use of theories. Consequently, we encourage HPE scholars not only to use existing theoretical propositions in their work but also to be open to revising theory as needed for better application to HPE settings. Good doctoral dissertations in HPE often require revising theories to facilitate better alignment to the topic and/or proposing an alternative theoretical model that uses more than one theory to explain the phenomenon under investigation. One example is using the element of transfer (from cognitivist theories)14 to understand the development of assessment expertise, such as in the domain of rater decision-making processes.15,16

 

임상 실습에서도 [일반적인 치료 접근법에 도전하는 것]은 드문 일이 아니다. 예를 들어, 심폐소생술에 대한 우리의 접근 방식은, 10년 동안, 더 단단하고 더 빠른 압축, 다른 단계의 순서(순환 우선), 그리고 호흡에 대한 새로운 압축 비율과 함께 극적으로 변화해 왔다. HPE 연구자들이 다른 분야의 이론을 사용하기 때문에, 그들은 보건 분야에서 발견되는 학습자, 강사, 환경과 더 잘 일치하도록 그것들을 적응하고 수정해야 할 수도 있다.

Challenging the prevailing treatment approaches is not uncommon in clinical practice either. Our approach to CPR, for instance, has changed dramatically over the course of a decade, with harder and faster compressions, a different ordering of steps (circulation first), and a new ratio of compressions to breaths. As HPE researchers use theories from other fields, they may need to adapt and modify them to better align with the learners, instructors, and environments found in the health professions.

원칙 4: 용어가 이론에 따라 조정될 수 있음
Principle 4: Terminology Can Be Reconciled Across Theories

용어를 명확히 하고 전문 용어를 동시에 줄임으로써 HPE 커뮤니티에서 학문 간 협업을 촉진하고 이론적 민첩성을 향상시킬 수 있다. 그렇게 하는 한 가지 방법은 [서로 다른 이론과 용어의 유사점과 차이점을 검토]하고 이 비교 결과를 사용하여 조사 중인 문제에 대한 용어를 수정하는 것이다.

We can facilitate interdisciplinary collaboration and enhance theoretical agility in the HPE community by clarifying terminology and simultaneously reducing jargon. One way to do so is by examining the similarities and differences in terms from different theories and to use the results of this comparison to revise the terminology for the problem under investigation.

 

예를 들어, [자기 조절, 자기 주도, 자기 결정]이라는 용어에 대해 약간의 혼란이 있었다.17

  • 한 가지 접근 방식은 난제를 피하고 단일 이론을 선택하고, 자기 조절 학습이라고 하며, 용어를 고수하는 것이다.
  • 그러나 그렇게 함으로써, 연구원들은 자기 주도 학습 이론에 특정한 성인 학습과 자기 결정 이론에 특정한 내재적 동기 부여에 대한 잠재적인 통찰력을 잃게 된다.
  • 대신, 이러한 용어를 명확하고 신중하게 비교하고 수정하면 관련된 이론적 맥락을 보다 투명하게 하고 특정 작업(예: 시험을 위해 공부하는 간호 학생, 의사소통 전략에 대해 일하는 전문가 간 팀, 진행 중인 실무자)을 더 잘 지원할 수 있다

For example, there has been some confusion regarding the terms self-regulation, self-direction, and self-determination.17 

  • One approach would be to avoid the conundrum and to choose a single theory, say self-regulated learning, and to adhere to its terminology.
  • In so doing, however, the researcher loses potential insights on adult learning that are specific to self-directed learning theory and on intrinsic motivation that are specific to self-determination theory.
  • Instead, explicitly and carefully comparing and revising these terms can help make the associated theoretical contexts more transparent and better support the specific work (e.g., nursing students studying for exams, interprofessional teams working on communication strategies, practitioners improving their ongoing practice). 

 

임상적 실천에서도 용어의 개정revision은 내재되어 있다. 예를 들어, 간호학에서는 의사 소통, 환자 치료 및 데이터 수집을 개선하기 위해 용어를 전환하고 표준화하려는 움직임이 있다.18 예를 들어, "소량", "중량" 또는 "대량" 출혈이 실제 상황에 걸쳐 일관되도록 재정의되었다. 마찬가지로, HPE에서 학자들은 용어를 주의 깊게 검토하고 이 용어를 다양한 실제 및 이론적 맥락에서 사용하기 위해 적응할 수 있는 혁신적인 방법을 찾을 수 있다.18

Revision of terminology is also inherent in clinical practice. There is a movement in nursing, for instance, to shift and standardize terminology to improve communication, patient care, and data collection.18 For instance, “small,” “moderate,” or “large” amounts of bleeding have been redefined to be consistent across practice contexts. Similarly, in HPE, scholars can carefully examine terminology and find innovative ways to adapt this terminology for use across a variety of practical and theoretical contexts.18

원칙 5: 이론에 도전할 수 있다
Principle 5: Theories Can Be Challenged

이론들은 (경험적 연구의 중요한 구조에 기초하기 때문에) 도전할 수 없다고 종종 생각됩니다. 우리는 이론이 도전할 수 있고 도전해야 한다고 주장하지만, HPE에서 "이론 검증theory testing"는 표준, 인과 비교 설계 또는 실험과 다를 수 있다. 이론의 테스트는 이론적 개념의 전달 가능성을 입증하기 위해 다양한 맥락에서 반복된 응용을 포함할 수 있다.

  • 정량적 연구에서 이론 테스트는 결론의 일반화 가능성을 입증하기 위해 추론 통계가 있는 수치 결과를 통해 발생한다.
  • 정성적 연구에서 발견의 명확성과 신뢰성, 즉 새로운 통찰력을 창출하는 정도와 이러한 통찰이 과학계에 의해 채택되는 정도도 일반화의 한 형태이다.

두 경우 모두, 연구 결과는 "더 나은 진실"이 확인될 때까지만 "진실"을 구성한다.
It is often thought that theories cannot be challenged because they are based on a significant body of empirical research. We argue that theory can and should be challenged, but in HPE, “theory testing” can differ from the standard, causal comparative design or experiment. The testing of a theory may involve repeated applications in various contexts to demonstrate transferability of a theoretical concept.

  • In quantitative research, theory testing occurs through numerical outcomes with inferential statistics to demonstrate the generalizability of the conclusion.
  • In qualitative research, the clarity and plausibility of the findings—the extent to which they create new insights and the extent to which these insights are adopted by the scientific community—are also forms of generalization.

In both cases, the research outcomes constitute the “truth” only until a “better truth” is identified.

 

이론이 없는 실천은 유용하지 않다; 이론도 실천이 없는 것은 아니다. 실제로, 우리는 HPE가 학생들이 [여러 잘 정의된 보건전문영역에 전문가가 되도록 교육받기 때문에] 교육 결과를 검토할 수 있는 고유한 기회를 제공한다고 생각한다. 따라서 [실제 수행능력]과 [훈련 중의 수행능력]을 연계하는 것이 더 용이하다. 우리는 이론이 우리 분야의 증거에 따라 지속적으로 시험되고 수정되어야 한다
After all, practice devoid of theory is not useful; neither is theory devoid of practice. Indeed, we suggest that HPE offers a unique opportunity to examine educational outcomes because we educate students to become professionals across well-defined health professional domains. Thus, it is easier to link performance in practice with performance during training. We argue that theories should be continually tested and revised according to the evidence in our field.

 

예를 들어, 의학 및 공중 보건에서 흡연은 폐암과 인과 관계를 가지고 있다는 이론은 단일 인과 비교 연구에 의해 테스트된 것이 아니라, 전체 연구 프로그램에 의해 결국 합의를 이끌어냈다. HPE에서, 프로그램 이론 테스트는 종종 단 하나의 결정적인 "빅뱅" 연구보다 더 유용하다. 예를 들어, 맥락 특수성을 이해하는 도전(의사가 동일한 증상 및 소견을 가진 2명의 환자를 보고(그리고 동일한 기본 진단) 2개의 다른 진단 결정에 도달하는 성가신 의료 현상을 예로 들 수 있다.19 우리는 이 과제를 어떻게 5가지 원칙을 이해하는 컨텍스트로서 다음에 논의한다. 교육 이론을 사용하는 것은 복잡한 연구 문제에 적용될 수 있다.

In medicine and public health, for example, the theory that smoking has a causal relationship with lung cancer was not tested by a single causal comparative study but, rather, by a whole program of research eventually leading to consensus. In HPE, programmatic theory testing is often more useful than a single, definitive “big bang” study. Take, for example, the challenge of understanding context specificity—a vexing medical phenomenon whereby a physician sees 2 patients with identical symptoms and findings (and the same underlying diagnosis) but arrives at 2 different diagnostic decisions.19 We discuss this challenge next as a context in which to understand how the 5 principles of using educational theory can be applied to a complex research problem.

실제 사례
A Practical Example

임상 추론에서 [맥락 특수성] 현상은 복잡한 문제이다. 전통적으로 임상적 추론은 의료 사례의 내용의 난이도에 의해서만 영향을 받는 개별적인 기술로 생각되었다. 그러나 맥락 특수성이 관찰될 때 의료 내용 이상의 무언가가 의사의 임상적 추론을 유도하고 있다. 먼저, 우리는 이 현상을 탐구하기 위해 "자극"을 제어할 수 있는 시뮬레이션 환경에서 상황별을 경험적으로 조사하려고 했다. 우리는 비디오와 실시간 시뮬레이션 사례를 모두 동일한 내용으로 세심하게 제작했는데, 이는 상황적 요인(환자가 영어가 모국어가 아닌 사람, 전자 건강 기록 오작동 또는 지친 의사 등 정확한 진단에 도달하는 데 필요한 내용 이외의 정보)의 유무에 의해서만 달랐다.
The phenomenon of context specificity in clinical reasoning is a complex problem. Traditionally, clinical reasoning was conceived as an individual skill, affected only by the difficulty of the content of the medical case. However, something more than the medical content is driving the physician’s clinical reasoning when context specificity is observed. First, we sought to empirically investigate context specificity in the simulation environment where we could control the “stimulus” to explore this phenomenon. We carefully crafted both video and live simulation cases with identical content, which differed only by the presence or absence of contextual factors (information other than the content needed to arrive at a correct diagnosis, such as the patient being a non-native English speaker, electronic health record malfunctions, or a fatigued physician).

 

  • [추론이라는 개념을 개인의 능력으로 통합]하거나, 추론 능력이 건강 전문가의 환경에 의해 어떻게 영향을 받을 수 있는지에 대한 명확한 HPE 이론이 없었기 때문에 어떤 이론을 [맥락 특이성 현상에 적용할 것인지 고심했다(원칙 3: 이론의 명제에서 벗어날 수 있음).
  • 따라서, 우리는 임상적 만남에서 몇 가지 중요한 특징과 상호작용을 작동시키고 맥락 특수성을 이해하는 데 중요한 것이 무엇인지에 대한 기본적인 이해를 얻기 위해 위치 인식 이론(SCT)이라는 [매크로 이론]으로 시작했다. (원칙 1: 모든 이론이 동등하게 만들어지지 않음)
  • 그런 다음 우리는 이 이론을 우리의 특정 연구 상황에 맞게 조정해야 한다는 것을 깨달았다. 20,21 우리는 의사의 임상 추론에 단순한 의료 내용 이외에, 의사의 임상적 추론에서 역할을 하는 측면의 예들이 진단에 도달해야 한다는 것을 확인했다(이것은 우리가 맥락적 요인이라고 불렀다). SCT를 사용하여 이러한 문제를 해결하고 환자, 의사 및 조우에 관련된 상황적 요인을 그룹화했다(그림 1 참조).
  • We struggled with what theory to apply to the phenomenon of context specificity because there were no readily apparent HPE theories that integrated the notion of reasoning as an individual ability and how it could be affected by the health professional’s environment (Principle 3: You can deviate from a theory’s propositions).
  • Therefore, we started with a macro theory, situated cognition theory (SCT), to help us operationalize some of the important features and interactions in a clinical encounter and to obtain a basic understanding of what might be important in understanding context specificity (Principle 1: All theories are not created equal).
  • We then realized that we had to adapt this theory to our specific research context, requiring multiple discussions and experiments.20,21 We identified examples of aspects that played a role in a physician’s clinical reasoning, other than merely the medical content, needed to arrive at the diagnosis (which we termed contextual factors). Using SCT, we grappled with these matters and grouped contextual factors related to the patient, the physician, and the encounter (see Figure 1).

 

 

 

이 매크로 이론에서, 우리는 그러한 맥락적 요인이 의사의 임상 추론에 어떻게 영향을 미칠 수 있는지를 볼 수 있었고, 우리는 연구를 더 나아가게 하기 위해 2개의 [미시 이론]을 식별하도록 이끌었다: 인지 부하 이론(CLT)과 자기 조절 학습 이론(SRLT) (원칙 1: 모든 이론이 동등하게 만들어지지 않았다; 원칙 2: 하나의 연구에 여러 이론이 사용된다.)

  • CLT를 사용하여, 우리는 상황적 요인의 결과로 발생할 수 있는 잠재적인 증가된 정신 노력(즉, 인지 부하)에 대한 측정을 개발했다. CLT가 학습 이론이지만(수행능력 이론과 달리) 성능을 평가하는 학습을 위해 CLT 원칙을 채택하여 HPE 학자로서 우리의 요구를 충족하도록 이론을 강화했다(원칙 3: 이론의 명제에서 벗어날 수 있다).
  • 그런 다음, CLT와 함께, 우리는 의사가 증가된 인지 부하(예: 전략적 계획, 목표 설정)를 관리하기 위해 사용할 수 있는 도구를 탐색하기 위해 SRLT를 사용했다(그림 2 참조).

From this macro theory, we were able to see how such contextual factors can affect a physician’s clinical reasoning, leading us to identify 2 more micro theories to further guide the investigation: cognitive load theory (CLT) and self-regulated learning theory (SRLT) (Principle 1: All theories are not created equal; Principle 2: Multiple theories can be used in a given research study).

  • Using CLT, we developed measures of the potential increased mental effort (i.e., cognitive load) that might be generated as a result of the contextual factors. Although CLT is a learning theory (as opposed to a theory of performance), we adapted CLT principles for learning to evaluate performance, thereby enhancing the theory to meet our needs as HPE scholars (Principle 3: You can deviate from a theory’s propositions).
  • Then, alongside CLT, we used SRLT to explore the tools that physicians might be using to manage this increased cognitive load (e.g., strategic planning, setting goals) (see Figure 2).

 

 

 

이 세 가지 이론(SCT, CLT, SRLT)의 통합으로 인해 우리는 임상 추론의 정의와 같은 일부 용어 불일치와 씨름하고 화해할 수 밖에 없었다(원칙 4: 용어는 이론 간에 조정될 수 있다). 우리는 여러 분야에 걸친 임상 추론이라는 용어의 의미를 조정하고 컨텍스트 특수성을 정의하는 과제를 해결하는 데 도움이 되는 방어 가능한 의미를 설정해야 했다. 
The integration of these 3 different theories (SCT, CLT, and SRLT) forced us to grapple with—and reconcile—some terminology mismatches, such as the definition of clinical reasoning (Principle 4: Terminology can be reconciled across theories). We had to reconcile the meaning of the term clinical reasoning across multiple fields and establish a defensible meaning to help address the challenge of defining context specificity.

 

이 통합 프레임워크를 적용하여, 우리는 다음과 같은 작업을 수행할 수 있었다: 일련의 실험을 사용하여 현상을 조사하고, 맥락 특수성을 이해하고, 임상적 자리에서 이러한 이론에 대한 이해를 높이고, 이론적 예측을 테스트할 수 있는 새로운 렌즈를 제공한다(원칙 5: 이론에 도전할 수 있다).

Applying this integrated framework, we were able to do the following: investigate the phenomenon using a series of experiments, provide a new lens through which to understand context specificity, enhance our understanding of these theories in a clinical sitting, and test our theoretical predictions (Principle 5: Theories can be challenged).

 

 

Aligning and Applying the Paradigms and Practices of Education

 

The Spectrum of Inductive and Deductive Research Approaches Using Quantitative and Qualitative Data

 

 


Acad Med. 2020 Apr;95(4):518-522.

 doi: 10.1097/ACM.0000000000003066.

Five Principles for Using Educational Theory: Strategies for Advancing Health Professions Education Research

Anita Samuel 1Abigail KonopaskyLambert W T SchuwirthSvetlana M KingSteven J Durning

Affiliations collapse

Affiliation

  • 1A. Samuel is assistant professor, Graduate Programs in Health Professions Education, Uniformed Services University, Bethesda, Maryland. A. Konopasky is assistant professor, Graduate Programs in Health Professions Education, Uniformed Services University, Bethesda, Maryland. L.W.T. Schuwirth is professor and director, Prideaux Centre for Research in Health Professions Education, Flinders University, Adelaide, South Australia, Australia. S.M. King is lecturer, Prideaux Centre for Research in Health Professions Education, Flinders University, Adelaide, South Australia, Australia. S.J. Durning is professor and director, Graduate Programs in Health Professions Education, Uniformed Services University, Bethesda, Maryland.
    • PMID: 31702692

 

Abstract

Health professions education (HPE) research often involves examining complex phenomena. Theory provides a means for better understanding the mechanics of these phenomena and guiding health professions researchers and educators as they navigate the practical implications for teaching, learning, and research. Engaging with educational theory is, therefore, critical to facilitating this understanding. However, this engagement presents a key challenge for HPE researchers and educators without a background in social science. This article outlines 5 key principles of engaging with theory and offers integration strategies to assist HPE researchers and educators who wish to apply theory to their HPE scholarship and practice. The article concludes with a practical example of how these principles were applied to an HPE research project, demonstrating the value of theory in enhancing research quality. Existing theories can facilitate opportunities for individual researchers to better understand complex phenomena while simultaneously moving forward the field of HPE.

 

 

RIME을 앞으로: 교육연구의 과학을 구성하는 것은 무엇인가? (Acad Med, 2020)

RIME Foreword: What Constitutes Science in Educational Research? Applying Rigor in Our Research Approaches

 

 

교육연구에서 과학을 구성하는 것은 무엇인가? 이 질문은 보건 직업 교육에 대표되는 학문의 다양성을 고려할 때 대답하기가 그렇게 간단하지 않다.1 연구자로서, 우리는 우리의 분야를 발전시키기 위한 과학적 연구에 종사한다. 또한 우리는 실무와 변화로 번역될 수 있는 지식을 생산하는 목표를 가진 응용 분야이다. 우리 분야는 교육, 심리학, 사회학, 생물 의학 및 임상 과학을 포함한 여러 분야와 데이터 과학 및 언어 역학 같은 신흥 분야에 뿌리를 두고 있다. 따라서, 과학과 과학적 조사의 원리를 정의하는 특정 요소는 다양할 수 있다.2 그럼에도 불구하고, 우리는 연구에서 생성된 과학의 질이 부분적으로 질문의 유형과 관련성 그리고 어떻게 답이 도출되는지에 기인한다는 것에 합의agree할 수 있다.3.4
What constitutes science in educational research? This question is not as straightforward to answer given the diversity of disciplines represented in health professions education.1 As researchers, we engage in scientific study to advance our field; we are also an applied field, with goals to produce knowledge that can translate into practice and change. Our field has roots in multiple disciplines, including education, psychology, sociology, biomedical and clinical sciences, as well as in emerging areas, such as data science and linguistic dynamics. As such, the specific elements that define science and principles of scientific inquiry may vary.2 And yet, we can agree that the quality of science generated from a study stems, in part, from the type and relevance of questions asked and how the answers are derived.3,4

 

오브라이언과 동료 5의 2019년 의학 교육 연구(RIME) 서언에서는 [추구할 가치가 있는 질문]과 [연구 질문을 유망한 investigation으로 만들어주는 요소]를 식별하는 방법에 대해 논의하였다. Promising question은 여러 가지 다른 연구 접근법을 통해 조사할 수 있지만, 일부 접근법은 질문 유형을 기반으로 추구하기에 더 효과적일 수 있다. 각 접근방식은 교육 커뮤니티에서 표준과 인정된 관행에 따라 "과학적인" 연구를 산출할 수 있다. 연구자들이 그들의 질문에 가장 잘 맞는 접근법을 선택하도록 돕기 위해, Ringsted와 동료 6은 관련된 해답을 얻기 위해 경로의 다양성을 탐색하기 위해 연구 나침반을 만들었다. 
The 2019 Research in Medical Education (RIME) Foreword by O’Brien and colleagues5 discussed how to identify questions worth pursuing and factors that make research questions promising for investigation. Promising questions can be investigated through several different research approaches, though some approaches may be more fruitful to pursue based on the type of question. Each approach may yield “scientific” studies according to the standards and accepted practices in the educational community. To help researchers choose the approach that best fits their question, Ringsted and colleagues6 created the research compass to navigate the diversity of pathways toward reaching relevant answers. 


[연구 접근 방식research approach]은 [과학]을 [저널리즘, 제품 테스트 또는 개인적 성찰과 같은 다른 유형의 탐구 및  조사]와 구별되는 것이다. 과학적 연구 접근법에는 현상에 대한 더 나은 설명을 제공함을써, ["무엇이" 작동하였는지 뿐만 아니라 "어떻게" 또는 "왜" 작동하는지"] 물어봄으로써 현상에 대한 더 나은 설명과 더 미묘한 이해를 찾기 위한 연구 공동체의 지속적인 노력이 수반된다. 그렇다면, 연구가 그 분야를 발전시키고 우리의 과학을 더 높은 지위로 끌어올리는 것인지 어떻게 알 수 있을까요?
The research approach is what sets science apart from other types of investigation and inquiry such as journalism or product testing or personal reflection. Scientific research approaches involve continuous efforts by the research community to find better explanations and more nuanced understanding of phenomena by asking “what” works as well as “how” or “why” it works by providing better explanations of the phenomenon. One approach rarely suffices to answer all these questions. , then, do we know if research is advancing the field and bringing our science to higher state?

연구 접근 방식: 연구설계, 연구방법론, 과학철학과의 연계성 연구
Research Approaches: Aligning Questions With Research Design, Research Methodology, and Philosophy of Science

[연구 접근법]은 우리가 연구에 참여하는engage in 방법이라고 설명할 수 있고, 연구 질문은 연구 접근법의 출발점이다. [연구 접근법]은 데이터 수집, 분석 및 해석과 관련된 연구 형성에서 방법론에 이르는 과정을 개괄적으로 설명하는 계획 및 결정을 명확히 한다.8-10 설명, 정당화, 명확화 연구로 특징지어질 수 있는 건강 직업 교육의 연구 질문과 유사하게, 연구 접근법은 식별한 연구 질문에 뒤따느는 후속 연구 과정에 inform and line하는 여러 계층을 가질 수 있다.
How we engage in research is described as the research approach, and a research question is the starting point for the research approach. Research approaches articulate the plans and decisions that outline the process from study formation to methodologies involved in data collection, analysis, and interpretation.8–10 Similar to research questions in health professions education that can be characterized as description, justification, and clarification studies,11 research approaches can have multiple layers that inform and link the subsequent research process following the identification of a research question.

 

연구자들은 종종 접근방식을 본질적으로 정량적, 정성적 또는 혼합적 방법으로 특징짓는다. HPE의 과학 상태가 발전함에 따라, 데이터의 유형에 기초한 이러한 분류는 우리 분야에서 이용 가능한 일련의 규율 전통과 관행을 고려할 때 불충분하다.12 연구 접근법은 연구를 guide하는 [연구 질문, 가정 및 개념적 프레임워크]에 기초한 결정을 요구한다.9 과학 연구에서 보다 구체적으로, 의사결정 과정에 영향을 미치는 연구 접근법에는

  • (1) 철학 가정(연구 패러다임 또는 과학의 철학),
  • (2) 연구 설계(조사의 과정) 및
  • (3) 연구 방법(데이터 수집, 분석 및 해석)

...의 세 가지 원칙이 있다. 

Researchers often characterize an approach as being quantitative, qualitative, or mixed-methods in nature. As the state of the science advances in HPE, these classifications, based on the type of data, are insufficient given the array of disciplinary traditions and practices available in our field.12 Research approaches require decisions based on research questions, assumptions, and conceptual frameworks guiding the study.9 More specifically in scientific studies, there are 3 principles of research approaches that influence the decision-making process:

  • (1) philosophical assumptions (research paradigm or philosophies of science),
  • (2) research designs (processes of inquiry), and
  • (3) research methods (data collection, analysis, and interpretation).

그림 1은 세 가지 연구 접근법의 관계를 나타내며, [연구 질문]과 [답변] 사이에서 프레임워크를 운용한다. 연구접근법은 연구자가 조사한 방향과 범위를 알려준다.

Figure 1 illustrates this relationship of the 3 research approaches, operationalizing the framework within research questions and answers. Research approaches inform the direction and scope examined by the researcher.

 

 

그림 1: 과학적 연구를 위한 프레임워크: 질문과 답변을 연구 접근법과 일치시킵니다. 

  • 연구자는 연구질문을 식별하고, 해당 질문에 맞는 연구 접근 방식을 선택하고, 결과를 사용하여 답변을 작성하는 것으로 시작한다. 
  • 이 프로세스 내에서 연구원은 엄격한 기준을 적용하여 세 가지 연구 접근 방식(철학, 설계 및 방법)을 식별한다. 
  • 세 가지 연구 접근법에서 과학적 엄격성의 적용은 과학적 연구를 뒷받침한다. 

Figure 1: 

A framework for scientific research: Aligning questions and answers with research approaches. A researcher conducting a study begins by identifying a research question, selecting research approaches that align with the question, and using the results to form answers. Within this process, the researcher identifies three research approaches (philosophy, design, and methods), applying standards of rigor. The application of scientific rigor in the three research approaches support making a scientific study. 

 

[과학의 철학]세계가 어떻게 작동operate하는지에 대한 가정을 하며, 다음의 것에 기초하여 과학이 수행conducted되는 방식을 가이드한다
Philosophies of science2,13 make assumptions about how the world operates, guiding the way in which science is conducted based on

 

  • 존재론(현실을 보는 방식),
  • 인식론(지식의 본질이 어떻게 생각되는가)
  • 가치론(연구 과정에서 가치의 역할과 장소, 특히 인식론, 방법론 및 방법 사이의 관계에 대한 가치의 영향)
  • 방법론(패러다임이 과학을 정의하고 처리하는 방법), 그리고
  • 엄격함(연구의 품질을 정당화하기 위한 노력)

 

  • ontology (how reality is viewed),
  • epistemology (how the nature of knowledge is conceived),
  • axiology (role and place of values in the research process specifically the influence of values on the relationship between epistemology, methodology, and methods),
  • methodology (how the paradigm defines and processes science), and
  • rigor (criteria to justify the quality of research).

 

그림에 열거된 철학은 실증주의, 후기실증주의, 비판이론, 구성주의, 실용주의, 현실주의, 포스트모더니즘을 포함한 보건직 교육 연구자들이 이용할 수 있는 광범위한 패러다임의 하위 집합이다.14

The philosophies listed in the figure are a subset of the wide range of paradigms available for health professions education researchers, including positivism, postpositivism, critical theory, constructionism, pragmatism, realism, and postmodernism.14

 

[연구 설계](탐구 전략)는 연구의 특정 방향과 프로세스에 대한 지침을 제공한다. 보건 직업 교육 연구자는 광범위한 연구 설계를 이용할 수 있다. 

  • 실험 설계(랜덤화 제어 연구 또는 준-치과학적 연구 포함) 및 조사와 같은 정량적 지향 설계부터, 
  • 서술적 연구, 현상학, 근거 이론, 민족학, 사례 연구와 같은 질적 지향적 설계
  • 수렴적/설명적 순차적 연구, 변형적 연구를 포함하는 혼합적 설계

Research designs (strategies of inquiry) provide guidance on the specific direction and process for the study.15 Health professions education researchers have a wide selection of research designs available, ranging

  • from quantitatively oriented designs such as experimental designs (including randomized controlled studies or quasi-experimental studies) and surveys,
  • to qualitatively oriented designs such as narrative research, phenomenology, grounded theory, ethnography, case studies, and
  • mixed-methods designs that include convergent, explanatory/exploratory sequential, and transformative studies.


[연구 방법론]연구 결과를 합성하고 연구 질문에 답하기 위해 데이터 수집, 분석 및 해석을 수행하는 방법에 대한 프레임워크를 제공한다. 연구 방법론은 또한 정량적, 정성적 또는 혼합적 방법 방향을 가질 수 있다. 데이터를 수집하기 위한 도구를 식별하는 특정 방법에 따라, 다양한 데이터 소스를 컴파일하고, 분석을 수행하고, 해석을 수행합니다. 예를 들어,

  • 해석을 위한 상관관계 또는 회귀 분석과 같은 통계적 방법을 사용하여 채점되고 분석되는 정보를 수집하기 위해 정신 측정 척도를 사용하는 것이 포함될 수 있다. 
  • 해석 과정의 일부로서 주제와 패턴을 식별하기 위한 스크립트 분석과 함께 인터뷰를 통해 데이터를 수집하기 위해 개방형 질문을 사용할 수 있다. 
  • 또는 이러한 방법론의 조합을 사용하여 숫자 및 텍스트 기반 데이터에서 추론을 도출할 수 있다.

The research methodology provides the framework for how data are collected, analyses performed, and interpretation conducted to synthesize findings and arrive at answering the research question.9,15 Research methodologies may also have a quantitative, qualitative, or mixed-methods orientation, depending on the specific method for identifying the tools to collect data, compile the different sources of data, perform analysis, and conduct interpretation. For example, this may involve

  • using psychometric scales to gather information that is scored and analyzed using statistical methods such as correlations or regression analysis for interpretation;
  • open-ended questions may be used to gather data through interviews, with analysis of transcripts to identify themes and patterns as part of the interpretive process.
  • Alternatively, a combination of these methodologies can be used, drawing inference from numeric and text-based data.


이러한 연구 접근법의 3가지 핵심 구성요소의 구별에서 보건 직업 교육에 연구를 수행하는 선형 경로가 없다는 것이 다소 명확해진다.

  • 실증주의 또는 후기실증주의 지향성을 가진 연구원은 사전에 설정한 검증가능한 가설(과학철학)로 시작하여, 조사 및 지식시험(연구방법론)에서 수집된 데이터를 사용하여, 실험연구(연구설계)를 수행할 수 있다.
  • 구성주의적 오리엔테이션(과학철학)에서 일하는 연구원은 현장 노트에 포착된 인터뷰 및 관찰 데이터(연구방법론)를 수집 및 분석하는 민족학적 연구(연구설계)를 수행할 수 있다. 15,16 

It becomes somewhat clear from the distinction of these 3 core components of research approaches that there is no linear pathway for conducting research in health professions education.

  • A researcher with a positivist or postpositivist orientation may begin with an a priori testable hypothesis (philosophy of science) and choose to conduct an experimental study (research design) using data collected from a survey and knowledge test (research methodology).
  • A researcher working from a constructivist orientation (philosophy of science) may choose to conduct an ethnographic study (research design) that involves collecting and analyzing interview and observational data captured in field notes (research methodology).15,16 

 

또한, 의학 교육에 대한 연구는 여러 연구 접근법을 수반할 수 있으며, "방법론적 다원론"으로 과학 연구를 촉진한다.

Moreover, studies in medical education may involve multiple research approaches, prompting scientific research with “methodological pluralism.”17

건강직업교육의 과학적 엄격성을 이용한 연구접근법 개발
Advancing Research Approach Using Scientific Rigor in Health Professions Education

 

그렇다면 무엇이 연구를 [과학적]으로 만들까요? 만약 우리가 연구 접근법의 3가지 요소를 고려한다면, 3가지 요소들 사이에 정렬, 접근법에 적용되는 엄격성 표준의 신중한 고려, 그리고 그러한 표준이 연구 과정 동안 충족되었다는 증거가 있어야 한다.10 [엄격성]에 대한 표준은 연구 접근법의 구성요소에 따라 다르다. 예를 들어,

  • [실험 설계]에서 엄격성의 증거는 연구자가 객관성을 입증하고 연구에 영향을 미칠 수 있는 주관적 편향을 최소화하는 정도이며, 가설 검증에 대한 위협이 최소화되는 방법에 대한 증거를 제공함으로써, 연구된 요인 간의 연관성 또는 인과 관계를 달성한다. 또한 큰 표본 크기와 추론 통계를 통해 연구를 복제하거나 연구의 소견을 일반화하려는 목적이 있다.
  • 이와는 대조적으로, [구성주의자 근거 이론]을 채택한 연구에서, 엄격성의 기준은 연구팀이 연구 과정 전체에 걸쳐 그들의 가정과 관점을 어떻게 생각했는지에 대한 증거로서 [반사성]의 개념을 포함하며, 또한 연구 참여자를 어떻게 의도적으로 선택했는지 설명하는 [지속적 비교 기법]을 포함할 수 있다. 또한 주제와 주제 사이의 관계를 식별하기 위해 [반복 프로세스]를 사용했음을 보여주는 것이다. 이 때의 목표는 [통계적 일반화가능성과 복제]보다는 [개념적 또는 이론적 일반화 가능성]이다.

 

So what makes a research study scientific? If we consider the 3 components of research approach, then there must be alignment among the 3 components, careful consideration of standards of rigor that apply to the approach, and evidence that such standards have been met throughout the research process.10 Standards for rigor vary depending on the components of the research approach. For example,

  • in an experimental design, the evidence of rigor is in the degree to which the researcher demonstrates objectivity and minimizes subjective bias that can influence the study, providing evidence on how threats to hypothesis testing is minimized and thereby achieving the association or causal relationship between the factors studied. There is also an aim toward study replication and generalizing findings through large sample sizes and inferential statistics.
  • In contrast, in a study employing constructivist grounded theory, the criteria for rigor may include concepts of reflexivity as evidence of how the research team considered their own assumptions and perspectives throughout the research process and constant comparative techniques to explain how the researchers purposefully selected study participants and used an iterative process to identify themes and relationships among themes.18,19 Conceptual or theoretical generalizability is a goal rather than statistical generalizability and replication.

 

[연구 설계]의 경우 엄격성에 대한 표준을 적용하고 입증해야 한다.

  • 설문조사를 실시할 경우 파일럿 조사나 설문 구성의 모범사례지침을 적용하는 등 엄격성 원칙을 보고해야 한다.
  • 예를 들어, 민족학 연구에서 데이터 소스의 장기 참여를 통한 삼각 측량, 참가자 반응성의 고려에 대한 증거는 엄격함을 보여줄 수 있다.
  • 마찬가지로, 연구 방법론의 경우, 참가자 감소를 최소화하기 위한 노력, 타당성 증거를 뒷받침하는 측정 도구의 사용, 회귀 모델에서 추정치의 통계적 모델 적합 및 표준 오차 평가와 같은 데이터 수집의 엄격성 표준에 대한 합의 지침이 있다.

For research design, standards for rigor should be applied and demonstrated.

  • If a survey was administered, principles of rigor such as pilot testing the items or applying best-practice guidelines to survey construction should be reported.
  • In an ethnographic study, for example, evidence of prolonged engagement triangulation of data sources and consideration of participant reactivity can demonstrate rigor.
  • Likewise, for research methodology, there are consensus guidelines on standards of rigor in data collection such as efforts to minimize participant attrition, use of measurement tools with supporting validity evidence, or evaluating the statistical model fit and standard error of estimates in a regression model.

이러한 각 연구 접근법에 대한 표준은 문헌에 보고되고 연구자에게 지침을 제공한다. 그러나 특히 과학의 엄격성과 증거를 구성하는 것에 대해 현장의 추가적인 주의가 필요한 혼합 방법 영역에서, 새로운 접근법과 새로운 접근법에 대한 엄격성 원칙과 지침이 결여된 연구 접근법도 있다.

Standards for each of these research approaches are reported in the literature and provide guidance to researchers.20,21 However, there are also research approaches that lack principles of rigor and guidance for newer and emerging approaches, particularly in mixed-methods domains that require further attention from the field on what constitutes rigor and evidence of science.


상황에 따라 [엄격함]과 [관련성] 사이에서 진자의 균형을 맞출 필요가 있을 수 있다.22 연구가 목적적합하기 위해서는 [최종 사용자의 근본적인 관심사]에 초점을 맞춰야 한다. 그러나 관련성을 지원하는 연구 접근 방식은 추가적인 논의, 추가 합의, 문화적 맥락과 규범에 대한 민감성을 요구할 수 있다.23,24

Depending on context, there may be a need to balance the pendulum between rigor and relevance.22 For research to be relevant, it must focus on the fundamental concerns of the end users. Yet the research approach supporting relevance may require additional discussion, further consensus, and sensitivity to cultural contexts and norms.23,24

RIME 2020의 연구접근법 : 보건직업 교육을 위한 신흥 및 개척적 연구접근법
Research Approaches in RIME 2020: Emerging and Frontier Research Approaches for Health Professions Education

 

최근 기술과 대량의 데이터 수집 능력(양적, 질적 및 시각적 이미지)의 진보는 이용 가능한 방법론에 대한 우리의 시야를 넓힐 수 있는 수많은 기회를 촉발시켰다.29 
Recent advances in technology and ability to gather large quantities of data (quantitative, qualitative, and visual images) have prompted numerous opportunities to expand our horizon on the available methodologies.29 

 

데이터 과학의 출현과 컴퓨팅 능력의 향상으로 어떤 연구 접근 방식을 활용할 수 있습니까? 이는 2020년 RIME 전체회의의 초점이었으며, 패널들은 인공지능, 학습자 분석, 실습 기반 연구 네트워크를 포함하는 신흥 및 개척자 연구 접근 방식을 논의하였다.27 
What research approaches can be leveraged with the emergence of data science and improvements in computing power? This was the focus of the 2020 RIME plenary, with panelists discussing emerging and frontier research approaches covering the domains of artificial intelligence,25 learner analytics,26 and practice-based research networks.27 

 

  • 대규모 데이터 합성에 대한 상당한 진보가 딥 러닝 및 인공지능 방법론을 사용하여 보건 전문가를 양성하는 데 사용할 수 있는 잠재력을 보여주었다. 30
  • 학습자와 교수진에게 실시간 분석 데이터를 제공하여 종방향 및 발전적 진보를 위한 훈련 시스템을 개선할 수 있다31
  • 또한 평가, 학습자, 프로그램 및 기관에 걸쳐 다양한 수준의 데이터를 포함하는 대량의 데이터를 수집할 수 있는 능력은 실무 기반 연구 네트워크의 과학에 의해 안내된 바와 같이 협업 인프라와 데이터 공유를 필요로 합니다.32 

 

  • Significant advances to synthesizing large-scale data have shown potential for their use to train health professionals using deep learning and artificial intelligence methodologies30;
  • real-time analytic data may be provided to learners and faculty, allowing improved systems of training for longitudinal and developmental progress31;
  • and the ability to gather large quantities of data that cover multiple levels of data across assessments, learners, programs, and institutions requires collaborative infrastructure and data sharing, as guided by the science of practice-based research networks.32 

 

보건직업교육의 연구접근법 연구기여부
Contribu
tions in Research Approach From Health Professions Education

우리는 종종 우리의 많은 핵심 연구 접근법과 개념 체계를 심리학, 사회학, 통계학과 같은 전통적인 학문에서 이전되거나 채택된 것으로 간주한다. 사회과학 연구의 많은 원칙이 핵심 연구 접근법의 프로파일에 기여했지만, 우리는 새로운 접근 방식을 수정하고 개발하였다.33 예를 들어, 평가를 연구하는 데 사용되는 많은 연구 접근 방식은 심리학적 접근 방식을 포함한 K-12 교육 환경에서 비롯되었다. 지난 수십 년 동안, 의학교육 분야는 성과 기반 평가를 위한 연구를 구현하고 운영하는 방법에 있어 이러한 아이디어를 수정해 왔다. 이러한 방법은 현재 객관적인 구조화된 임상 검사 및 작업장 기반 평가를 분석하는 방법을 포함하여 보건 직업 교육 외부의 분야에 영향을 미치고 있다.34
We often regard many of our core research approaches and conceptual frameworks as being transferred or adopted from traditional disciplines such as psychology, sociology, and statistics. While many principles of social science research have contributed to our profile of core research approaches, we have modified and also developed new approaches.33 For example, many research approaches used to study assessments have originated from K-12 educational settings including psychometric approaches. Over the past decades, the field has modified these ideas in how we implement and operationalize research for performance-based assessments—these methods are now influencing disciplines outside health professions education, including how we analyze objective structured clinical examinations and workplace-based assessments, to name a few.34

 

또한 [표준화된 환자 방법론]은 현재 다른 분야의 전문가 교육에 혁명을 일으키고 있는 건강 직업 교육에 채택된 독특한 연구 접근법이다. 의학교육의 엄격성에 대한 표준은 또한 공학 교육 및 법률 교육의 영역을 포함한 치과 교육 및 기타 보건 교육 분야의 연구 표준에 영향을 미치고 있다. 우리는 점차 혁신적인 연구 방법론과 다른 분야로의 접근을 수출하는 분야로 옮겨갔다.
In addition, the standardized patient methodology is a unique research approach adopted in health professions education that is now revolutionizing the training of professionals in other fields. Standards for rigor in medical education are also impacting research standards in dental education and in other health education fields, including domains of engineering education and legal education. We have gradually shifted into a field that now exports innovative research methodology and approaches to other disciplines.


우리는 확립된 단일 방법론을 따르기를 거부하는 일반적인 질적 접근법에서 예시처럼, 방법론의 혼합을 채택하는 새로운 접근법을 보고 있다.35,36 그러한 [새로운 접근법]의 영향은 보건 직업 교육 연구자들 사이의 엄격성에 대한 신중한 고려가 필요하다. 더욱이, 형평, 다양성, 포함inclusion의 문제를 진전시키는 방법론을 포함하여, 여전히 그 분야의 개발을 기다리고 있는 연구 접근법과 엄격성 표준이 있다.37 [인력 구성과 다양성]을 검토하는 파이프라인 프로그램을 검토하는 평가 연구는 (특히 이러한 중요한 주제와 일치하는 연구 질문들에서) 연구 접근법과 엄격성에 대한 지침이 여전히 부족하다. 

We are seeing newer approaches that adopt a mixture of methodologies, as exemplified in generic qualitative approaches that refuse to follow a single established methodology.35,36 The impact of such newer approaches requires thoughtful consideration for rigor among health professions education researchers. Furthermore, there are research approaches and standards of rigor that still await development for the field, including methodologies that advance issues in equity, diversity, and inclusion.37 Evaluation studies examining pipeline programs that examine workforce composition and diversity still lack guidance in research approach and rigor, particularly among research questions that align with these important topics.

 

게다가, [교육의 프랙세올로기praxeology]에 대해서도 구체적인 고려가 필요하다.38 프랙세올로기는 "프랙시스"에서 비롯되는데, 이는 교육이 어떻게 실행되어야practiced 하는지에 대한 문제와 관련이 있다. 그것은 구체적으로 교육이 효과를 발휘하도록 하는 연구가 무엇을 의미하는지 묻는 질문에 대답한다. 프랙세올로기는 가치 중립적이지 않으며 기관과 국가 기관의 우선순위에 따라 달라진다.

Additionally, praxeology of education needs to be given specific consideration.38 Praxeology stems from “praxis”—action, which has to do with the question of how education is to be practiced. It specifically answers the question of what research means for making education work. Praxeology is not value-neutral and depends on the priorities of institutions and national bodies.

 

블랙 라이프 매터(BLM, Black Life Matter) 운동이 한창인 가운데, 의학교육 연구가 소수민족에게 어떤 영향을 미쳤는지 되새겨볼 것을 독자들에게 당부한다. 연구의 결과로 praxis, change, action이 이루어졌는가? 다양성, 형평성, 포괄성 분야의 연구가 교육 변화를 구현하기 위한 제도적 조치에 부합할 필요가 있다는 점을 유념해야 한다. 이러한 분야에 대한 기여는 과학 발전을 위한 다른 관련 분야뿐만 아니라 우리 분야에도 상당한 영향을 미칠 수 있다.39

In the midst of the BLM (Black Lives Matter) movement, we challenge our readers to reflect on how medical education research has impacted minorities. Has the research resulted in praxis, change, and action? It is important to note that research in the field of diversity, equity, and inclusion need to be met with institutional action to implement changes in education. Contributions in these areas can have significant impact for our field as well as other related disciplines in how we advance science.39

끝맺는 말
Concluding Remarks

여러 분야의 학자들이 있는 분야에서, 최고의 과학의 모든 원칙과 가치를 포괄하는 하나의 엄격한 기준을 명확히 하는 것은 쉽지 않다. 여전히 많은 엄격한 기준이 존재한다. 우리는 질문의 유형과 작업의 보고 표준에서도 상당한 진전을 이뤘습니다. 그리고 우리의 연구 접근법과 관련된 과학적 엄격함은 여전히 지속적으로 다듬을 가치가 있는 분야로 남아있을지도 모른다. 
In a field with scholars from many disciplines, it is not easy to articulate a single standard of rigor that encompasses all principles and values of best science—there still are many contending standards of rigor. We have made significant progress in the types of questions we ask and also in the reporting standards of our work. And perhaps the scientific rigor associated with our research approach still remains to be a domain worth continuously refining.

 

그러나, 연구자들을 위한 테이크-홈 메시지는, 연구자가 연구 설계, 연구 방법론, 그리고 과학철학의 가정과 선택에 걸쳐 엄격성 표준을 따르고 있음을 입증하고 노력해야 한다는 것이다. 다음을 명확하게 설명하는 것은 모두 과학적 엄격함의 프로세스에 공헌할 것이다.

  • 연구가 우리 분야의 문제나 현상과 관련된 지식을 어떻게 발전시키는가,
  • 다른 문화적 맥락에서 연구의 목적적합성과 적용 가능성,
  • 연구의 결과로 교육에서 어떤 변화가 필요한가(praxeology),
  • 연구가 우리 분야의 핵심 원칙과 가치에 어떻게 이야기를 걸어오는가(axiology)

Yet, the take-home message is for researchers to demonstrate and to strive toward adherence in standards of rigor across their selection of research design, research methodology, and assumption and choices in the philosophy of science. Clear articulation of

  • how a research study advances knowledge relevant to a problem or phenomenon in our field,
  • the relevance and applicability of the study in different cultural contexts,
  • what needs to change in education as a result of the finings (praxeology), and
  • how the research speaks to core principles and values of our field (axiology)

...all contribute to the process of scientific rigor.


2020년은 우리가 교육 연구원과 실무자로서, 그리고 전문가로서 어떻게 기능하는가에 대한 불확실성과 도전으로 가득 찬 특이한 한 해이다. 우리는 우리가 봉사하는 직업과 사회에 어떤 특성과 가치를 가져다 주는지 잠시 멈추고 반영해야 할 중요한 시기에 있다. 또한 올해는 59번째 RIME 프로그램으로, 우리는 RIME의 다음 이정표에 접어들고 있으며, 보건직업 교육의 과학을 움직이는 연구와 발견에 있어 새로운 10년을 내다보고 있다. 

The year 2020 marks an unusual year, full of uncertainties and challenges in how we function as educational researchers and practitioners and more importantly as professionals; we are at a crucial time to pause and reflect what character and value we bring to the profession and communities we serve. This year also marks our 59th RIME program, where we are at a cusp entering the next milestone for RIME, as we look toward a new decade of excellence in research and discoveries that drive the science of health professions education. 

 

 

 


Acad Med. 2020 Nov;95(11S Association of American Medical Colleges Learn Serve Lead: Proceedings of the 59th Annual Research in Medical Education Presentations):Si-Sv.

 doi: 10.1097/ACM.0000000000003636.

RIME Foreword: What Constitutes Science in Educational Research? Applying Rigor in Our Research Approaches

Yoon Soo Park 1Zareen ZaidiBridget C O'Brien

Affiliations collapse

Affiliation

  • 1Y.S. Park is chair, Research in Medical Education (RIME) Program Planning Committee, and director of health professions education research, Massachusetts General Hospital and Harvard Medical School, Boston, Massachusetts; ORCID: http://orcid.org/0000-0001-8583-4335. Z. Zaidi is incoming chair, Research in Medical Education (RIME) Program Planning Committee, and associate chief for faculty development, Division of General Internal Medicine, University of Florida College of Medicine, Gainesville, Florida; ORCID: https://orcid.org/0000-0003-4328-5766. B.C. O'Brien is immediate past chair, Research in Medical Education (RIME) Program Planning Committee, professor of medicine, Department of Medicine, and education scientist, Center for Faculty Educators, University of California, San Francisco, San Francisco, California; ORCID: http://orcid.org/0000-0001-9591-5243.
    • PMID: 32769461

 

 

의학교육연구의 근거이론(AMEE Guide No. 70) (Med Teach, 2012)

Grounded theory in medical education research: AMEE Guide No. 70
Christopher J. Watling &Lorelei Lingard

 

 

 

소개 Introduction

지난 몇 년 동안 의학 교육 연구에서 질적인 조사 방법의 사용과 수용이 점진적으로 증가해왔다. 이러한 경향은 이 분야에서 가장 시급하고, 목적적합하며, 중요한 질문 중 일부는 전통적으로 생물 의학 영역을 지배해온 실험 및 정량적 연구 방법을 사용하여 만족스럽게 탐색할 수 없다는 인식이 증가하고 있음을 반영한다. 연구자가 이용할 수 있는 많은 정성적 방법 중, 근거이론은 생물의학과 사회과학 영역 모두에서 가장 자주 사용되어 왔다(Harris 2003). 
The last several years have witnessed a gradual increase in the use and acceptance of qualitative methods of inquiry in medical education research. This trend reflects a growing recognition that some of the most pressing, relevant, and important questions in the field cannot be satisfactorily explored using the experimental and quantitative research methods that have traditionally dominated the biomedical domain. Among the multitude of qualitative methods available to the researcher, grounded theory has been the approach most frequently used in both the biomedical and social science realms (Harris 2003). 

 

역사적 관점
An historical perspective

 

근거이론은 사회학자 창시자인 바니 글레이저와 앤셀름 스트라우스와 불가분의 관계를 유지하고 있는데, 그는 1967년 저서 "근거이론의 발견"에서 경험적 데이터로부터 이론을 생성하는 방법을 설명했다. 그들은 이 방법을 정성적 데이터와 정량적 데이터에 모두 적용할 수 있다고 언급했지만, 이론 생성에 관한 한 두 가지 유형의 데이터 간의 구분이 무의미하다는 것을 암시하기까지 했지만, 그들 자신의 연구는 정성적이었다. 근거이론의 비평가들조차 그들의 선구적인 연구가 사회과학의 질적 연구 방법의 정당화에 중요한 영향을 끼쳤다는 것을 인정한다(Thomas & James 2006).
Grounded theory remains inextricably linked with its sociologist founders, Barney Glaser and Anselm Strauss, who described, in their 1967 book The Discovery of Grounded Theory, a method for generating theory from empirical data (Glaser & Strauss 1967). Although they noted that the method could be applied to both qualitative and quantitative data, even suggesting that the distinction between the two types of data was meaningless as far as theory generation was concerned, their own research was qualitative. Even critics of grounded theory acknowledge that their pioneering work was a key influence on the legitimization of qualitative research methods within the social sciences (Thomas & James 2006).


[근거이론이 개발된 시대]의 맥락에 대한 관점이 유용하다. 글레이저와 스트라우스는 지난 수십 년 동안 사회과학 내에서 이론 검증에 대한 강한 경향을 한탄했고, 기존 이론을 시험하고 검증하기 위한 연구만을 이용하기보다는 자료로부터 이론의 생성을 촉진하고 싶었다(글레이저 & 스트라우스 1967). 또한, 질적 연구가 이전에는 잘 알려져 있었지만, 1960년대에 이르러 양적 학자들은 질적 연구를 종속적인 지위로 격하시켰다. (덴진 & 링컨 2005) Glaser와 Strauss는 데이터 분석을 위한 절차와 관행을 명확히 하고 코딩함으로써 정량적 접근법에 의해 점점 더 지배되는 분야에서 질적 연구를 정당화하는 것을 목표로 했다. 요컨대, 그들은 질적 연구가 잘 수용된 정량적 조사 방법과 나란히 설 수 있도록 하는 엄격함의 수준을 달성할 수 있다는 것을 증명함으로써 사회과학 연구의 발전뿐만 아니라 정치적 의제의 발전에도 관심이 있었다. (Bryant 2002)
A perspective on the context of the times in which grounded theory was developed is useful. Glaser and Strauss lamented the strong trend toward theory verification within the social sciences over the preceding decades, and wanted to promote the generation of theory from data rather than the use of research exclusively to test and verify existing theories (Glaser & Strauss 1967). In addition, although qualitative research had previously been well-regarded, by the 1960s, quantitative scholars had relegated qualitative research to subordinate status (Denzin & Lincoln 2005). Glaser and Strauss aimed to legitimize qualitative research in a field increasingly dominated by quantitative approaches by clarifying and codifying their procedures and practices for data analysis. In short, they were interested not only in advancing social science research but also in advancing a political agenda by demonstrating that qualitative research could attain levels of rigour that would allow it to stand alongside well-accepted quantitative methods of inquiry (Bryant 2002).


글레이저와 스트라우스의 "이론"과 그 발견에 대한 아이디어에 대한 고찰은 계몽적이다. 이론이 경험적 데이터로부터 나오고, 따라서 데이터에 "근거"되어 있다는 그들의 핵심 개념은, 심지어 출현에 대한 개념이 논쟁되고 비판되었음에도 불구하고 오늘날 많은 근거이론작업을 안내하는 중요한 원리로 남아 있다. (Bryant 2002, 2003; Kelle 2005) 그들은

  • 특정 영역 내의 경험적 조사 영역에 기초한 실질적 이론substantive theory
  • 특정 설정과 사회 구조의 시간과 장소와는 별개로 존재하며, 개념적conceptual인 형식적 이론formal theory을 구별했다.

An examination of Glaser and Strauss's ideas about “theory” and its discovery is enlightening. Their key notion that theory emerges from empirical data, and is thus “grounded” in data, remains an important principle guiding much grounded theory work today, even as the idea of emergence has been disputed and critiqued (Bryant 2002, 2003; Kelle 2005). They distinguished between

  • substantive theories, based on empirical areas of inquiry within a particular domain, and
  • formal theories, which were conceptual, distinct from the time and place of specific settings and social structures.

그들은 실질적인 이론substantive theory이 연구자 자신의 데이터로부터 생성될 수 있고 생성되어야 한다고 주장했다. 그들은 ("논리적인 추론 이론가들의 방식을 빌리기" 보다는) 데이터의 공식적 이론formal theory조차 근거가 있어야 한다고 주장했지만(Glaser & Strauss 1967, p.91) 그들은 공식적 이론formal theory이 다양한 실질적인 분야에서 연구되지 않는 한 [연구자 자신의 데이터에서 쉽게 도출될 수 없다는 것]을 인정했다.

Substantive theories, they argued, could and should be generated from the researcher's own data (Glaser & Strauss 1967). While they called for grounding of even formal theories in data rather than borrowing the ways of logico-deductive theorists (Glaser & Strauss 1967, p.91), they acknowledged that formal theory could not easily be derived from the researcher's own data, unless a large number of studies in a variety of substantive areas had been done.

실증주의Positivism

원래의 형태에서, 근거이론은 객관적이고 실증주의적 가정에 뿌리를 두고 있었다. 실증주의 패러다임은 객관적이고 초연한 연구자가 이해할 수 있는 진정한 현실을 가정한다(Guba & Lincoln 2005). 글레이저와 스트라우스의 원작은 사실 포스트 포지티브 패러다임이 출현하고 있던 시기에 일어났다(Guba & Lincoln 2005, p.193). 이 패러다임에서는 현실을 "불완전하고 확률적으로만 이해가능한apprehendable" 것으로, 보다 비판적으로 보았다. 그러나 사실 실증주의와 후기실증주의가 연구질문의 접근법에 미치는 영향은 미미하다. 실증주의적 사고는 근거이론 방법의 원래 설명에서 "발견"이라는 단어의 두드러진 사용에서 명백하다. 그 의미는 진리가 연구자에 의해 "발견"되기를 기다리고 있다는 것이다.

In its original form, grounded theory was rooted in objectivist and positivist assumptions. The positivist paradigm assumes a true reality that is apprehendable by a detached, objective researcher (Guba & Lincoln 2005). Glaser and Strauss's original work, in fact, occurred at a time when a post-positivist paradigm was emerging, in which reality is viewed more critically as “only imperfectly and probabilistically apprehendable” (Guba & Lincoln 2005, p.193), but in fact the differences between positivism and post-positivism in terms of their influences on the approach to research questions are minor. The positivist thinking is apparent in the prominent use of the word “discovery” in the original description of the grounded theory method; the implication is that truth is waiting to be “discovered” by the researcher.

새로운 패러다임
New paradigms

근거이론의 원래 서술 이후 수십 년 동안, 구성주의를 포함한 새로운 패러다임의 출현과 연구의 기초가 되는 실증주의적 가정에 대한 광범위한 비판을 목격했다. 구성주의 패러다임은 지식을 인간의 상호작용과 관계의 산물로서 능동적으로 구성되고 공동 창조된 것으로 본다.

  • 따라서 데이터와 분석은 "참가자 및 기타 데이터 출처와의 공유된 경험 및 관계"에서 작성된다(Charmaz 2006, 페이지 130).
  • 구성주의 패러다임 내에서 연구 목표는 진리를 발견한다는 실증주의 목표에서, 특정 목적의 이해와 적절한 모델의 개발로 전환된다(Bryant 2002).
  • 구성주의자들은 이론 생성의 해석적 성격을 인정한다. 그들은 이러한 해석을 만드는 데 있어 연구자의 역할에 대해 반사적으로 반응하고 열정 분석가로서의 연구자의 실증주의적 개념을 거부한다(Charmaz 2005).
  • 연구 과정은 연구자가 자신의 배경과 가정을 분석 과정에 가져오는 적극적인 참여의 하나로 간주된다.

The decades that followed the original description of grounded theory witnessed extensive critiques of the positivist assumptions underlying research and the emergence of new paradigms, including constructivism. The constructivist paradigm views knowledge as actively constructed and co-created as the product of human interactions and relationships. Data and analysis are therefore created from “shared experiences and relationships with participants and other sources of data” (Charmaz 2006, p. 130). Within the constructivist paradigm, the goals of research shift from the positivist goal of discovering truth toward the development of understanding and adequate models for specific, situated purposes (Bryant 2002). Constructivists acknowledge the interpretive nature of theory generation. They are reflexive about the role of the researcher in creating these interpretations and reject positivist notions of the researcher as dispassionate analyst (Charmaz 2005). The research process is viewed as one of active engagement, where the researcher brings his or her own background and assumptions to the analytic process.


지식 생산의 포스트모던 개념의 영향은 근거이론 방법을 업데이트해야 하는 추가적인 요구로 이어졌다.

  • 단순하고 일반화될 수 있는 기본적인 사회 과정을 밝혀내려는 실증주의적인 목표와 달리, 포스트모더니즘은 복잡성, 불안정성 및 이질성을 인정하고 강조한다(Clarke 2003).
  • 클라크는 포스트모더니즘이 요구하는 복잡성에 대한 반사성과 명시적 인정 없이는 근거이론과 다른 질적 접근법이 더 이상 받아들여질 수 없다고 주장한다. 그녀는 포스트모던 감성과 더 잘 호환되는 상황 매핑situational mapping과 같은 새로운 접근법의 통합을 통해 근거이론 방법의 보다 전면적인 정비를 주장해왔다(Clarke 2003).

The influence of postmodern notions of knowledge production has led to further calls to updating the grounded theory method. In stark contrast to positivism, with its goal of uncovering basic social processes that are simple and generalizable, postmodernism acknowledges and emphasizes complexity, instability, and heterogeneity (Clarke 2003). Clarke contends that grounded theory and other qualitative approaches are no longer acceptable without the reflexivity and explicit acknowledgment of complexity that postmodernism demands. She has advocated for a more sweeping overhaul of the grounded theory method through the incorporation of newer approaches, such as situational mapping, that are more compatible with postmodern sensibilities (Clarke 2003).

근거이론조사: 원칙 및 절차
Doing grounded theory research: Principles and procedures

근거이론의 기저 가정에 대한 이 비판적인 질문의 결과로 근거이론이 진화했지만, 근거이론 연구를 정의하는 많은 근본적인 방법론적 전략이 남아 있다.

Although grounded theory has evolved as a result of this critical questioning of its underlying assumptions, there remain a number of fundamental methodologic strategies that define grounded theory studies.

 

우리는 의사 학습에 대한 중요한 영향을 탐구한 최근 근거이론 연구('영향 경험 연구')를 참고하여 이러한 원칙과 절차를 설명할 것이다(Watling et al. 2012). 그러나 우리는 모든 연구가 시작되어야 하는 곳에서 강력한 연구 질문으로 시작할 것입니다.

We will illustrate these principles and procedures, where useful, by making reference to a recent grounded theory study of our own (the “influential experiences study”) in which we explored the important influences on physicians’ learning (Watling et al. 2012). We will start, however, where every piece of research should start – with a strong research question.

근거이론 연구의 연구 질문
Research questions in grounded theory studies

생물 의학 분야를 지배하는 연구에 대한 실험적 접근법과 달리, 근거이론 연구는 시험 가설에 관한 것이 아니다. 오히려, 근거이론 연구는 관심 대상 현상의 근간을 이루는 [핵심 사회적] 또는 [사회 심리적 과정]을 이해하고자 하는 탐구적인 것이다. 근거이론은 연구자가 "어떤 상황이나 특정한 사건을 둘러싸고, 무엇이 일어나고 있거나 무슨 일이 일어나고 있는지 설명할 수 있게 해준다." (Morse 2009, 페이지 14) 이러한 목표는 근거이론 연구에서 질문해야 하는 연구 질문의 유형을 결정한다.

Unlike the experimental approach to research that dominates biomedical disciplines, grounded theory research is not about testing hypotheses. Rather, grounded theory research is exploratory, seeking to understand the core social or social psychological processes underlying phenomena of interest. Grounded theory allows the researcher “to explicate what is going on or what is happening … within a setting or around a particular event.” (Morse 2009, p.14) These aims determine the types of research questions that should be asked in a grounded theory study. 

 

질문은 연구자가 완전히 집중되지 않은 상태에서 주제를 깊이 탐구할 수 있을 정도로 충분히 광범위해야 한다(Corbin & Strauss 2008). 초기 연구 질문은 연구의 범위를 정의하고 데이터 수집을 안내하는 동시에, 연구자가 데이터를 검토할 때 때때로 발생하는 예기치 않은 방향을 유연하게 따를 수 있도록 해야 한다. 예를 들어, 우리의 "영향력 있는 경험 연구"에서, 우리는 의사의 학습에 의미 있는 영향을 미치는 임상 경험의 qualities을 탐구하는 데 관심이 있었다1. 데이터 수집을 위해 진행한 인터뷰에서, 우리는 의사들이 학습에 가장 영향력 있다고 생각하는 유형의 경험과 이러한 경험이 그들에게 반향을 일으킬 수 있는 것이 무엇인지 물었다(Watling et al. 2012). 이러한 질문은 임상 학습 경험을 심층적으로 설명하는 데이터를 수집할 수 있을 정도로 충분히 광범위하면서도 관심 있는 맥락과 개인을 정의할 수 있도록 허용했다.

The questions should be broad enough to allow the researcher the freedom to explore a topic in depth, while not being entirely unfocused (Corbin & Strauss 2008). The initial research questions should define the scope of the study and guide the collection of data, while allowing flexibility for the researcher to follow the sometimes unexpected turns that arise as data is examined. For example, in our “influential experiences study”, we were interested in exploring the qualities of those clinical experiences that meaningfully influenced physicians’ learning1. In the interviews we employed for data collection, we asked what kinds of experiences physicians considered most influential in their learning, and what allowed these experiences to resonate with them (Watling et al. 2012). These questions were sufficiently broad to allow us to collect data that elucidated the experience of clinical learning in some depth, while still allowing us to define the contexts and individuals of interest.

방법론적 적합성 보장
Ensuring methodologic fit

연구자는 이 단계에서 근거이론 방법이 당면한 연구 질문을 탐구하는 데 적합한지 확인하기 위해 일시 중지하는 것pausing에서 이익을 얻을 수 있다. 
The researcher may benefit, at this stage, from pausing to ensure that the grounded theory method is an appropriate fit for exploring the research questions at hand. 


질적 탐구에 대한 다양한 접근법들 사이에 약간의 중복이 있을 수 있지만, 그들의 핵심에는 분명히 다른 목표를 가지고 있으며, 결과적으로 그들은 분명히 다른 제품으로 이어진다.

  • 민족학 연구는 데이터를 해석하는 렌즈로서의 문화 개념을 사용한다(Goodson & Vassar 2011). 민족학자는 사회 조직을 내부에서 이해하는 것을 목표로 하며, 일반적으로 사회적 환경에서 지속적인 몰입적 참여를 통해 얻어지는 데이터 출처로서의 관찰에 크게 의존한다(앳킨슨 & 퍼글리 2005). 민족학 연구의 산물인 민족학은 연구된 집단의 "전체주의적 문화적 초상화"를 제공한다. (크레스웰 2007, 페이지 72)
  • 이와는 대조적으로, 현상학경험된 개념이나 현상의 의미를 설명하는 데 초점을 맞추고 있다. 연구는 관심 있는 현상으로 시작하여 그 현상에 대한 여러 개인의 경험을 연구하여 그 본질로 축소한다(Cresswell 2007). 현상학의 중심은 연구자가 데이터 해석에 영향을 미칠 수 있는 선입견, 가정 및 편견을 식별한 다음 이러한 편견을 의도적으로 배제하려고 시도하는 괄호치기 관행이다(Dornan et al. 2005).
  • 사례 연구 접근법에서, 연구원은 경계를 쉽게 정의할 수 있는 사례 또는 소수의 사례를 연구하기로 선택한다(Stake 2005). 사례 연구 연구는 연구 방법보다는 연구된 것에 의해 정의되며, 일반적으로 여러 출처로부터 정보를 수집하고 분석하는 것을 포함한다. 그것의 목표는 이론의 도출이나 일반화할 수 있는 원칙의 정교함이 아닌 개별 사례의 복잡성에 대한 심층적인 이해이다(Cresswell 2007).

Although there may be some overlap between the various approaches to qualitative inquiry, they have, at their core, distinctly different goals, and as a result they lead to distinctly different products.

  • Ethnographic research uses the concept of culture as a lens through which to interpret data (Goodson & Vassar 2011). The ethnographer aims to understand a social organization from within, and typically relies heavily on observations as a data source, often obtained through sustained immersive engagement in a social milieu (Atkinson & Pugsley 2005). The product of ethnographic research, an ethnography, provides a “holistic cultural portrait” of the studied group. (Cresswell 2007, p. 72).
  • Phenomenology, in contrast, focuses on describing the meaning of an experienced concept or phenomenon. The research starts with a phenomenon of interest, then studies several individuals’ experiences of that phenomenon to reduce it to its essence (Cresswell 2007). Central to phenomenology is the practice of bracketing, in which the researcher identifies preconceptions, suppositions, and biases that may influence data interpretation, then attempts to deliberately set these biases aside (Dornan et al. 2005).
  • In the case study approach, the researcher chooses to study a case or a small number of cases whose boundaries can be readily defined (Stake 2005). Case study research is defined by what is studied rather than by how it is studied, and typically involves the collection and analysis of information from multiple sources. Its goal is an in-depth understanding of the complexity of an individual case, rather than the derivation of theory or the elaboration of generalizable principles (Cresswell 2007).


우리는 연구자들이 가장 관련성이 높은 방법론적 선택권과 연구과정의 이 단계를 진지하게 받아들이도록 권장할 것이다. 특정한 연구 문제를 해결하기 위해 상대적인 강점과 약점을 따져보는 것.
we would encourage researchers to take seriously this step of the research process by informing themselves of the most relevant methodological options and weighing their relative strengths and weaknesses for grappling with a particular research question.


다음은 근거이론연구의 수행을 정의하는 절차적 요소

the procedural elements that define the conduct of a grounded theory study, which we describe below.

반복공정
Iterative process

The Discovery of Ground Theory에서 Glaser와 Strauss는 데이터의 수집, 코딩 및 분석이 "연속적이어야 하며, (경계가) 흐리고 얽혀야 한다"고 언급하면서, 근거이론방법의 반복적 성격을 강조했다(Glaser & Strauss 1967, 페이지 43) 데이터 수집이 신중하게 제어되고 의도적으로 새로운 결과에 영향을 받지 않는 대부분의 실험적이고 가설 중심적인 정량적 연구와 대조적으로, 근거이론연구는 데이터 수집과 데이터 분석을 동시에 수행하며, 서로에게 정보를 제공한다. 예를 들어, 인터뷰 연구에서, 반복 프로세스는 스크립트가 완료될 때 스크립트를 읽고 초기 분석 통찰력과 개념 아이디어가 후속 데이터 수집을 형성할 수 있도록 하는 것을 의미한다. 예상치 못했거나 추가 탐구를 위한 설득력 있는 영역을 나타낼 수 있는 연구 결과는 유도 조사와의 후속 인터뷰에서 후속적으로 추적된다. 결과적으로, 조사를 신흥 지역emerging area으로 유도함으로써 얻은 추가 정보는 진행 중인 분석을 형성한다.
In The Discovery of Grounded Theory, Glaser and Strauss highlighted the iterative nature of the grounded theory method, noting that collection, coding, and analysis of data should blur and intertwine continually (Glaser & Strauss 1967, p.43). In contrast to most experimental, hypothesis-driven quantitative research, in which data collection is carefully controlled and deliberately not influenced by emerging results, grounded theory research involves performing data collection and data analysis simultaneously, with each informing the other. In an interview study, for example, an iterative process means reading transcripts as they are completed and allowing early analytic insights and conceptual ideas to shape subsequent data collection. Findings that were unanticipated or that may represent a compelling area for further exploration are followed up in subsequent interviews with directed probes. In turn, the additional information gained by directing the inquiry toward emerging areas shapes the ongoing analysis.

부호화
Coding

 

코딩은 근거이론 연구에서 분석 전략의 핵심 부분이다. 코딩과정에서 데이터를 핵심 개념 영역이나 테마를 중심으로 정리한다. 결과적으로, 잘 처리한 코딩은 단순히 데이터의 내용을 기술하거나 요약하는 것 이상을 필요로 한다. 오히려 코딩은 연구자가 데이터를 이해하기 위해 데이터와 상호작용해야 한다. 그러므로 코딩은 이론 구축 과정의 본질적이고 필수적인 부분이다.
Coding is a key part of the analytic strategy in grounded theory studies. Through coding, data are organized around key conceptual areas or themes. As a result, coding done well requires more than merely describing or summarizing the contents of the data. Rather, coding requires the researcher to interact with their data in order to make sense of it. Coding is therefore an intrinsic and essential part of the process of theory building.


다른 곳에서 자세히 설명한 코딩 데이터에 대한 여러 가지 접근법이 있다(Charmaz 2006; Corbin & Strauss 2008). [초기 코딩] 중에는 연구자가 가능한 많은 개념적 및 이론적 방향에 열려 있는 것이 중요하다(Charmaz 2006). 스크립트 내의 개별 줄이나 문장과 같은 작은 분석 단위에 초기 코딩 단계를 집중하면 가장 두드러진 아이디어가 식별되고 적절한 주의를 기울이도록 보장한다. 이 초기 상세 데이터 마이닝으로부터 개념적으로 관련된 많은 아이디어를 포함할 수 있는 더 넓은 범주가 개발되는 두 번째 코딩 단계가 온다. 종종, 코딩 체계는 추가 데이터가 수집됨에 따라 진화할 것이다. 특정 범주는 데이터가 특정 통합 기능에 의해 관련된다는 것이 분명해짐에 따라 다른 범주는 흡수될 것이며, 다른 범주는 새로운 데이터를 조사하는 과정에서 뚜렷한 하위 개념이 등장함에 따라 분할될 것이다.
There are multiple approaches to coding data that have been described in detail elsewhere (Charmaz 2006; Corbin & Strauss 2008). During initial coding, it is important that the researcher remains open to many possible conceptual and theoretical directions (Charmaz 2006). Focusing the initial coding phase on small units of analysis, such as individual lines or sentences within transcripts, ensures that the most salient ideas are identified and given appropriate attention. From this initial detailed mining of data comes a second coding phase where broader categories are developed that may encompass a number of conceptually related ideas. Frequently, the coding scheme will evolve as further data are collected. Certain categories will be absorbed by others as it becomes clear that their data are related by particular unifying features, while other categories will split as distinct sub-concepts emerge in the process of examining fresh data.


이 단계에서는 보다 상세한 코딩 예제가 도움이 될 수 있다. 상자 1에서, 우리는 "영향력 있는 경험 연구"에서 인터뷰 데이터가 분석됨에 따라 진화한 초기 코딩 체계를 보여준다. 상자 1에 표시된 코딩 방법은 궁극적으로 22개의 인터뷰 대본이 될 첫 15개를 읽고 다시 읽은 후에 개발되었다. 제안된 각 코드는 그 특성과 한계를 정의하는 일련의 [설명자]가 뒤따른다. 이 전략은 데이터 분류 작업에 접근함에 따라 연구자에게 중요한 지침을 제공한다.
A more detailed coding example may be instructive at this stage. In Box 1, we show an early coding scheme that evolved as interview data were analyzed in our “influential experiences study”. The coding scheme shown in Box 1 was developed after reading and re-reading the first 15 of what would ultimately turn out to be 22 interview transcripts. Note that each proposed code is followed by a series of descriptors that define its characteristics and its limits. This strategy provides important guidance to the researcher as the task of categorizing data is approached.


Box 1 "유입 경험 연구"를 위한 코딩 방법

Box 1 Coding scheme for “Influential Experiences Study”

 

지속적 비교
Constant comparison

코딩이 진행됨에 따라, 제정된 분석 프로세스는 지속적인 비교 중 하나입니다. 데이터를 조사examine함에 따라, incidents는 다른 incidents와 비교되고 범주의 새로운 특성 및 특성(Glaser & Strauss 1967; Corbin & Strauss 2008)과 비교된다. 비교 프로세스는 각 범주의 폭과 특성을 정의하고, 새로운 개념을 설명하는 사고가 발생할 때 새로운 범주의 출현을 촉진한다. 반례(반대 사례 – 마주치는 "부정적 사례")는 지속적인 비교 과정 내에서 특히 중요하다. 실제로, 그러한 특이치는 이론 개발에 기여하는 중요한 분석 통찰력을 열 수 있다. 이러한 사고를 범주의 기존 속성과 비교함에 있어, 연구원은 마주치는 데이터의 전체 범위를 설명할 수 있는 프로세스 개념 원칙을 드러내며, 이와 같은 간단한 분류를 넘어 생각할 수밖에 없다.

As coding proceeds, the analytic process enacted is one of constant comparison. As the data are examined, incidents are compared with other incidents and with the emerging characteristics and properties of the category (Glaser & Strauss 1967; Corbin & Strauss 2008). The comparative process defines the breadth and characteristics of each category, and facilitates the emergence of new categories when incidents are encountered that illustrate new concepts. Counter-examples – the “negative cases” that are encountered – are particularly important within the constant comparative process. Indeed, such outliers can unlock vital analytic insights that contribute to theory development. In comparing these incidents with the existing properties of the category, the researcher is forced to think beyond simple categorizations of like with like, revealing in the process conceptual principles that can account for the full range of data that is encountered.

코드에서 개념으로
From codes to concepts

코딩은 그 자체로 끝이 아니다; 오히려, 그것은 이론 개발을 용이하게 하는 전략이다. 전략은 힘을 이용할 때만 성공하며, 그렇게 하려면 연구자가 주제 분류만으로 만족하지 않아도 된다. 이론을 생성하기 위해서는 범주categorical에서 개념conceptual으로 분석이 제기되어야 한다. [개념 수준]에서 분석하려면 데이터에 대해 다음과 같은 질문을 해야 합니다.

  • 여기서 무슨 일이 일어나고 있나요?
  • 이 사건은 어떤 예입니까?
  • 왜 참가자들은 이런 식으로 반응하는가?

Coding is not an end in itself; rather, it is a strategy to facilitate theory development. The strategy only succeeds when its power is harnessed, and doing so requires that the researcher not be satisfied with mere thematic classification. The analysis must be raised from the categorical to the conceptual in order to generate theory. Analysis at the conceptual level requires asking questions of the data:

  • What is happening here?
  • What is this incident an example of?
  • Why are participants reacting this way?

 

데이터 내에서 기본 스토리를 정의하려는 이러한 노력은 보다 풍부한 분석 제품으로 보상됩니다. 더 깊고 개념적인 분석에 대한 한 가지 접근 방식은 코딩 프로세스에서 발생하는 주요 범주categories 간의 관계를 탐구하는 것을 포함한다. 범주를 연결하는 아이디어는 이론 개발을 지원하는 개념적 발판을 제공할 수 있습니다.

Such efforts to define the underlying story within the data are rewarded with a richer analytic product. One approach to deeper, conceptual analysis involves exploring the relationships among the major categories that emerge from the coding process. The ideas that link categories can provide the conceptual scaffold to support theory development.


우리의 예제로 돌아가면, 코드 체계는 더 많은 데이터가 분석되고 범주 간의 연결이 탐색되고, 말해진 것what was said뿐만 아니라 의미하는 것what was meant이 무엇인지 질문함에 따라 발전되고 다듬어졌다. 이 연구를 위한 코딩 범주의 최종 목록은 [단순히 데이터를 분류하기보다는 개념화하려는 움직임]을 반영한다(박스 2). 예를 들어, 이전의 범주인 "학습자 태도"와 "독립성/자율성"은 "학습 조건"의 요소로 개념화되었고, "측정", "형식 평가", "역할 모델"은 "학습 신호"의 요소로 개념화되었다. "피드백"도 학습 신호였지만, 우리는 이 범주가 매우 중요하다고 느꼈기 때문에 분석에서 풍부함이 손실되지 않도록 구별하는 것을 선택했다.
Returning to our example, the coding scheme evolved and was refined as further data were analyzed, as the links between categories were explored, and as we asked not only what was said but what was meant. The final list of coding categories for this study reflects a move toward conceptualizing our data rather than simply categorizing it (Box 2). For example, the previous categories of “learner attitude” and “independence/autonomy” were conceptualized as elements of “learning conditions”, while “measuring up”, “formal assessments”, and “role models” were conceptualized as elements of “learning cues”. Although “feedback” was also a learning cue, we felt this category was so significant that we opted to keep it distinct to ensure that its richness was not lost in the analysis.

상자 2 "유입 경험 연구"를 위한 최종 코딩 방법

Box 2 Final coding scheme for “Influential Experiences Study”

 

메모 및 다이어그램을 사용하여 분석 촉진
Facilitating analysis with memos and diagrams

 

메모는 분석의 기록이다(Charmaz 2006; Corbin & Strauss 2008). 근거이론 연구자는 자료를 수집하고 분석할 때 정기적으로 메모를 작성해야 한다. 메모 쓰기는 자료 수집과 출판 원고 초안 작성 사이의 중간 단계 역할을 할 수 있지만, 과정은 자유롭고 비공식적이어야 한다. 연구자들은 축적된 데이터를 탐색하는 과정을 거치면서 발생하는 아이디어를 기록해야 한다. 메모 쓰기는 새로운 통찰력의 출현과 범주 간의 관계의 정교화를 촉진하여 분석 과정을 진전시킨다. 메모를 작성하는 행위는 연구자가 코드화된 데이터를 검토하고 그 의미를 개념적 수준에서 해석하도록 강요force한다. 메모 모음에는 근거이론의 개발을 게시하여 프로세스가 논리적이고 체계적이며 데이터에 기반을 두고 있는지 확인합니다.
Memos are a written record of analysis (Charmaz 2006; Corbin & Strauss 2008). Grounded theory researchers should write memos regularly as they collect and analyze their data. Although memo writing can serve as an intermediate step between collecting data and drafting a manuscript for publication, the process should be free and informal. Researchers should record the ideas that occur to them as they move through the process of exploring their accumulating data. Memo-writing facilitates the emergence of new insights and the elaboration of relationships among categories, propelling the analytic process forward. The act of writing a memo forces the researcher to examine coded data and to interpret its meaning at a conceptual level. A collection of memos signposts the development of a grounded theory, ensuring that the process is logical, systematic, and grounded in the data.



상자 3은 "영향 경험 연구" 예제를 위해 수집된 데이터의 분석 중에 작성된 메모의 추출물을 포함한다. 데이터를 검사하면서, 우리는 학습자가 자신의 성과와 관련하여 이용할 수 있는 정보의 신뢰성에 대한 반복적인 언급을 주목했고, 학습자가 특히 감독자로부터 받은 피드백과 관련하여 어떤 정보가 신뢰할 수 있고 없는지를 어떻게 결정했는지에 관심을 갖게 되었다. 상자 2에 표시된 최종 코딩 체계의 "신뢰도를 결정하는" 범주에 포함된 데이터를 면밀하게 검토한 후 작성된 이 메모에는 이 문제에 대한 데이터에서 나오는 핵심 통찰력이 요약되어 있다. 글쓰기가 자유롭고 스타일리스트적으로 조잡하다는 것에 주목하라; 관심은 문법과 구문보다는 아이디어 자체에 집중된다. 분석 과정에서 제기되는 질문들은 더 많은 생각과 주의를 요하는 잠재적으로 중요한 아이디어에 신호를 보내기 위해 메모에 명시되어 있다.
Box 3 contains an extract of a memo written during the analysis of data collected for the “influential experiences study” example. As the data was examined, we noted recurring references to the credibility of information that was available to learners related to their own performance, and we became interested in how learners determined what information was credible and what was not, particularly as it related to feedback received from their supervisors. In this memo, written after careful examination of the data contained in the “determining credibility” category of the final coding scheme shown in Box 2, key insights emerging from the data on this issue are outlined. Note that the writing is free and stylistically crude; the attention is on the ideas themselves rather than on grammar and syntax. Questions raised in the analytic process are articulated in the memo to signal potentially important ideas requiring further thought and attention.

 

3번 상자 "신뢰도 결정" 메모

Box 3 Memo on “Determining credibility”

 

궁극적으로, 우리는 피드백의 신뢰성에 대한 학습자의 판단과 그들의 성과에 대한 다른 정보가 임상 학습에 중추적인 역할을 한다는 것을 인식했다. 이와 같은 메모는 우리가 이 아이디어의 풍부함과 중심성을 인식하는 데 도움이 되었다. 메모가 반복적으로 처리될 경우 분석이 강화되며, 데이터 수집 및 분석이 진행됨에 따라 이를 재검토하고 수정해야 한다. 상자 3에 표시된 메모의 길이가 더 긴 원본 버전에서, 각 나열된 포인트는 데이터에서 직접 추출한 2-3개의 인용구로 지원된다는 점에 주목할 필요가 있다. 메모에 직접 인용문이 등장할 필요는 없지만, 신뢰도 결정에 관한 원래 메모에 삽입하는 연습은 통찰력이 데이터에 기반을 두게 할 뿐만 아니라 나중에 원고를 쉽게 쓸 수 있도록 하는 데 도움이 되었다.
Ultimately, we recognized that learners’ judgments about the credibility of feedback and other information about their performance played a pivotal role in their clinical learning. Memos such as this one facilitated our recognition of the richness and centrality of this idea. Analysis is strengthened when memos are treated iteratively; they should be revisited and revised as data collection and analysis proceeds. It is worth noting that in the original, lengthier version the memo shown in Box 3, each listed point was supported by 2-3 quotations directly drawn from the data. Although direct quotations need not appear in memos, the exercise of inserting them into the original memo on determining credibility served not only to ensure that the insights were grounded in the data but also to facilitate the writing of the manuscript later.

 

다이어그램은 기본 이론 작업에서 메모와 유사한 목적으로 사용될 수 있습니다. 다이어그램은 나타나는 개념 간의 관계를 시각적으로 표현한 것입니다. 다이어그램을 작성하려면 연구자가 데이터에 대한 생각을 범주 수준에서 개념 수준으로 끌어올려 분석에 가치를 더해야 합니다(Corbin & Strauss 2008). 개념 구성, 개념 간의 관계 이해 및 데이터의 본질적 축소를 촉진한다(Corbin & Strauss 2008).

Diagrams can serve a similar purpose to memos in grounded theory work. Diagrams are visual representations of the relationships between concepts that emerge. The creation of a diagram requires the researcher to raise their thinking about the data from the level of categories to the level of concepts, adding value to the analysis (Corbin & Strauss 2008). They promote organization of concepts, understanding of relationships among concepts, and reduction of data to its essence (Corbin & Strauss 2008). 

 

상자 4는 그러한 다이어그램의 예를 보여준다. 관심 있는 독자들은 이 초기 다이어그램을 우리의 출판된 원고에 포함된 최종 버전과 비교하기를 원할 수 있다(Watling et al. 2012).
Box 4 shows an example of one such diagram; interested readers may wish to compare this early diagram with the final version that was included in our published manuscript (Watling et al. 2012).

상자 4 수집된 데이터에서 그린 다이어그램의 예

Box 4 Example of diagram drawn from data collected

 

영감과 창의력
Inspiration and creativity

근거이론은 수집된 데이터에서 발생하는 프로세스와 관련된 요소와 범주를 주의 깊게 조사함으로써 프로세스에 대한 개념적 이해를 도출하려고 한다. 범주가 어떻게 개념이 되고 설명이 어떻게 이해되는가 하는 것만으로 신비롭고 이해하기 어려울 수 있다. 창의적 사고는 근거이론 연구의 피할 수 없는 요소로, 단순한 서술보다는 해석이 필요하다. 그러나 해석적 영감은 우연이 아니다.

Grounded theory seeks to derive conceptual understanding of a process by carefully examining the elements and categories related to that process emerging from the data collected. Just how categories become concepts and description becomes understanding can seem mysterious and difficult to grasp. Creative thinking is an inescapable element of grounded theory research, which requires interpretation rather than mere description. Interpretive inspiration, however, is not accidental. 

 

연구자는 의미 있는 해석적 통찰의 출현을 촉진할 조건을 의도적으로 만들어야 한다.

  • 데이터에 반응하는 유연한 코딩 시스템을 유지하고,
  • 정기적인 메모 작성에 관여하며,
  • 아이디어를 일관성 있는 스토리로 모을 수 있도록 도표를 사용하는 것은 모두 해석 과정을 촉진하기 위한 의도적인 전략이다.

The researcher must deliberately create the conditions that will facilitate the emergence of meaningful interpretive insights.

  • Maintaining a flexible coding system that is responsive to the data,
  • engaging in regular memo writing, and
  • using diagrams to help bring ideas together into a coherent story are all deliberate strategies for facilitating the interpretive process.

그러나 궁극적으로 해석의 주요 촉진자는 데이터에 대한 철저한 지식입니다. 데이터를 자세히 검토하고 다시 검토해야만 연구자가 분석 과정을 안내할 패턴과 반복 테마를 인식할 수 있다.

Ultimately, however, the key facilitator of interpretation is a thorough knowledge of the data. Only by examining and re-examining data in detail will the researcher be able to recognize the patterns and recurring themes that will guide the analytic process.

이론 표본 추출
Theoretical sampling

 

근거이론 연구의 표본 추출 전략은 목적적이며 이론적 고려에 의해 유도된다. [초기 표본 추출]은 연구 질문에 의해 유도된다. 연구원은 이러한 질문과 관련된 풍부한 정보를 제공할 가능성이 있는 것으로 간주되는 데이터의 출처를 의도적으로 선택한다. 차르마즈가 지적한 바와 같이, 이 초기 샘플링은 "출발 지점"만 제공한다(Charmaz 2006, 페이지 100). 후속 이론적 샘플링은 이 초기 데이터 수집에서 나온 범주와 개념에 의해 안내된다.
The sampling strategy in grounded theory research is purposive and guided by theoretical considerations. Initial sampling is guided by the research question. The researcher purposefully selects sources of data that are considered likely to provide rich information relevant to these questions. As Charmaz points out, this initial sampling provides only “a point of departure” (Charmaz 2006, p.100); subsequent theoretical sampling is guided by the categories and concepts that emerge from this initial data collection.


[이론적 표본 추출]은 "사람, 장소 및 사건으로부터 데이터 수집을 수반하며, 이들의 특성과 치수의 측면에서 개념을 개발하고, 변화를 발견하며, 개념 간의 관계를 식별하는 기회를 최대화한다."(Strauss & Corbin 2008, 페이지 143).

Theoretical sampling entails the collection of data from people, places, and events that will maximize opportunities to develop concepts in terms of their properties and dimensions, uncover variations, and identify relationships between concepts (Strauss & Corbin 2008, p.143).

 

가설 중심 실험 연구에 사용되는 표본 추출 전략과 달리, [이론적 표본 추출]은 연구가 시작되기 전에 확립된 것이 아니라 데이터에 반응적responsive이다(Strauss & Corbin 2008). 따라서 이론적 샘플링은 데이터 분석이 데이터 수집과 동시에 발생할 뿐만 아니라 실제로 데이터 수집을 추진하는 반복 프로세스의 맥락에서만 발생할 수 있다. 연구원은 이론적 구조를 개발하고 다듬는 것을 촉진하는 새로운 데이터 소스를 명시적으로 찾는다. 이론적 표본 추출의 목적은 표본이 모집단을 대표하는지 확인하거나 결과의 통계적 일반화 가능성을 허용하는 것이 아니라, 범주와 개념을 정교하고 다듬기 위한 전략적이고 구체적인 표본 추출을 통해 풍부하고 완전한 이론적 개발을 보장하는 것이다(Charmaz 2006). 이론적인 표본 추출은 연구자가 개발 아이디어를 확인하고, 반박하고, 확장하고, 다듬을 수 있게 한다.

Unlike sampling strategies used in hypothesis-driven experimental research, theoretical sampling is responsive to the data rather than established before the research begins (Strauss & Corbin 2008). Theoretical sampling can therefore only occur in the context of an iterative process in which data analysis not only occurs concurrent with data collection, but actually drives data collection. The researcher explicitly seeks out new sources of data that facilitate developing and refining theoretical constructs. The goal of theoretical sampling is not to ensure that the sample is representative of a population nor to allow statistical generalizability of the results; rather, the aim is to ensure rich and full theoretical development through strategic and specific sampling to elaborate and refine categories and concepts (Charmaz 2006). Theoretical sampling allows the researcher to confirm, refute, expand, and refine developing ideas.

 

포화
Saturation

연구자는 충분한 데이터가 수집되었을 때 어떻게 알 수 있는가? 포화 상태에 도달할 때까지 표본 추출을 계속하는 것이 지침 원칙이지만, 포화도는 단순히 새로운 데이터가 출현하지 않는 상태 이상more than을 가리킨다. 포화도는 분석 프로세스와 밀접하게 연관되어 있으며, 데이터 수집 및 데이터 분석의 반복 프로세스 내에서만 결정할 수 있습니다. 포화도는 데이터 수준이 아닌 [개념적 및 이론적 수준]에서 보아야 합니다. 포화도를 결정할 때 질문해야 할 중요한 질문은 연구자가 출현한 개념과 테마의 차원과 특성에 대해 충분한 이해를 할 수 있도록 충분한 데이터가 수집되었는지와 관련이 있다.
How does the researcher know when enough data has been collected? The guiding principle is to continue sampling until saturation has been reached, but saturation refers to more than a state where no new data are emerging. Saturation is intimately linked with the analytic process, and can only be determined within an iterative process of data collection and data analysis. Saturation must be viewed at a conceptual and theoretical level, rather than at a data level. The important questions to ask in determining saturation relate to whether sufficient data has been collected for the researcher to have gained an adequate understanding of the dimensions and properties of the concepts and themes that have emerged.


포화라는 개념은 연구자의 판단과 경험에 달려 있기 때문에 도전적challenging이다. 생물 의학 연구에 익숙한 정량적 방법과는 달리, 근거이론 연구자들이 연구 문제를 적절히 해결하기 위해 필요한 표본 크기를 추정하기 위한 지침이나 공식은 없다. 결과적으로, 질적 연구의 일반적인 표본 크기는 초보 연구자와 기관 검토 위원회 및 허가 기관, 특히 양적, 실험적인 연구 접근법이 지배적인 분야의 연구 기관 모두에게 어려운 문제가 될 수 있다.
The notion of saturation is challenging because the determination that it has been reached rests on the judgment and experience of the researcher. Unlike in the quantitative methods familiar in biomedical research, there are no guidelines or formulae available to grounded theory researchers for estimating the sample size that will be required to adequately address the research question. As a result, sample size in qualitative research in general can be a thorny issue for both novice researchers and for institutional review boards and granting agencies, particularly those from fields where the quantitative, experimental approach to research is dominant.


모스(1995)는 포화 문제를 해결하기 위한 많은 유용한 지침을 제공했다. 아마도 가장 중요한 것은, [포화가 편의성 또는 무작위 샘플링보다 이론적 샘플링에서 더 쉽게 발생할 것이라는 점에 주목]하면서, 샘플의 사려 깊고 이론적 정당성을 요구한다. 또한 데이터 양에 대한 데이터의 풍부성과 변동을 강조합니다. 위에서 강조했듯이, 드물게 발생하는 특이치와 부정적인 사례에 대한 세심한 주의는 개념 설명, 개념 연결 및 이론 개발을 용이하게 할 수 있는 이러한 드문 사례에 대한 검토이기 때문에 많은 유사한 사례를 수집하는 것보다 포화를 달성하는 데 훨씬 더 생산적일 수 있다. 간단히 말해서, [데이터 수집]은 [논리의 격차gaps나 비약leaps 없이, 데이터에 대한 그럴듯한 설명을 제공하는, 완전하고 설득력 있는 이론이 개발되었을 때 중단]될 수 있다(Morse 1995).

Morse (1995) has offered a number of useful guidelines for addressing problem of saturation. Perhaps most important, she calls for thoughtful and theoretical justification of the sample, noting that saturation will occur more readily with theoretical sampling than with convenience or random sampling. She also emphasizes data richness and variation over data quantity. As we have emphasized above, careful attention given to the infrequently occurring outliers and negative cases may be much more productive in achieving saturation than collecting a large number of like cases, as it is the examination of these infrequent cases that can facilitate delineation of concepts, linking of concepts, and development of theory. In short, data collection can stop when a complete and convincing theory has been developed that provides a plausible account of the data without gaps or leaps of logic (Morse 1995).

근거 이론의 비판
Critiques of grounded theory

근거이론 방법은 여러 면에서 비판을 받아왔다. 몇 가지 핵심 비판에 대한 간략한 개요는 방법을 사용하는 연구자와 근거이론 연구의 독자 모두에게 관련된다.

The grounded theory method has been criticized on a number of fronts. A brief overview of some of the key critiques is relevant both for researchers using the method and for readers of grounded theory studies.

해석학자들의 비판
Critiques from the interpretivists

 

근거이론의 가장 강력한 비판은 [그것의 실증주의적 기원]을 떨쳐 버리고 지식과 그것의 세대에 대한 새로운 사고방식이 등장함에 따라 그 자체를 재상상상하고 재정렬하는 데 실패하는 것을 목표로 한다. (Bryant 2002) 구성주의적 패러다임을 수용하는 사람들에게, 데이터로부터 이론의 "등장"이라는 개념은 특히 문제가 있다. 어떻게 이론이, 사실, 데이터로부터 나올까요? 

The strongest critiques of grounded theory target its failure to shake off its positivist origins and to reimagine and realign itself as new ways of thinking about knowledge and its generation have emerged (Bryant 2002). To those who embrace the constructivist paradigm, the notion of “emergence” of theory from data is especially problematic. How does theory, in fact, emerge from data?

 

[고전적인 근거이론가]들은 연구자가 "추상적인 놀라움"(Glaser 1992, 페이지 22)으로 그 분야에 진입enter하고, 연구자의 "정보적인 분리informed detachment"를 강조할 것을 요구한다(Glaser & Strauss 1967) 그러면 연구자는 사전 지식이나 개인적인 관점의 족쇄에서 벗어나 데이터 내에서 진실을 "발견"할 수 있습니다. 

Classic grounded theorists call for the researcher to enter the field with abstract wonderment (Glaser 1992, p. 22), and emphasize the “informed detachment” of the researcher (Glaser & Strauss 1967). The researcher, freed from the shackles of prior knowledge or personal perspectives, can then “discover” the truth within their data. 

 

[구성주의자]들은 위와 같은 데이터에 대한 연구자의 수동적 입장과 이론의 출현에 대한 이러한 생각들이 포스트모던 패러다임에서는 도저히 옹호될 수 없다고 주장한다. (Bryant 2002) Fish(1994)는 근거이론 연구를 하기 위한 목적으로 [개인적인 믿음과 관점을 제쳐두는 것의 얼빠짐zaniness]에 대해 다채롭게 언급헸다. 이 논평은 근거이론에 대한 주요 구성주의적 비판을 반영한다: 참여자 및 데이터와의 상호작용을 통해 지식을 구축하고 창출하는 데 있어 연구자의 주요 역할을 인식하지 못한다는 것이다.

Constructivists argue that these ideas about the passive stance of the researcher toward their data and the emergence of theory are simply not tenable within postmodern paradigms (Bryant 2002). Fish (1994) speaks colourfully about the zaniness of putting aside personal beliefs and perspectives for purposes of doing grounded theory research, and this comment reflects a key constructivist critique of grounded theory: that it fails to acknowledge the researcher's key role in constructing and creating knowledge through interaction with the participants and with the data.


일부 근거이론가들은 분석 과정에서 연구자의 [반사성의 중요성]을 강조함으로써 이러한 비판에 대응했다. 의도적 성찰deliberate reflection은 연구자가 연구과정에 미치는 영향에 대한 관점을 제공하여 지식의 구축에 대한 연구자 자신의 공헌을 더욱 명확하게 한다. 연구자가 성찰로 얻은 통찰력으로 무엇을 해야 하는지가 토론의 주제다. 예를 들어, 코빈과 스트라우스(Corbin & Strauss 2008)는 근거이론 프로세스에 필수적인 반사성을 포함시키는 데 있어 구성주의의 힌트를 보여주지만, 반사성의 가치는 부분적으로 분석에 대한 개인적 편견이 침입하는 것에 대한 안전성을 제공하는 것이라는 것을 암시한다.

Some grounded theorists have responded to these critiques by emphasizing the importance of researcher reflexivity in the analytic process. Deliberate reflection provides perspective on the researcher's influence on the research process, making clearer his or her own contribution to the construction of knowledge. What the researcher should do with the insights gained from reflection is the subject of debate. Corbin and Strauss, for example, display hints of constructivism in enshrining reflexivity as essential to the grounded theory process, but imply that the value of reflexivity is, in part, in providing a safeguard against the intrusion of personal bias into the analysis (Corbin & Strauss 2008). 

 

[이론수립]이라는 과제에 접근하면서, [연구자가 자신의 관점을 인식하고 고의적으로 절제해야 한다는 이 관념]은 여전히 [실증주의적 전통을 강하게 반영]하고 있다는 지적을 받아 왔는데, 이는 연구자가 어떻게든 그 밖에 남아 있어야만 밝혀낼 수 있는 진실이 데이터 안에 존재한다는 것을 시사하기 때문이다.
This notion that the researcher must recognize and then deliberately temper his or her perspective as they approach the task of theory-building has been criticized as still firmly reflective of a positivist tradition, as it suggests that there is a truth within the data that can only be revealed if the researcher remains somehow outside of it.


보다 확고하게 [구성주의자]나 [해석주의자]의 입장에서 말하는 사람들은 왜 이런 종류의 해석적 거리가 유용한지에 의문을 제기한다.

  • [구성주의 근거이론]은 데이터 분석과 개념화에 대한 반복적 접근법에 중점을 두지만, "해석적 이해와 위치적 지식"을 목표로 하는 궁극적인 이론-구축 목표를 재정의한다(Charmaz 2008, 페이지 133).
  • [구성주의 근거이론]은 반사성을 강조하지만, 이는 연구자의 역할, 연구 참여자의 역할, 지식 구조에서의 연구 상황과 과정을 인정하는 것이다(Charmaz 2008).
  • [구성주의 근거이론]의 기초가 되는 지식 창출에 대한 근본적인 가정의 변화를 고려할 때, 일부 해석학자들은 '근거 이론'이라는 용어가 왜 구성주의 패러다임에서 질적 연구를 수행하는 사람들에 의해 전혀 유지되는지 의문을 제기하였다(Thomas & James 2006).

 

Those speaking from a more firmly constructivist or interpretivist position ask why this kind of interpretive distance is useful.

  • Constructivist grounded theory retains the emphasis on an iterative approach to analyzing and conceptualizing data, but redefines the ultimate theory-construction goal to aim for “interpretive understanding and situated knowledge” (Charmaz 2008, p.133).
  • Constructivist grounded theory stresses reflexivity, acknowledging the roles of the researcher, the research participants, and the research situation and process in knowledge construction (Charmaz 2008).
  • Given the shift in fundamental assumptions about knowledge creation that underlie constructivist grounded theory, some interpretivists have questioned why the term ‘grounded theory’ is retained at all by those who undertake qualitative research in the constructivist paradigm (Thomas & James 2006).

고전주의자들의 비판
Critiques from the classicists

 

바니 글레이저가 이끄는 [고전적 근거 이론의 지지자]들은, 그 방법을 정의하는 몇몇 중요한 원리들을 유지하지 못한 것에 대해, 근거 이론의 구성주의적 수정을 비판해 왔다.

  • 특히 연구자 편향 문제는 데이터를 개념적 수준으로 끌어올리는 것을 확실히 하고, 일부 연구 참여자의 경험과 유사할 경우 연구자 자신의 경험을 다른 데이터와 비교해야 할 데이터로 처리함으로써 해결할 수 있는 문제로 제시된다.
  • 글레이저는 차마즈 및 다른 구성주의자들의 연구가 합법적인 정성적 데이터 분석을 나타내지만, 정당한legitimate 근거 이론이 아니라고 주장한다(글레이저 2002).
  • 그는 근거이론에서 정당성legitimacy은 지속적인 비교 접근법에 대한 신뢰와 고수에서 성장한다고 주장한다.
  • 만약 연구자가 동일한 현상의 여러 사례를 주의 깊게 본다면, 연구자의 편향이 없어지고 데이터가 객관적으로 만들어질 것이라고 그는 주장한다.
  • 그의 견해에 따르면, [정당한 근거 이론은 개념화에 관한 것]이고, 반면에 [구성주의적 수정은 그것의 연구 주체의 목소리와 서술에 초점을 맞추고 있어서, 더 이상 근거 이론이 아니다]. (Glaser 2002)

 

Led by Barney Glaser, adherents to classical grounded theory have criticized the constructivist modification of grounded theory for its failure to maintain some of the important principles that define the method. In particular, the issue of researcher bias is presented as a problem that can be resolved by ensuring that the data is raised to a conceptual level, and by treating the researcher's own experiences, if they are similar to those of some of the research participants, as data to be compared with other data. Glaser contends that the work of Charmaz and other constructivists represents legitimate qualitative data analysis, but not legitimate grounded theory (Glaser 2002). He maintains that legitimacy, in grounded theory, grows out of trust in and adherence to the constant comparative approach. If, he contends, the researcher looks carefully at multiple cases of the same phenomenon, researcher bias will be eliminated and the data will be made objective. Legitimate grounded theory, in his view, is about conceptualization, while the constructivist modification is so focused on description and on representing the voice of its research subjects that it ceases to be grounded theory (Glaser 2002).

위치 지정
Positioning ourselves

 

우리는 이러한 스펙트럼의 양쪽 끝에서 나온 비판을 근거이론 연구에 적합하고 활력을 주는 것으로 본다. 근거이론에 대한 구성주의적 접근법에 내재된 반사성의 정신에서, 우리는 구성주의적 질적 연구자로서 우리 자신의 위치를 인정한다. 목적적합성을 유지하기 위해 우리는 근거이론이 지식 창출에 대한 구성주의적 개념을 통합하도록 진화해야 한다고 믿는다. [연구자가 연구분야에 진입함에 있어 자신의 배경지식, 경험, 이론적인 성향 등을 한 쪽으로 밀쳐둔 채], [수동적이고 객관적인 관찰자 역할을 할 수 있다는 생각]은 시대에 뒤떨어지고 믿을 수 없는 것으로 보인다.
We view these critiques from both ends of the spectrum as healthy and invigorating for grounded theory research. In the spirit of reflexivity that is inherent in the constructivist approach to grounded theory, we acknowledge our own position as constructivist qualitative researchers. In order to remain relevant we believe that grounded theory must evolve to incorporate constructivist notions of knowledge creation. To us, the idea that the researcher can set aside his or her own background knowledge, experience, and theoretical leanings on entering the research field and play the role of passive, objective observer seems outdated and implausible.


반면에, 우리는 근거이론이 탐구적이고 질적인 연구에 접근하기 위해 제공하는 원칙에는 많은 가치가 있다고 믿는다. 지식과 그것의 정교함에서 연구자의 역할에 대한 근본적인 가정에 대한 재고에 기초한 방법론적 진화는 이러한 유용한 원칙들을 포기해야 한다는 것을 의미하지는 않는다. Babchuk(1997)이 언급했듯이, 근거이론은 다양한 문헌에 걸쳐 질적 데이터 분석에 대한 다양한 스타일과 접근 방식을 포괄하는 우산umbrella 용어로 사용되어 왔다. 이같은 "뭐든 가능하다anything goes" 접근 방식은 근거이론 연구의 신뢰성과 관련성에 확실히 해롭다.

On the other hand, we believe there is much value in the principles grounded theory provides for approaching exploratory, qualitative research. Methodologic evolution based on reconsideration of underlying assumptions about knowledge and the role of the researcher in its elaboration does not mean that these useful principles should be abandoned. As Babchuk (1997) has noted, grounded theory has been used as an umbrella term for a wide variety of styles and approaches to qualitative data analysis across a range of literatures; this “anything goes” approach is surely harmful to the credibility and relevance of grounded theory research. 

 

따라서 우리는 GT의 infromed use를 지지한다. 다만, 이 때 GT의 핵심 교리tenets을 유지함으로써 달성되는 rigor를 존중하되, GT가 처음 형성된 실증주의적 가정에 대해서는 지식 형성의 구성주의적 개념의 관점에서 다시 생각해 볼 필요가 있음을 인정해야 한다.

We therefore advocate for

an informed use of grounded theory,

combining respect for the rigour provided by maintaining its core tenets

with recognition that the positivist assumptions on which the method was built require rethinking in view of constructivist conceptions of knowledge creation.

 

근거이론 연구자는 패러다임의 충실성, 배경, 데이터 수집에서의 역할, 주제 또는 연구 분야와의 관계에 대해 명시함으로써 독자들이 그들의 작품을 정보에 입각한 방식으로 사용할 수 있도록 도울 수 있다.

Grounded theory researchers can help readers to use their work in an informed way by being explicit about their paradigmatic allegiances, their background, their role in data collection, and their relationship to their subjects or to their field of study.

근거이론연구의 함정
Pitfalls in grounded theory research

해석 프로세스를 충분히 수행하지 않음
Not taking the interpretive process far enough

 

모든 근거이론 연구가 대담하고 계몽적인 새로운 이론을 만들어 낼 수 있는 것은 아니다. 그러나 일부 연구는 데이터의 "큰 그림"을 렌더링하기보다는 테마나 개념의 목록에 맞춰 시도하지 않는 것으로 만족한다(Kennedy & Lingard 2006). 다른 형태의 질적 조사와 비교했을 때, 근거이론은 연구자들이 그들의 노력을 지도할 수 있는 더 명확한 로드맵을 제공하는 것으로 보인다. 그러나 이러한 구조는 완전히 실현되지 않은 분석을 촉진할 수 있다. 데이터를 분류하고 분류할 수 있는 과정을 기술하는 것은 비교적 쉽지만, 해석적 기술과 창의성을 요구하는 이러한 범주에서 이론을 개발하는 후속 창조적 요소를 기술하는 것은 전혀 간단하지 않다.

Not all grounded theory studies can generate bold, enlightening new theories. However, some studies seem content not to try, settling instead for lists of themes or concepts, rather than a “big picture” rendering of their data (Kennedy & Lingard 2006). Compared with other forms of qualitative inquiry, grounded theory seems on the surface to provide a clearer roadmap for researchers to guide their efforts. This very structure, however, might promote an analysis that is not fully realized. It is relatively easy to describe a process by which data can be classified and categorized, but not at all straightforward to describe the subsequent creative element of developing theory from these categorizations, which calls for interpretive skill and creativity. 

 

GT에서 연구자는 겉으로 보여지는 규범적인 코딩 절차의 늪에 빠져 더 큰 목표를 놓치기 쉽다. 근거 이론 방법의 기술과 절차를 상당히 상세하게 설명한 줄리엣 코빈은 "분석 과정이 가장 우선적이고 최우선적으로 사고 과정"이라고 상기시키며, 이는 특정 절차를 따를 필요보다는 데이터와의 상호작용을 통해 얻어진 통찰에 의해 추진되어야 한다. (Corbin 2009, 페이지 41) 차르마즈는 연구자들이 연구 결과의 경계를 넓히고 '그래서 어쩌지so what?'라는 질문에 답할 것을 강력히 촉구한다.

It is easy for the researcher to become bogged down in the apparently prescriptive coding procedures and to lose sight of the larger goal. Juliet Corbin, who has described the techniques and procedures of the grounded theory method in considerable detail, reminds us that “the analytic process is first and foremost a thinking process” (Corbin 2009, p.41) that should be driven by the insights gained through interaction with data rather than by a need to follow specific procedures. Charmaz helpfully urges researchers to push the boundaries of their findings and answer the ‘So what?’ questions (Charmaz 2006, p.107).

설명할 수 없는 주장을 하는 것
Making unsupportable claims of explanation

 

근거이론 연구의 산물이 정말로 "이론"인지 여부에 대한 정당한 의문이 제기되었다. (토마스 & 제임스 2006) 토머스는 근거이론이 너무 많은 것을 약속한다고 비판해 왔다; 그의 주장에 따르면, 그 제품이 기술이나 이해가 아닌 "이론"이라는 주장은, 거의 존재하지 않는다고 설명하고 예측하는 힘을 시사한다. (토머스 & 제임스 2006) 사실, 근거이론가들은 그들의 분석으로부터 지지할 수 없는 주장을 하는 것을 경계해야 한다. 그러나 토마스나 제임스와는 달리, 우리는 이론 생성의 목표가 버려져야 한다고 생각하지 않는다. 왜냐하면 이것은 근거이론 작업과 다른 형태의 질적 연구를 구별하는 바로 이 목표이기 때문이다.

Legitimate questions have been raised about whether the product of grounded theory studies is really “theory” at all (Thomas & James 2006). Thomas has criticized grounded theory for promising too much; its insistence that its product is “theory” rather than description or understanding suggests a power to explain and predict that, he argues, is rarely present (Thomas & James 2006). Indeed, grounded theorists must guard against making unsupportable claims from their analyses. Unlike Thomas and James, however, we do not believe that the goal of theory generation should be abandoned, as it is this very goal that distinguishes grounded theory work from other forms of qualitative research.

 

차마즈(2006)는 근거이론 연구자들에게 설명explanation이라기보다는, "상상적 이해imaginative understanding"를 강조하는 이론의 해석적 정의를 추구할 것을 제안함으로써 이 문제를 해결한다. 마찬가지로 브라이언트(2002)는 설명하고 예측하는 힘으로 진실을 발견하거나 일반화할 수 있는 이론을 수립하는 [실증주의적 목표]보다는 특정 맥락과 목적에 대해 적절한 이해를 달성하려는 [구성주의적 목표]를 목표로 삼을 것을 제안한다.

Charmaz (2006) resolves this issue by suggesting that grounded theory researchers look to interpretive definitions of theory that emphasize “imaginative understanding” (p. 126) rather than explanation. Similarly, Bryant (2002) suggests targeting a constructivist goal of achieving adequate understanding for specified contexts and purposes, rather than a positivist goal of discovering truth or establishing generalizable theories with the power to explain and predict.


그러므로 GT 연구자들은 그들의 연구의 목표와 그들의 새로운 이론의 설명력의 한계에 대해 곰곰이 생각해 보아야 한다. 연구 결과의 일반화에 대한 과감한 주장은 의심으로 보아야 한다. 근거이론은 예를 들어, 개인이나 그룹이 직면하는 관련 관계, 프로세스에 대한 주요 영향 또는 도전을 식별할 수 있지만, 이러한 관계, 영향 또는 도전의 크기를 결정할 수는 있다. 이러한 결정을 내리려면 통계 샘플링과 관련된 완전히 다른 연구 접근법이 필요하며, 이는 뚜렷한 목표를 가지고 있다. 따라서 근거이론은 [(정량적 실험 방법을 포함한 다른 방법을 사용하여) 시험될 수 있는 가설을 생성]할 수 있지만, 근거이론은 그러한 [가설을 시험하기 위한 수단이 아니다].

Researchers should therefore reflect thoughtfully on the goals of their work and the limits of their emerging theory's explanatory power. Bold claims of generalizability of findings should be viewed with suspicion. Grounded theory might identify relevant relationships, key influences on a process, or challenges facing individuals or groups, for example, but cannot determine the magnitude of these relationships, influences, or challenges. Making such determinations would require an entirely different research approach, involving statistical sampling, with a distinctly different goal. Grounded theory might therefore generate hypotheses that could be tested using other methods, including quantitative, experimental methods, but grounded theory is not the vehicle for testing those hypotheses.

근거이론연구논란
Controversies in grounded theory research

문학고찰에 관한 논란
The literature review

연구자들이 가변적이고 종종 상충되는 조언을 접할 수 있는 한 영역은 근거이론 연구에서 문헌 검토의 장소이다. Dunne(2011)은 문헌 검토를 수행하는 것이 근거이론의 스펙트럼을 따라 모든 점에서 연구자들에 의해 적절하다고 생각한다는 점에 주목한다. 문헌고찰에 관한 논란은 문헌 검토의 시기에 있다.

  • 예를 들어, 글레이저와 다른 사람들은 조기적이고 포괄적인 문헌 검토가 연구자의 분석 능력이 돌이킬 수 없을 정도로 약화될 선입견과 이론적 짐을 너무 부담한다는 이유로 데이터 수집 및 분석에 앞서 유의한 문헌 검토에 반대한다(글레이저 1992, 나타니).2006년). 
  • 다른 사람들은 사전 문헌 검토를 자제하는 것의 비효율성을 미리 언급했고, 문헌 검토가 초점을 날카롭게 하고 연구 질문을 개선함으로써 연구를 풍부하게 할 수 있는 가능성에 대해 언급하였다(Dunne 2011). 한 연구가 선행하는 연구로부터 논리적으로 따르는 프로그램적 연구에서는 연구자가 연구 분야에서 관련 문헌에 대한 친숙함을 증가시키는 것은 피할 수 없으며 사실상 프로그램을 진전시키는 새로운 연구 질문의 생성을 촉진할 것이다.

One area where researchers will encounter variable and often conflicting advice is the place of the literature review in grounded theory studies. Dunne (2011) notes that performing a literature review is considered appropriate by researchers at all points along the spectrum of grounded theory; the controversy lies in the suggested timing of that review. Glaser and others, for example, argue against a significant literature review in advance of data collection and analysis on the grounds that an early, comprehensive literature review will so burden the researcher with preconceived notions and theoretical baggage that his or her analytic capacity will be irretrievably weakened (Glaser 1992, Nathaniel 2006). Others have noted the inefficiency of abstinence from a literature review in advance, and have commented on the potential for the literature review to enrich the research by sharpening the focus and improving the research questions (Dunne 2011). In programmatic research, where one study follows logically from one that precedes it, the researcher's growing familiarity with relevant literature in the area of research is unavoidable and in fact will facilitate the generation of compelling new research questions that advance the program.


흥미롭게도, 글레이저와 스트라우스조차 연구자들이 관련 데이터를 식별하고 그 데이터에서 중요한 테마를 추출할 수 있는 관점을 필요로 한다는 것을 인정했다. (글레이저 & 스트라우스 1967) 우리의 견해는 문헌 검토가 정확하게 이러한 관점을 제공하고 연구 질문을 형성하는데 필수적이라는 것이다. 그러나, 우리는 연구자들이 데이터와 그것이 포함하는 개념과 아이디어에 의도적으로 개방적인 태도를 유지하기를 경고한다. 근거이론가들의 스펙트럼 전반에 걸쳐, 데이터 분석에 대한 이러한 [초기 개방적인 접근법initial open-minded approach]이 널리 지지된다(Glaser & Strauss 1967; Charmaz 2006).

Interestingly, even Glaser and Strauss acknowledged that researchers require a perspective that allows the identification of relevant data and the abstraction of significant themes from that data (Glaser & Strauss 1967). Our own view is that a literature review is indispensible in providing exactly this perspective and in shaping the research question. We caution researchers, however, to remain deliberately open-minded to the data and the concepts and ideas that it contains: across the spectrum of grounded theorists, this initial open-minded approach to data analysis is widely endorsed (Glaser & Strauss 1967; Charmaz 2006).

 

기존 이론의 통합에 관한 논란
The integration of existing theory

 

글레이저와 스트라우스는 연구자들에게 기존의 형식 이론에서 도출된 선입견을 이 분야로 끌어들이지 말라고 경고했지만(글레이저와 스트라우스 1967), 그들은 새로운 근거이론의 생성이 기존 이론과 완전히 분리되어 일어날 필요는 없다는 것을 인정했다. 그들의 목적은 열린 마음을 위한 명시적 노력의 중요성을 강조하는 것이었는데, 우리는 이것이 여전히 근거이론 연구의 중심이라고 믿는다. 열린 마음open-mindedness이 기존의 이론적 관점에 대한 지식과 친숙함과 공존할 수 있는가? 기존 이론이 분석 과정을 "오염"하지 않고 근거이론 연구에 통합될 수 있는가? 우리는 그것이 통합될 수 있고 통합되어야 한다고 믿지만, 기존 이론을 사용하는 접근 방식은 여전히 논쟁의 여지가 있다.

Although Glaser and Strauss cautioned researchers against bringing preconceived notions drawn from existing formal theories into the field (Glaser & Strauss 1967), they acknowledged that the generation of new grounded theory need not occur in complete isolation from existing theory. Their aim was to highlight the importance of explicit efforts at open-mindedness, which we believe remain central to grounded theory research. Can open-mindedness co-exist with knowledge of and familiarity with existing theoretical perspectives? Can existing theory be integrated into grounded theory research without “contaminating” the analytic process? We believe that it can and should be integrated, but the approach to using existing theory remains controversial.

 

확실히 근거이론이 emerge하고 난 다음에, 기존의 이론적 프레임워크가 어떻게 데이터 해석을 보완하거나 확장하거나 어려운 데이터에 대한 대체 설명을 제공하는지를 고려하는 것이 적절하다. 실제로, 어떤 사람들은 연구자들이, 물론, 기존 이론들로부터 분리되어 행해진 근거이론 작업은, 이론이 축적되지 못할 위험non-cumulative이 있으며, 따라서 지식의 구축을 억제stifles한다는 비판이 있다. 이에 대한 부분적인 대응으로, 기존 이론의 자료에서 도출한 이론에 명백히 "근거ground"해야 한다고 제안했다. (골드컬 & 크론홀름 2003). 심지어 실증주의적인 경향을 가진 연구자들조차도 (근거이론의 개발이 기존의 이론적 틀에 강요되지만 않는다면), 새로운 근거이론과 기존 이론의 연결을 지지하는 경향이 있다.

Certainly after a grounded theory emerges, it is appropriate to consider how existing theoretical frameworks might complement or extend the data interpretation or offer alternate explanations for challenging data. Indeed, some have suggested that researchers should, as a matter of course, explicitly “ground” the theories they derive from data in existing theories, in part as a response to the criticism that grounded theory work done in isolation from existing theories risks non-cumulative theory development and thus stifles the building of knowledge (Goldkuhl & Cronholm 2003). Even those researchers with positivist leanings tend to support the linking of emergent grounded theories with existing theories, provided that the timing of doing so is such that the very development of the grounded theory is not forced into a pre-existing theoretical framework.

 

그러나, 구성주의자들은 [먼저 기존의 이론적인 제약에서 벗어나 근거이론이 출현하도록 허용하고, 후에 그것을 풍부하게 하기 위해 관련 기존 이론을 통합하는] 이 개념은 인위적이고 비현실적이라고 주장한다. 구성주의자에게 연구자의 훈련 배경과 이론적 관점은 [데이터 내의 가능성과 프로세스에 대해 경각심을 갖게 하며, 관련성 있는 질문을 하도록 안내하는 데 중요한] 민감성 개념sensitizing concept을 제공할 수 있다(Charmaz 2006).

Constructivists would argue, however, that this notion of first allowing the grounded theory to emerge, free of existing theoretical constraints, and then only later integrating relevant existing theories to enrich it is artificial and impractical. To the constructivist, the researcher's disciplinary background and theoretical perspective may provide vital sensitizing concepts that alert them to possibilities and processes within their data and that guide them in asking relevant questions (Charmaz 2006).

 

기존 이론을 어떻게 언제 근거이론 연구에 통합할 것인가에 대한 논란은 연구자뿐 아니라 자신의 작품을 읽고 검토할 사람들에게도 과제를 안겨준다. 근거이론을 사용하는 연구원들은 출판용으로 제출하는 원고에서 기존 이론의 사용에 기초한 잠재적 비판을 예측하고 해결하는 그들의 연구 방법에 대한 설명을 능숙하게 할 필요가 있다. [연구자가 데이터에 부과impose하는 것이 아니라], [코드와 범주가 데이터에서 나오는emerge] 신중하고 체계적인 코딩 프로세스를 명확하게 설명하면, 독자와 리뷰어는 연구자가 데이터에 대한 초기 접근에서 열린 마음을 가졌다는 것을 안심시킬 수 있다. 더욱이, 연구자들은 기존 이론에 대한 그림을 그리는 논리에 대해 논리를 제시해야 한다. 기존 이론을 사용하는 것은 제시된 데이터 분석의 맥락에서 "이치에 맞아야make sense" 한다.

Controversy around how and when to integrate existing theory in grounded theory research creates challenges not only for researchers but also for those who will read and review their work. Researchers using grounded theory need to be skillful in their descriptions of their research methods in manuscripts they submit for publication, anticipating and addressing potential critiques based on their use of existing theory. A clear description of a careful and methodical coding process in which codes and categories emerge from the data rather than being imposed on the data will reassure readers and reviewers that the researcher has been open-minded in their initial approach to their data. Furthermore, researchers should make the case for the logic of drawing on existing theories; the use of existing theory must “make sense” in the context of the data analysis that is presented.

컴퓨터 지원 데이터 분석
Computer-assisted data analysis

연구자들이 산더미 같은 데이터를 관리해야 하는 어려움에 직면하는 경우가 많기 때문에, 모든 유형의 질적 데이터 분석은 매우 어려울 수 있습니다. 점점 더 많은 컴퓨터 소프트웨어 프로그램들이 데이터 분석 과정을 용이하게 하기 위해 근거이론가들과 다른 질적 연구자들에 의해 사용되고 있다. 이 프로그램들은 연구자에게 많은 잠재적인 이점을 제공한다.

  • 소프트웨어 패키지는 데이터를 코딩 카테고리와 하위 카테고리로 구성할 수 있고, 카테고리 간의 연결을 식별할 수 있으며, 카테고리를 메모 및 기타 관련 문서에 연결할 수 있습니다. 
  • 이 조직 시스템은 쉽게 검색할 수 있으므로 효율적인 데이터 관리가 가능하며 연구자가 분석을 작성하거나 제시할 때 핵심 개념을 지원해야 할 때 데이터 내의 보석을 쉽게 찾을 수 있습니다. 
  • 또한 데이터 분석 소프트웨어를 사용하면 수행된 분석 단계를 추적하는 감사 추적을 제공할 수 있습니다.

Qualitative data analysis of any type can be daunting, as researchers often face the challenge of managing mountains of data. Increasingly, computer software programs are being used by grounded theorists and other qualitative researchers to facilitate the process of data analysis. These programs offer many potential advantages to the researcher. Software packages can allow organization of data into coding categories and subcategories, can identify links between categories, and can link categories to memos and other relevant documents. This organizational system is readily searchable, allowing efficient data management and ensuring that gems within the data are readily found when the researcher needs to support core concepts as they write up or present their analysis. The use of data analysis software also can provide an audit trail that tracks the analytic steps that were taken.


컴퓨터 보조 데이터 분석은 엄격한 데이터 분석 방법을 대체하는 것이 아니며, "N-Vivo를 사용하여 데이터를 분석했다"와 같은 용어로 기술된 근거이론을 사용하는 것을 지지하는 연구는 의심스럽게 보아야 한다(Jones & Diment 2010). 데이터 분석을 안내하는 원칙을 제공하는 것은 소프트웨어 패키지가 아니라 근거 이론grounded theory입니다. 컴퓨터는 연구자가 분석에 철저하고 효율적일 수 있도록 지원하는 도구일 뿐이다. 연구자는 여전히 데이터를 해석하고, 떠오르는 개념을 인식하고, 개념과 범주가 서로 어떻게 관련되는지 묻고, 분석을 이론 개발을 촉진하는 추상적인 수준으로 밀어넣어야 한다. 이론 개발에 있어 연구자가 요구하는 창의성은 컴퓨터에 의해 제공될 수 없다(Becker 1993). 그러나 소프트웨어 패키지는 연구자가 다양한 방법으로 데이터를 시각적으로 탐색할 수 있는 기회를 제공할 수 있으며, 전략적으로 사용될 경우 창의적인 사고를 촉진하고 분석 프로세스를 향상시키는 통찰력의 출현을 자극할 수 있다(Bringer et al. 2006).

Computer assisted data analysis is not a substitute for a rigorous method of data analysis, and studies purporting to use grounded theory whose methods are described in terms such as “Data were analyzed using N-Vivo” should be viewed with suspicion (Jones & Diment 2010). It is grounded theory, and not the software package, that provides the principles that guide the data analysis. The computer is merely a tool that can support the researcher in being both thorough and efficient in the analysis. The researcher still must interpret the data, recognize emerging concepts, ask how concepts and categories relate to one another, and push the analysis to an abstract level that promotes theory development. The creativity required of the researcher in developing theory cannot be provided by a computer (Becker 1993). However, software packages can provide opportunities for researchers to explore their data visually in a variety of ways, which when used strategically may foster creative thinking and stimulate the emergence of insights that enhance the analytic process (Bringer et al. 2006).

단독 분석 대 협업 분석
Solo analysis versus collaborative analysis

많은 근거이론 작업은 마치 컴퓨터 위에 매달려 있는 단일 연구자에 의해 분석이 완전히 수행되거나 데이터에 대한 어떤 감각이 만들어질 수 있을 때까지 테이블 위의 문서 더미를 살펴보는 것처럼 묘사된다. 실제로, 뛰어난 근거이론 연구는 단독 연구자들에 의해 수행될 수 있다. 방법 그 자체만 본다면, 반드시 연구자들 간의 협업을 필요로 하는 것은 없다. 데이터를 단독으로 작업하는 연구자들은 연구 영역에 대한 위치 및 관점에 대해 특히 반성하고, 그러한 관점이 분석과 이론 구성에 어떤 영향을 미치는지 인식하고 설명해야 한다.
Much grounded theory work is described as if the analysis is done entirely by a single researcher, hunched over a computer or sifting through piles of documents on a table until some sense can be made of the data. Indeed, outstanding grounded theory work can be done by solo researchers; there is nothing in the method that requires collaboration among researchers. Researchers working alone with their data must be particularly reflective about their position and perspective relative to the area of study, recognizing and accounting for how that perspective influences their analysis and their theory construction.


우리는 협력적으로 일하는 것이 분석 과정을 크게 향상시킬 수 있다는 것을 발견했다. 전체 과정이 그룹 차원의 노력이 될 필요는 없지만, 공동작업자의 전략적 활용이 고도로 생산적이고 조명적일 수 있는 연구 과정에서 핵심 포인트가 있다. 

  • 초기 코딩 단계 동안, 두 명 또는 세 명의 연구자가 동일한 데이터를 독립적으로 검사하고 데이터를 코드에서 나오는 것으로 인식하는 테마에 대해 데이터를 코드화하는 것이 도움이 될 수 있다. 
  • 공동작업자가 만나서 그들이 고안한 데이터와 코드에 대한 초기 인상을 논의함에 따라, 의견 불일치가 방송되고 합의가 이루어짐에 따라 보다 강력한 코딩 체계가 나타날 수 있다. 
  • 따라서 지속적 비교constant comparison 과정은 데이터뿐만 아니라 데이터에 대한 서로 다른 인식과 reading 간의 비교를 포함하도록 확장된다.
  • 또한 공동작업은 초기 코딩이 완료된 후 연구자가 해석 수준을 범주에서 개념으로, 구체적인 것에서 추상적인 것까지 올려야 하는 중요한 단계에서 가치가 있을 수 있다.
  • 우리는 종종 이 단계에서 협력자를 불러서 하나 이상의 범주의 요소를 해석적 수준에서 논의한다. 이러한 논의는 항상 분석적 사고를 개념적 수준으로 높이는 데 도움이 됩니다. 데이터 내에서 확인된 프로세스의 이유why, 방법how, 그리고 so what이 서로 다른 관점에서 검토되기 때문입니다.
  • 새로운 개념에 대한 협력적 논의는 또한 연구자에게 이러한 개념이 목표 대상자에게 어떻게 반향을 일으킬 수 있는지, 또는 연구의 전체 이야기에서 어떤 개념이 가장 중심적이거나 설득력 있는지에 대한 유용한 관점을 제공할 수 있다.

We have found that working collaboratively can enhance the analytic process significantly. The entire process need not be a group effort, but there are key points in the course of the research where strategic use of collaborators can be highly productive and illuminating. During the phase of initial coding, it can be helpful to have two or three researchers examine the same data independently and code the data for the themes that they perceive as emerging from it. As collaborators meet to discuss their initial impressions of the data and the codes they have devised, a more robust coding scheme can emerge as disagreements are aired and consensus is reached. The process of constant comparison is thus expanded to include comparisons not only among the data but among different perceptions and readings of the data. Collaboration may also be valuable after the initial coding is complete, at the critical stage where the researcher needs to raise the interpretive level from the concrete to the abstract – from categories to concepts. We often bring in collaborators at this stage to discuss the elements of one or more categories at an interpretive level. These discussions invariably assist in raising the analytic thinking to a conceptual level, as the why, how, and so what of the processes identified within the data are examined from different perspectives. Collaborative discussions of emerging concepts can also provide the researcher with a useful perspective on how these concepts might resonate with their target audience, or on which concepts are the most central or compelling in the overall story of the research.


협동은 근거이론가의 반사성을 대체하는 것이 아니다. 그러나 서로 다른 관점을 가진 동료와의 의도적인 협업은 분석 프로세스에서 데이터의 균형 잡힌 렌더링을 보장하는 데 도움이 될 수 있습니다. 다른 배경을 가진 동료들은 연구자가 자신의 학문적 상자displinary box를 넘어서 생각하도록 push할 수도 있고, 또는 그 이론이 주로 자신의 배경과 관점에 의해 형성되도록 하기보다는 데이터에서 그들의 이론 개발을 확고하게 뒷받침할 것을 상기시킬 필요가 있는 연구자를 구속할 수도 있다.

Collaboration is not a substitute for reflexivity for the grounded theorist. However, deliberate collaboration with colleagues with distinctly different perspectives can help to ensure a balanced rendering of the data in the analytic process. Colleagues from different backgrounds can push the researcher to think beyond their own disciplinary box, or rein in the researcher who needs reminding to ground their theory development firmly in the data rather than allowing that theory to be shaped primarily by their own background and perspective.

근거이론 연구의 품질 기준
Quality criteria for grounded theory research

근거이론 연구를 수행하는 절차는 고도로 구조화되어 있지만, 근거이론 연구의 품질을 평가해야 하는 기준은 명확하지 않다. 연구자와 독자 모두가 연구의 품질을 평가하기 위한 명확한 지침을 참조할 수 있는 생물 의학 연구를 지배하는 정량적 연구 전략에 비해, 근거이론 작업을 판단하는 기준은 모호하고 해석하기 어려워 보일 수 있다. 그럼에도 불구하고, 많은 저자들이 근거이론 연구를 평가하기 위한 기준을 제안했고, 이러한 기준 중 일부를 간략하게 검토하는 것이 유용하다.
Although the procedures for carrying out grounded theory research are highly structured, the criteria on which the quality of a grounded theory study should be evaluated are less clear. Relative to the quantitative research strategies that dominate biomedical research, where researchers and readers alike can refer to clear guidelines for appraising the quality of a piece of research, the criteria for judging grounded theory work can seem vague and challenging to interpret. Nonetheless, a number of authors have suggested criteria for evaluating grounded theory studies, and a brief examination of some of these criteria is useful.

 

글레이저와 스트라우스는, 그들의 기초 이론 방법에 대한 원래 설명에서, 근거이론은 다음을 갖춰야 한다고 제안했다.

  • 쉽게 이해할 수 있어야 한다.
  • 적용 대상인 실질적인 영역에 "적합"해야 한다.
  • 다양한 일상 상황에 적용할 수 있을 만큼 충분히 일반적이어야 한다.
  • 사용자가 상황 변화를 가져올 수 있을 만큼 충분한 통제 권한을 제공해야 한다.

Glaser and Strauss, in their original description of the grounded theory method, suggested that a grounded theory needed

to be readily understandable,

to “fit” the substantive area to which it was applied,

to be sufficiently general to be applied to a variety of diverse daily situations, and

to provide the user with sufficient control to bring about change in situations.

 

그들에게는 근거이론이 연구된 분야에 유용하고 적용 가능해야 했다. (글레이저 & 스트라우스 1967) 코빈과 스트라우스는 또한 "적합fit"의 중요성을 강조했는데, 이는 이 발견이 연구가 의도된 전문가와 연구에 참여한 참가자, 그리고 적용가능성 또는 유용성 모두에게 반향을 불러일으킨다는 것을 암시한다. 그들은 개념의 개발 및 상황화, 논리, 깊이, 변화, 창의성, 민감성, 메모의 증거 등 많은 다른 품질 기준을 추가했다(Corbin & Strauss 2008). 이 마지막 기준(memo)은 글레이저와 스트라우스에 의해 강조된 투명한 과정의 중요성을 말해준다. 연구자는 데이터로부터 어떻게 이론을 도출했는지 입증할 수 있어야 한다. 메모는 분석 과정을 설명하고 "인상주의적impressionistic" 이론 개발의 감각을 경계한다(Glaser & Straus 1967).

Grounded theory, to them, needed to be useful and applicable to the area studied (Glaser & Strauss 1967). Corbin and Strauss also stressed the importance of “fit”, which implies that the findings resonate with both the professionals for whom the research was intended and the participants who took part in the study, as well as applicability or usefulness. They added a number of other quality criteria, including the development and contextualization of concepts, logic, depth, variation, creativity, sensitivity, and evidence of memos (Corbin & Strauss 2008). This last criterion speaks to the importance of a transparent process, also highlighted by Glaser and Strauss. The researcher should be able to demonstrate how they derived theory from data; memos elucidate the process of analysis and guard against the sense of “impressionistic” theory development (Glaser & Strauss 1967).


차르마즈(2006)는 근거이론 연구를 평가하기 위한 4가지 핵심 기준인 신뢰도, 독창성, 공명, 유용성을 제시했다.

  • 신뢰성데이터 수집의 깊이와 범위가 분석적 주장을 뒷받침하기에 충분하다는 것을 의미한다. 신뢰성은 또한 나타나는 인수가 논리적이고 데이터에 명확하게 연결되도록 보장하는 체계적인 비교 프로세스에 따라 달라집니다.
  • 독창성연구가 새로운 통찰력, 신선한 개념적 이해를 제공하고 이론적으로나 사회적으로 중요한 분석을 제공한다는 것을 암시한다.
  • 공명resonance근거이론참가자들에게 이치에 맞으며 그들의 경험의 본질과 충만함을 포착한다는 것을 암시한다.
  • 유용성은 연구 대상 세계에 거주하는 개인이 일상 상황에서 사용할 수 있는 해석을 의미한다(Charmaz 2005, 2006).

매우 다른 패러다임의 관점에서 근거이론에 접근하는 개인에 의해 개발되었음에도 불구하고, 이러한 기준에서 상당한 중복을 인식할 수 있다. 이러한 기준은 근거이론 작업의 품질을 조사하기 위한 접근법으로 독자와 연구자를 모두 무장시킬 수 있다.

Charmaz (2006) has suggested her own set of four key criteria for evaluating grounded theory studies: credibility, originality, resonance, and usefulness.

  • Credibility implies that the depth and range of data collection is sufficient to support the analytic claims made. Credibility also depends on a systematic process of comparisons that ensures that the argument that emerges is logical and linked clearly to the data.
  • Originality implies that the research offers new insights, fresh conceptual understandings, and that the analysis is theoretically or socially significant.
  • Resonance implies that the grounded theory makes sense to the participants and captures the essence and fullness of their experience.
  • Usefulness implies interpretations that can be used in day-to-day situations by individuals who inhabit the world under study (Charmaz 2005, 2006).

One can appreciate considerable overlap in these criteria, even though they were developed by individuals who approach grounded theory from very different paradigmatic perspectives. These criteria can arm readers and researchers alike with an approach to interrogating the quality of grounded theory work.

결론
Conclusion

질적 연구 방법론 중에서, 근거이론은 의학 교육자들이 가장 쉽게 접근할 수 있다. 의학교육자라는 청중에게 근거이론의 매력은 그것의 객관주의적 기원과 관련이 있을 수 있는데, 이것은 실험적인 연구 방법에 익숙한 사람들에게 친숙하고 편안해 보일 수 있다. 근거이론은 그것의 시작 이후 상당한 진화를 거쳤고, 점점 더 구성주의적 패러다임과 더 최근에는 포스트모던 지향성을 통합했다.

Among qualitative research methodologies, grounded theory may be the most accessible to medical educators. The appeal of grounded theory to this audience might relate to its objectivist origins, which may seem familiar and comfortable to those accustomed to experimental research methods. Grounded theory has undergone considerable evolution since its inception, increasingly incorporating constructivist paradigms, and, more recently, postmodern orientations. 

 

 

 


Med Teach. 2012;34(10):850-61. doi: 10.3109/0142159X.2012.704439. Epub 2012 Aug 22.

Grounded theory in medical education research: AMEE Guide No. 70

Christopher J Watling 1Lorelei Lingard

Affiliations expand

    • PMID: 22913519

 

Abstract

Qualitative research in general and the grounded theory approach in particular, have become increasingly prominent in medical education research in recent years. In this Guide, we first provide a historical perspective on the origin and evolution of grounded theory. We then outline the principles underlying the grounded theory approach and the procedures for doing a grounded theory study, illustrating these elements with real examples. Next, we address key critiques of grounded theory, which continue to shape how the method is perceived and used. Finally, pitfalls and controversies in grounded theory research are examined to provide a balanced view of both the potential and the challenges of this approach. This Guide aims to assist researchers new to grounded theory to approach their studies in a disciplined and rigorous fashion, to challenge experienced researchers to reflect on their assumptions, and to arm readers of medical education research with an approach to critically appraising the quality of grounded theory studies.

질적자료의 주제분석: AMEE Guide No. 131 (Med Teach, 2020)

Thematic analysis of qualitative data: AMEE Guide No. 131
Michelle E. Kiger & Lara Varpio

 

 

 

도입

Introduction

 

[데이터 분석]은 '질적 프로젝트의 모든 단계 중 가장 복잡하고 불가사의하며, 문헌에서 가장 사려 깊지 않은 논의를 받는 단계'로 설명되었다(Thorne 2000). 많은 정성적 연구 논문은 데이터 분석을 알리는 방법에 대한 명확한 설명이 부족하거나, 포함되었다 하더라도, 데이터 분석 방법을 설명하는 데 사용되는 용어가 종종 부정확하게 사용되거나 완전히 잘못 레이블링된다(Sandelowski 및 Barroso 2003; Sandelowski 2010). 문제, 질적 데이터 분석을 기술하는 특정한 더 복잡한 용어들은 [광범위한 정의를 가지고 있거나] [명확한 정의를 가지고 있지 않다]. 이러한 부정확성은 투명성 부족으로 이어져 독자가 데이터 분석이 어떻게 수행되었고 결과적으로 결과를 해석하는 방법을 이해하기 어렵게 한다(Nowell et al., 2017). 또한 정성적 연구가 정량적 연구보다 덜 엄격하다는 인식에도 기여한다(클라크와 브라운 2013).
Data analysis has been described as ‘the most complex and mysterious of all of the phases of a qualitative project, and the one that receives the least thoughtful discussion in the literature’ (Thorne 2000). Many qualitative research papers lack explicit description of the methods informing data analysis, or, when included, the terms used to describe data analytic methods are often used imprecisely or are mislabeled entirely (Sandelowski and Barroso 2003; Sandelowski 2010). matters, certain Further complicating terms describing qualitative data analysis have either carried a wide range of definitions or lacked clear definitions. This imprecision leads to a lack of transparency, making it difficult for readers to understand how data analysis was performed and, consequently, how to interpret findings (Nowell et al. 2017). It also contributes to perceptions that qualitative research is less rigorous than quantitative research (Clarke and Braun 2013).

불행히도, 이러한 명확한 용어의 부족은 건강 직업 교육(HPE) 연구에 가장 자주 사용되는 정성적 데이터 분석 방법인 [주제 분석]을 괴롭힌다.

  • 주제 분석은 가변적으로 정의된 용어이며(Merton 1975; Aronson 1995; Boyatzis 1998; Attride-Stirling 2001; Braun and Clarke 2006; Joffe 2011), 정성적 방법보다 정교하지 않거나 열등한 것으로 간주되기도 했다(Braun and Clarke 2006, 2014).
  • 주제 분석을 사용하는 많은 연구자들은 후속 분석 과정과 분석을 뒷받침하는 이론 또는 인식론적 가정에 대한 충분한 설명을 제공하지 못한다(Attride-Stirling 2001; Braun and Clarke 2006).
  • 또한 주제 분석을 채택한 많은 연구는 원고에서 이를 명시적으로 분류하지 않았다. 대신, 이러한 보고서는 추가 설명 없이 단순히 '반복 테마에 대해 질적 데이터가 검사되었다'고 명시한다(Braun과 Clarke 2006).

Unfortunately, this lack of clear terminology plagues a qualitative data analysis method that is among those most frequently used in health professions education (HPE) research: thematic analysis.

  • Thematic analysis is a term that has been variably defined (Merton 1975; Aronson 1995; Boyatzis 1998; Attride-Stirling 2001; Braun and Clarke 2006; Joffe 2011), and that has even been discounted as other unsophisticated or inferior to qualitative methods (Braun and Clarke 2006, 2014).
  • Many researchers who use thematic analysis fail to provide sufficient descriptions of the analysis process followed and of the theories or epistemological assumptions undergirding the analyses (Attride-Stirling 2001; Braun and Clarke 2006).
  • Additionally, many studies that have employed thematic analysis have not explicitly labeled it as such in their manuscripts; instead, these reports simply state that ‘qualitative data were examined for recurring themes’, without offering further explanation (Braun and Clarke 2006).

분명히 연구자들 사이에는 주제 분석이 무엇을 의미하는지, 언제 그것을 사용할지, 그리고 그것을 사용하는 방법에 대해 상당한 혼란이 있다. 

Clearly there is considerable confusion amongst researchers about what thematic analysis means, when to use it, and how to use it.

 

주제 분석은 무엇인가?
What is thematic analysis?


주제 분석은 반복 패턴을 식별, 분석 및 보고하기 위해 데이터 세트를 검색하는 정성적 데이터를 분석하는 방법이다(Braun 및 Clarke 2006). 데이터를 기술하는 방법이지만 코드를 선택하고 테마를 구성하는 과정에서도 해석이 필요하다. 주제 분석의 구별되는 특징은 광범위한 이론적 및 인식론적 프레임워크 내에서 사용할 수 있고 광범위한 연구 질문, 설계 및 표본 크기에 적용할 수 있는 유연성이다. 일부 학자들은 주제 분석을 민족학(Aronson 1995) 영역 내에 있거나 현상학(Jofe 2011)에 특히 적합한 것으로 설명했지만, 브라운과 클라크(2006)는 주제 분석이 분석 방법으로서 독자적일 수 있으며 다른 정성적 연구 방법의 기초라고 주장한다. 실제로 데이터를 코드화하고, 테마를 검색하고, 결과를 보고하는 방법에 대한 주제 분석의 원칙은 근거 이론(Watling and Lingard 2012)과 담화 분석(Taylor et al. 2012)과 같은 다른 몇 가지 정성적 방법에 적용할 수 있다. 이러한 유연성 때문에, Braun과 Clarke(2006)는 보다 엄격하게 규정된 방법론methodology보다는, 주제 분석을 하나의 방법method으로 언급한다.
Thematic analysis is a method for analyzing qualitative data that entails searching across a data set to identify, analyze, and report repeated patterns (Braun and Clarke 2006). It is a method for describing data, but it also involves interpretation in the processes of selecting codes and constructing themes. A distinguishing feature of thematic analysis is its flexibility to be used within a wide range of theoretical and epistemological frameworks, and to be applied to a wide range of study questions, designs, and sample sizes. While some scholars have described thematic analysis as falling within the realm of ethnography (Aronson 1995) or as particularly suited to phenomenology (Joffe 2011), Braun and Clarke (2006) argue that thematic analysis can stand alone as an analytic method and be seen as foundational for other qualitative research methods. Indeed, the principles of thematic analysis of how to code data, to search for and refine themes, and to report findings are applicable to several other qualitative methods such as grounded theory (Watling and Lingard 2012) and discourse analysis (Taylor et al. 2012). Because of this flexibility, Braun and Clarke (2006) refer to thematic analysis as a method, as opposed to a more tightly prescribed methodology.


주제 분석은 특정한 패러다임 지향에 구속되지 않으며, 대신 사후 긍정주의자, 건설주의자 또는 비판적 현실주의 연구 접근법(Braun and Clarke 2006) 내에서 사용될 수 있다. 다양한 연구 패러다임에서 주제 분석을 사용하면 이 방법을 각각의 목적과 산출물output에 활용할 수 있다.
Thematic analysis is not bound to a particular paradigmatic orientation; instead, it can be used within post-positivist, constructivist, or critical realist research approaches (Braun and Clarke 2006). Using thematic analysis in different research paradigms entails harnessing this method to distinct purposes and outputs.

후기실증주의자는 주제 분석을 사용하여 개인의 의미와 경험에 초점을 맞춰 외부 현실에 대한 통찰력을 얻을 수 있으므로 현실에 대한 추측적 지식conjuectural knowledge 개발을 지원할 수 있다.
Post-positivists can use thematic analysis to focus on individuals’ meanings and experiences to gain insights into the external reality, thereby supporting the development of conjectural knowledge about reality.


많은 해석적 지향(예: 구성주의)에서 주제 분석은 
개별 경험에 영향을 미치는 사회적, 문화적, 구조적 맥락을 강조할 수 있다. 이로써 연구자와 연구 참가자 간의 상호작용을 통해 구성된 지식의 개발을 가능하게 하며, 사회적으로 구성되는 의미를 드러낸다(Braun과 Clarke 2006).

In many interpretivist orientations (e.g. constructivism), thematic analysis can emphasize the social, cultural, and structural contexts that influence individual experiences, enabling the development of knowledge that is constructed through interactions between the researcher and the research participants, revealing the meanings that are socially constructed (Braun and Clarke 2006).

조페(2011년)는 광범위한 데이터 분석 과정을 통해 특정 사회 구조가 어떻게 발전하는지 설명할 수 있기 때문에 주제 분석이 특히 구성주의에 적합하다고 제안한다. 이러한 방식으로, 구성주의적 주제 분석은 데이터 내에서 더 많은 잠재적이고 더 깊은 테마를 검색할 것이다.
Joffe (2011) suggests that thematic analysis is particularly suited to constructivism because, through the process of analyzing a wide range of data, it can illustrate how a certain social construct develops. In these ways, constructivist thematic analyses will search for more latent, deeper themes within the data.

마지막으로, 비판적 현실주의는 물질적 현실에 바탕을 둔 경험과 인식을 인정하지만 관심 주제 이면의 사회적 의미와 함의를 조사하려고 한다(Jofe 2011; Clarke and Braun 2017). 비판적 현실주의 프레임워크 내에서, 주제 분석을 통해 연구자들은 현실에 inform하는 권력 관계를 연구하고 억압된 인구의 목소리를 중시하는 해방 조사에 참여할 수 있다.
Finally, critical realism acknowledges experiences and perceptions grounded in a material reality but seeks to investigate social meanings and implications behind the topic of interest (Joffe 2011; Clarke and Braun 2017). Within a critical realist framework, thematic analysis can allow researchers to study the power relations informing reality and to engage in emancipatory investigations that value the voices of oppressed populations.

주제 분석을 '후기실증주의적 방식'이라고 기술한 사람들 중에서 (아론슨 1995; 보야츠 1998) Boyatzis(1998)는 [신뢰할 수 있고 객관적이며 사실에 기초한 현실을 이해하려는 포스트 포지티브] 추구와 많은 [사회과학 연구자들의 보다 해석적인 목표] 사이의 틈을 메울 수 있는 것으로 주제 분석을 전달한다. 
보야츠는 이렇게 말한다. 

 '주제 분석'은 해석적 사회과학자의 의미의 사회적 구성이 판단의 일관성으로서 신뢰성과 함께 사회적 "추상적" 또는 관찰에 대한 설명이 나타나는 것처럼 보이는 방식으로 표현되거나 포장될 수 있도록 한다.
Among those who have described thematic analysis as a post-positivist method (Aronson 1995; Boyatzis 1998). method Boyatzis (1998) forwards thematic analysis as a that can bridge the chasm between the post-positivist pursuit of understanding a reliable, objective, fact-based reality, and the more interpretive aims of many social science researchers. Boyatzis posits that 

 ‘thematic analysis allows the interpretive social scientist’s social construction of meaning to be articulated or packaged in such a way, with reliability as consistency of judgment, that description of social “facts” or observations seems to emerge’ (p. xiii).


주제 분석 사용 시기
When to use thematic analysis


분석 프로세스를 명확하게 제시한 사람들(Braun and Clarke, 2006, 2012; Clarke 및 Braun 2017) 덕분에, 연구자들은 주제 분석이 초보 정성 연구자들이 마스터하기 좋은 첫 번째 분석 방법이라고 제안했다 (Braun and Clarke 2006, 2012; Clarke and Braun 2017; Nowell et al. 2017). 그러나 다른 연구 또는 분석 방법과 마찬가지로 주제 분석을 사용하는 선택은 추적하기 쉬운 분석 방법을 선택하려는 욕망보다 연구 자체의 목표에 기초해야 한다고 주장한다. 주제 분석은 데이터 세트(Braun 및 Clarke 2012)에 걸쳐 일련의 경험, 생각 또는 행동을 이해하고자 할 때 사용할 적절하고 강력한 방법이다. 공통의 의미나 공유된 의미를 검색하도록 설계되었기 때문에 [단일 개인이나 데이터 항목의 고유한 의미나 경험을 검토하는 데 적합하지 않다]. 마지막으로, 다른 정성적 연구 방법과의 관련성 때문에, 주제 분석의 단계는 (프로세스의 일부로 테마에 대한 데이터 세트 코딩과 검색에 의존하는) 근거 이론, 민족학 및 기타 정성적 방법론의 단계와 부합echo한다.
Thanks in large part to those who have clearly laid out its analytical processes (Braun and Clarke, 2006, 2012; Clarke and Braun 2017), researchers have suggested that thematic analysis is a good first analytic method for novice qualitative researchers to master (Braun and Clarke 2006, 2012; Clarke and Braun 2017; Nowell et al. 2017). However, as with any research or analytic method, we would argue that the choice to use thematic analysis should be based on the goals of the research itself, more than a desire to select an easy-to-follow method of analysis. Thematic analysis is an appropriate and powerful method to use when seeking to understand a set of experiences, thoughts, or behaviors across a data set (Braun and Clarke 2012). Since it is designed to search for common or shared meanings, it is less suited for examining unique meanings or experiences from a single person or data item. Finally, because of its relevance to other methods of qualitative research, the steps of thematic analysis echo those of grounded theory, ethnography, and other qualitative methodologies that also rely on coding and searching data sets for themes as part of their processes. 

다른 정성적 분석 방법과 관련하여 주제 분석을 배치하면 방법의 범위와 목적을 이해하는 데 도움이 될 수 있다.
Situating thematic analysis in relationship to other qualitative analysis methods can help us understand the method’s scope and purpose.

Sandelowski와 Barroso(2003)는 정성적 분석 방법이 분석 중에 [데이터가 변환되는transform 정도]에 따라 정의되는 연속체를 따른다고 주장한다.

Sandelowski and Barroso (2003) contend that qualitative analysis methods fall along a continuum defined by the degree to which data is transformed during analysis. 

 

이 연속체의 한 끝에는 [데이터가 유의하게 변환되지 않는 순수하게 기술적인 분석]이 있다. 예를 들어, 샌델로프스키와 바로수(2003)가 주장하는 주제 조사topical survey는 인터뷰나 포커스 그룹 참가자가 제기한 주제 목록이나 재고를 (종종 빈도나 백분율로) 보고하는데 집중하지만, [참가자를 표본으로 추출하거나 결과를 해석]하려는 노력을 거의 또는 전혀 기울이지 않기 때문에 진정한 질적 연구로 분류되어서는 안 된다고 주장한다.
This continuum is grounded at one pole with purely descriptive analyses in which the data is not significantly transformed. Analysis methods at this far end include, for example, topical surveys which Sandelowski and Barroso (2003) argue should not be classified as true qualitative research because they focus on reporting lists or inventories of topics raised by interview or focus group participants, often as frequencies or percentages, but make little or no effort to purposefully sample participants or interpret findings.

연속체의 다른 쪽 끝에는 [데이터의 상당한 변환이 있는 고도로 해석적인 분석]이 있습니다. 이 극에는 데이터의 변환과 심층 해석을 수반하는 현상학과 같은 방법이 있다. 해석적 현상학적 분석은 개인의 경험과 사람들이 그들에게 붙이는 의미들이 관심있는 질문을 어떻게 알릴 수 있는지 자세히 살펴본다. (Smith와 Osborn 2003)
At the other end of the continuum are highly interpretive analyses in which there is considerable transformation of the data. Located at this pole are methods, such as phenomenology, which involve transformation and deep interpretation of data. Interpretative phenomenological analysis looks in detail at how individual experiences and the meanings that people attach to them can inform a question of interest (Smith and Osborn 2003).

우리는 주제 분석이 연속체에 걸쳐 사용될 수 있지만, 그것은 거의 자연스럽게 두 극 사이의 중심 근처에 도달한다고 제안한다. 주제 분석을 통해 데이터의 요소를 재구성, 재해석 및/또는 연결하는 테마를 구성합니다. 따라서 테마는 단순히 데이터를 분류하고 레이블을 지정하는 데 사용되는 조직 도구만이 아닙니다. 주제 분석의 프로세스는 연구자가 [데이터를 설명하는 조직 및 분류 레이블]을 개발하도록 하는 반면, 주제 분석은 [해석 및 데이터 변환 프로세스]로 더욱 나아간다.

We suggest that, while thematic analysis can be used across the continuum, it most naturally lands near the center between the two poles. Through thematic analysis, the research constructs themes to reframe, reinterpret, and/or connect elements of the data. Thus, themes are not merely organizational tools used to classify and label data. While processes of thematic analysis will have the researcher developing organizational and classification labels to describe the data, thematic analysis goes further into the interpretation and data transformation processes. 

 

그러나 주제 분석이 분석 연속체의 순수하게 서술적인 극에 속하지 않는다면, 또한 고도로 해석적인 극에도 속하지 않는다. 주제 분석은 일반적으로 기초 이론의 중심 목표인 이론의 개발 지점으로 데이터 해석과 변환에 관여하는 데 사용되지 않는다. 대신, 주제 분석은 가장 자연스럽게 두 극 사이에 위치한다. 단순한 설명과 분류보다는 자료에 더 많이 관여하지만, 그렇다고 해서 이론의 개발까지는 확장되지 않는다.

But if thematic analysis does not belong at the purely descriptive pole of the analysis continuum, it also does not belong at the highly interpretive pole. Thematic analysis is generally not used to engage in data interpretation and transformation to the point of developing theory, the central goal of grounded theory (Glaser and Strauss 1967). Instead, thematic analysis lands most naturally between the poles–engaging in more than description and categorization, but not extending so far as to develop theory.

 

테마란 무엇인가?
What is a theme?

 

주제 분석의 특정 단계를 조사하기 전에 이 분석 방법에서 테마라는 용어가 무엇을 의미하는지 정의하는 것이 중요합니다. [주제]란 연구 질문에 inform하는 데이터에서 도출된 '패턴화된 반응 또는 의미'(Braun and Clarke 2006, 페이지 82)이다. 데이터 세트의 'manifest content'에 대한 설명과 조직을 제공하는 범주에 반대하여 볼 때, [주제]는 더 많은 수준의 데이터 해석과 통합을 수반하는 보다 추상적인 실체이다(Nowell et al., 2017). 주제 분석에 참여할 때, 연구자들은 주제와 관련된 [특정 아이디어 또는 항목이 데이터 세트에 나타나는 횟수에 관계없이] 테마를 식별할 수 있다. 또한 테마의 중요성 또는 중심성은 데이터 내에서 테마의 출현 빈도를 반드시 반영하는 것은 아니다(Braun and Clarke 2006; Nowell et al. 2017). 

Before delving into the specific steps of thematic analysis, it is important to define what the term theme means in this analysis method. A theme is a ‘patterned response or meaning’ (Braun and Clarke 2006, p. 82) derived from the data that informs the research question. Viewed in opposition to a category–which provides description and organization to the ‘manifest content’ of a data set–a theme is a more abstract entity that involves a greater degree of interpretation and integration of data (Nowell et al. 2017). When engaging in thematic analysis, researchers can identify themes irrespective of the number of times a particular idea or item related to that theme appears in a data set. Furthermore, the importance or centrality of a theme is not necessarily reflective of the frequency of its appearance within the data (Braun and Clarke 2006; Nowell et al. 2017).

 

 

테마는 semantic 또는 latent로 구분될 수 있다.

  • 보다 [명시적이거나 표면적인 의미를 다루는 의미적semantic(종종 매니페스트manifest라고도 함)] 또는
  • 보다 깊고 근본적인 의미, 가정 또는 이념을 반영하는 잠재적latent으로 분류될 수 있다(Boyatzis 1998; Braun and Clarke 2006).

Themes can be classified as either 

  • semantic (also often labeled as manifest), which address more explicit or surface meanings of data items, or 
  • latent, which reflect deeper, more underlying meanings, assumptions, or ideologies (Boyatzis 1998; Braun and Clarke 2006). 

연구자는 어떤 주제를 파악해야 할지 높은 유연성을 가지고 있지만, 연구 질문을 다루는 중요한 통찰력을 제공하는 주제(Braun과 Clarke 2006)를 파악하기 위해 노력해야 한다.

The researcher has great flexibility in which themes to identify, but he or she should strive to identify themes that provide important insights that address the research question (Braun and Clarke 2006).

연구자들은 테마 식별에 [귀납적 또는 연역적] 접근법을 사용할 수 있다(Braun and Clarke 2006, 2012).

  • 근거 이론에 사용되는 귀납적 접근법은 연구자의 데이터에서 테마를 도출한다(Varpio et al. 2019). 이러한 테마는 데이터 중심적이기 때문에 참가자들에게 던진 정확한 질문(예: 참가자가 주제를 벗어난 경우)을 반영하지 않을 수 있으며, 주제에 대한 연구자 자신의 관심사나 믿음을 반드시 반영하는 것은 아니다(Braun과 Clarke 2006).
  • 반대로, 연역적 접근법은 기존의 이론, 프레임워크 또는 다른 연구자가 주도하는 초점을 사용하여 관심 주제를 식별한다(Braun and Clarke 2012; Varpioetal.2019).

Researchers can employ an inductive or deductive approach to theme identification (Braun and Clarke 2006, 2012). 

  • An inductive approach, as used in grounded theory, derives themes from the researcher’s data (Varpio et al. 2019). Since these themes are data driven, they might not mirror the exact questions asked of participants (e.g. if participants veered off topic), and they are not necessarily reflective of the researcher’s own interests or beliefs on the subject (Braun and Clarke 2006).  
  • Conversely, deductive approaches use a pre-existing theory, framework, or other researcherdriven focus to identify themes of interest (Braun and Clarke 2012;Varpioetal.2019). 

따라서

  • 귀납적 접근법은 전체 데이터 본문에 대한 보다 폭넓고 광범위한 분석을 제공하는 경향이 있는 반면,
  • 연역적 접근법은 데이터의 특정 측면 또는 기존 이론이나 프레임의 맥락에서 가장 잘 조명되거나 이해될 수 있는 특정 발견을 연마하는 데 유용하다(Braun and Clarke 2006).


Therefore, 

  • an inductive approach tends to provide a broader, more expansive analysis of the entire body of data, whereas 
  • a deductive approach is useful for honing in on a particular aspect of the data or a specific finding that could be best illuminated or understood in the context of a pre-existing theory or frame (Braun and Clarke 2006). 




주제 분석에 참여하는 방법
How to engage in thematic analysis


Clarke와 Braun의 주제 분석은 후속 단계를 연구자가 추가 조사를 받을 가치가 있는 새로운 데이터 또는 새로 등장한 주제에 비추어 이전 단계로 돌아가도록 유도할 수 있는 선형 프로세스가 아니라 [재귀적 프로세스]로 설계되었다는 점에 유의해야 한다. 
It is important tonote that Clarke and Braun’s thematic analysis is designedto be a recursive, rather than linear, process in which sub-sequent steps may prompt the researcher to circle back to earlier steps in light of new data or newly emergingthemes that merit further investigation. 


이러한 단계를 설명하기 위해 소아 레지던시 프로그램 내의 연속성 클리닉에서 환자 소유 경험을 조사하기 위해 수행한 연구의 원본 데이터를 사용한 예를 제공한다(각 단계의 데이터 변환에 대한 그림은 상자 1 참조).
To illustrate these steps, we offer an example using original data from a study we performed examining the experience of patient ownership in continuity clinics within a pediatric residency program (see Box 1 for illustrations of each step’s transformation of the data).


이 예시에서, 우리는 주제 분석에 [귀납적인 접근 방식]을 채택하고 [구성주의 인식론] 내에서 일한다.
In this example, we employ an inductive approach to thematic analysis, and work within a constructivist epistemology.

 

 

 

 

1단계: 데이터에 익숙해지는 단계
Step 1: Familiarizing yourself with the data

주제 분석의 프로세스의 첫 번째 단계는 전체 데이터 세트에 익숙해지는 것으로, 데이터의 반복적이고 능동적인 읽기를 수반한다(Braun 및 Clarke 2006). 연구에 따라 데이터 세트에는 인터뷰, 포커스 그룹, 기록된 관찰, 필드 노트, 저널 항목 또는 사진이나 비디오와 같은 다른 미디어가 포함될 수 있다(Thorne 2000; Nowell et al. 2017). 데이터 코딩과 테마 검색을 즉시 시작하는 것이 바람직할 수 있지만, 먼저 전체 데이터 세트를 숙지하는 것은 원시 데이터에 대한 중요한 방향을 제공할 것이며 이후의 모든 단계를 위한 기초가 될 것이다. 전사해야 하는 오디오 데이터의 경우, 전사 과정은 시간이 많이 걸릴 수 있지만 데이터에 익숙해지는 훌륭한 방법으로도 작용할 수 있다. 연구자가 이 단계를 용이하게 하기 위해 음성 인식 소프트웨어를 사용하거나 전사 서비스를 고용하는 경우, 원본 오디오 녹음과 비교하여 정확한 내용을 확인하는 것도 마찬가지로 유용할 수 있다.
The first step in thematic analysis’s process is becoming familiar with the entire data set, which entails repeated and active reading through of the data (Braun and Clarke 2006). Depending on the study, the data set might include interviews, focus groups, recorded observations, field notes, journal entries, or other media such as photographs or videos (Thorne 2000; Nowell et al. 2017). While it can be tempting to begin coding data and searching for themes immediately, familiarizing oneself with the entirety of the data set first will provide a valuable orientation to the raw data and is foundational for all subsequent steps. For audio data that need to be transcribed, the process of transcription can be time-consuming but also serves as an excellent way to become familiar with the data. If researchers use voice-recognition software or hire transcription services to facilitate this step, checking the transcripts against original audio recordings for accuracy may be similarly useful.

 

2단계: 초기 코드 생성
Step 2: Generating initial codes


프로세스의 첫 번째 분석 단계인 코딩은 세분화되고 구체적인 수준에서 데이터를 구성하는 데 도움이 됩니다. 1단계의 친숙화 작업 후, 연구자들은 관심 있는 잠재적 데이터 항목, 질문, 데이터 항목 간의 연결 및 기타 예비 아이디어에 대해 메모하기를 시작할 수 있다. 이것이 2단계의 코딩 프로세스의 시작입니다. 이 단계의 작업은 [테마가 아닌 코드를 생성]합니다. Boyatzis(1998)는 코드를 '[t] 현상과 관련하여 의미 있는 방식으로 평가할 수 있는 원시 데이터 또는 정보의 [가장 기본적인 세그먼트] 또는 요소'로 정의했다. (p. 63)
As the first truly analytic step in the process, coding helps to organize data at a granular, specific level. After step 1’s familiarization work, researchers can begin to take notes on potential data items of interest, questions, connections between data items, and other preliminary ideas. This is the beginning of step 2’s coding process. This phase of work generates codes, not themes. Boyatzis (1998) defined a code as ‘[t]he most basic segment, or element, of the raw data or information that can be assessed in a meaningful way regarding the phenomenon’ (p. 63). 


코드는 다른 코드와 중복되지 않도록 [충분히 잘 정의되고 구분]되어야 한다. 적용할 코드를 요약하고 정의하여 코딩 프로세스를 안내하는 더 큰 코딩 프레임워크 또는 코딩 템플릿(때로는 코딩 매뉴얼이라고도 함)에 논리적으로 적합해야 한다.
A code should be sufficiently well-defined and demarcated such that itdoes not overlap with other codes and should fit logically within a larger coding framework or coding template (some-times also called coding manuals) that guides the coding process by outlining and defining the codes to be applied(Crabtree and Miller 1999; Attride-Stirling 2001; King 2004;Nowell et al. 2017). 


테마 간의 구별과 유사하게, 코드는 더 의미론적 또는 잠재적 의미로 묶일 수 있으며, 코딩 프레임워크는 

  • 귀납적, 데이터만으로 제기된 관련 문제의 반영, 이거나
  • 연역적, 특정한 이론이나 이론적인 틀에 의해 인도 일 수 있다. 

Similar to distinctions among themes, codes can be tied to more semantic or latent meanings (Braun and Clarke 2012), and the coding framework can be

  • inductive, reflective of pertinent issues raised by the data alone, or
  • deductive, guided by specific theories or theoretical frameworks (Attride-Stirling 2001; Braun and Clarke 2006).

 

관찰과 아이디어에서 [코드가 어떻게 개발되었는지를 기록]함으로써, 연구원은 연구자의 해석과 분석의 신뢰성을 지원하기 위한 [감사 추적audit trail 생성 과정]을 시작할 수 있다(링컨과 구바 1985; Nowell et al.

By recording how codes developed from observations and ideas, the researcher can begin the process of creating an audit trail to support the trustworthiness of a researcher’s interpretations and analysis (Lincoln and Guba 1985; Nowell et al. 2017).

[코딩 프레임워크 또는 템플릿이 정의]되면, 연구자들은 데이터 추출물에 관련 코드를 라벨링하여 [전체 데이터 세트에 동일한 코드를 적용]하며, 이후 테마 개발(Braun과 Clarke 2006)을 알릴 수 있는 항목 간의 [연결 또는 잠재적 패턴을 기록]한다.
Once the coding framework or template is defined, researchers then apply the same codes to the entire data set by labeling data extracts with relevant codes, making note of any potential patterns or connections between items that might inform subsequent theme development (Braun and Clarke 2006).

또한 관련성이 있는 경우 단일 추출물에 여러 개의 코드로 레이블을 지정할 수 있습니다(Braun 및 Clarke 2006). 연구자가 전체 데이터 세트를 코드화하면, 3단계, 즉 테마 검색에 대비하여 코드로 데이터를 수집할 수 있습니다.

Also, a single extract can be labeled with multiple codes if relevant (Braun and Clarke 2006). Once the researcher has coded the entire data set, he or she can collate the data by code in preparation for step 3: the search for themes.

 

 

3단계: 테마 검색
Step 3: Searching for themes


세 번째 단계에는 (보다 광범위한 중요성을 갖는) [잠재적 테마를 찾기 위한 코드화되고 수집된 데이터 추출물의 검사examination]가 포함된다(Braun 및 Clarke 2006). Braun과 Clarke (2012)는 전체 분석이 집이라고 볼 때 [개별 코드]는 벽돌과 타일이고 [테마]는 벽과 지붕이라고 비유합니다. 테마 식별 프로세스(벽과 지붕을 만드는 방법)는 기본적으로 능동적이고 해석적인 프로세스입니다.
The third step involves examination of the coded and collated data extracts to look for potential themes of broader significance (Braun and Clarke 2006). Braun and Clarke (2012) offer an analogy that, if your entire analysis is seen as a house, the individual codes are the bricks and tile, and themes are the walls and the roof. The process of theme identification – how those walls and roof are built – is fundamentally an active and interpretive process.

테마는 단순히 데이터로부터만 나타나는 것이 아니라(Varpio et al., 2017), 연구자에 의해 코드가 서로 어떻게 관련되어 있는지 분석, 결합, 비교, 심지어 그래픽 맵핑함으로써 테마가 구성된다.
Themes do not simply emerge from the data (Varpio et al. 2017); instead, themes are constructed by the researcher through analyzing, combining, comparing, and even graphically mapping how codes relate to one another.

  • 귀납적 분석에서 연구자들은 코딩된 데이터에서 테마를 명시적으로 도출하기 때문에 식별된 테마는 원본 데이터와 더 밀접하게 연결되고 전체 데이터 세트의 반영된다(Braun 및 Clarke 2006). 반대로
  • 연역적 분석에서, 미리 정의된 이론 및/또는 이론적 프레임워크는 테마 개발을 알려줄 것이며, 따라서 이러한 테마는 종종 데이터 세트의 특정 측면이나 특정 관심 질문에 더 초점을 맞춘다(Braun and Clarke 2006).
  • In inductive analysis, researchers derive themes expressly from the coded data, so the themes identified will be more closely linked to the original data and reflective of the entire data set (Braun and Clarke 2006). 
  • Conversely, in deductive analysis, predefined theories and/or theoretical frameworks will inform theme development, so these themes often focus more on a particular aspect of the data set or a specific question of interest (Braun and Clarke 2006).


테마를 만들고 구성할 때, 테마 맵은 개념 간의 교차 연결과 주요 테마 및 하위 테마 간의 교차 연결을 시각적으로 입증하는 데 유용하다(Braun과 Clarke 2006).
When creating and organizing themes, thematic maps are useful for visually demonstrating cross-connections between concepts and among main themes and subthemes (Braun and Clarke 2006).

그림 1과 2는 우리 연구의 주제 맵의 예를 보여준다.
Figures 1 and 2 illustrate examples of thematic maps from our study.

테마는 독립적으로 의미 있어야 하지만 '[일관성 있는 전체], 즉, 분석적 이야기를 형성하기 위해 협력해야 한다'(클라크와 브라운 2014). 브라운과 클라크(2006)와 킹(2004)은 이 분석 단계에서 포함시킬 것을 권고했다. 연구자는 잠재적인 중요성을 가질 수 있는 어떤 주제와 모든 주제를, 그것들이 연구 문제와 직접적으로 관련이 있는 것처럼 보이든 그렇지 않든, 그리고 그것들에 속하는 데이터의 규모나 양에 관계없이 메모해야 한다. '기타' 테마를 구성하는 데이터 양에 대해 정의된 임계값이 없습니다. 연구자들은 기존의 주제 체계에 잘 맞지 않는 고아 코드orphan codes를 통합하는 테마를 만들 수도 있다(Braun and Clarke 2006).
Themes should be independently meaningful but also ‘work together to form a coherent whole–an analytic story’ (Clarke and Braun 2014). Both Braun and Clarke (2006) and King (2004) recommended being inclusive at this stage of analysis. The researcher should make note of any and all themes of potential significance, whether or not they seem directly related to the study question, and regardless of the volume or quantity of data that falls under them. No defined threshold exists for the amount of data that constitutes a ‘miscellaneous’ theme. Researchers can even create a theme to incorporate orphan codes that do not fit well within one’s existing thematic scheme (Braun and Clarke 2006).

 

 

 

 

4단계: 테마 검토
Step 4: Reviewing themes

 

브라운과 클라크(2006)는 4단계를 2단계 분석 과정으로 설명했다.
Braun and Clarke (2006) described step 4 as a two-level analytical process.

[첫 번째 분석 수준]에서, 연구원은 적절한 적합성을 보장하기 위해 각 테마 내에 배치된 코드화된 데이터를 살펴봅니다. 각 테마에 따라 모든 관련 코드 및 데이터 추출물을 검토하고 다음을 묻습니다. 

  • 각 테마는 적절한 지원 데이터가 있습니까? 
  • 그 주제를 뒷받침할 때 데이터가 일관성 있게 포함되었는가? 
  • 어떤 테마는 너무 크거나 다양하진 않은가?

In the first level of analysis, the researcher looks at coded data placed within each theme to ensure proper fit. He or she reviews all relevant codes and data extracts under each theme and asks: 

  • Does each theme have adequate supporting data? 
  • Are the data included coherent in supporting that theme? 
  • Are some themes too large or diverse? 

각 테마 내의 데이터는 적절한 공통성과 일관성을 가져야 하며, 테마 간 데이터는 충분히 구별가능distinct enough 해야 한다(Attride-Stirling 2001; Braun과 Clarke 2006). 이 때 데이터 추출물을 다시 정렬하고 테마를 수정하여 코드화된 데이터를 더 잘 반영하고 캡처할 수 있다. 테마를 추가, 결합, 분할 또는 삭제할 수 있습니다.

Data within each theme should have adequate commonality and coherence, and data between themes should be distinct enough to merit separation (Attride-Stirling 2001; Braun and Clarke 2006). At this point, data extracts can be re-sorted and themes modified to better reflect and capture coded data. Themes can be added, combined, divided, or even discarded.

이 첫 번째 수준의 분석은 연구자가 수정된 [주제도theme map]가 최종 분석에 포함될 코드화된 모든 데이터를 적절히 포함한다고 확신하면 완료된다(Braun and Clarke 2006). 이 과정 내내, 연구자들은 테마가 개발, 수정 및/또는 제거되는 방법에 대해 내린 사고 과정과 결정에 관한 상세한 메모 또는 메모를 보관해야 한다. 이러한 메모는 연구자들이 주제 간의 연결을 만들고, 또한 연구 결과의 신뢰성을 강화하는 감사 추적을 만드는 데 도움이 될 수 있다(Nowell et al., 2017).
This first level of analysis is complete when the researcher is confident that the revised thematic map adequately covers all of the coded data to be included in the final analysis (Braun and Clarke 2006). Throughout this process, researchers should keep detailed notes, or memos, regarding their thought processes and decisions made regarding how themes were developed, modified, and/or removed. Such memos can help researchers make connections between themes and also create an audit trail that bolsters the trustworthiness of their findings (Nowell et al. 2017).

[두 번째 단계]는 전체 데이터 세트와 관련하여 테마에 유사한 질문 세트를 적용합니다. 여기서 연구원은 [개별 테마가 데이터 세트에 의미 있게 적합한지] 여부 및 [주제 맵이 데이터의 전체 본문을 정확하고 적절하게 나타내는지] 여부를 결정한다(Braun and Clarke 2006). [주제 맵]은 [테마가 어떻게 상호 연관되어 있는지], 그리고 그것들이 [어떻게 관심 질문이나 구조를 나타내는지]를 명확하게 보여야 한다. 이 과제를 달성하기 위해, 연구원은 전체 데이터 세트를 다시 읽어 테마를 재점검하고 이 단계에서 새로 작성 또는 수정된 테마에 해당하는 추가 데이터에 대해 재코드한 다음, 그에 따라 테마 맵을 수정한다(Braun 및 Clarke 2006).
Level two applies a similar set of questions to the themes in relation to the entire data set. The researcher here decides if individual themes fit meaningfully within the data set and whether the thematic map accurately and adequately represents the entire body of data (Braun and Clarke 2006). The thematic map should clearly demonstrate how themes interrelate and how they represent the question or construct of interest. To accomplish this task, the researcher re-reads the entire data set to reexamine themes and to re-code for additional data that falls under the themes that have been newly created or modified in this phase, then revises the thematic map accordingly (Braun and Clarke 2006).

4단계는 주제 분석의 전체 프로세스의 재귀적 특성에 대한 명확한 예를 제공합니다. 코드와 테마를 다시 읽고 수정하는 것은 분석 과정의 일부이다.

Step 4 provides a clear example of the recursive nature of the entire process of thematic analysis. Re-reading and revising codes and themes are expected parts of the analytic process.

 

이러한 반복 프로세스는 이론적으로 무한정 계속될 수 있지만, King(2004)과 Braun and Clarke(2006)는 연구 질문과 관련이 있는 것으로 보이는 모든 데이터 항목이 코딩 체계에 통합되고, 테마가 일관되며, 추가적인 개선으로 실질적인 변화가 발생하지 않으면 개정을 중단할 수 있다고 권고했다.
While this iterative process could theoretically continue indefinitely, King (2004) and Braun and Clarke (2006) recommended that the revisions could cease once all data items that appear relevant to the study question have been incorporated into the coding scheme, themes are coherent, and additional refinements are not yielding substantial changes.


 

5단계: 테마 정의 및 이름 지정
Step 5: Defining and naming themes

 

 

일단 주제 지도가 다듬어지면, 5단계는 연구자가 [각 주제에 대한 정의와 서술적 설명]을 만드는 것이며, [광범위한 연구 질문의 관점에서 왜 그것이 중요한지]를 생각해야 한다. 최종 보고서에 포함될 [테마의 이름을 검토]하여 간략하고 적절하게 설명되었는지 확인합니다(Braun과 Clarke 2006). 
Once the thematic map has been refined, step 5 finds the researcher creating a definition and narrative description of each theme, including why it is important to the broader study question (Braun and Clarke 2006). The names of themes to be included in the final report are reviewed to ensure they are brief and adequately descriptive (Braun and Clarke 2006).

 

그런 다음 연구원은 각 테마의 가장 중요한 측면과 데이터 세트의 어떤 측면을 다루는지 강조하여 각 테마 내에서 코드화된 데이터가 어떻게 그리고 왜 

  • 고유한 통찰력을 제공하고,
  • 더 큰 질문에 대한 전반적인 이해에 기여하며,
  • 다른 테마와 상호작용하는지
    ...에 대한 일관된 설명을 만든다(Braun과 Clarke 2006). 

The researcher then hones in on the most important aspect of each theme and which aspects of the data set it covers, creating a coherent narrative of how and why the coded data within each theme

  • provide unique insights,
  • contribute to the overall understanding of larger questions, and
  • interact with other themes (Braun and Clarke 2006).

 

이러한 질문을 다루면서, 연구원은

  • 주제 간 중복 영역을 찾고,
  • 새로운 하위 테마를 식별하고(데이터 내에서 주제에 대한 보다 상세한 설명을 제공하는 것과 계층 구조를 설명하는 데 모두 사용할 수 있음),
  • 각 테마가 수반하거나 포함하는 것의 범위를 명확하게 구분한다(Braun과 Clarke 2006). 

While addressing these questions, the researcher

  • looks for areas of overlap between themes,
  • identifies emergent sub-themes (which can be used both to provide more detailed accounts of themes and to describe hierarchies within the data), and
  • clearly delimits the scope of what each theme entails or includes (Braun and Clarke 2006).

 

이 때가 테마의 주요 특징을 설명하는 [최종 보고서에 표시할 데이터 추출물을 선택]하고 각 테마가 말하는 더 넓은 [스토리에 대한 중요성을 설명하는 컨텍스트를 제공하는 데이터 추출물]을 만들 좋은 시간이다.

This is a good time to select data extracts to be presented in the final report that illustrate key features of themes and to create narratives surrounding them that provide context to explain their importance to the broader story each theme tells (Braun and Clarke 2012).

 

6단계: 보고서/매뉴얼 작성
Step 6: Producing the report/manuscript


이 마지막 단계에는 최종 분석 및 소견 설명(Braun and Clarke 2006)을 작성하는 것이 포함된다. 쓰기 프로세스의 요소들은 이미 노트 작성, 테마 설명, 그리고 이전 단계에서 대표적인 데이터 추출물의 선택 과정을 통해 시작되었다. 실제로 킹(2004)은 연구 결과를 제시하는 마지막 단계를 '별도의 단계'가 아니라, 이미 발생한 분석 및 해석의 '계속continuation'이라고 설명했다( 페이지 267).
This final step involves writing up the final analysis and description of findings (Braun and Clarke 2006). Elements of the writing process have already begun through the processes of note taking, describing of themes, and selection of representative data extracts in prior steps. In fact, King (2004) described the final step of presenting findings as a ‘continuation’ of the analysis and interpretation that has already happened as opposed to a ‘separate stage’ (p. 267).


최종 보고서는 코드와 테마에 대한 단순한 설명을 넘어서야 한다. 보고서는 연구자가 [어떻게 데이터를 해석하였는지 뿐만 아니라, 왜 연구자의 주제 선택과 데이터의 해석이 중요하고 정확한지]를 명확하고 간결하며 논리적인 설명을 제공하는 내러티브로 엮어야 한다(Braun and Clarke 2006, 2012). 서술적 설명과 대표적인 데이터 추출물(예: 참가자의 직접 인용)을 모두 사용하여 분석을 통해 데이터를 설명하고, 연구자의 설명이 연구 질문에 풍부하고 완전하게 답하는 이유에 대한 주장을 제공해야 한다(Braun과 Clarke 2006). 모든 직접 데이터 추출물은 의미를 이해하는 적절한 컨텍스트를 포함해야 하며 그 중요성을 설명하는 잘 짜여진 텍스트 설명에 의해 서포트되어야 한다.
The final report should move beyond mere description of codes and themes (King 2004). The report should weave a narrative that provides a clear, concise, and logical account not only how a researcher interprets the data, but also why his or her selection of themes and interpretation of the data are important and accurate (Braun and Clarke 2006, 2012). Using both narrative descriptions and representative data extracts (e.g. direct quotations from participants), the analysis should describe the data and provide an argument for why the researcher’s explanation richly and fully answers the research question (Braun and Clarke 2006). Any direct data extracts should contain adequate context to understand their meaning and be supported by interwoven textual description that explains their importance (Braun and Clarke 2012).

토론 섹션은 주제를 더 큰 질문과 연관시키고, 발견의 함의를 논의하며, 주제를 발생시킨 가정이나 전제조건에 의문을 제기함으로써 분석을 확장할 수 있다(Braun and Clarke 2006).
The discussion section can broaden the analysis by relating themes to larger questions, discussing implications of findings, and questioning the assumptions or preconditions that gave rise to the themes (Braun and Clarke 2006).

관련 문헌을 참조하는 것은 또한 특정 테마가 선택된 이유에 대한 지원을 구축하고(Aronson 1995년), 현존하는 문헌 본문 내에 발견물을 배치함으로써 분석의 강점을 더할 수 있다(Tuckett 2005년).
Referencing related literature can also add to the strength of the analysis by building support for why particular themes were selected (Aronson 1995) and situating findings within the extant body of literature (Tuckett 2005).

주제 분석이 데이터 분석을 수행하는 방법에 대해 연구자에게 허용하는 유연성을 고려할 때, 어떤 선택을 하였는지 밝히는 것은 특히 중요하다(예: 코딩 및 주제 식별에 귀납적 또는 연역적 분석 사용). 그리고 (패러다임적 지향을 포함하여) 원고 전체에 걸쳐 분석의 기초가 되는 가정들을 밝히는 것이 중요하다(Braun and Clarke 2006).

 

Given the flexibility that thematic analysis allows researchers regarding how to conduct data analysis, it is particularly important to identify choices (such as using inductive or deductive analysis in coding and identifying themes) and assumptions (including paradigmatic orientation) that underlie the analysis throughout the manuscript (Braun and Clarke 2006). 

 

주제 분석의 장점
The advantages of thematic analysis

 

다른 많은 정성적 방법과 비교했을 때, 주제 분석은 비교적 간단하게 학습하고 적용할 수 있다. 분석을 알리기 위해 이론을 사용할 필요가 없기 때문에(즉, 순수하게 귀납적일 수 있음) 그리고 이 분석 방법의 사용에 대한 설명과 예가 출판되어 있기 때문에, 주제 분석은 경험이 적은 연구자들이 꽤 쉽게 접근할 수 있다(2004년; 브라운과 클라크 2006년; Nowell et al. 2017년). 
As compared to many other qualitative methods, thematic analysis is relatively simple to learn and apply. Because it does not require the use of theory to inform analysis (i.e. it can be purely inductive) and because there are published descriptions and examples of the use of this analysis method, thematic analysis is quite accessible to less experienced researchers (King 2004; Braun and Clarke 2006; Nowell et al. 2017). 


동시에 연구자가 다양한 데이터 세트의 주요 특징을 요약하고 강조하며 해석할 수 있는 강력한 데이터 분석 방법이다. 게다가, 그것의 방법은 수많은 다른 형태의 질적 분석의 기초가 된다; 사실, Braun과 Clarke(2006)는 그것이 연구자들이 배우는 첫 번째 질적 분석 방법이어야 한다고 주장했다.
At the same time, it is a powerful method for analyzing data that allows researchers to summarize, highlight key features of, and interpret a wide range of data sets. Furthermore, its methods are foundational to numerous other forms of qualitative analysis; in fact, Braun and Clarke (2006) argued that it should be the first method of qualitative analysis that researchers learn. 


마지막으로 가장 중요한 것은 주제 분석이 다음과 관련하여 연구자에게 큰 유연성을 제공한다는 점이다.

  • (a) 사람들의 경험과 이해에 대한 개인적인 설명에서부터 다양한 사회적 맥락에서의 더 넓은 구조에 이르기까지 다룰 수 있는 연구 질문의 유형
  • (b) 조사된 데이터 및 문서의 형식
  • (c) 분석된 데이터의 양
  • (d) 적용되는 이론적 및/또는 인식론적 프레임워크의 선택
  • (e) 유도 데이터 중심 접근법 또는 연역적 이론 중심 접근법으로 데이터를 분석하는 능력(Clarke and Braun 2013).

Finally, and perhaps most importantly, thematic analysis offers researchers great flexibility with respect to:

  • (a) the type of research questions it can address, from personal accounts of people’s experiences and understandings to broader constructs in various social contexts;
  • (b) the type of data and documents examined;
  • (c) the volume of data analyzed;
  • (d) the choice of theoretical and/or epistemological framework applied; and
  • (e) the ability to analyze data with an inductive, data-driven approach or a deductive, theory-driven approach (Clarke and Braun 2013). 

 

 

주제 분석의 단점
The disadvantages of thematic analysis



주제 분석이 제공하는 [유연성은 엄격한 방법이 아니라는 인식]에 기여한다는 점에서도 단점으로 볼 수 있다(클라크와 브라운 2013). 원고가 작품의 패러다임적 방향과 이론의 역할을 분석에서 명확히 밝히지 않는다면 주제적 분석 위험은 폭넓게 적용되고 결코 일관되지 않는 방법으로 보여진다. 또한, 이 분석 방법의 유연한 특성을 고려할 때, 일부 연구자들은 데이터의 어떤 측면에 초점을 맞추고/또는 분석에 사용할 이론적 또는 인식론적 프레임워크를 결정하는 것이 어려울 수 있다(Braun과 Clarke 2006). 다른 분석 방법과 마찬가지로, 주제 분석이 제대로 수행되지 않을 수 있습니다(아래의 함정 섹션 참조). 그러나 주제 분석의 특별한 단점은 더 잘 정의되고 덜 유연한 프레임워크를 가진 다른 방법에 비해 용어를 일관되지 않거나 부적절하게 사용하기 쉽다는 것이다. 이러한 변수들은 주제 분석을 사용하거나 사용을 주장하는 원고의 평가를 복잡하게 한다(Braun과 Clarke 2006). 

The flexibility that thematic analysis offers can also be seen as a drawback in that it contributes to a perception among some that it is not a rigorous method (Clarke and Braun 2013). If manuscripts don’t clearly state the paradigmatic orientation of the work and the role of theory in the analysis, thematic analysis risks being seen as a method that is applied broadly and never consistently. Additionally, given the flexible nature of this analysis method, it can be challenging for some researchers to determine which aspects of data to focus on and/or which theoretical or epistemological frameworks to use for their analysis (Braun and Clarke 2006). As with any analytic method, thematic analysis can be conducted poorly (see Pitfalls section below). However, a particular disadvantage with thematic analysis is that it has been more prone to inconsistent or improper use of terminology as compared to other methods with more well-defined and less flexible frameworks. These vagueries complicate appraisals of manuscripts that use, or claim to use, thematic analysis (Braun and Clarke 2006). 


피해야 할 함정
Pitfalls to avoid


Braun과 Clarke(2006)는 주제 분석을 수행할 때 피해야 할 몇 가지 잠재적 함정을 강조하며, 이는 크게 세 가지 범주로 분류된다.
Braun and Clarke (2006) highlight several potential pitfalls to avoid when conducting thematic analysis, which broadly fall into three categories. 

첫째, 분석의 기초가 되는 가정을 적절히 설명하지 못하는 것이다. 유도 대 연역 분석을 위해 이 방법을 사용할 경우 수학적 다른 분석이 진행됩니다. 그것은 또한 그것이 건설적인 조사와 비교해서 포스트 포지티브 조사에 이용될 경우 다른 목표를 달성하는 것을 목표로 할 것이다. 연구의 이러한 기초적인 측면을 명시적으로 언급한 후, 연구자의 분석은 그러한 기초에 맞춰져야 한다(Braun과 Clarke 2006).
First is a failure to adequately describe the assumptions that underlie the analysis. Thematic different analysis will proceed in ways if the method is used for inductive versus deductive analysis. It will also aim to achieve different goals if it is harnessed for a post-positivist investigation versus a constructivist investigation. These foundational aspects of the study should be explicitly stated, and then the researcher’s analysis must align itself to those foundations (Braun and Clarke 2006). 

두 번째는 적절한 분석의 부족이다(Braun과 Clarke 2006). 연구 결과에 대한 설명이나 데이터 추출물 또는 구문 분석 응답의 목록만으로는 주제 분석을 구성하지 않는다. 주제 분석은 연구자가 보다 해석적인 작업에 참여해야 한다. 예를 들어, 인터뷰 질문 그 자체를 주제로 사용해서는 안 되는데, 이는 데이터 세트에 대한 분석이 부족함을 나타내기 때문이다(Braun and Clarke 2006). 
Second is a lack of adequate analysis (Braun and Clarke 2006). Mere description of findings or a listing of data extracts or paraphrased responses does not constitute a thematic analysis; thematic analysis requires the researcher to engage in more interpretive work. For example, interview questions should not be used as themes, as this indicates a lack of analysis across the data set (Braun and Clarke 2006).  

세 번째는 약한 분석으로, 조사 결과 보고서에서 제기된 주장이 설득력이 없거나 근거가 없는 것이다(Braun과 Clarke 2006). 테마가 겹치거나, 의미가 없거나, 내부 일관성이 부족한 경우 이 문제가 발생할 수 있습니다. 또한, 모범적인 데이터 추출이 없거나, 데이터 세트의 모든(또는 적어도 가장 관련성이 높은 부분)을 포괄하지 못하거나, 일화 또는 고립된 이벤트를 테마 수준으로 올리지 못하거나, 데이터(Braun 및 Clarke 2006)에 의해 모순되는 경우 분석이 불완전하고 지원되지 않을 것이다.

Third is a weak analysis, in which the claims made in the report of findings are unconvincing or unfounded (Braun and Clarke 2006). This can occur when themes are overlapping, nonsensical, and/or lack internal consistency. Additionally, an analysis will be incomplete and unsupported if it lacks exemplary data extracts, fails to encompass all (or at least all of the most relevant parts) of the data set, elevates anecdotes or isolated events to the level of themes, or is contradicted by its data (Braun and Clarke 2006). 



Conclusion

 

 

 


Med Teach

  •  
  •  
  •  

. 2020 Aug;42(8):846-854.

 doi: 10.1080/0142159X.2020.1755030. Epub 2020 May 1.

Thematic analysis of qualitative data: AMEE Guide No. 131

Michelle E Kiger 1 2Lara Varpio 1 2

Affiliations collapse

Affiliations

  • 1Wright-Patterson Medical Center, Dayton, OH, USA.

  • 2Uniformed Services University of the Healthy Sciences, Bethesda, MD, USA.

    • PMID: 32356468

 

Abstract

Thematic analysis is a widely used, yet often misunderstood, method of qualitative data analysis. It is a useful and accessible tool for qualitative researchers, but confusion regarding the method's philosophical underpinnings and imprecision in how it has been described have complicated its use and acceptance among researchers. In this Guide, we outline what thematic analysis is, positioning it in relation to other methods of qualitative analysis, and describe when it is appropriate to use the method under a variety of epistemological frameworks. We also provide a detailed definition of a theme, as this term is often misapplied. Next, we describe the most commonly used six-step framework for conducting thematic analysis, illustrating each step using examples from our own research. Finally, we discuss advantages and disadvantages of this method and alert researchers to pitfalls to avoid when using thematic analysis. We aim to highlight thematic analysis as a powerful and flexible method of qualitative analysis and to empower researchers at all levels of experience to conduct thematic analysis in rigorous and thoughtful way.

Keywords: Thematic analysis; qualitative analysis; qualitative research methods.

어떻게 현상학이 다른 사람의 경험으로부터 배울 수 있도록 돕는가 (Perspect Med Educ, 2019)

How phenomenology can help us learn from the experiences of others

Brian E. Neubauer1,2 · Catherine T.Witkop3 · Lara Varpio1



도입 Introduction


인간은, 다른 사람의 경험으로부터 배울 수 있는 능력을 가지고 있다는 점에서 독특하며, 동시에 그렇게 하는 것을 명백히 꺼리는 것으로 유명하다.—더글라스 애덤스

Human beings, who are almost unique in having the ability to learn from the experience of others, are also remarkable for their apparent disinclination to do so.—Douglas Adams


인간은 다른 사람들의 경험으로부터 배울 수 있는 몇 안 되는 동물들 중 하나라는 사실에도 불구하고, 우리는 종종 그렇게 하기를 싫어한다.

Despite the fact that humans are one of few animals who can learn from the experiences of others, we are often loath to do so.


학자들이 다른 사람들의 경험으로부터 배우는 것은 필수적이다. 사실, 그것은 연구의 기본적인 전제이다. 연구는 정보를 발견하거나 주체에 대한 새로운 이해를 얻기 위해 대상(즉, 개인, 집단, 사회 또는 객체)에 대한 상세한 연구를 포함한다 [1]. 그러한 상세한 연구는 종종 우리가 특정한 현상에 대한 새로운 통찰력을 얻을 수 있도록 다른 사람들의 경험을 이해하도록 요구한다. 보건 직업 교육 학자들은 다른 사람들의 경험으로부터 배울 필요성에 대해 잘 알고 있다.

it is essential for scholars to learn from the experiences of others. In fact, it is a foundational premise of research. Research involves the detailed study of a subject (i. e., an individual, groups of individuals, societies, or objects) to discover information or to achieve a new understanding of the subject [1]. Such detailed study often requires understanding the experiences of others so that we can glean new insights about a particular phenomenon. Scholars in health professions education (HPE) are savvy to the need to learn from the experiences of others.


이러한 노력을 종종 억제curtail하는 것은 방법론의 부족이다. 다른 말로 하자면, HPE 연구원들은 다른 사람들의 경험으로부터 배우는 방법을 알아야 한다.

What often curtails these efforts is a lack of methodology. In other words: HPE researchers need to know how to learn from the experiences of others.


현상학은 이 연구를 뒷받침할 수 있는 독특한 위치에 있는 질적 연구 접근법이다. 그러나, HPE 연구에 참여하기 위한 접근법으로서, 현상학은 강한 추종자를 가지고 있지 않다. 현상학을 진정으로 이해하려면 그것을 뒷받침하는 철학에 대한 감상을 발전시켜야 한다. 그 철학들은 인간 경험의 의미를 이론화한다. 다시 말해, 현상학 연구에 참여하는 것은 학자가 인간의 경험에 대한 해석의 철학적 계류방식mooring에 익숙해지도록 요구한다.

Phenomenology is a qualitative research approach that is uniquely positioned to support this inquiry. However, as an approach for engaging in HPE research, phenomenology does not have a strong following. It is easy to see why: To truly understand phenomenology requires developing an appreciation for the philosophies that underpin it. Those philosophies theorize the meaning of human experience. In other words, engaging in phenomenological research requires the scholar to become familiar with the philosophical moorings of our interpretations of human experience.


현상학이 대답할 수 있는 질문들과 이런 종류의 연구가 제공할 수 있는 통찰력은 HPE에게 근본적인 중요성을 가집니다: 

  • 수치심의 경험과 의학 학습자들에게 그러한 경험이 미치는 영향은 무엇입니까? 

  • 공감하는 임상의[3]가 된다는 것은 무엇을 의미합니까? 

  • 고위험 시험에서 낙제했을 때의 의료 학습자의 경험은 무엇입니까 [4]?

The questions that phenomenology can answer, and the insights this kind of research can provide, are of foundational importance to HPE: 

  • What is the experience of shame and the impact of that experience for medical learners [2]? 

  • What does it mean to be an empathetic clinician [3]? 

  • What is the medical learner’s experience of failure on high stakes exams [4]?


현상학이란 무엇인가?

What is phenomenology?


간단히 말해서, 현상학은 [현상을 경험한 사람들의 관점에서 그것을 탐구함으로써 현상의 본질을 설명하고자 하는 연구에 대한 접근법]으로 정의될 수 있다[6]. 현상학의 목표는 이 경험의 의미를 경험하는 것과 경험하는 방법 두 가지 측면에서 설명하는 것입니다 [6]. 인간 경험의 어떤 것과 방법을 생각하는 다른 방법에 뿌리를 둔 다양한 종류의 현상학이 있다. 다른 말로 하자면, 현상학의 각 접근은 서로 다른 철학에 뿌리를 두고 있다.

In simple terms, phenomenology can be defined as an approach to research that seeks to describe the essence of a phenomenon by exploring it fromthe perspective of those who have experienced it [6]. The goal of phenomenology is to describe the meaning of this experience—both in terms of what was experienced and how it was experienced [6]. There are different kinds of phenomenology, each rooted in different ways of conceiving of the what and how of human experience. In other words, each approach of phenomenology is rooted in a different school of philosophy.


이 원고에서, 우리는 현상학에 대한 초월적 접근과 헤르메네틱한(해석적) 접근을 강조하지만, 더 넓은 현상학적 지형이 존재한다. 예를 들어, 1997년에 출판된 현상학 백과사전은 7가지 다른 유형의 현상학에 대한 기사를 특집으로 다루고 있습니다 [7]. 초월적/그녀의 본질적 분열을 연결하는 더 현대적인 전통도 개발되어 왔다. 이러한 전통 중 몇 가지는 표 1[8-10]에 자세히 설명되어 있습니다.

In this manuscript, we highlight the transcendental and the hermeneutic approaches to phenomenology, but a broader phenomenological landscape exists. For instance, the Encyclopedia of Phenomenology, published in 1997, features articles on seven different types of phenomenology [7]. More contemporary traditions have also been developed that bridge the transcendental/hermeneutic divide. Several of these traditions are detailed in Tab. 1 [8–10].




현상학에 대한 이러한 접근법들 중 하나를 이해하기 위해서, 대부분의 접근법들이 현상학의 연구목적에 대한 유사한 정의를 가지고 있다는 것을 기억하는 것이 유용하다. 현상학은 보통 다음에 대한 연구이다.

  • 우리의 경험에서 나타나는 현상, 

  • 우리가 현상을 인지하고 이해하는 방법, 

  • 우리의 주관적인 경험에 있는 의미적 현상 [11]. 

To understand any of these approaches to phenomenology, it is useful to remember that most approaches hold a similar definition of phenomenology’s object of study. Phenomenology is commonly described as the study 

  • of phenomena as they manifest in our experience, 

  • of the way we perceive and understand phenomena, and 

  • of the meaning phenomena have in our subjective experience [11]. 


좀 더 간단하게 말하자면, 현상학은 개인이 살아 겪는 세상의 경험에 대한 연구입니다 [12]. 경험이 주관적으로 살아있는 것을 조사함으로써, 새로운 의미와 감상이 우리가 그 경험을 이해하는 방법을 알리거나 방향을 바꾸도록 개발될 수 있습니다 [13].

More simply stated, phenomenology is the study of an individual’s lived experience of the world [12]. By examining an experience as it is subjectively lived, new meanings and appreciations can be developed to inform, or even re-orient, how we understand that experience [13].


초월현상학

Transcendental phenomenology


현상학은 수세기에 걸쳐 진화한 철학적 전통에서 기원하지만, 대부분의 역사가들은 에드먼드 후셀이 20세기 초에 현상학을 정의했다고 믿는다.

Phenomenology originates in philosophical traditions that evolved over centuries; however, most historians credit Edmund Husserl for defining phenomenology in the early 20th century [14].


철학에 대한 Husserl의 접근은 그의 작품 본문이 '순수 현상론'에 대한 그의 관심에 종지부를 찍거나 철학과 과학의 보편적인 기초를 찾기 위해 노력하면서 객관적 경험과 주관적 경험을 동등하게 높이려고 노력했다. Husserl은 외부 현실에 대한 객관적인 관찰이라는 실증주의에 절대적인 초점을 두기를 거부하고, 대신 [개인의 의식에 의해 인식되는 현상]들이 과학적 연구의 대상이 되어야 한다고 주장했다. 그러므로, Husserl은 어떤 가정도 현상의 연구를 알려주지 말아야 한다고 주장했다. 어떤 철학적이거나 과학적인 이론, 연역적인 논리 절차, 그리고 어떤 다른 경험적 과학이나 심리학적 추측도 그 연구에 정보를 주지inform 말아야 한다. 대신에, 초점은 개인의 직관에 직접 주어지는 것에 맞춰져야 합니다 [16].

Husserl’s approach to philosophy sought to equally value both objective and subjective experiences, with his body of work ‘culminating in his interest in “pure phenomenology” or working to find a universal foundation of philosophy and science [13].’ Husserl rejected positivism’s absolute focus on objective observations of external reality, and instead argued that phenomena as perceived by the individual’s consciousness should be the object of scientific study. Thus, Husserl contended that no assumptions should inform phenomenology’s inquiry; no philosophical or scientific theory, no deductive logic procedures, and no other empirical science or psychological speculations should inform the inquiry. Instead, the focus should be on what is given directly to an individual’s intuition [16].


스타티가 최근에 주장했듯이, 현상학에 대한 이러한 태도는 '과거에 알려지지 않았던 현실의 차원을 발견한 자연 과학자의 태도'[17]와 비슷하다. 이러한 초점의 전환은 연구자가 '사물의 본질과 의미를 발견하기 위해 자신에게 되돌아갈 것'을 요구한다. Husserl이 주장했듯이, '결국 모든 진짜 그리고 특히 모든 과학적 지식은 내면적 증거에 달려 있다.' 내면적 증거, 즉 의식에 나타나는 것이 현상을 연구해야 하는 부분이다. 이것이 Husserl에게 의미하는 것은 [주관적이고 객관적인 지식은 밀접하게 연관되어 있다는 것]이다. 현상의 실체를 이해하는 것은 현상의 실체를 사람이 살아가는 그대로 이해하는 것이다. 이 살아있는 경험은 Husserl에게 아직 발견되지 않은 존재의 차원입니다 [17].

As Staiti recently argued, this attitude towards phenomenology is akin to that of ‘a natural scientist who has just discovered a previously unknown dimension of reality [17].’ This shift in focus requires the researcher to return ‘to the self to discover the nature and meaning of things [18].’ As Husserl asserted: ‘Ultimately, all genuine and, in particular, all scientific knowledge, rests on inner evidence [19].’ Inner evidence—that is, what appears in consciousness—is where a phenomenon is to be studied. What this means for Husserl is that subjective and objective knowledge are intimately intertwined. To understand the reality of a phenomenon is to understand the phenomenon as it is lived by a person. This lived experience is, for Husserl, a dimension of being that had yet to be discovered [17].


Husserl에게 현상학은 인식론적 태도에 뿌리를 두고 있었다; 그에게 있어 현상학적 조사의 중요한 질문은 '개인이 현상에 대해 알고 있거나 의식하는 것이 무엇인가?'였다. Husserl의 현상학 개념에서, 어떤 경험적 현상도 연구의 대상이 될 수 있으며, 따라서 분석을 단순한 감각 지각(즉, 내가 보고 듣고 만지는 것)을 넘어 사상, 기억, 상상 또는 감정의 경험으로 밀어넣을 수 있다[21].

For Husserl, phenomenology was rooted in an epistemological attitude; for him, the critical question of a phenomenological investigation was ‘What is it for an individual to know or to be conscious of a phenomenon [20]?’ In Husserl’s conception of phenomenology, any experienced phenomenon could be the object of study thereby pushing analysis beyond mere sensory perception (i. e. what I see, hear, touch) to experiences of thought, memory, imagination, or emotion [21].


Husserl은 [현상의 살아있는 경험]은 [현상을 경험한 개인들이 흔히 인식하는 특징]을 가지고 있다고 주장했다. 일반적으로 인식되는 이러한 [특징 또는 보편적 본질]은 [일반화할 수 있는 설명]을 개발하기 위해 식별될 수 있다. Husserl에 따르면 현상의 본질essence은 그 현상의 본질true nature을 나타낸다고 한다. 그렇다면 Husserl의 현상학에 참여하는 연구자가 직면하는 과제는 다음과 같습니다.

Husserl contended that a lived experience of a phenomenon had features that were commonly perceived by individuals who had experienced the phenomenon. These commonly perceived features—or universal essences—can be identified to develop a generalizable description. The essences of a phenomenon, according to Husserl, represented the true nature of that phenomenon. The challenge facing the researcher engaging in Husserl’s phenomenology, then, is:


사물을 그 자체로 묘사하고, 그 앞에 놓인 것을 의식 속으로 들어가 직관과 자기 성찰의 관점에서 그 의미와 본질로 이해되도록 합니다. 그 과정은 [실제로 존재하는 것]과 [가능한 의미의 이점으로부터 상상되는 것]의 혼합을 포함한다. 그러므로, 실제와 이상 사이의 통일성을 만드는 것이다. [18].

To describe things in themselves, to permit what is before one to enter consciousness and be understood in its meanings and essences in the light of intuition and self-reflection. The process involves a blending of what is really present with what is imagined as present from the vantage point of possible meanings; thus, a unity of the real and the ideal [18].


즉, 과제는 [그 현상의 보편적인 본질을 강조하는 현상]에 대한 [한 개인의 살아있는 경험] 연구에 참여하는 것입니다 [22]. 이를 위해서는 연구자가 현상에 대한 참가자의 경험에 초점을 맞추고 현상의 본질을 파악하기 위해 자신의 태도, 신념 및 가정을 중단해야 한다. 철학과 과학에 대한 Husserl의 큰 공헌 중 하나는 그가 개발한 방법인데, 이것은 연구자들이 '자연스러운 태도뿐만 아니라 우리가 인간 정신이라고 부르는 것에 대한 순진한naive 이해를 중단하고suspende, 새로운 연구 분야로서 초월적 주관성의 영역을 공개'할 수 있게 해준다.

In other words, the challenge is to engage in the study of a person’s lived experience of a phenomenon that highlights the universal essences of that phenomenon [22]. This requires the researcher to suspend his/her own attitudes, beliefs, and suppositions in order to focus on the participants’ experience of the phenomenon and identify the essences of the phenomenon. One of Husserl’s great contributions to philosophy and science is the method he developed that enables researchers ‘to suspend the natural attitude as well as the naïve understanding of what we call the human mind and to disclose the realm of transcendental subjectivity as a new field of inquiry [17].’


Husserl's의 초월적 현상학(때로는 서술적 접근법이라고도 함)에서, 연구자의 목표는 [초월적 주관성]을 달성하는 것이다. 즉, '연구자가 조회에 미치는 영향을 지속적으로 평가하고 편견과 선입견을 중화시켜 연구 대상에 영향을 미치지 않는 상태이다.[22]

In Husserl’s’ transcendental phenomenology (also sometimes referred to as the descriptive approach), the researcher’s goal is to achieve transcendental subjectivity—a state wherein ‘the impact of the researcher on the inquiry is constantly assessed and biases and preconceptions neutralized, so that they do not influence the object of study [22].’


연구자는 분리되어 떨어져 있어야 하며, [참가자가 제공한 설명]을 해석하는데 자신의 주관을 개입하지 않아야 한다. 이 살아있는 경험의 차원은 [초월적 I]의 상태를 달성할 수 있는 연구자가 가장 잘 접근한다. 즉, 객관적 연구자가 [실제 경험의 사실에 대한 참가자의 설명]에서 벗어나, [의식 자체를 파악할 수 있는 현상의 보편적인 본질]로 이동하는 상태]이다 [23].

The researcher is to stand apart, and not allow his/her subjectivity to inform the descriptions offered by the participants. This lived dimension of experience is best approached by the researcher who can achieve the state of the transcendental I—a state wherein the objective researcher moves from the participants’ descriptions of facts of the lived experience, to universal essences of the phenomenon at which point consciousness itself could be grasped [23].


초월적 I의 상태에서, 연구자들은 '당연한 것으로 간주되는 것 또는 상식적인 것들을 포함하여, 개념화에 대한 분류에 의존하지 않는다'는 현상에 대한 참가자들의 경험에 사전성찰적으로prereflectively 접근할 수 있다. 초월적 I은 어떤 정의, 기대, 가정 또는 가설도 연구에 가져오지 않는다; 대신에, 이 상태에서는, 연구자는 현상의 본질에 대한 이해를 발전시키기 위해 참가자들의 경험을 이용하는 빈 석판인 [타블라 라사]의 위치를 가정한다.

In the state of the transcendental I, the researcher is able to access the participants’ experience of the phenomenon prereflectively—that is ‘without resorting to categorization on conceptualization, and quite often includes what is taken for granted or those things that are common sense [13].’ The transcendental I brings no definitions, expectations, assumption or hypotheses to the study; instead, in this state, the researcher assumes the position of a tabula rasa, a blank slate, that uses participants’ experiences to develop an understanding of the essence of a phenomenon.


이 상태는 일련의 환원을 통해 달성됩니다. 

This state is achieved via a series of reductions. 


  • 초월적 단계라고 불리는 첫 번째 환원은 괄호치기bracketing 과정이라고도 불리는, 에포체(epoche)를 통해 일상 생활의 자연스러운 태도에서 초월을 요구한다. 이것은 연구자들이 관심 현상에 대한 이전의 이해, 과거의 지식 및 가정들을 수학 방정식에서처럼 제쳐놓거나 분류하는 과정이다. 이전부터 없어져야 할 이해는 과학적 이론, 지식 또는 설명, 참여자의 주장의 진실 또는 거짓, 그리고 연구자의 개인적인 견해와 경험을 포함한 광범위한 출처를 포함한다. 

The first reduction, referred to as the transcendental stage,requires transcendence from the natural attitude of everyday life through epoche, also called the process of bracketing. This is the process through which the researchers set aside—or bracket off as one would in a mathematical equation—previous understandings, past knowledge, and assumptions about the phenomenon of interest. The previous understandings that must be set aside include a wide range of sources including: scientific theories, knowledge, or explanation; truth or falsity of claims made by participants; and personal views and experiences of the researcher [24].


  • 두 번째 단계, 초월적-현상학적 환원에서, 각 참가자의 경험은 개별적으로 고려되며, 현상의 의미와 본질에 대한 완전한 설명이 구성된다 [18].

In the second phase, transcendental-phenomenological reduction, each participant’s experience is considered individually and a complete description of the phenomenon’s meanings and essences is constructed [18].


  • 다음은 상상적 변화를 통한 환원으로, 모든 참가자의 의식적 경험에 대한 설명이 자유 변화 과정을 통한 통합적 통합으로 증류된다[25]. 이 과정은 직관에 의존하며, 현상의 본질에 도달하기 위해 현상의 다양한 변형을 상상해야 한다 [25]. 이러한 본질은 현상에 대한 모든 지식의 기초가 된다.

Next is reduction via imaginative variation wherein all the participants’ descriptions of conscious experience are distilled to a unified synthesis of essences through the process of free variation [25]. This process relies on intuition and requires imagining multiple variations of the phenomenon in order to arrive at the essences of the phenomenon [25]. These essences become the foundation for all knowledge about the phenomenon.


일반적으로 사용되는 한 가지 초월적 현상학적 방법은 심리학자인 Clark Moustakas의 방법이며, 다른 접근법에는 Collaizi [26], Giorgi [27] 및 Polkinghorne [28]의 연구가 포함된다. 사용된 접근법에 관계없이, 초월적 현상학에 엄격하게 참여하기 위해, 연구자들은 연구자의 개별 주관성이 데이터 분석과 해석에 치우치지 않도록 분류 작업에 주의를 기울여야 한다.

One commonly used transcendental phenomenological method is that of psychologist Clark Moustakas, and other approaches include the works of: Colaizzi [26], Giorgi [27], and Polkinghorne [28]. Regardless of the approach used, to engage rigorously in transcendental phenomenology, the researcher must be vigilant in his/her bracketing work so that the researcher’s individual subjectivity does not bias data analysis and interpretations.


이것은 연구자 자신의 해석, 인식, 범주 등이 감소 과정에 영향을 미치지 않는 [초월적 I]의 상태에 도달하는 도전이다. 현대 철학자들이 계속해서 후셀의 괄호치기 개념과 씨름하고 있다는 것을 주목하는 것은 중요하다. 괄호치기가 성공적으로 달성되면, 연구자는 연구자의 물리적 신체를 포함하여, 세계와 그 내용 전체를 제쳐놓습니다 [17].

This is the challenge of reaching the state of the transcendental I where the researcher’s own interpretations, perceptions, categories, etc. do not influence the processes of reduction. It is important to note that modern philosophers continue to wrestle with Husserl’s notions of bracketing. If bracketing is successfully achieved, the researcher sets aside the world and the entirety of its content—including the researcher’s physical body [17].


[물리적 현실에 대한 의존과 기반을 중단하는 것]은 초월적 자아를 찾는 것과 같은 방법으로 인간의 경험을 버리는 유일한 방법이다.

Suspending reliance on and foundations in physical reality is the only way to abandon our human experiences in such a way as to find the transcendent I.


연구자들은 이 목표를 달성하기 위해 다른 정성적 연구 방법에서 practice를 빌릴 수 있다. 예를 들어, 여러 명의 연구자가 [30] 환원을 삼각 측량하여 적절한 괄호치기가 유지되었는지 확인하도록 연구를 설계할 수 있습니다. 또는, 확인된 본질이 참가자의 경험과 일치하는지 확인하기 위해 [31] 멤버체킹을 통한 데이터 [18]의 유효성 검사가 연구에 포함될 수 있다.

Researchers might borrow [29] practices from other qualitative research methods to achieve this goal. For instance, a study could be designed to have multiple researchers triangulate [30] their reductions to confirm appropriate bracketing was maintained. Alternatively, a study could involve validation of data [18]via member checking [31] to ensure that the identified essences resonated with the participants’ experiences.


헤르메네틱 현상학

Hermeneutic phenomenology


해석적 현상학으로도 알려진 헤르메네틱 현상학은 마틴 하이데거의 연구에서 비롯된다. 하이데거는 신학 분야에서 경력을 쌓기 시작했지만, 그 후 철학 학생으로 학계로 옮겨갔다. 하이데거의 철학적인 연구는 후셀의 연구와 일치하면서 시작되었지만, 그는 후에 후셀의 초월적 현상론의 몇 가지 중요한 측면에 도전했다.

Hermeneutic phenomenology, also known as interpretive phenomenology, originates from the work of Martin Heidegger. Heidegger began his career in theology, but then moved into academia as a student of philosophy. While Heidegger’s philosophical inquiry began in alignment with Husserl’s work, he later challenged several key aspects of Husserl’s transcendental phenomenology.


그의 전임자와의 근본적인 결별이 현상학적인 조사의 초점이었다. Husserl이 지식의 본질(즉, 인식론적 초점)에 관심이 있었던 반면, Heideger는 존재와 시간의 본질(즉, 존재론적 초점)에 관심이 있었다 [21]. 인간의 경험과 그것이 어떻게 사는가에 초점을 맞추면서, 그녀의 해석적 현상학이 다른 점이다. 후셀은 '세상에 참여하고, 인지하고, 기억하고, 생각하는 행위'와 현상의 지식자knower로서의 인간에 초점을 맞춘다.

A foundational break from his predecessor was the focus of phenomenological inquiry. While Husserl was interested in the nature of knowledge (i. e., an epistemological focus), Heidegger was interested in the nature of being and temporality (i. e., an ontological focus) [21]. With this focus on human experience and how it is lived, hermeneutic phenomenology moves away from Husserl’s focus on ‘acts of attending, perceiving, recalling and thinking about the world [13]’ and on human beings as knowers of phenomenon.


이와는 대조적으로 하이데거는 [세계의 배우actors in the world로서 인간]에 관심이 있어서, 개인과 그의 삶의 세계 사이의 관계에 초점을 맞추고 있다하이데거의 용어, 생활세계lifeworld는 '개인의 현실'은 그들이 살고 있는 세계에 의해 변함없이 영향을 받는다는 생각을 언급했습니다. 이러한 지향을 고려할 때, 개인은 (끊임없이, 명시적으로, 그리고/또는 의식적으로 그러한 이해를 인식하지 않더라도), 항상 이미 세계 내에서 자신에 대한 이해를 가지고 있는 것으로 이해됩니다 [17].

In contrast, Heidegger is interested in human beings as actors in the world and so focuses on the relationship between an individual and his/her lifeworld. Heidegger’s term lifeworld referred to the idea that ‘individuals’ realities are invariably influenced by the world in which they live [22].’ Given this orientation, individuals are understood as always already having an understanding of themselves within the world, even if they are not constantly, explicitly and/or consciously aware of that understanding [17].


하이데거에게 있어, 현상에 대한 개인의 의식적인 경험은, [세계와 분리되지도 않고 개인의 역사와도 분리되지도 않는다]. 대신, 의식은 개인의 역사와 그/그녀가 자란 문화를 포함하여 역사적으로 살아온 경험의 형태입니다 [22].

For Heidegger, an individual’s conscious experience of a phenomenon is not separate from the world, nor from the individual’s personal history. Consciousness is, instead, a formation of historically lived experiences including a person’s individual history and the culture in which he/she was raised [22].


개인은 자신의 삶의 세계에서 벗어날 수 없다. 인간은 자신의 배경에 대한 이해를 언급하지 않고는 현상을 경험할 수 없다. 따라서, 해석적 현상학은 '표면적 인식 아래에 가려진 인간 경험의 더 깊은 층을 이해하고, 그 또는 그 혹은 그녀가 그것을 사전-성찰적으로 경험하면서 그 세계가 어떻게 이 경험에 영향을 미치는지 이해'하려고 한다. 헤르메네틱 현상학은 개인의 내러티브를 연구하여, 그 개인들이 일상 생활과 생활 세계에서 경험하는 것을 이해한다.

An individual cannot step out of his/her lifeworld. Humans cannot experience a phenomenon without referring back to his/her background understandings. Hermeneutic phenomenology, then, seeks ‘to understand the deeper layers of human experience that lay obscured beneath surface awareness and how the individual’s lifeworld, or the world as he or she pre-reflectively experiences it, influences this experience [35].’ Hermeneutic phenomenology studies individuals’ narratives to understand what those individuals experience in their daily lives, in their lifeworlds.


그러나 헤르메네틱한 전통은 서술적인 이해를 넘어서고 있다. 해석적 현상학은 해석에 뿌리를 두고 있다. 즉, 개인의 인생 세계를 통해 [경험과 현상을 해석하는 것]이다.

But the hermeneutic tradition pushes beyond a descriptive understanding. Hermeneutic phenomenology is rooted in interpretation—interpreting experiences and phenomena via the individual’s lifeworld.


헤르메네틱스는 문헌을 다른 언어로 번역해야 할 필요성과 원본(예: 성경)에 대한 접근이 문제가 있었던 곳에서 개발된 이론으로, 텍스트의 해석을 참조한다 [36].

Hermeneutics refers to the interpretation of texts, to theories developed from the need to translate literature from different languages and where access to the original text (e. g., the Bible) was problematic [36].


만약 모든 인간의 경험이 개인의 인생세계에 영향을 받고informed, 모든 경험이 그 배경을 통해 해석되어야 한다면, 해석적 현상학은 현상에 대한 설명을 넘어서, 현상에 대한 해석으로 이어져야 합니다. 연구자들은 개인의 배경이 미치는 영향을 알아야 하고, 그들이 존재의 경험에 미치는 영향에 대해 설명해야 한다.

If all human experience is informed by the individual’s lifeworld, and if all experiences must be interpreted through that background, hermeneutic phenomenology must go beyond description of the phenomenon, to the interpretation of the phenomenon. The researcher must be aware of the influence of the individual’s background and account for the influences they exert on the individual’s experience of being.


이는 개인의 주관적 경험(사회, 문화 및 정치적 맥락과 불가분의 관계에 있음)이 사전에 결정된다는 것을 의미하지는 않는다. 하이데거는 개인이 자유를 찾아왔다고 주장했다. 위치 자유는 '개인은 자유롭게 선택할 수 있지만, 그들의 자유는 절대적이지 않다; 그것은 그들의 일상 생활의 특정한 조건에 의해 제한된다. [22]’

This is not to say that the individual’s subjective experience—which is inextricably linked with social, cultural, and political contexts—is pre-determined. Heidegger argued that individuals have situated freedom. Situated freedom is a concept that asserts that ‘individuals are free to make choices, but their freedom is not absolute; it is circumscribed by the specific conditions of their daily lives [22].’


해석적 현상학은 개인의 경험이 그의 인생세계를 통해 해석되기 때문에, 세계 속 개인의 존재의 의미를 연구한다. 그리고 이러한 의미와 해석이 개인의 선택에 어떻게 영향을 미치는지를 연구한다. 이러한 초점은 존재에 대한 참가자의 이해의 기본 구조와, 그 이해가 개인이 내린 결정을 어떻게 형성했는지를 조명하기 위해, 연구 참여자가 제공한 내러티브를 해석하도록 요구한다 [37].

Hermeneutic phenomenology studies the meanings of an individual’s being in the world, as their experience is interpreted through his/her lifeworld, and how these meanings and interpretations influence the choices that the individual makes [13]. This focus requires the hermeneutic phenomenologist to interpret the narratives provided by research participants in relation to their individual contexts in order to illuminate the fundamental structures of participants’ understanding of being and how that shaped the decisions made by the individual [37].


그녀의 해석적 현상학을 구별하는 또 다른 중요한 측면은 연구에서 [연구자의 역할]이다.

Another key aspect that distinguishes hermeneutic phenomenology is the role of the researcher in the inquiry.


연구자의 주관적인 관점을 배제하는 대신, 해석적 현상학은 연구 주제와 마찬가지로 연구자가 자신의 삶의 세계를 제거할 수 없다는 것을 인정한다. 대신에, 연구원의 과거의 경험과 지식은 그 연구의 귀중한 지침이다. 연구자의 교육 및 지식 기반은 연구할 가치가 있는 현상이나 경험을 고려하도록 이끈다. 연구에서, 데이터에 대해 편파적이지 않은 접근법을 취하도록 요구하는 것은 해석적 현상학의 철학적 뿌리와 일치하지 않는다. 대신, 이 전통에서 일하는 연구자들은 그들의 선입견을 공개적으로 인정하고 그들의 주관성이 분석 과정의 일부인 방법에 대해 성찰해야 합니다 [16].

Instead of bracketing off the researcher’s subjective perspective, hermeneutic phenomenology recognizes that the researcher, like the research subject, cannot be rid of his/her lifeworld. Instead, the researcher’s past experiences and knowledge are valuable guides to the inquiry. It is the researcher’s education and knowledge base that lead him/her to consider a phenomenon or experience worthy of investigation. To ask the research to take an unbiased approach to the data is inconsistent with hermeneutic phenomenology’s philosophical roots. Instead, researchers working from this tradition should openly acknowledge their preconceptions, and reflect on how their subjectivity is part of the analysis process [16].


해석적 현상학의 해석 작업은 하나의 규칙 결합 분석 기법에 얽매이지 않는다. 대신, 그것은 다중 분석 활동의 상호작용을 포함하는 해석 과정이다 [35].

The interpretive work of hermeneutic phenomenology is not bound to a single set of rule-bound analytical techniques; instead, it is an interpretive process involving the interplay of multiple analysis activities [35].


    • 우리의 관심을 살아있는 경험으로 향하게 하는 흥미로운 현상을 발견하는 것으로부터 시작합니다. 

    • 그런 다음 연구팀의 구성원들은 경험이 [(개념화되기 보다는) 살아있는 lived rather than conceptualized 그대로의 경험을 조사하고, 그 현상에 대한 참가자의 경험을 특징짓는 필수적인 [현상적] 주제들을 성찰하는 동시에 자신의 경험도 성찰한다. 

    • 연구자들은 자신의 성찰 내용을 글로 포착한 다음 성찰하고 다시 작성하며, 지속적이고 반복적인 주기를 만들어 점점 더 강력하고 미묘한 분석을 개발한다. 

    • 분석 내내, 연구자들은 연구 중인 현상에 대한 강한 지향을 유지하고(즉, 주의를 산만하게 하지 않음) 부품과 전체 사이의 상호작용에 주의를 기울여야 한다. 

    • 헤르메네틱 서클이라고도 하는 이 마지막 단계는 데이터(부품)가 현상(전체)의 진화하는 이해에 어떻게 기여하는지와 각 요소가 다른 것의 의미를 어떻게 향상시키는지를 신중하게 고려하는 관행을 강조한다[35].

Starts with identifying an interesting phenomenon that directs our attention towards lived experience. 

Members of the research team then investigate experience as it is lived, rather than as it is conceptualized, and reflect on the essential [phenomenological] themes that characterize the participant’s experience with the phenomenon, simultaneously reflecting on their own experiences. 

Researchers capture their reflections in writing and then reflect and write again, creating continuous, iterative cycles to develop increasingly robust and nuanced analyses. 

Throughout the analysis, researchers must maintain a strong orientation to the phenomenon under study (i. e., avoid distractions) and attend to the interactions between the parts and the whole. 

This last step, also described as the hermeneutic circle, emphasizes the practice of deliberately considering how the data (the parts) contribute to the evolving understanding of the phenomena (the whole) and how each enhances the meaning of the other [35].


현상학에 대한 헤르메네틱 접근법에서, 이론은 집중적인 조사, 연구 참여자에 대한 의사 결정, 그리고 연구 질문이 제기될 수 있는 방법에 도움이 될 수 있습니다 [22]. 이론들은 또한 연구의 결과를 이해하는데 도움을 주기 위해 사용될 수 있다. 그녀의 음소 현상학과의 연관성이 널리 존경받는 한 학자는 Max van Manen [38]이다. Van Manen은 hermenetic 현상학이 '해석적 현상한 그 자체를 방법론적 스키마나 해석적 절차 집합으로 기만적으로 환원하지 않도록 한다[39].'고 인정한다. 대신에, 이런 종류의 현상학은 연구자가 해석적 현상학적 사고, 읽기, 쓰기의 프로젝트를 이해하기 위해, 이 전통의 철학을 깊이 읽도록 요구한다.

In the hermeneutic approach to phenomenology, theories can help to focus inquiry, to make decisions about research participants, and the way research questions can be addressed [22]. Theories can also be used to help understand the findings of the study. One scholar whose engagement with hermeneutic phenomenology is widely respected is Max van Manen [38]. Van Manen acknowledges that hermeneutic phenomenology ‘does not let itself be deceptively reduced to a methodical schema or an interpretative set of procedures [39].’ Instead, this kind of phenomenology requires the researcher to read deeply into the philosophies of this tradition to grasp the project of hermeneutic phenomenological thinking, reading, and writing.



결론 

Conclusion


아마도 가장 비판적으로, HPE 학자들은 선택된 방법론의 원리와 그것을 뒷받침하는 철학적 뿌리와 일치하는 연구 과정을 구성해야 한다. 이 정렬은 연구 엄격성과 신뢰성을 확립하기 위한 초석입니다.

Perhaps most critically, HPE scholars must construct research processes that align with the tenets of the methodology chosen and the philosophical roots that underlie it. This alignment is the cornerstone for establishing research rigour and trustworthiness.


검증 활동 또는 필수 프로세스의 특정 체크리스트를 따르는 것은 특정 현상학적 연구의 품질과 엄격함을 높일 수 없다. 대신에, 연구 질문, 패러다임 및 선택된 방법론 사이의 충실도를 유지하는 것 외에도, 강력한 현상학적 연구는 읽기, 반성적 쓰기, 다시 읽기 및 다시 쓰기를 통해 데이터에 대한 깊은 관여를 포함한다.

Following a specific checklist of verification activities or mandatory processes cannot buoy the quality and rigour of a particular phenomenological study. Instead, beyond maintaining fidelity between research question, paradigm, and selected methodology, robust phenomenological research involves deep engagement with the data via reading, reflective writing, re-reading and re-writing.


  • [초월적 현상학]에 대한 무스타카스의 접근법에서는 연구자는 데이터를 읽고, 데이터를 의미 단위로 축소하고, 축소된 데이터를 다시 분석하여 주제 클러스터링에 참여하고, 데이터를 비교하고, 설명을 쓰는 등의 작업을 수행합니다. 지속적인 데이터 처리 및 성찰적 문서 작성 과정에서 연구자가 살아 있는 경험의 본질을 설명할 수 있을 때까지 요약한다.

In Moustakas’s approach to transcendental phenomenology, the researcher reads the data, reduces the data to meaning units, re-reads those reductions to then engage in thematic clustering, compares the data, writes descriptions, and so on in an ongoing process of continually engaging with the data and writing reflections and summaries until the researcher can describe the essence of the lived experience [18].


  • [해석적 현상학]에서, 학자들은 연구자가 데이터를 읽고, 애매한 이해를 형성하고, 반사적 글쓰기에 관여한 다음, 수정된 이해로 본문과 다시 결합하는 헤르메네틱 서클에 관여하는 것을 설명한다[40]. 읽기와 쓰기의 주기, 본문 전체와 부분들에 주의를 기울이는 주기들에서, 해석적 연구자는 살아 있는 경험에 대한 이해를 형성한다.

In hermeneutic phenomenology, scholars describe engaging in a hermeneutic circle wherein the researcher reads the data, constructs a vague understanding, engages in reflective writing, then re-engages with the text with revised understandings [40]. In cycles of reading and writing, of attending to the whole of the text and the parts, the hermeneutic researcher constructs an understanding of the lived experience.


두 가지 전통 모두 읽기, 쓰기, 다시 읽기 및 다시 쓰기를 통한 데이터와의 긴밀한 결합이 기본입니다.

In both traditions, deep engagement with the data via reading, writing, re-reading and re-writing is foundational.


현상학적 데이터의 읽기 및 쓰기에 대한 참여 깊이에 대한 주의는 엄격함에 필요한 조건이다.

attention to the depth of engagement in reading and writing of the phenomenological data is a necessary condition for rigour.





Review
 
. 2019 Apr;8(2):90-97.
 doi: 10.1007/s40037-019-0509-2.

How phenomenology can help us learn from the experiences of others

Affiliations 

Affiliations

  • 1Department of Medicine, Uniformed Services University, Bethesda, MD, USA. brian.e.neubauer.mil@mail.mil.
  • 2General Internal Medicine Service, Walter Reed National Military Medical Center, Bethesda, MD, USA. brian.e.neubauer.mil@mail.mil.
  • 3Department of Preventative Medicine and Biostatistics, Uniformed Services Medical Center, Bethesda, MD, USA.
  • 4Department of Medicine, Uniformed Services University, Bethesda, MD, USA.
Free PMC article

Abstract

Introduction: As a research methodology, phenomenology is uniquely positioned to help health professions education (HPE) scholars learn from the experiences of others. Phenomenology is a form of qualitative research that focuses on the study of an individual's lived experiences within the world. Although it is a powerful approach for inquiry, the nature of this methodology is often intimidating to HPE researchers. This article aims to explain phenomenology by reviewing the key philosophical and methodological differences between two of the major approaches to phenomenology: transcendental and hermeneutic. Understanding the ontological and epistemological assumptions underpinning these approaches is essential for successfully conducting phenomenological research.

Purpose: This review provides an introduction to phenomenology and demonstrates how it can be applied to HPE research. We illustrate the two main sub-types of phenomenology and detail their ontological, epistemological, and methodological differences.

Conclusions: Phenomenology is a powerful research strategy that is well suited for exploring challenging problems in HPE. By building a better understanding of the nature of phenomenology and working to ensure proper alignment between the specific research question and the researcher's underlying philosophy, we hope to encourage HPE scholars to consider its utility when addressing their research questions.

Keywords: Hermeneutic phenomenology; Qualitative; Transcendental phenomenology.


교육 설계연구: 생산적 학술활동을 계획하고, 수행하고, 강화하는 것(Med Educ, 2020)

Educational design research: Portraying, conducting, and enhancing productive scholarship

Susan McKenney1 | Thomas C. Reeves2



1 | 소개

1 | INTRODUCTION


인간은 [해결하려는 문제의 본질을 완전히 이해하기 전에 해결책으로 뛰어드는 공통된 경향]을 가지고 있으며, 이는 Morozov에 의해 '해결책주의solutionism'으로 묘사된 관행을 입증한다. 1 교육도 (그러한 행동의 희생물이 되는 유일한 분야는 아니지만) 수십 년 동안 예외는 아니었다. 예를 들어, 1922년 에디슨은 영화가 교과서를 대체할 것이라고 약속했다. 2 증강현실과 다른 기술들이 의학 교육의 미래로 제시됨에 따라 오늘날에도 유사한 예측이 계속 이루어지고 있다. 비평가들이 교육에서 기술적 해결책에 대한 대부분의 연구가 '별로 큰 차이는 없다'고 밝혔음에도 불구하고, 이러한 경향은 지속되고 있다. 아마도 이것은 경험에 대한 낙천주의의 승리를 나타내거나, 아니면 단순히 순진무구함일 수도 있다.

Humans have a common tendency to jump to solutions prior to fully understanding the nature of the problem they are trying to solve, thus demonstrating a practice described as ‘solutionism’ by Morozov.1 Education is not the only field to fall prey to such behaviour, but it has seen its fair share of examples over the course of many decades. For instance, in 1922 Edison promised that films would replace textbooks.2 Similar predictions continue to be made today as augmented reality and other technologies are put forward as the future of medical education.3 Despite the fact that critics have revealed that the majority of studies on technological solutions in education yield ‘no significant difference,'4 the tendency persists. Perhaps this represents the triumph of optimism over experience, or perhaps it is simply naïveté.


[새로운 지식을 발견하기 위한 기초연구]와 [실제적인 문제를 해결하기 위한 응용연구] 사이에 종종 구별이 이루어졌지만, 이 단순한 이분법은 연구가 실제로 어떻게 수행되는지 또는 대부분의 학자들에 의해 추구되는 [다중적 목표]를 적절하게 나타내지 못한다. 의료 교육 분야에서 일하는 사람들을 포함한 교육 연구자들은 종종 [그들의 목적이 서술적, 예측적, 해석적 또는 개발이나 행동을 참조할 수 있다는 점에서] 다양한 목표를 가지고 있다.4 개발 목표와 함께 이론에 기여하는 데 관심이 있는 연구자들에게 교육 설계 연구(EDR)는 매력적인 옵션이 될 수 있다.6

A distinction has often been made between basic research to discover new knowledge and applied research to solve practical problems, but this simplistic dichotomy does not adequately represent either how research is actually conducted or the multiple goals pursued by most scholars.5 Education researchers, including those working in the field of medical education, often have a range of different goals in that their purposes may be descriptive, predictive, interpretivist, or refer to development or action.4 For researchers interested in contributing to theory alongside development goals, educational design research (EDR) may be a compelling option.6


2 | EDR을 묘사하는 것

2 | PORTRAYING EDR


교육 설계 연구실용적이고 복잡한 교육 문제에 대한 해결책의 반복적 개발도 경험적 조사의 맥락을 제공하는 연구의 한 장르로 정의될 수 있는데, 이것은 다른 사람들의 작업에 정보를 줄 수 있는 이론적 이해를 산출한다.'7

‘Educational design research can be defined as a genre of research in which the iterative development of solutions to practical and complex educational problems also provides the context for empirical investigation, which yields theoretical understanding that can inform the work of others.’7


EDR에 적합한 문제를 식별하려면 [조사 가치가 있고 EDR 프로세스를 통해 해결할 수 있는 실제 과제]를 찾아야 한다. 특정 문제는 실무자, 연구원 또는 문헌 연구를 통해 확인할 수 있다.7 예를 들어, 의학 교육의 심각한 문제는 미래의 의사가 패혈증을 예방하기 위한 일관된 습관을 개발하도록 돕는 것을 말한다.8 소독 프로토콜은 잘 알려져 있지만, 왜 제대로 지켜지지 않는지 이해하고, 이 문제를 근절할 수 있는 추가적인 해결책을 개발하기 위한 연구가 필요하다.10

Identifying problems amenable to EDR involves finding real-world challenges that are worthy of investigation and capable of being solved through the EDR process. Specific problems may be identified by practitioners, by researchers, or through the study of literature.7 For example, a serious problem in medical education refers to helping future physicians develop consistent habits to prevent sepsis.8 Although antisepsis protocols are well known, research is needed to understand why they are insufficiently adhered to, and to develop additional solutions that can eradicate this problem.10


명백하게 심각한 문제가 제기되었을 때, 그것이 정말로 정당하고, 연구 가능하고 연구 가치가 있는지 확인하기 위해 문헌과 실제 모두에서 검증이 필요하다

  • 정당성: 이론적 관점에서, 만약 그렇게 하는 것이 현존하는 문헌의 명백한 차이를 해결할 수 있다면, 그 문제는 연구할 가치가 있다.

  • 연구가능성: 현존하는 방법이 노력을 보증할 수 있을 정도여서, 충분히 잘 연구될 수 있는 경우(연구 가능)

  • 연구가치: 이 작업이 특이적 우려와 반대로 광범위한 보유자와 관련된 이론 개발 또는 과학적 이해에 기여할 것인지 여부(연구 가치)

When even an obvious serious problem is raised, verification in both literature and practice is necessary to ascertain if it is, indeed, legitimate, researchable and research-worthy. 

  • From the theoretical perspective, the problem is worth studying if doing so would address a clear gap in the existing literature (legitimate), 

  • if existing methods will allow it to be studied well enough to warrant the effort (researchable), and 

  • if the work will contribute to theory development or scientific understanding related to a widely held, as opposed to idiosyncratic, concern (research-worthy).7


다음은 총 해부학 클래스에 있는 예제입니다.

Here is an example situated in a gross anatomy class:


• 문제: 시신 기증자는 제한적이며, 인체 해부학을 가르치기 위한 기존의 시뮬레이션은 충분한 충실도가 결여되어 있다(문제의 실질적인 측면). 현재 시뮬레이션 문헌은 포유류 해부학을 위한 고품질 시뮬레이션을 개발하는 방법에 대한 지침이 불충분하다(문제의 과학적 측면).

• Problem: corpse donors are limited and existing simulations for teaching human anatomy lack sufficient fidelity (the practical side of the problem). The current simulation literature provides insufficient guidance on how to develop high-quality simulations for mammalian anatomy (the scientific side of the problem).


• 실제적인 목적: 학생들이 실제 해부를 수행하지 않고도 과정 목표를 달성할 수 있는 고품질의 인간 해부 시뮬레이션을 개발하는 것.

• Practical aim: to develop a high-quality human dissection simulation that allows students to meet course goals without conducting actual dissection.


• 과학적 목적: 포유류 및 특히 인간을 위한 고품질 시뮬레이션의 특성을 이해하고 기술하는 것

• Scientific aim: to understand and describe the characteristics of high-quality simulations for mammals in general and humans in particular.


[[현실 세계의 과제를 해결함으로써 이론과 실제에 기여]하는 것을 명시적으로 추구하지 않는 연구]는 분명 큰 가치가 있을 수 있지만, EDR을 구성하지는 않는다.

Research that does not explicitly seek to contribute to both theory and practice by addressing real-world challenges can certainly be of great value, but it does not constitute EDR.



2.1 | 이론적이고 실제적인 시너지: 간략하고 포괄적인 검토

2.1 | Theoretical and practical synergies: a brief, non-comprehensive review


이론과 실제 작업을 연결하는 과학을 연결한다는 개념은 심리학자들에 의해 한 세기 이상 주장되어 왔다. 

  • 1930년대와 1940년대에, 이 방향의 주요한 진보는 Lewin과 동료들에 의해 [실행 연구]를 통해 이루어졌는데, 이 연구는 집단의 결정에 따르는 문제에 대한 논의를 통한 가설 생성과 테스트가 중심이었다. 

  • 1960년대와 1970년대에는 사회과학 분야에서 [(참여형) 행동 연구]가 번창했고, 실무자 연구가 등장했으며, 교육의 문제와 필요를 직접적으로 해결하기 위한 교육 연구의 요구는 증가했다. 

  • 무엇보다도, 이것은 1980년대 '행동 과학action science'과 1990년대에 널리 추진력을 얻은 '사용에 영감을 받은 기초 연구'의 발판을 마련했다. 

The notion of a linking science connecting theoretical and practical work has been advocated by psychologists for over a century.11,12 

  • In the 1930s and 1940s, major advancements in this direction were made by Lewin and colleagues, through action research, in which hypothesis generation and testing through the discussion of problems followed by group decisions were central.13 

  • In the 1960s and 1970s, (participatory) action research flourished in the social sciences, practitioner inquiry emerged, and calls for educational research to directly address the problems and needs of education increased.14 

  • Amongst other things, this set the stage for the rise of ‘action science’ in the 1980s15 and the notion of ‘use-inspired basic research,' which gained widespread momentum in the 1990s5. 


그 무렵, 교육 설계 및 커리큘럼 개발 분야의 연구원들은 교육 제품, 프로그램, 프로세스 및 정책의 강력한 설계를 안내하기 위해 보다 [신뢰할 수 있는 처방적prescriptive 이해]의 필요성을 강조하기 시작했다. 동시에, 교육 심리학 분야의 연구원들은 이론이 학습의 설계에 어떻게 영향을 미치는지와 그 반대의 경우에 어떻게 영향을 미치는지 주장하며, [학습이 실제로 일어나는 상황에 연구가 위치할situated 것]을 요구하며, [학습 현상을 이해하기 위한 실험실 상황의 단점을 언급]하는 획기적인 논문을 발표했다.9, 20

Around that time, researchers in the fields of instruction design and curriculum development began to stress the need for more reliable, prescriptive understanding to guide the robust design of educational products, programmes, processes and policies.16-18 At the same time, researchers in the field of education psychology published landmark papers arguing for how theory informs the design of learning and vice versa, calling for research to be situated in the contexts in which that learning actually takes place, and citing the shortcomings of laboratory settings for understanding learning phenomena.19, 20


교육 전반에 걸쳐, 그러한 견해는 파스퇴르의 사분면: 기초 과학 및 기술 혁신 출판에 탄력을 받았다.5 스톡스는 이번 세미나 연구에서 우유의 부패와 광견병 치료와 같은 현실 세계의 문제를 해결하는 맥락에서 근본적인 지식을 찾았던 프랑스의 화학자이자 미생물학자 루이스 파스퇴르와 같은 연구를 더 많이 해야 한다고 주장한다. 이 전통에서, EDR은 생태학적으로 타당하고 다른 사람들의 작업에 inform해주는 과학적 이해를 산출하고자, [현실의 기존 문제 해결]과 [탐구 과정의 구조화]에 관심이 있다.

Across disciplinary lines, such views gained momentum upon the publication of Pasteur’s Quadrant: Basic Science and Technological Innovation.5 In this seminal work, Stokes argues for more research like that of the French chemist and microbiologist Louis Pasteur, who sought fundamental knowledge within the context of solving real-world problems such as the spoilage of milk and treatment for rabies. In this tradition, EDR is concerned with the solving of existing problems in practice and with the structuring of the inquiry process so that it yields scientific understanding that is ecologically valid and informs the work of others.


2.2 | 접근법 제품군

2.2 | A family of approaches


우리는 'EDR'이라는 용어를 [이론적 이해의 개발] 및 [실제 개입의 설계 및 구현]이라는 이중 목표를 위해 노력하는 일군의 접근법을 설명는 용어로 사용한다.21 다음의 용어를 포함한다

  • design-based research, 

  • design-based implementation research, 

  • development research, 

  • design experiments, 

  • formative research, 

  • participatory design research, 

  • realist evaluation, 

  • the Medical Research Council (MRC) framework for evaluating complex interventions, 

  • action research and improvement science.

다양한 이름들은 동의어가 아니며, 일부 작가들은 이 가족의 특정한 구성원들이 다른 사람들과 어떻게 다른지 광범위하게 묘사했다.22

We use the term 'EDR' to describe a family of approaches that strive towards the dual goals of developing theoretical understanding and also designing and implementing interventions in practice.21 This family of approaches may, but does not always, include design-based research, design-based implementation research, development research, design experiments, formative research, participatory design research, realist evaluation, the Medical Research Council (MRC) framework for evaluating complex interventions, action research and improvement science. The various names are not synonymous, and some authors have extensively described how specific members of this family differ from others.22


표 1은 EDR을 다른 형태의 조사와 차별화시키는 각 접근방식의 목표와 특징을 요약한다. 즉, 실제 문제에 대한 해결책의 (반복적) 개발을 통한 이론적 이해의 추구이다.

Table 1 summarises the goals and characteristics of each approach in light of that which sets EDR apart from other forms of inquiry: the pursuit of theoretical understanding through the (iterative) development of solutions to problems in practice.


2.3 | 의료 교육에서 EDR의 예

2.3 | Examples of EDR in medical education


다른 연구와 마찬가지로, EDR은 데이터 수집과 분석을 통해 기존의 이론적 지식을 확장한다.23-25 그러나 많은 다른 종류의 연구와 달리, EDR 프로세스는 [해결하려는 문제에 대한 해결책의 (종종 주기적) 개발]에 embed되어 있다.23-25

Like other research, EDR extends existing theoretical knowledge through data collection and analysis.23-25 However, unlike many other kinds of research, the EDR process is embedded in the (often cyclic) development of a solution to the problem being tackled.23-25


• Hege 등 26은 가상 환자를 특징으로 하는 [임상 추론 도구 개발]에 embed된 연구를 설명한다. 심리학적 이론, 환자 중심, 교수 및 평가, 학습자 중심 및 맥락을 기반으로 소프트웨어 설계를 위한 프레임워크를 개발한 후 가상 환자 시스템과 함께 사용할 소프트웨어 도구가 개발되었다. 특히 임상 추론 기술 획득을 지원하고 이 복잡한 프로세스의 모든 단계를 평가합니다. 저자 26은 소프트웨어의 주요 구성 요소, 사용적합성 시험 결과 및 시험 연구를 설명하고 추가 개발 방향을 제시한다.

• Hege et al26 describe the research embedded in the development of a clinical reasoning tool featuring virtual patients. After a framework for software design had been developed based on psychological theories, patient-centredness, teaching and assessment, learner-centredness and context, a software tool was developed to be used with virtual patient systems. It specifically supports clinical reasoning skills acquisition and assesses all steps of this complex process. The authors26 describe the main components of the software, results of usability tests and a pilot study, and indicate directions for further development.


• Duitsman 외 연구진 27은 [임상 역량 위원회의 기능을 개선]하기 위한 주기적 접근방식을 설명한다. 이 프로젝트에서는, 이론적인 원칙을 문헌에서 추출하여 대학 아동 병원의 거주자 성과에 초점을 맞춘 임상 역량 회의를 재구성하였다. 그 회의는 평가되었고 거주자의 성과를 널리 알리는 데 유용하다고 간주되었다. 주어진 설계 원칙과 권고사항은 다른 (연구에 대한) 레지던트 프로그램에 유용하며, 다른 상황에 맞게 조정할 수 있다.

• Duitsman et al27 describe their cyclic approach to improving the functioning of a clinical competency committee. In this project, theoretical principles were distilled from the literature to (re-) shape clinical competency meetings focused on resident performance in a university children’s hospital. The meetings were evaluated and deemed useful for obtaining a broad indication of resident performance. The design principles and recommendations given are useful for other (research on) residency programmes, and can be adjusted to different contexts.


• Bararends 등 28은 [학부 작업 치료 학생 사이의 증거 기반 의사결정 능력을 육성]하기 위해 EDR을 수행했다. 그들의 보고서는 인지 도제 및 위치 학습의 원칙에 기초하는 교육 및 학습 시나리오의 기초가 되는 교육 원리를 생성하고 시험하기 위해 수행된 혼합 방법 연구를 설명한다. 그 개입은 잘 받아들여졌고 저자들은 학생들이 증거 기반 의사결정에 필요한 자기 효과, 인지 능력 및 비판적 사고 능력을 개발하는 데 도움이 될 수 있는 후속 연구와 개발을 위한 권고안을 제시한다.

• Baarends et al28 conducted EDR to foster evidence-based decision-making capacity amongst undergraduate occupational therapy students. Their report describes a mixed-methods study undertaken to generate and pilot test the pedagogic principles underlying a teaching and learning scenario based on principles of cognitive apprenticeship and situated learning. The intervention was well received and the authors28 make recommendations for subsequent research and development that can help students develop the self-efficacy, cognitive skills and critical thinking skills required for evidence-based decision making.



2.4 | 주요 특징

2.4 | Key characteristics


실용적이고 과학적인 목표의 동시 추구는 이 과정의 핵심이며, 다섯 가지 필수적인 특징으로 특징지어질 수 있다

  • 교육 설계 연구는 이론적으로 지반 설계에 사용할 뿐만 아니라 설계와 개발 작업이 광범위한 과학적 이해에 기여하기 위해 수행되기 때문에 '이론지향적'이다. 

  • 그것은 특정한 교육 환경에서 생산적인 변화를 일으키기 위해 수행되기 때문에 '개입주의적'이다. 

  • 연구자와 실무자를 포함한 다원적 파트너십의 전문지식을 필요로 하지만 다른 분야(예: 주제 전문가, 소프트웨어 프로그래머 및 촉진자)의 전문지식을 요구하기 때문에 '협력적'이다. 

  • 그것은 그것의 제품이 참가자의 전문지식, 문헌, 특히 현장 시험에 의해 형성되기 때문에 '반응기반적'이다. 

  • 마지막으로, 그것은 일반적으로 설계, 개발, 시험 및 개정의 여러 사이클을 통해 진화하기 때문에 '반복적'이다.

The simultaneous pursuit of practical and scientific goals is central to the process, which can be characterised by five essential features. 

  • Educational design research is 'theorectically oriented' not only because it uses theory to ground design, but also because the design and development work is undertaken to contribute to broader scientific understanding. 

  • It is 'interventionist' because it is undertaken to engender productive change in a particular education context. 

  • It is 'collaborative' because it requires the expertise of multidisciplinary partnerships, including researchers and practitioners, but also often others (eg, subject matter specialists, software programmers and facilitators). 

  • It is 'responsively grounded' because its products are shaped by participant expertise, the literature and, especially, field testing. 

  • Finally, it is 'iterative' because it generally evolves through multiple cycles of design, development, testing and revision.


표 1 개입 개발을 통해 이론적이고 실용적인 결과를 본질적으로 산출하는 방법(회색 셀)과 사용 방법에 따라 이론적이고 실제적인 결과를 산출할 수 있는 방법(백색 셀)을 포함하여 실용적이고 과학적인 시너지를 추구하는 접근법 제품군

TABLE 1 Family of approaches seeking practical and scientific synergies, including those that inherently yield theoretical and practical outcomes through intervention development (grey cells), and those that may yield theoretical and practical outcomes, depending on how they are used (white cells)


전반적인 EDR 연구 기간이 일반적으로 월이 아닌 [년 단위]로 측정된다는 것은 놀랄 일이 아니다.

no surprise that the overall duration of EDR studies is typically measured in years, rather than months.


교육 설계 연구는 방법론이 아니다. 이것은 [ERD이 따라야 할 방법론적 기준이 다른 종류의 연구의 기준과 다르지 않다는 것]을 명확히 하기 때문에 언급하는 것이 중요하다. 따라서 EDR 이니셔티브의 방법론적 엄격성은 정성적, 정량적 또는 혼합적 방법 연구의 기존 기준(예: 신뢰성, 유효성, 신뢰성, 이전 가능성, 신뢰성, 신뢰성, 신뢰성, 확인성)을 사용하여 판단되어야 한다. 또한, EDR은 설계, 사회학 및 교육 분야의 기존 관행을 활용하여 참여와 참여를 형성한다.

Educational design research is not a methodology. This is important to mention because it clarifies that the methodological standards to which it should be held are no different from those of other kinds of research. The methodological rigour of EDR initiatives should therefore be judged using existing criteria for qualitative, quantitative or mixed-methods studies (eg, reliability, validity, credibility, transferability, dependability, confirmability). Further, EDR leverages existing practices from the fields of design, sociology and education to shape participation and engagement.




3 | EDR 수행

3 | CONDUCTING EDR


3.1 | 프로세스 모델링

3.1 | Modelling the process


그림 1에 표시된 EDR의 일반 모델. 

a generic model for EDR, shown in Figure 1. 



첫째, 그림 1의 네모은 세 개의 핵심 단계를 나타내며, 그 사이의 화살표는 이 과정이 반복적이고 유연하다는 것을 나타냅니다.

First, the squares in Figure 1 denote three core phases, and the arrows between them indicate that the process is both iterative and flexible.


  • '분석 및 탐구' 단계 동안, 다룰 문제에 대한 더 나은 이해를 형성하기 위해 실무자와의 협업을 모색한다. 이 단계 동안의 연구는 일반적으로 문제, 맥락 또는 이해관계자에 관한 이론적 이해에 기여한다.

During the 'analysis and exploration' phase, collaboration with practitioners is sought in order to shape a better understanding of the problem to be addressed. Research during this phase is typically informed by and contributes to theoretical understanding concerning the problem, context or stakeholders.


  • '설계와 시공' 동안, 문제가 어떻게 처리될 수 있는지에 대한 아이디어는 다소 크고 모호하게 시작해서, 점차 개선, 가지치기, 조작화 경향이 있다. 비록 이 단계는 본질적으로 [경험적 작업을 포함하지는 않으며], 그것의 특징과 근본적인 행동 이론을 포함하여, (일종의) 개입에 대한 [이론적 이해]에 의존하고 기여한다.

During 'design and construction,' ideas about how the problem might be addressed tend to start off as rather large and vague, and gradually become refined, pruned and operationalised. Although this phase does not inherently involve empirical work, it does rely on and contribute to theoretical understanding about the (kind of) intervention, including its characteristics and underlying theory of action.


  • '평가 및 성찰' 동안, 설계 아이디어와 프로토타입 솔루션은 경험적으로 조사되며, (이론적으로) 개입 기능이 작동하는지, 어떻게 그리고 왜 작동하는지 이해하는 것을 목표로 그 결과를 성찰한다. 이 단계에서 연구는 (종류의) 개입이나 그것이 초래하는 반응에 대한 이론적 이해에 의해 형성되고 기여한다.

During 'evaluation and reflection,' design ideas and prototype solutions are empirically investigated, and the findings are reflected upon, with the aim of refining (theoretical) understanding about if, how and why intervention features work. During this phase, research is shaped by and contributes to theoretical understanding about the (kind of) intervention or the responses it engenders.


모든 단계에서 합리적이고 창의적인 사고방식이 혼합되어 생산적입니다.

Across all phases, a blend of rational and creative mindsets is productive.


둘째, 이론과 실제에 대한 [이중 초점]은 각각 실용적, 과학적 산출물을 나타내는 직사각형을 통해 명백하게 이루어진다. EDR로 인한 실질적인 솔루션은 다음이 있다.

  • 교육용 제품(예: 다중 사용자 가상 학습 게임)

  • 프로세스(예: 뒤집힌 교실에서 의대생 학습을 비계하기 위한 전략)

  • 프로그램(예: 의료 교사가 보다 효과적인 질문 전략을 개발하는 데 도움이 되는 일련의 워크샵)

  • 정책(예: 인턴의 현장 멘토링을 위한 최소 일대일 시간 지정)

Second, the dual focus on theory and practice is made explicit through the rectangles, which represent the practical and scientific outputs, respectively. The practical solutions resulting from EDR can be 

  • educational products (eg, a multi-user virtual learning game), 

  • processes (eg, a strategy for scaffolding medical student learning in a flipped classroom), 

  • programmes (eg, a series of workshops intended to help medical teachers develop more effective questioning strategies), or 

  • policies (eg, the designation of a minimum amount of one-to-one time for on-site mentoring of interns).


[EDR에서 얻어진 이론적 이해]는 교육현상을 기술, 설명, 예측 또는 조작하는데 사용될 수 있다. 앞에서 언급한 바와 같이, 설계 연구에 대한 이론적 이해는 개입의 설계를 뒷받침하고, 과학적 연구를 체계화하며, 개입의 경험적 시험을 통해 생성된 결과에 의해 진전된다.

The theoretical understanding resulting from EDR can be used to describe, explain, predict or manipulate education phenomena. As noted previously, the theoretical understanding in design research underpins the design of the intervention, frames the scientific inquiry, and is advanced by findings generated through the empirical testing of the intervention.


마지막으로, 모델은 구현과 확산을 나타내는 사다리꼴을 통해 실제 사용에 주의를 기울인다는 것을 보여줍니다. 이것은 연습과의 상호작용이 [사후 사고afterthought]가 아닌 [프로세스의 시작부터 존재]하며, 시간이 지남에 따라 증가한다는 것을 보여준다. 양방향 화살표는 실제에서 일어나는 일이 궁극적인 결과뿐만 아니라 진행 중인 핵심 프로세스에 영향을 미치며 그 반대의 경우도 영향을 미친다는 것을 나타낸다.

Finally, the model demonstrates that attention to practical use through the trapezoid, which represents implementation and spread. It shows that interaction with practice is present from the start of the process, not as an afterthought, and increases over time. The bi-directional arrows indicate that what happens in practice influences the ongoing core processes, as well as the ultimate outputs, and vice versa.


3.2 | 모든 단계에 걸친 하나의 예

3.2 | One example spanning all phases


이 모델이 어떻게 살아나는지를 설명하기 위해, 우리는 세계보건기구(WHO)가 경험한 문제를 다룬 이전에 발표된 4년 PhD 연구에 대해 간략하게 설명한다. 즉, 세계보건기구는 운송, 보관 및 유통 중 적절한 온도 범위 내에 유지해야 하는 백신 및 기타 의약품의 취급에 적용되는 '콜드 체인'에 대한 확장 가능한 고품질 교육 프로그램이 부족했다. 

To illustrate how this model comes to life, we briefly describe a previously published 4-year PhD study, 32 which addressed a problem experienced by the World Health Organization (WHO). Namely, the WHO lacked a scalable, high-quality training programme on the ‘cold chain’ that applies to the handling of vaccines and other pharmaceutical products that must be kept within the appropriate temperature range during shipping, storage and distribution.


  • 분석 및 탐색 중, Byster32는 관련 학습 접근법, WHO e-러닝 프로그램의 최신 기술을 이해하기 위한 현장 기반 조사 및 기존 콜드 체인 훈련 프로그램의 참여자 관찰에 대한 문헌 검토를 실시했다.

During analysis and exploration, Vesper32 conducted a literature review on relevant learning approaches, field-based investigation to understand the state of the art of WHO e-learning programmes, and participant observation of the existing cold chain training programme.


  • 설계와 시공 중에, Byster는 문헌과 경험적 시험(즉, 평가와 반영의 결과)을 기반으로 복수의 훈련 프로그램 프로토타입을 개발하고 수정했다.32

During design and construction, Vesper developed and revised multiple training programme prototypes on the basis of the literature and empirical testing (ie, the outcomes of evaluation and reflection).32


  • 평가와 성찰 과정에서, E-러닝 전문가의 전문가 평가, 콘텐츠 전문가의 위험 분석, 대상 사용자와의 성숙한 시제품의 현장 테스트 등 다양한 프로토타입을 조사하기 위해 다양한 전략을 사용했다.

During evaluation and reflection, Vesper32 used diverse strategies to investigate the various prototypes, including expert appraisal by e-learning specialists, risk analysis by content experts, and field testing of a mature prototype with target users.


첫 번째 분석 활동에서 마지막 버전의 과정에 이르기까지, 구현에 대한 관심이 집중되었고 실무자와의 긴밀한 상호작용을 통해 확산되었다. 이후 WHO의 다른 온라인 학습 환경의 설계에 적용된 실질적인 결과물(e-러닝 과정 및 기본 설계 프레임워크) 외에도, 과학적 산출물은 각각 분석, 탐사, 설계 및 시공, 평가 및 반영 단계에서의 조사에 기초하여 5개의 저널 기사의 형태로 볼 수 있다.

From the very first analysis activities through to a final version of the course, attention was given to implementation and spread through close interaction with practitioners. In addition to the practical output (the e-learning course and underlying design framework), which has subsequently been applied to the design of other online learning environments at the WHO,33 the scientific output is visible in the form of five journal articles, based on the investigation during analysis and exploration,34 design and construction,35 and evaluation and reflection36-38 phases, respectively. 


Figure 2



3.3 | 다양한 단계의 기여를 강조하는 여러 가지 예

3.3 | Multiple examples highlighting contributions from different phases


여기에서 의료 교육 분야에서 수행되는 다양한 EDR을 설명하기 위해 서로 다른 연구 보고서 39-41이 사용된다. 각각의 문제에 대해, 해결된 문제, 개발된 개입, 생성된 지식 및 사용된 방법이 표 2에 요약되어 있다.

Here, different research reports39-41 are used to illustrate the variety of EDR conducted within the field of medical education. For each one, the problem addressed, the intervention developed, the knowledge created and the methods used are summarised in Table 2.



[분석 및 탐색 단계의 결과]는 사회경제적으로 불리한 배경에서 청소년을 대상으로 한 건강 식자율을 위한 방과 후 프로그램인 HackHealth를 만들고, 구현하고, 개정하기 위해, [설계 연구에서 정량적이고 질적인 방법]을 사용한 Subramaniam et al의 연구에서 매우 잘 나타난다. 이 특별 하위 연구는 다양한 건강 관련 정보 활동을 완료할 때 직면하는 과제에 대한 심층 분석 및 탐색을 위해 초기 문헌 기반 프로토타입의 구현이 어떻게 컨텍스트를 제공했는지를 보여준다. 연구 결과는 Hack Health 프로그램을 개선하는 것 이상으로 확장되며, 이 인구와 협력하고, 그들의 건강 식자율 기술을 평가 및 개선하고, 그들의 요구에 부합하는 지침을 설계하는 데 중요한 의미를 갖는다.

Results from the analysis and exploration phase are highly visible in the article by Subramaniam et al,39 who used quantitative and qualitative methods in their design research to create, implement and revise HackHealth, an after-school programme for health literacy that was targeted at adolescents from socioeconomically disadvantaged backgrounds. This particular sub-study demonstrates how the implementation of the initial, literature-based prototype provided the context for deeper analysis and exploration of the challenges encountered when completing various health-related information activities. The findings extend beyond improving the HackHealth programme and hold important implications for working with this population, assessing and improving their health literacy skills, and designing instruction that stands to meet their needs.


[설계와 시공 단계]는 [일반 실습 학생들을 위한 5가지 학습 모듈을 구축하는 과정]에서 그들이 취한 단계와 특히 그들의 근본적인 추론을 설명하는 반데트리 등의 작업의 핵심이다. 이 작업은 노인을 돌보거나 신체적으로 정의되지 않은 증상을 가진 환자를 다루는 것과 같은 진짜 복잡한 작업을 통해 교육자가 임상 추론, 의사소통 및 건강 증진과 같은 통합 능력의 개발을 어떻게 다룰 수 있는지를 보여준다. 모듈 설명은 전체 작업 학습의 원칙과 4C/ID(4-구성 요소/지시적 설계) 모델을 적용할 수 있는 방법을 설명하고 또한 교육 혁신 과정의 과제와 함정에 주목하여 유사한 과제를 해결하고자 하는 다른 사람들에게 지침을 제공한다.

The design and construction phase is central in the work of Vandewaetere et al,40 who describe the steps they took, and especially their underlying reasoning, in the course of building five learning modules for general practice students. Through authentic complex tasks such as caring for elderly people or handling patients with physically undefined symptoms, this work demonstrates how educators can address the development of integrated competencies, such as clinical reasoning, communication and health promotion. The module descriptions illustrate how principles of whole-task learning and the 4C/ID (four-component/instructional design) model can be applied, as well as also noting challenges and pitfalls in the educational innovation process, and thus offers guidance to others wishing to tackle similar challenges.


[평가와 성찰 과정]과 연구 결과는 [수의과 학생들을 위한 이론 기반 평가 프로그램의 실행]을 조사한 41세의 복 외 연구진들의 연구에서 전경화되었다. 그들의 프로그램은 학생들이 직장에서 피드백을 찾고 축적하고 배울 수 있도록 동기를 부여하고 지원함으로써 학습과 평가를 통합한다. 그들은 학생과 임상 감독자의 경험을 탐구하기 위해 양적, 질적 방법을 사용했다. 그들의 연구결과는 유사한 이니셔티브의 개발뿐만 아니라 그들의 프로그램에 대한 개정에도 영향을 미친다. 예를 들어, 동료 피드백, 사회적 상호 작용 및 외부 지침은 이 (종류의) 프로그램에서 중요한 요소인 반면, 포트폴리오 심판과 의도하지 않은 학생 인식(즉 형성적 평가조차 총괄적이라는)에 필요한 훈련 수준은 정면으로 대처해야 할 과제를 구성한다.

The evaluation and reflection processes and findings are foregrounded in the work of Bok et al,41 who investigated the implementation of a theory-based assessment programme for veterinary medicine students. Their programme integrates learning and assessment by motivating and supporting students to seek, accumulate and learn from feedback in the workplace. They used quantitative and qualitative methods to explore the experiences of students and clinical supervisors. Their findings hold implications for revisions to their programme, as well as the development of similar initiatives. For example, peer feedback, social interaction and external guidance are crucial elements in this (kind of) programme, whereas the level of training required for portfolio judges and unintended student perceptions (namely, that even formative assessments are still summative) constitute challenges to be tackled head on.


4 | EDR 강화 

4 | ENHANCING EDR


4.1 | 도전과 한계

4.1 | Challenges and limitations


다른 사람들 중 필립스와 돌은 [실용적인 혁신과 이론 구축을 동시에 추구하는 것은 매우 야심적이고 어렵다]고 경고했다. 이는 부분적으로 설계 연구를 추구하는 연구자들이 실제 교육 문제의 복잡한 변이와 직접 씨름하기 위해 실무자들과 손을 맞잡고 작업한다는 사실에서 비롯된다. 복잡성은 증가하지만, 이러한 협업은 모든 관련자를 위한 전문 개발 목표인 EDR의 세 번째 목표를 달성할 수 있습니다.

Phillips and Dolle,42 amongst others, have cautioned that the simultaneous pursuit of practical innovation and theory building is extremely ambitious and difficult. This partially stems from the fact that researchers pursuing design research work hand-in-hand with practitioners to grapple directly with the complex variation of realworld education problems. Although it increases complexity, this collaboration can lead to the accomplishment of a third goal of EDR, that of professional development for all those involved.


EDR을 수행할 때 일반적으로 네 가지 유형의 도전에 직면합니다.

Four types of challenges are commonly encountered when conducting EDR,


[개념적 도전]은 EDR이 무엇인지(또는 그렇지 않음)와 추구되는 목표의 종류를 이해하는 것과 관련이 있다. [방법론적 관점]에서 EDR은 프로젝트의 라이프사이클 전체에 걸쳐 질문 유형의 다양성을 고려할 때, 연구자들이 다양한 방법에서 다방면의 기술을 보유해야 하기 때문에 도전적이다. EDR 연구의 프로세스와 [결과를 전달]하는 것은 어려울 수 있다. 왜냐하면 이러한 연구는 일반적으로 크고 복잡하며, 비-이해관계자들에게 그들의 가치가 항상 명확하게 표현되는 것은 아니기 때문이다. 네 번째 과제는 종종 조직 정책 및 이해관계자 역학과 같은 설계(실행)에서 비롯되는 [정치적 차원]과 관련이 있다. 표 3

Conceptual challenges relate to understanding what EDR is (or is not) and the kinds of goals being pursued. From a methodological standpoint, EDR is challenging because, given the variety in the types of questions asked throughout a project’s lifecycle, it requires that researchers possess well-rounded skills in a variety of methods. Communicating the processes and outcomes of EDR studies can be challenging because these studies are typically large and complex, and because their value to non-stakeholders is not always articulated. A fourth set of challenges relates to political dimensions, often stemming from (implementing) the design, such as organisational policies and stakeholder dynamics. Table 3


EDR을 고려하는 사람들에게는 정보에 입각한 선택을 하는 것이 중요하다. 

  • 째로, EDR은 (적어도) 연구자와 실무자 사이의 긴밀한 협력을 요구한다.43 이것이 실현 가능하지 않거나 바람직하지 않을 때 EDR은 실행 가능한 옵션이 되지 않는다. 

  • 둘째, EDR은 이론, 혁신 및 실제를 연결한다.44 이들 중 하나 이상의 개발이 높은 우선순위가 아닐 때, EDR은 유용하지 않을 가능성이 있다. 

  • 셋째, 실무에서 생산적인 변화를 창출하는 데 중점을 두기 때문에 EDR은 상당한 시간이 필요하다.45 가용 시간이 몇 개월 또는 몇 년이 아닌 몇 주 단위로 측정된다면 EDR은 실현 가능하지 않을 가능성이 높다.

For those considering EDR, it is important to make informed choices. First, EDR requires close collaboration between (at least) researchers and practitioners.43 When this is not feasible or desirable, EDR ceases to be a viable option. Second, EDR connects theory, innovation and practice.44 When the development of one or more of these is not of high priority, EDR is not likely to be useful. Third, because it centres on creating productive change in practice, EDR requires substantial amounts of time.45 If the time available is measured in weeks (rather than months or years), EDR is not likely to be feasible.


마지막으로, EDR이 제대로 수행하기가 상당히 쉽고 잘 수행하기가 상당히 어렵다는 점을 감안할 때, EDR의 네 번째 제한은 접근법 자체와 더 적은 관련이 있으며, EDR을 수행하는 사람들의 능력capacity과 더 많은 관련이 있다. 다른 아이디어와 마찬가지로 EDR의 가치는 그 정의가 아니라 실현에 있다. '디자인 연구는 [혁신성, 증거에 대한 대응성, 기초 과학과의 연결성, 그리고 지속적인 개선에 대한 헌신]이라는 특성을 가진 실천공동체 내에서 이루어진다.' 46.

Finally, given that EDR is fairly easy to do poorly and quite difficult to do well, a fourth limitation of EDR has less to do with the approach per se and more to do with the capacity of those conducting it. As with other ideas, the value of EDR lies not in its definition but in its realisation. ‘Design research is constituted within communities of practice that have certain characteristics of innovativeness, responsiveness to evidence, connectivity to basic science, and dedication to continual improvement.’46


이러한 궤도에서 연구자들은 디자이너와 컨설턴트의 역할도 완수해야 하며, 이는 매우 도전적인 노력이 될 것입니다. McKenney와 Brand-Gruwel47은 설계 연구의 각 하위 프로세스(분석과 탐구, 설계와 시공, 평가와 반영, 구현과 확산)에 비추어 이 세 가지 역할을 검토했다.

In these trajectories, researchers must also fulfil the roles of designers and consultants, rendering this a highly challenging endeavour. McKenney and Brand-Gruwel47 examined these three roles in light of each sub-process of design research (analysis and exploration; design and construction; evaluation and reflection; implementation and spread).


표 3 공통 과제 및 이를 완화하는 방법

TABLE 3 Common challenges and ways to mitigate them



그들은 각각의 역할을 제정하는 데 필요한 [가지 기본 역량]을 명확히 하고, 그것을 발전시키기 위한 지침을 제공한다. 그들은 예를 들어 

  • '공감'이 공유되지 않은 목표를 탐구하거나 다른 환경에서 인센티브, 동기 및 보상 구조에 노출되기 위해 필요하다는 점에 주목한다. 

  • '조정'은 연구 프레임워크, 데이터 수집, 솔루션 설계, 구현, 인프라 문제 및 이해관계자 소유에 동시에 참여할 수 있도록 지원합니다. 

  • 창의적이고 분석적인 '유연성'은 지침의 목표와 일치하는 방식으로 사용 가능한 인적 및 물질적 자원의 최적화를 지원합니다. 

  • 마지막으로 '사회적 역량'은 각 역할을 수행하는 데 필요한 상호작용 전략의 강력한 레퍼토리를 가리킨다. 따라서 EDR을 수행하는 것은 분명히 복잡한 작업이다.

They articulate four foundational competencies that are required to enact each role, and offer guidelines for developing them. 

  • They note that 'empathy' is needed, for example, to explore (un)shared goals or become exposed to the incentives, motives and reward structures in different settings. 

  • 'Orchestration' helps to simultaneously attend to research framing, data collection, solution design, implementation, infrastructure woes and stakeholder ownership. 

  • Creative and analytical 'flexibility' supports the optimisation of the human and material resources available in ways that remain aligned with the goals of the instruction. 

  • Finally, 'social competence' refers to a robust repertoire of the interaction strategies needed to fulfil each role. Thus, conducting EDR is clearly a complex task.


4.2 | 결론

4.2 | CONCLUSIONS


교육 디자인 연구는 물론 만병통치약이 아니다. 그러나, 그것은 교육적 개입이나 해결책이 잉태되기 전에 문제의 본질을 분명히 하는 그것의 높아진 관심 때문에 해결책주의에 은유적인 제동을 걸었다. 우리는 의학 교육이 이론적인 목표와 개발 목표 모두를 시너지 효과적으로 추구함으로써 가장 잘 해결될 수 있는 많은 도전에 직면해 있다고 믿는다. 예를 들어 Chen과 Reeves48이 주장하는 바와 같이 이 접근 방식은 다음과 같은 용도로 사용될 수 있습니다.

Educational design research is of course no panacea. However, it does put the metaphorical brakes on solutionism because of its heightened attention to clarifying the nature of the problem before an educational intervention or solution is conceived. We believe that medical education faces many challenges that might be best addressed by synergistically pursuing both theoretical and development goals. For example, as Chen and Reeves48 argue, this approach could be used to:


• 점점 더 유동적인 의료 팀에서 효과적으로 일할 수 있는 역량 개발 

• develop capacities to work effectively in increasingly fluid health care teams; 


• 환자 및 기타 의료 전문가와 문화적으로 유능하게 의사소통할 수 있는 기술을 배양한다. 

• cultivate skills to communicate in a culturally competent manner with patients and other health care professionals; 


• 기계 학습 알고리즘과 로봇에 점점 더 심화되고 있는 세계에서 의료 전문가들이 실습할 수 있도록 준비한다. 

• prepare health care professionals for practice in a world that is increasingly infused with machine learning algorithms and robots; 


• 역량 기반 교육을 촉진하기 위한 평가 프로토콜 및 피드백 관행을 개선합니다. 

• improve assessment protocols and feedback practices to promote competency-based education, and 


• 의료 전문가의 임상 추론 능력 향상

• enhance health care professionals’ clinical reasoning skills.


이 공동체가 설계 연구를 공유하기 전에 접근법의 유창성이 아직 개발되지 않은 경우(더 많이), 설계 연구에 더 익숙한 자매 분야의 연구원들과의 협력(예: 학습 과학, 교육 설계 또는 교육 기술)은 탐구할 가치가 있을 수 있다. 그렇게 함으로써, 해결책을 개발하기 전에 다룰 가치가 있는 문제들에 대한 서술적이고 설명적인 이해를 보장하는 데 세심한 주의를 기울이는 것을 우선시하는 같은 사고방식을 가진 학자들을 찾는 것이 중요해 보인다.

If fluency with the approach has yet to be developed before this community shares its design studies (more), then collaboration with researchers in sister fields, who are more accustomed to design research (eg, those in the learning sciences, instructional design or educational technology) may be worth exploring. In so doing, it seems crucial to seek out like-minded scholars who prioritise the giving of careful attention to ensuring descriptive and explanatory understanding of problems worth tackling before developing solutions.







. 2020 Jun 21.
 doi: 10.1111/medu.14280. Online ahead of print.

Educational design research: Portraying, conducting, and enhancing productive scholarship

Affiliations 

Affiliations

  • 1Department of Teacher Development (ELAN), Faculty of Behavioural, Management and Social Sciences, University of Twente, Enschede, the Netherlands.
  • 2Department of Career and Information Studies, College of Education, University of Georgia, Athens, Georgia, USA.

Abstract

Context: Solutionism is the all-too-common human propensity to jump to a solution before adequately understanding the nature of a problem. Solutionism has long been prevalent in efforts to improve education at all levels, including medical education.

Thesis: Educational design research (EDR) is a genre of research that features the gaining of in-depth understanding of a problem before any prototype solution is designed and tested. It is different from other forms of scientific inquiry because it is committed to the simultaneous development of both theoretical insights and practical solutions, together with stakeholders. This approach is powerful for theory building because it privileges ecologically valid studies that embrace the complexity of investigating learning in authentic (as opposed to laboratory) settings. When conducted well, both the research process and its outcomes generate valuable contributions to practice.

Preview: This article constitutes an expository essay on EDR, comprised of three movements. First, the approach is defined, its origins are presented, and its characteristics are described. Second, a generic model for conducting EDR is offered, and illustrated with examples from the field of medical education. Third, pathways towards advancing this form of inquiry are discussed, including ways to address inherent challenges and limitations, as well as recommendations for the medical education community. Although EDR is no panacea, this article illustrates how it can serve medical education research in a wide variety of geographic and disciplinary contexts.

의학교육에서 디자인-기반 연구 접근을 활용한 이론과 실천의 다리놓기: AMEE Guide No. 60 (Med Teach, 2012)

Building bridges between theory and practice in medical education using a design-based research approach: AMEE Guide No. 60

DIANA H. J. M. DOLMANS & D. TIGELAAR

Maastricht University, The Netherlands



도입 Introduction


뭐가 문제야?

What is the problem?


의학 교육 연구는 지난 20년 동안 전세계적으로 엄청나게 성장했다. 과학 학술지가 늘고 의료교육 연구 국제회의 참가자도 늘었다(Eva 2009). 그러나 의학 교육 연구는 교육 관행의 개선으로 이어지고 지식의 발전에 기여하는가?

Medical education research has grown enormously over the past 20 years worldwide. The number of scientific journals has increased and also the number of participants at international conferences on medical education research (Eva 2009). But, does medical education research lead to improvements in educational practice and does it contribute toward the advancement of knowledge?


교육 실무자들은 종종 교육 연구와 교육 실무 사이에 차이가 있다고 불평한다(Badley 2003). 일반교육영역 내에서 이뤄지는 연구는 교육실무와 관련이 없다는 주장이다. 의학 교육 연구 내에서는 의학 교육 연구가 지식체나 이론의 증대에 기여하지 않는다는 주장이 종종 제기된다(Albert et al. 2007).

Educational practitioners often complain that there is a gap between educational research and educational practice (Badley 2003). They argue that the research that is conducted within the general education domain is not relevant for educational practice. Within medical education research, it is often argued that medical education research does not contribute toward an increase of a body of knowledge or theory building (Albert et al. 2007).


많은 연구가 이론적 배경이 부족하다(Albert et al. 2007; Norman 2007). 이건 큰 문제야. 이론에 기반을 두지 않는 연구가 행해지고 있다면, 그 기초적인 요소나 원인을 이해하거나 설명하거나 개입이 작용하거나 작용하지 않는 이유를 설명하는 것은 매우 어려워질 것이다.

A number of studies lack a theoretical background (Albert et al. 2007; Norman 2007). This is a big problem. If studies are being conducted that do not rest on theories, then it will become very difficult to understand or explain the underlying factors or causes or to explain why an intervention works or does not work.


교육 연구는 일반 교육과 의료 교육 모두에서 지식체와 이론 구축(Ribes et al. 2008; Monruxe & Rees 2009)과 교육 실무에서 직면하는 문제 이해(Eva 2009)에 모두 기여해야 한다.

Educational research, both in general education and medical education, should both contribute toward the building of a body of knowledge and theories (Reeves et al. 2008; Monrouxe & Rees 2009) and understanding problems encountered in educational practice (Eva 2009).


교육 연구는 [개입이 작동하는지 여부]를 증명하는 데 목적이 있어야 할 뿐만 아니라 이러한 [복잡성을 이해]하는 데도 목적이 있어야 한다(Regehr 2010).

Education research should not only be aimed at proving whether an intervention works or not but also should be aimed at understanding this complexity (Regehr 2010).


본 가이드에서는, 설계 기반 연구(DBR)가 한편으로는 이론 시험과 정교화, 다른 한편으로는 교육 관행 개선에 기여하기 때문에, 연구와 실천 사이의 격차를 해소하는 데 도움이 될 수 있다고 주장할 것이다.

In this Guide, it will be argued that design-based research (DBR) can help to bridge the gap between research and practice, because it does contribute toward theory testing and refinement on the one hand and improvement of educational practice on the other hand.


DBR 뒤의 이론

The theory behind DBR explained


DBR의 특징은 무엇인가?

What are the characteristics of DBR?


    • 첫 번째 중요한 특징 중 하나는 DBR이 실험실 환경에서 이루어지는 것이 아니라, 학습이 정상적으로 이루어지는 실세계 환경에서 일어난다는 것이다(Barab & Squire 2004). DBR 연구는 실제 학습 맥락에서 학습의 본질에 대한 복잡한 문제에 초점을 맞춘다(Collins et al. 2004).

One first important characteristic is that DBR does not take place in a laboratory setting, but in a reallife setting where learning normally takes place (Barab & Squire 2004). DBR studies’ focus on complex problems about the nature of learning in a real learning context (Collins et al. 2004).


    • DBR의 또 다른 중요한 특징은 설계, 평가, 재설계(Design-Based Research Collective 2003)의 연속적인 사이클에서 일어난다는 것이다. 따라서 설계는 진정한 학습 환경에서 시험되거나 평가된다. 평가는 새로운 통찰력으로 이어지며, 이에 기초하여 설계를 더욱 개선하거나 재설계할 수 있다.

Another important characteristic of DBR is that it takes place in continuous cycles of design, evaluation, and redesign (Design-Based Research Collective 2003). Thus, a design is tested or evaluated in an authentic learning environment. The evaluation leads to new insights, based on which the design can be further improved or redesigned.


    • DBR의 세 번째 중요한 특징은 학습 환경의 설계가 이론적 원리에 기초한다는 것이다. DBR은 이론의 진보를 목표로 한다(Barab & Squire 2004). 이론은 많은 다른 변수들이 상호 작용하는 교육 같은 복잡한 환경에서 특정한 상황에서 어떤 것이 어떻게 작용하거나 작용하지 않는지를 이해하는 데 도움을 주기 때문에 교육 연구에서 매우 중요하다. 즉, 좋은 DBR은 이론과 실무를 발전시킨다(Barab & Squire 2004).

A third important characteristic of DBR is that the design of the learning environment is based on theoretical principles. DBR is aimed at advancing theories (Barab & Squire 2004). Theories are very important in education research because they help us to understand how or why something works or does not work under particular circumstances in a complex environment such as education, in which many different variables interact with each other. In other words, good DBR advances theories and practice (Barab & Squire 2004).


    • DBR의 네 번째 중요한 특성은 설계 평가에 단일 방법을 사용하지 않으며, 혼합 방법 연구가 특징이다. 학생, 교사, 학습 자료 및 평가 도구 사이의 복잡한 상호작용을 더 잘 이해하기 위해 DBR은 어떤 상황에서 어떤 것이 작용하는지 명확히 하는 양적 방법과 질적 방법 모두를 혼합한 방법을 사용한다. 한 연구 내의 혼합된 방법은 자연 환경에서 복잡한 상호작용을 연구할 때 매우 유용하다. 왜냐하면 그 연구 결과가 서로 보완될 수 있고, 결과를 교차 점검할 수 있고 불일치를 발견할 수 있게 할 수 있기 때문이다(Schifferder & Reed 2009).

A fourth important characteristic of DBR is that not a single method is used to evaluate the design, but DBR is characterized by mixed-methods studies. In order to better understand the complex interactions between students, teachers, learning materials, and assessment tools, DBR makes use of mixed methods, both quantitative and qualitative methods that clarify what works under which circumstances. Mixed methods within one study are very useful when studying complex interactions in natural settings, because the findings may complement each other, make it possible to cross-check findings and make it possible to discover inconsistencies (Schifferdecker & Reed 2009).


    • DBR의 다섯 번째 중요한 특징은 서로 다른 전문지식을 가진 설계자, 연구자 및 실무자들이 학습 환경을 설계, 평가 및 재설계하는데 긴밀히 협력한다는 것이다(Barab & Squire 2004). 그들은 서로 자주 교류하고 소통하며, 그들의 생각을 공유하며, 함께 이론과 실무를 다듬는다. 그래서 디자이너, 교사, 연구자와 연구자가 협력하여 전파한다. 이것은 교사와 학습자들의 소유권과 헌신을 만드는 데 기여한다. 또한, 그 디자인이 교육 실무에서 어떻게 재해석되고 각색되는지 명확히 한다(Design-Based Research Collective 2003).

A fifth important characteristic of DBR is that designers, researchers, and practitioners with different expertise work closely together in designing, evaluating, and redesigning the learning environment (Barab & Squire 2004). They interact and communicate with each other frequently, share their ideas, and together refine theories and practice. So, designers, teachers, and research and researchers collaborate in conducting the disseminating it. This contributes toward creating ownership and commitment from teachers and learners. It also makes us clear on how the design is reinterpreted and adapted in educational practice (Design-Based Research Collective 2003).


표 1. DBR의 다섯 가지 중요한 특성.

Table 1. Five important characteristics of DBR.


설계, 평가 및 재설계의 연속적인 사이클에서 수행

Takes place in continuous cycles of design, evaluation, and redesign


학습이 정상적으로 이루어지는 실제 학습 환경에서 수행

Takes place in authentic real-life learning settings where learning takes place normally


이론을 테스트하고 다듬는 동시에 실무의 진보를 목표로 함

Is aimed both at testing and refining theories and also advancing practice


혼합 방법 연구가 특징임

Is characterized by mixed-methods studies


서로 다른 전문지식을 가진 설계자, 연구자 및 실무자가 자주 상호 작용하여 아이디어를 공유

Designers, researchers, and practitioners with different expertise interact frequently and share their ideas


DBR의 짧은 역사

A short history of DBR


DBR 또는 설계 연구는 1990년대 초반에 처음 설명되었다(Ribes et al. 2005). 1992년 브라운(1992년)이 디자인 실험이라는 용어를 도입한 이유는 그 때부터 학습을 연구하기 위해 사용한 방법론의 틈새를 설계 실험이 채울 수 있다는 의견 때문이었다(Collins et al. 2004). [설계 실험design experiment]은 실제 학습 맥락에서 학습의 본질에 관한 이론적 질문을 다루고 이론 원리에 기초하여 교육 설계를 시험하고 다듬는 형성적 평가를 실시하는 것을 목적으로 했다(Collins et al). 2004년). 그 때부터 문헌에서는 설계 실험, 설계 연구, 개발 연구, DBR 등 다른 용어가 사용되고 있다. 이 용어는 서로 바꾸어 사용할 수 있지만, 본조에서는 설계 기반 연구 또는 DBR이라는 용어를 사용한다.

DBR or design research was first described in the early 1990s (Reeves et al. 2005). In 1992, the termdesign experiments was introduced by Brown (1992) because she was of the opinion that design experiments could fill a niche in the methodologies that were used since that time to study learning (Collins et al. 2004). Design experiments were aimed at addressing theoretical questions about the nature of learning in a real learning context and at conducting formative evaluations that test and refine educational designs based on theoretical principles (Collins et al. 2004). Since that time, different terms are being used in the literature such as design experiments, design research, development research, and DBR . The terms can be used interchangeably, but in thisarticle, we use the term design-based research or DBR.


DBR 및 기타 접근 방식

DBR and other approaches


지금까지 이 가이드를 읽은 후 일부 독자들은 DBR이 형성적 평가 또는 행동 연구, 즉 강사가 이를 개선하기 위해 자신의 교수 실습을 연구하거나 평가하는 연구의 새로운 단어라는 결론을 내릴 수 있다. DBR은 설계, 평가 및 재설계의 반복적이고 순환적인 과정과 같이 이러한 접근방식이 많은 공통점을 가질 수 있음에도 불구하고 형성적 평가 연구나 행동 연구action research와는 다르다. DBR은 특정 개입이 특정 기본 표준을 충족하는지 또는 어떤 측면의 개입에 개선이 필요한지를 형성적으로 평가하는 문제만은 아니다.

After having read this Guide so far, some readers might come to the conclusion that DBR is a new word for formative evaluation or action research; i.e., research in which instructors study or evaluate their own teaching practice in order to improve it. DBR is different from formative evaluation studies or action research, even although these approaches might have a lot in common, such as the iterative and cyclic process of design, evaluation, and redesign. DBR is not only a matter of formatively evaluating whether a particular intervention meets certain basic standards or which aspects of the intervention need improvement.


좋은 DBR은 또한 복잡한 학습 환경의 특성에 관한 이론을 시험하거나 다듬는 것을 목적으로 한다(Design-Based Research Collective 2003). 즉, 그 개입이 시험과 밀접하게 연결되어 있는 것은 이론과 정교함, 그리고 학습 환경을 설계하고 개선하는 데 얽혀 있는 이론들이다. [이론과의 연관성]은 DBR과 형성적 평가 또는 행동 연구의 기본적인 차이점이다. DBR은 학습 및 학습 환경에 대한 이론적 지식을 발전시키는 것을 목적으로 한다(Barab & Squire 2004). 이론적 토대와 주장claims이 DBR 접근법의 핵심이다(리브스 외 2005).

Good DBR is also aimed at testing or refining theories about the nature of complex learning environments (Design-Based Research Collective 2003). In other words, the interventions are closely connected to the testing is theories and refinement and of theories intertwined with designing and improving the learning environment. The connection with theory is the basic difference between DBR and formative evaluations or action research. DBR is aimed at advancing theoretical knowledge about learning and learning environments (Barab & Squire 2004). Theoretical foundations and claims are at the heart of the approach (Reeves et al. 2005).


DBR 및 혼합 방법 연구

DBR and mixed-methods research


또한 명심해야 할 중요한 것은 DBR이 여러 가지 방법을 사용한다는 것이다. 

    • 서로 다른 변수가 서로 어떻게 영향을 미치는지에 대한 통찰력을 제공하는 방법. 

    • 결과뿐만 아니라 개입이 왜 작용하는지, 어떻게 작용하지 않는지를 설명할 수 있는 기본 프로세스에 대해서도 주의를 기울이는 방법. 

실험실 환경에서 실험 연구는 DBR에서는 수행되지 않는다. 교육 개입에서 통제된 실험은 다소 환원적이고 사소한trivial 운동으로 이어질 수 있다는 문제 때문이다(Gruppen 2008).

What is also important to keep in mind is that DBR uses multiple methods; 

    • methods that provide insight in how different variables influence each other; and 

    • methods in which not only attention is paid to outcomes but also to the underlying processes that could explain why and how an intervention does work or not. 

Experimental studies in laboratory settings are not conducted within DBR. The problem is that controlled experimentation in educational interventions may lead to a rather reductionist and trivial exercise (Gruppen 2008).


우리는 통제된 실험이 절대 실행되어서는 안 된다고 주장하지 않는다. 그러나 이론과 교육 실습의 시험과 정교함을 모두 향상시키는 진정한 학습 환경에서 학습의 본질에 대한 연구 질문에 답하려면 DBR 접근법과 혼합된 방법론을 사용해야 한다. 혼합 방법 연구는 단일 연구에서 양적, 질적 연구 기법, 방법 또는 접근법을 사용하는 연구에 대한 접근법이다(Johnson & Onwegbuzie 2004).

We do not argue that controlled experiments should never be done. But, if we want to answer research questions about the nature of learning in authentic learning environments that both enhance the testing and refinement of theories and educational practice, we should use a DBR approach and a mixed-methods approach. Mixed-methods research is an approach to research in which quantitative and qualitative research techniques, methods, or approaches are used in a single study (Johnson & Onwuegbuzie 2004).


앞서 설명했듯이 연구자들이 서로 보완하고 강화하는 다른 전략과 방법을 이용해 복수의 데이터를 수집해야 한다는 취지다. 질적 방법은 DBR에서 중요한 역할을 한다. 정성적 방법은 풍부한 데이터를 생성하며 서로 다른 관점을 더 깊이 이해할 수 있다(Kuper et al. 2008). 질적 데이터는 복잡한 현상이 발생하는 방법과 이유를 탐구하고 동적 과정을 연구할 수 있도록 해준다(Johnson & Onwegbuzie 2004). 그러나 질적 데이터가 실제로 복잡한 현상을 설명하는 데 기여하는지는 물론 [질적 데이터가 잘 분석되고 조사 결과를 설명하는 데 기여하는지]에 달려 있다. 그저 테마들 사이의 관계는 설명하지 않고 데이터에서 나온 주제들을 설명하기만 해서는 안 된다(Pope & Mays 2009).

The idea is that researchers should collect multiple data using different strategies and methods that complement and strengthen each other, as also explained before. Qualitative methods play a crucial role in DBR. Qualitative methods generate rich data and can lead to deeper understanding of differing perspectives (Kuper et al. 2008). Qualitative data lend themselves to explore how and why complex phenomena occur and to study dynamic processes (Johnson & Onwuegbuzie 2004). But, whether qualitative data indeed contribute toward explaining complex phenomena is of course dependent on whether qualitative data are well analyzed and contribute toward explaining the findings and not just describing the themes that emerged from the data without explaining the relationships between the themes (Pope & Mays 2009).


실천에서 이론 The theory in practice


DBR 연구의 맥락

The context of the DBR studies


본 기사의 저자들이 참여한 DBR의 예는 고등교육의 맥락 안에서 교사의 전문적 발전을 촉진하기 위한 교수 포트폴리오의 개발을 다루었다(Tigela et al. 2006b, 2008). [평가, 교사의 전문적 개발 및 교수 포트폴리오에 관한 현대적 이론]이 교수 포트폴리오 프로토타입을 개발하기 위해 사용되었다(Tigelaar 등). 2004b).

An example of DBR in which the authors of this article were involved dealt with the development of a teaching portfolio for stimulating teachers’ professional development within the context of higher education (Tigelaar et al. 2006b, 2008). Modern theories on assessment, teachers’ professional development, and teaching portfolios were used to develop a teaching portfolio prototype (Tigelaar et al. 2004b).


교수 포트폴리오는 서로 다른 측정 기구를 포함하고 서로 다른 교수 역량과 관련되며 피드백이 중요한 역할을 하는 진정한 평가 도구다. 학습에 대한 구성주의적 견해와 그에 따른 학습과 평가의 정렬 필요성에 따라, 우리는 고등교육에서 형성적 목적과 총괄적 목적 모두에 적합한 교수 포트폴리오의 절차를 개발하고자 했다. 포트폴리오는 교사들에게 가르치는 과정에서 발생하는 학습 과정에 대한 통찰력을 주어야 하며, 동시에 승진 결정에 대한 적절한 근거를 제공해야 한다. 즉, 실제 교육 성과에 기초하여 교사 경력career을 추구persue할 수 있는 [타당한 결정]을 제공해야 한다. 이러한 결합된 목표는 포트폴리오 절차의 품질과 판단 방법에 높은 요구를 한다. 따라서 본 논문에서 다룬 일반적인 문제의 정의는 다음과 같다.

A teaching portfolio is an authentic assessment tool in which different measurement instruments are included, related to different teaching competencies, and in which feedback plays a crucial role. In line with constructivist views of learning and the corresponding need for alignment of learning and assessment, we wanted to develop a procedure for a teaching portfolio that was suitable for both formative and summative purposes in higher education. The portfolio should give teachers insight into their learning processes that occur as they are teaching and at the same time it should provide an appropriate basis for promotion decisions, i.e., decisions about the feasibility of pursuing a career in teaching on the basis of actual teaching performance. These combined objectives place high demands on the quality of the portfolio procedure and the judgment methods. Thus, the definition of the general problem that we addressed in this thesis was:


형성적 목적과 총괄적 목적 모두에 적합하기 위해 어떤 형태의 교육 포트폴리오를 취해야 하며, 그러한 포트폴리오의 품질을 어떻게 보장할 수 있는가?

What form should a teaching portfolio take to be appropriate for both formative and summative purposes and how can the quality of such a portfolio be guaranteed?


포트폴리오의 설계, 평가 및 재설계와 관련된 다른 단계들은 아래에 설명되어 있다. 또한, 상기 DBR의 5가지 특성이 어떻게 실제 적용되었는지에 대해서도 설명한다. 또한 이 DBR 연구에서 이론시험과 이론의 정교화와 실천의 진보가 어떻게 결정적인 역할을 했는지에 대해서도 설명한다.

The different steps involved in the design, evaluation and redesign of the portfolio are explained below. In addition, it is illustrated as to howthe five characteristics of DBR above were applied in practice. It is also illustrated how theory testing and theory refinement and advancement of practice played a crucial role in this DBR study.


포트폴리오의 설계, 평가 및 재설계의 지속적인 사이클

Continuous cycles of design, evaluation, and redesign of the portfolio


이론적 기초와 설계, 평가 활동 및 재설계를 정의하는 순환 과정이 형태 형성적 및 요약적 교사 평가를 위한 포트폴리오 절차의 개발의 기초가 되었다. 이 연구는 세 가지 주요 단계로 구성되었다.

A cyclic process of defining theoretical underpinnings and design, evaluation activities, and redesign was the basis for the development of a portfolio procedure for both formative and summative teacher assessments. The research consisted of three main steps:


(1) 분석 및 재설계 

(2) 평가 및 재설계 

(3) 분석 및 재설계

(1) Analysis and redesign; 

(2) Evaluation and redesign; and 

(3) Analysis and redesign


첫 번째 분석 및 재설계 단계는 두 개의 하위 단계로 구성되었다. 

The first analysis and redesign phase consisted of two substeps. 


    • 1a단계에서는 고등교육의 교육역량 프레임워크를 개발, 검증하여, 교사의 고등교육 수행평가를 위한 출발점으로 활용할 수 있도록 하였다. 이 틀은 교육 전문가들이 ''고등교육에 경험이 많은 교사에게 각 영역에서 다음과 같은 교수 역량이 얼마나 중요한가?'라는 질문에 답하도록 하는 델파이 연구를 통해 개발되었다.’’

In step 1a, a framework for teaching competencies in higher education was developed and validated, which could be used as a starting point for appraisal of teachers’ performance in higher education. This framework was developed by means of a Delphi study in which educational experts were asked to answer the question: ‘‘How important are the following teaching competencies in each domain for an experienced teacher in higher education?’’


    • 1b단계에서는 이론적 기초에 기초하여 교원양성과 평가를 위한 교수 포트폴리오의 프로토타입이 개발되었다. 이 프로토타입은 포트폴리오를 재설계한 후 포트폴리오 전문가의 의견에 따라 테스트되었다.

In step 1b, a prototype for a teaching portfolio for teacher development and assessment was developed based on theoretical underpinnings. This prototype was tested against the opinions of portfolio experts after which the portfolio was redesigned.


평가 및 재설계 단계는 2a, 2b, 2c 단계로 구성되었다.

The evaluation and redesign step consisted of steps 2a, 2b, and 2c.


    • 2a단계에서는 설계를 구체화하고 수정하기 위해 소규모 연구에서 포트폴리오의 형성적 기능을 탐구했다. 우리는 포트폴리오 과제를 분석하여 교사들의 기능 측면에 대한 성찰의 다양한 예시를 파악했다.

In step 2a, we explored the formative function of the portfolio in a small-scale study in order to specify and revise the design. We analyzed portfolio assignments to identify illustrative teachers’ a variety examples of reflections on of aspects of their functioning.


    • 2b단계에서는 포트폴리오 작업 과정에서 교사의 협력적 성찰의 질을 분석했다. 참여 교사들의 동료 회의 영상 녹화는 세부적인 방식으로 분석되었다.

In step 2b, we analyzed the quality of teachers’ collaborative reflections during the process of working on the portfolio. Video recordings of peer meetings from the participating teachers were content analyzed in a fine-grained way.


    • 2c단계에서는 포트폴리오에 의한 교사의 전문적 발전 자극과 관련된 활성화 및 비활성화 요인을 조사했다. 우리는 또한 교사들이 그 포트폴리오가 전문적 발전을 촉진하고 교육 분야의 직업 전망에 대한 종합적인 결정을 위한 좋은 도구라고 생각하는지 문의했다.

In step 2c, we examined enabling and disabling factors in relation to the stimulation of teachers’ professional development by the portfolio. We also inquired whether teachers thought the portfolio was a good instrument for fostering professional development and for summative decisions about prospects for a career in education.


3단계에서는 정성적 데이터를 평가하는 방법에 대한 이론적 관점을 분석하여 교육 포트폴리오 평가를 위한 품질 기준이나 설계 지침을 정의했다. 본 연구에서 제시된 주장에 기초하여, 교수 포트폴리오에 대한 평가 절차의 구성을 위한 설계 지침이 개발되었다.

In step 3, we defined quality criteria or design guidelines for assessing teaching portfolios based on an analysis of a theoretical perspective on how to assess qualitative data. On the basis of the arguments presented in this study, design guidelines were developed for the organization of assessment procedures for teaching portfolios.


마지막으로, 우리는 일반적인 문제 정의와 목표로 돌아가 우리의 설계와 개발 노력에서 배운 것뿐만 아니라 이론적 기초와 교수 포트폴리오의 실제 구현에 관한 시사점에 대해 토론했다.

Finally, we returned to the general problem definition and aims and discussed what we learned from our design and development efforts as well as the implications with regard to the theoretical underpinnings and the practical implementation of teaching portfolios.


이번 연구는 설계, 평가, 재설계 등의 순환 과정으로 진행됐다. 

The research was carried out as a cyclic process of design, evaluation, and redesign. 


    • 1b단계에서는 포트폴리오 평가 경험이 풍부한 교육자에게 포트폴리오 프로토타입을 평가하도록 했다. 이로 인해 포트폴리오 설계 지침이 몇 가지 갱신되었다. 예를 들어, 교사의 창의성과 학습 과정을 촉진하기 위해 포트폴리오 구조가 개방적이고 유연해야 하며 지나치게 규범적이지 않아야 한다는 설계 지침이 있다.

In step 1b, educationalists with ample experience with portfolio assessment were asked to evaluate the portfolio prototype. This resulted in several updates of the portfolio design guidelines. For example, The design guideline that the portfolio structure should be open and flexible and not be too prescriptive, in order to stimulate teachers’ creativity and learning processes.


    • 2단계에서는 일정한 형성적 평가 과정도 수행했다. 포트폴리오 설계는 다음을 기반으로 업데이트 되었다. 다양한 포트폴리오 과제에 의해 추진되는 교사의 성찰 내용 분석 (2a 단계)

      동료 회의 중 교사의 협력적 성찰의 질에 대한 세분화된 분석 (2b 단계)

      포트폴리오의 유용성에 대한 교사들의 의견 (2c 단계) 

      이는 예를 들어, 교사 개인의 필요에 따라 포트폴리오를 조정할 수 있는 가능성을 열기 위해 차별화된 포트폴리오 과제를 사용해야 한다는 지침에서 비롯되었다.

In step 2, a constant formative evaluation process was carried out as well. The portfolio design was updated based on
an analysis of the content of teachers’ reflections promoted by the different portfolio assignments (step 2a, Tigelaar et al. 2004b),
a fine-grained analysis of the quality of teachers’ collaborative reflections during the peer meetings (step 2b, Tigelaar et al. 2008), and
teachers’ opinions about the usefulness of the portfolio (step 2c, Tigelaar, et al. 2006b).
This resulted, for example, in the guideline that differentiated portfolio assignments should be used in order to open the possibility to tailor a portfolio to a teacher’s individual needs.


    • 포트폴리오 평가를 위한 가이드라인을 구체화하는 데 초점을 맞춘 3단계에서는 설계 가이드라인도 업데이트하는 결과를 낳았다. 문헌 연구에 기초하여, 우리는 이론적 기초와 설계 지침을 업데이트했다. 포트폴리오 평가에 대한 가장 적절한 접근방식은 포트폴리오 내 정보의 질적 특성에 대한 정의가 작용하기 때문에 hermeneutic, 해석적 접근방식이 될 것이라고 결론지었다.

Step 3, which focused on specifying the guidelines for portfolio assessment, resulted in an update of the design guidelines, too. On the basis of a literature study, we updated our theoretical underpinnings and design guidelines. We concluded that the most appropriate approach to portfolio assessment would be a hermeneutic, interpretative approach, because this would do justice to the qualitative nature of the information in portfolios.


또한, 우리는 포트폴리오 평가 프로세스에 대한 설계 가이드라인을 구축하기 위해 [헤르메뉴틱, 해석적 연구에 사용되는 기준](Guba & Lincoln 1989년)이 가장 적합하다고 결론지었다. 우리는 가능한 한 권력power의 불균형이 거의 없는 상태에서 우리의 조형적이고 포괄적인 포트폴리오 평가 절차가 청취, 대화 및 의견 교환으로 특징지어지는 과정이 되도록 설계 지침을 재설계했다.

In addition, we concluded that criteria that are used in hermeneutic, interpretative research (Guba & Lincoln 1989) would be the most appropriate ones for building design guidelines for portfolio assessment processes. We redesigned our design guidelines in such a way that our formative and summative portfolio assessment procedure would be a process that is characterized by listening, dialog, and exchange of views with as little imbalance of power as possible.


설계 지침의 몇 가지 예는 다음과 같다: 

    • 평가자는 포트폴리오의 모든 증거를 신중히 고려해야 하며, 포트폴리오 증거에서 대수를 검색하면서 동료 평가자와 그들의 해석에 도전해야 한다. 

    • 후보자에게는 포트폴리오에 대한 평가 기준과 해석에 대해 토론할 수 있는 기회가 주어지고 최종 판단이 내려지기 전에 포트폴리오에 정보를 추가할 수 있는 기회가 주어진다.

Some examples of design guidelines are: 

    • Assessors should carefully consider all evidence in a portfolio, and challenge their interpretations with a peer assessor, searching for counterexamples in the portfolio evidence. 

    • Candidates should be given the opportunity to discuss about assessment criteria and interpretations about their portfolio and be given the chance to add information to their portfolio before final judgment is being made.


실제 설정

Authentic, real-life settings


평가(2a, 2b, 2c 단계)는 진실한authentic 실생활 환경에서 수행되었다. 5명의 경험 많은 선생님들과 그들의 개인 코치들이 이번 연구에 참여하였다.

The evaluation (steps 2a, 2b, and 2c) was carried out in an authentic, real-life setting. Five experienced teachers and their personal coaches were involved in the study,


평가 단계 동안, 미래 종합 사용의 선택권은 열려있었지만, 교육 포트폴리오의 목적은 주로 형성적이었다. 우리는 교사들에게 다음과 같은 교사들의 역할에 따라 포트폴리오를 구성하도록 요청했다. 2004a:

During the evaluation phase, the purpose of the teaching portfolio was primarily formative, although the option of future summative use was kept open. We asked the teachers to organize the portfolio according to the following roles of teachers: (Tigelaar et al. 2004a):


. 교사로서의 사람, 내용 지식 전문가, 학습 과정 촉진자, 조직자, 학자/평생 학습자. 

. the person as a teacher, expert on content knowledge, facilitator of learning processes, organizer, and scholar/ lifelong learner. 


게다가 교사들은 다음과 같은 6가지 과제를 수행했다. 

In addition, teachers carried out six assignments: 

. 당신의 교수 경력 이력을 설명하시오. 

. 교사로서 당신의 발전에 있어 중요한 사건들을 기술하시오. 

. 개인 학습 목표를 설계하고, 증빙 자료를 선택하시오

. 좋은 선생님의 프로필을 작성하시오

. 반성적인 포트폴리오를 짜시오

. describe your teaching career history; 

. describe critical incidents in your development as a teacher; 

. design personal learning goals; select evidential materials; 

. compose a profile of a good teacher; and 

. compile a reflective portfolio.


각각의 과제가 끝난 후, 교사들은 교대로 두 가지 유형의 사회적 상호작용 중 하나를 수행했다: 개인 코치와 세 번의 만남, 그리고 또래 회의에서 세 번의 만남. 사회적 상호작용을 통해 지원 및 피드백, 심층 분석, 실천 개선 제안, 교사의 인식에 대한 성찰 장려, 자신의 교육실무를 보다 잘 이해하기 위한 결정 등을 통해 과제의 효과를 강화할 수 있을 것으로 기대되었다.

After each assignment, the teachers alternately engaged in one of two types of social interactions: three meeting with their personal coach and three at a peer meeting. The social interactions were expected to reinforce the effects of the assignments through support and feedback, in-depth analysis, suggestions for improving practice, encouragement for teachers to reflect on their perceptions, and decisions in order to better understand their own teaching practice.


이론 테스트 및 정제 및 개선 실습

Testing and refining theory and advancing practice


위의 설명에서, [교사의 창의성과 학습 과정을 자극하기 위해서는], 연구들은 (포트폴리오 구조와 같이) 실천을 개선하기 위한 가이드라인이 개방적이고 유연해야 하며 너무 규범적이어서는 안 된다는 것이 분명해졌다. 아래에서는 형태 형성 평가 동안 지속적으로 그것들을 시험한 결과, 이론적 기초( – 교사 – 학습에 관한 이론에서 파생됨)가 얼마나 정제되었는지 더 자세히 설명한다.

From the description above, it became clear that the studies revealed design guidelines that advanced practice, such as the portfolio structure should be open and flexible and not be too prescriptive, in order to stimulate teachers’ creativity and we learning processes. Below, we illustrate further how refined our theoretical underpinnings (derived from theories about – teacher – learning) as a result of constantly testing those during the formative evaluations,


포트폴리오의 이론적 기초에 대한 첫 번째 개선은 포트폴리오의 목적을 다루었다. 우리는 평가에서 학습, 교육, 평가의 높은 일관성이 요구된다는 이론적 기초에서 출발했다. 이를 흔히 학습과 평가의 높은 일관성이 있는 '정렬alignment'의 원칙이라고 한다(Biggs 1996). 우리의 관점은 포트폴리오가 교사의 학습과 전문적 발전(형성적 기능)을 촉진하고 교육적 직업의 가능성(요약적 기능)과 같은 문제에 대한 결정의 근거를 제공해야 한다는 것이었다. 딜레마는 이것이 두 가지 유형의 목표를 바람직하지 않은 간섭을 일으킬 수 있다는 것이다. 문헌에 따르면 교사 학습 과정에 부정적인 역효과(backwash)가 있을 수 있다. 예를 들어, 교사들은 총괄 평가 기준과 관련하여 자신의 강점만을 제시하려고 할 수 있다(Biggs 1996, 1999).

A first refinement of our theoretical underpinnings of the portfolio dealt with the purpose of the portfolio. We departed from the theoretical underpinning that in assessments, a high consistency between learning, instruction, and assessment is required. This is often referred to as the principle of ‘‘alignment,’’ that is a high consistency between learning and assessment (Biggs 1996). Our viewpoint was that a portfolio should stimulate teachers’ learning and professional development (formative function) and provide a basis for decisions about issues such as the possibility of an educational career (summative function). The dilemma is that this may cause undesirable interference of the two types of goals. The literature indicates that there may be negative backwash effects on teacher learning processes, for instance teachers might be only willing to present their strong points in relation to the criteria for summative assessment (Biggs 1996, 1999).


이것은 교사들의 학습 과정과 그들의 전문적 발달과 같은 [형성적 기능]을 심각하게 약화시킬 것이다. 왜냐하면 그것은 개선이 필요한 영역이 피드백과 비판적 성찰에 노출되지 않은 채로 남아 있을 것이기 때문이다. 평가가 학습을 촉진한다고 알려져 있으므로(Longhurst & Norton 1997), 평가 과정은 의미 있는 학습 경험을 제공할 수 있도록 설계되어야 한다. 우리의 연구는 [교사의 학습과 그들의 전문적 발전]에 주안점을 두고 평가 과정이 신중하고 신뢰할 수 있는 방식으로 수행된다면, 두 가지 목표가 하나의 포트폴리오 절차로 결합될 수 있다는 것을 보여주었다포트폴리오 프로토타입에 대한 전문가 자문부터, 그리고 교육 포트폴리오의 유용성에 대한 참가자의 의견을 바탕으로 포트폴리오 목적에 관한 이론적 토대를 정비했다.

This would seriously weaken the formative function, i.e.: teachers’ learning processes and their professional development, because it would mean that areas that need improvement would remain underexposed to feedback and critical reflection. Since it is known that assessment drives learning (Longhurst & Norton 1997), assessment processes should be designed to provide meaningful learning experiences. Our studies demonstrated that the two aims can be combined in one portfolio procedure as long as the primary focus is on the learning of teachers and their professional development and the assessment process is performed in a careful and trustworthy manner. From our consultation of experts about the portfolio prototype (Tigelaar et al. 2004b), and on the basis of participants’ opinions on the usefulness of the teaching portfolio (Tigelaar et al. 2006b), we refined our theoretical underpinning with respect to portfolio purpose.


우리는 처음부터 총괄적 결정을 위해 사용할 수 있다는 것이 교사들로 하여금 그들의 포트폴리오에 대해 일하도록 동기를 부여한다고 주장했다. 분명, 본질적인 동기 부여가 교사들이 그들의 포트폴리오와 그들의 교육 성과에 대한 성찰에 시간을 소비하는 충분한 동기 부여라고 기대하는 것은 현실적이지 않다. 교사들 또한 궁극적인 목표와 이익이 그들의 노력을 가치 있게 만든다는 것을 확신할 필요가 있다. 따라서 우리는 가능한 한 권력의 불균형이 적은 분위기에서 좋은 가르침에 대한 의견 교환과 평가 기준에 대한 피드백과 대화로 특징지어지도록 설계 지침을 조정했다.

We argued that being able to work toward a summative decision from the start motivates teachers to work on their portfolio. Apparently, it is not realistic to expect that intrinsic motivation is a sufficient incentive for teachers to spend time on their portfolios and on reflecting on their teaching performance. Teachers also need to be convinced that the ultimate goals and profits make their efforts worthwhile. We therefore refined our design guidelines in such a way that a combined formative and summative portfolio procedure should be characterized by feedback and dialog about assessment criteria and an exchange of views about good teaching in a climate with as little imbalance of power as possible.


우리의 [이론적 기반]에 대한 또 다른 개선은 [코치의 역할]을 다루었다. 코치는 코칭 관계의 안전한 환경을 극대화하기 위해 지원 제공자만 되어야 하는가, 아니면 코치가 평가자의 종합적 기능을 가져야 하는가? 드라이센 외 (2005) 코치는 코칭하는 교사와 너무 밀접하게 관련되어 있기 때문에 코칭하는 교사의 공식적인 평가자가 되어서는 안 된다고 명시한다. 우리 연구에서 두 역할이 엄격하게 분리되어서는 안 된다는 결론을 내렸다. 장기간 교전(Guba & Lincoln 1989년)의 이론적 원리에 따르면, 평가자는 후보자의 교육 성과에 대해 이용할 수 있는 모든 종적 정보를 신중하게 고려해야 한다.

Another refinement of our theoretical underpinnings dealt with the role of the coach. Should coaches only be support providers so as to maximize the safe climate of the coaching relationship or should coaches also have the summative function of assessor? Driessen et al. (2005) state that coaches should not be the formal assessors of the teachers they coach, because they are too closely involved with them. In our studies, we concluded that the two roles should not be strictly separated. According to the theoretical principle of prolonged engagement (Guba & Lincoln 1989), it is important that assessors should carefully consider all the longitudinal information that is available about candidates’ teaching performance.


이는 후보들과 가장 오랜 교류가 있는 코치들도 좋은 가르침이 무엇인지에 대해 논의할 평가인 팀에 참여해야 함을 시사한다. 본 연구에서는 [장기간의 참여 원리]와 [학습자의 참여와 통제를 강조하는 학습 및 평가]에 대한 구성주의적 관점을 결합하여 코치 역할에 대한 이론적 원리를 다듬었다(Birenbaum 2003; Segers 2004). 이러한 관점에서, 코치가 [다른 관점에서 가르치는 것에 정통한 다른 멤버들로 구성된 평가자 팀의 일원으로서] candidate에 대한 추가적인 맥락 정보를 제공할 수 있다고 주장하면서, 평가를 받고 있는 교사의 코치에 대한 우리의 설계 지침은 정비되었다.

This suggests that coaches, who have the most prolonged engagement with the candidates, should also be involved in the team of assessors who will discuss about what constitutes good teaching. In our research, we refined our theoretical principle about the coach role by combining the principle of prolonged engagement with constructivist views on learning and assessment, which stress learner participation and control (Birenbaum 2003; Segers 2004). From this viewpoint, our design guideline about the coach of the teacher who is being assessed was refined, arguing that coaches might provide additional context information about their candidates as a member of the team of assessors, which is otherwise comprised of other members, who are knowledgeable on teaching from different perspectives.


우리의 [이론적 기초]에 대한 세 번째 개선은 [분석적 평가]와 [전체론적 평가]의 차이를 다루었다. 분석적 평가는 정밀한 기준과 표준화된 절차의 적용에 초점을 맞추는 반면, 전체론적 평가는 모든 평가 정보에 기초하여 가설을 지속적으로 개발하고 시험하는 모든 구성 요소에 비추어 전체적인 이해를 도모하는 것을 목적으로 한다. 한편, 투명성과 공정성을 촉진하기 위해 명확하게 정의된 분석 평가 기준이 필요한 반면, 그러한 기준에 지나치게 의존하는 것은 포트폴리오 평가를 무의미한 빈칸 채우기 연습으로 바꿀 수 있다. 전체론적인 포트폴리오 평가는 그 반대이다. 

A third refinement of our theoretical underpinnings dealt with the difference between analytic and holistic assessments. Analytic assessment focuses on the application of precise criteria and standardized procedures, whereas holistic assessment is aimed at seeking to understand the whole in the light of all its constituents, constantly developing and testing hypotheses based on all assessment information. On the one hand, clearly defined analytic assessment criteria are needed to promote transparency and fairness, whereas on the other hand too much reliance on such criteria might turn portfolio assessment into a meaningless exercise of filling in blanks. The opposite holds for holistic portfolio assessment. 


우리의 연구로부터, 우리의 [이론적 토대]는 투명성과 공정성보다 의미와 학습 기회가 우선되어야 한다는 결론에 도달했다는 점으로 정제되었다. 설계 지침 업데이트의 경우, 이는 기준이 [지원자는 자신의 기능을 성찰하도록 자극]하고, [평가자는 자신의 관점을 명확히 하도록 장려]하는 가이드로 간주되어야 함을 의미한다. 무엇이 좋은 교육을 구성하는지에 대한 토론과 대화는 평가자들이 포트폴리오를 평가하는 동안 나타나는 다양한 해석을 의미 있는 전체론적 판단으로 통합하도록 유도할 것이다. 즉, 정밀한 기준에 대한 판단을 내릴 필요 없이 평가기준이 고려의 단서를 제공해야 한다. 해석의 기준 또는 단계는 정기적인 개정의 대상이 되어야 한다.

From our studies, our theoretical underpinnings were refined in the sense that we came to the conclusion that meaningfulness and learning opportunities should take precedence over transparency and fairness. For our updates of the design guidelines, this means that criteria should be seen as guidelines that stimulate candidates to reflect on their functioning and encourage assessors to clarify their perspectives. Discussion and dialog about what constitutes good teaching will invite assessors to integrate different interpretations that emerge during the assessment of a portfolio into a meaningful holistic judgment. This means that assessment criteria should offer cues for consideration, without the need to pronounce judgment on precise criteria. The criteria, or steps for making interpretations, should be subject to regular revision.


혼합 방법 연구

Mixed-methods studies


표 2. 교육 포트폴리오를 설계, 평가 및 재설계하기 위해 수행된 연구의 개요.

Table 2. Overview of studies conducted to design, evaluation, and redesign a teaching portfolio.


1단계: 분석 및 재설계

Step 1: Analysis and redesign


1a: 역량강화 프레임워크 개발. 델피는 교육 전문가들 사이에서 연구한다. (티겔라르 외). 2004a)

1a: Development of a framework for teaching competence. Delphi study among educational experts. (Tigelaar et al. 2004a)


1b: 포트폴리오 프로토타입 개발. 포트폴리오 전문가와 인터뷰 연구(Tigelaar 등) 2004b).

1b: Development of portfolio prototype. Interview study with portfolio experts. (Tigelaar et al. 2004b)


2단계: 평가 및 재설계

Step 2: Evaluation and redesign


2a: 교사의 성찰 탐구. 문서 분석. (Tigelaar 등 2006a)

2a: Exploration of teachers’ reflections. Document analysis. (Tigelaar et al. 2006a)


2b: 동료 회의 중 교사의 상호작용 및 협력적 반영 프로세스 비디오 분석. (Tigelaar 등 2008)

2b: Teachers’ interactions and their collaborative reflection processes during peer meetings. Video analysis. (Tigelaar et al. 2008)


2c: 포트폴리오의 유용성에 대한 참가자들의 의견. 인터뷰 연구 (Tigelaar et al.

2c: Participants’ opinions about the usefulness of the portfolio. Interview study. (Tigelaar et al. 2006b)


3단계: 분석 및 재설계

Step 3: Analysis and redesign


3: 포트폴리오 평가 절차와 관련된 품질 기준 및 권고 사항. 문헌 연구 (Tigelaar et al. 2005)

3: Quality criteria and recommendations with regard to the portfolio assessment procedure. Literature study. (Tigelaar et al. 2005)


연구의 1단계에서는 양적 방법과 질적 방법을 조합하여 사용했다. 교육 역량 프레임워크를 개발하기 위해 1a단계에서 델파이 메소드를 사용했다. 우리는 교육 전문가가 작성한 설문지를 여러 라운드에서 개발했다.

In step 1 of the research, a combination of quantitative and qualitative methods was used. In order to develop a teaching competency framework, in step 1a, the Delphi-method was used; we developed a questionnaire which was filled out by educational experts, in different rounds.


이후 이론 원리에 기초한 포트폴리오 프로토타입의 개발인 1b 단계에서, 우리는 프로토타입에 이론적 기초가 어느 정도 반영되어 있는지를 결정하고, 그들이 필요하다고 생각하는 어떤 수정이 필요한지를 나타내기 위해 인터뷰 연구를 수행했다.

Subsequently, in step 1b, the development of a portfolio prototype based on theoretical principles, we carried out an interview study to determine to what extent the theoretical underpinnings were reflected in the prototype and to indicate any modifications they thought were required.


평가 단계인 2단계는 소규모로 진행됐다. 따라서 양적 방법은 그다지 적합하지 않았다. 그러나 서로 다른 질적 방법을 조합하여 혼합 방법 접근법을 적용하였다. 이는 포트폴리오에 의해 자극을 받은 학습 과정과 복잡한 상호작용에 대한 통찰력을 얻기 위해 수행되었다.

Step 2, the evaluation phase, was carried out on a small scale. Therefore, quantitative methods were not very suitable. However, a mixed-methods approach was applied by combining different qualitative methods. This was done in order to gain insight into the learning processes and complex interactions that were stimulated by the portfolio.


2a단계에서는 교사의 과제를 바탕으로 교사의 성찰적 글쓰기 내용을 분석하는 텍스트 분석을 실시했다. 이어서 2b단계에서는 또래회의 중 사회적 상호작용과 교사의 협력적 성찰 과정의 범위에 대해 세분화된 영상분석을 실시했다. 2c단계에서는 포트폴리오 구조의 유용성과 전문성 개발을 촉진하는 사회적 상호작용에 대한 교사와 코치의 의견으로 이러한 데이터를 보완했다. 포트폴리오의 유익성, 활성화 및 비활성화 요인과 관련된 카테고리를 사용하여 인터뷰 연구를 수행하고 결과를 분석하였다.

In step 2a, we carried out a document analysis, analyzing the contents of teachers’ written reflections, based on their assignments. Subsequently, in step 2b, we carried out a fine-grained video analysis on the social interactions during the peer meetings and on the scope of teachers’ collaborative reflection processes. In step 2c, we complemented these data with the opinions of teachers and their coaches about the usefulness of the portfolio structure and social interactions for stimulating their professional development. We carried out an interview study and analyzed findings using categories related to benefits, enabling and disabling factors in the portfolio.


마지막으로, 3단계에서는 포트폴리오 평가를 위한 정교한 설계 가이드라인에 도달하기 위해 포트폴리오 평가 방법 및 포트폴리오 평가 프로세스의 건전성을 보장하기 위한 품질 기준quality criteria에 대한 문헌 연구를 실시했다.

Finally, in step 3, in order to arrive at refined design guidelines for portfolio assessment, we carried out a literature study on methods for judging portfolios and quality criteria for guaranteeing the soundness of portfolio assessment processes.


설계자, 연구자 및 실무자 간의 빈번한 상호 작용

Frequent interaction between designers, researchers, and practitioners


설계 과정에서 연구과정의 일환으로 설계자, 연구자, 실무자 간의 고빈도 커뮤니케이션이 조직되었다. 연구 개발 과정은 4명의 교육 연구원으로 구성된 연구팀이 수행했는데, 이들은 2개의 교육 개발에도 전문지식이 있었다. 이 기사의 저자는 그 팀의 구성원이었다. 디자인 과정에서 교육 전문가와 실무자 모두의 의견을 구했다.

During the design process, frequent communication between designers, researchers, and practitioners was organized as part of the research process. The research and development process was carried out by a research team, consisting of four educational researchers, who also had expertise in two educational development. The authors of this article were members of that team. During the design process, we sought the opinions of both educational experts and practitioners from the field.


교수역량 프레임워크 개발에 초점을 맞춘 델파이 연구(1a단계)에는 고등교육에 종사하는 교육 전문가가 선정됐다. 이후 1b단계에서는 개발 및 평가를 위한 교육 포트폴리오의 프로토타입을 개발 및 테스트했다. 포트폴리오 평가 경험이 풍부한 9명의 교육자의 판단을 위하여 제출된 포트폴리오. 우리의 이론적 선택이 프로토타입에 어느 정도 반영되고 어떤 수정이 필요한지 조사했다.

For the Delphi study (step 1a), which was focused on developing a teaching competency framework, educational experts were selected who work in higher education. Subsequently, in step 1b, we developed and tested a prototype of a teaching portfolio for development and assessment was the purposes. The portfolio submitted to judgment of nine educationalists with ample experience with portfolio assessment. We investigated to what extent our theoretical choices were reflected in the prototype and which modifications were needed.


2a, 2b, 2c 단계에서는 실무자들이 참여하였다. 5명의 숙련된 교사들과 그들의 개인 코치들이 연구에 참여했고, 모든 의사들이 이 연구에 참여했다. 이러한 실무자들은 모두 포트폴리오의 유용성을 평가하는 데 참여했으며, 이들의 의견은 포트폴리오 설계 지침을 최적화하는 데 큰 도움이 되었다.

In steps 2a, 2b, and 2c, practitioners were involved. Five experienced teachers and their personal coaches were involved in the study, all medical doctors. All these practitioners were involved in evaluating the usefulness of the portfolio, and their opinions were of great benefit for optimizing the portfolio design guidelines.


일반적으로 DBR의 함정과 과제

Pitfalls and challenges of DBR in general


국지적 상황에 대한 실제적 목적의 경우에만 해당

Only of practical relevance for local situation


진정한 실세계 학습 환경 내에서 연구를 수행할 때의 단점은 [한 지역적 맥락 안에서 특정 혁신적 학습 환경]에서 흥미로운 통찰력을 얻을 수 있다는 점일 수 있지만, 이러한 연구는 다른 맥락에서는 가치가 제한될 수 있다. 즉, 연구는 종종 소수의 학생 또는 교사가 참여하는 특수 설계 환경에서 이루어졌기 때문에 다른 맥락에서 일반화되지 않을 수 있다.

A disadvantage of conducting studies within an authentic reallife learning setting might be that they may result in interesting insights in a particular innovative learning environment within one local context, but these studies have limited added value for other contexts. In other words, the findings may not generalize to other contexts, because the study took place in a specifically designed context in which often a few students or teachers participate.


반면에, 지역 상황보다 더 광범위한 관련성을 자극하기 위해 몇 가지 이슈를 고려할 수 있다. 

On the other hand, several issues can be taken into account to stimulate a broader relevance than the local situation. 


첫째, 이론에 바탕을 두고 이론들을 사용하여 연구 결과를 설명함으로써. 

둘째, 연구 내용에 대한 상세한 설명을 포함시킴으로써, 독자들은 그 결과를 자신의 상황에 어떻게 또는 어떻게 적용할 수 있는지 이해할 수 있다. 

셋째, 설계 원리를 생성한다.

First of all, by grounding the design on theories and using theories to explain the findings. 

Second, by including a detailed description of the context in the study, due to which readers can understand how or whether the findings can be applied to their own situation. 

Third, by generating design principles.


지역적 맥락은 DBR에서 매우 중요하지만, 좋은 DBR은 유사한 진정한 혁신적 학습 환경에서 일반화될 수 있는 지침을 제공해야 한다. 따라서 DBR은 다른 설정에서 설계가 시험되어야 할 필요가 있다(Design-Based Research Collective 2003). 그러나 다른 설정에 걸친 이 시험은 모든 맥락에 광범위하게 적용될 수 있는 설계 지침으로 귀결될 필요는 없다. 가장 좋은 경우, DBR 연구는 McKenney 등이 주장하는 바와 같이 [특정 이론적 주장 때문에 특정 개입이 특정 맥락에서 구현되기 위해 어떤 특성이 중요한지 명확히 하는 설계 지침]을 정의하도록 이끌어야 한다. (2006). 따라서, 레게르(2010년)의 주장처럼, 교육 실무에 광범위하게 관련되는 모든 맥락에 일반화될 수 있는 단순한 발견이나 설계 지침을 생성하는 문제가 아니다.

Although the local context is very important in DBR, good DBR should yield guidelines that can be generalized across similar authentic innovative learning environments. Therefore, DBR requires testing a design across different settings (Design-Based Research Collective 2003). This testing across different settings does, however, not need to result in design guidelines that can be broadly applied to all contexts. At best, DBR studies should lead to defining design guidelines that make clear which characteristics are crucial for a particular intervention to be implemented in a specific context because of certain theoretical arguments, as argued by McKenney et al. (2006). So, it is not a matter of generating simple findings or design guidelines that can be generalized to all contexts that are broadly relevant for educational practice, as also argued by Regehr (2010).


이론을 발전시키지 않는다.

Does not advance theories


DBR을 수행할 때의 또 다른 단점은 DBR이 실무 설계와 재설계에만 지나치게 집중하고 이론의 시험이나 정교함에 너무 덜 초점을 맞춘다는 것이다. 그러나 앞에서 언급한 바와 같이 좋은 DBR은 복잡한 학습 환경의 특성에 관한 이론을 시험하거나 다듬는 것을 목적으로 한다(DesignBased Research Collective 2003). 그러나 물론 DBR 연구에는 변화가 있다. 일부 DBR 연구는 [이론 테스트 또는 입증(흔히 검증 연구라고 함)]에 더 초점을 맞추고 있는 반면, 다른 연구들은 [이론 사용(개발 연구라고 함)]에 더 초점을 맞추고 있다(Nieven et al. 2006). 한 가지 주요한 차이점은 전자가 이론의 진보에 기여하는 반면 후자는 설계지침의 고도화에 기여한다는 것이다. 그러나 이러한 후기 연구는 문헌의 검토를 바탕으로 설계 지침을 작성하는 것에서부터 시작되는 경우가 많다는 것을 명심해야 한다. 즉, 이러한 발전 연구도 이론을 활용한다. 더욱이 이러한 발전 연구는 이론의 정교화와 이러한 이론들이 실제로 효과가 있는지 시험하는 것으로 이어진다.

Another disadvantage of conducting DBR might be that it is too much focused on designing and redesigning practice and too less focused on testing or refinement of theories. But, as stated before, good DBR is also aimed at testing or refining theories about the nature of complex learning environments (DesignBased Research Collective 2003). But, there are, of course, variations in DBR studies. Some DBR studies focus more on testing or proving theories (often called validation studies), whereas other studies focus more on using theories (often called development studies) (Nieveen et al. 2006). One major difference is that the former contribute toward the advancement of theories, whereas the latter contribute toward de-advancement of design guidelines. However, it is important to keep in mind that these latter studies often start with formulating design guidelines based on a review of the literature. In other words, these development studies also make use of theories. Furthermore, these development studies lead to the refinement of theories and testing whether these theories work in practice.


연구자의 참여는 결과를 편향시킬 수 있다.

The involvement of the researcher might bias findings


많은 DBR 연구에서 연구자와 설계자의 역할은 동일한 사람에 의해 수행된다. 이것은 어려울 수 있는데, 한편으로는 연구자가 디자인을 비판적으로 평가해야 하지만, 다른 한편으로는 디자인을 개발한 사람이고 교사나 학습자에게 디자인의 유용성에 대해 설득해야 하기 때문이다. 물론, DBR에서 설계자, 연구자 및 실무자 간의 긴밀한 상호작용이 깊고 의미 있는 통찰력으로 이어질 것으로 기대되지만, 설계에 대한 덜 비판적인 평가로 이어질 수도 있다왜냐하면 연구자는 개입이 효과가 있다고 확신하거나 학습자나 교사가 디자인을 비판하기 어려울 수 있기 때문이다. 다시 말해서, 이 연구의 결과는 연구자들의 편견에 의해 더 쉽게 영향을 받을 수 있다.

In many DBR studies, the roles of researcher and designer are fulfilled by the same person. This might be difficult, because the researcher on the one hand must critically evaluate the design, but on the other hand is also the one who developed the design and must convince teachers or learners about the usefulness of the design. Of course, close interactions between designer, researcher, and practitioners in DBR are expected to lead to deep and meaningful insights, but it might also lead to a less critical evaluation of the design, e.g., because the researcher is convinced that the intervention does work or because the learners or teachers may find it difficult to criticize the design. In other words, the findings of the study might be more easily influenced by the researchers’ biases.


따라서 데이터 소스와 데이터 방법의 삼각 측정이 매우 중요하다(McKenney et al. 2006). 추가 방법이나 데이터 출처의 강점은 다른 방법의 약점을 극복하기 위해 사용될 수 있으며 혼합된 방법은 증거를 확증하기 때문에 더 강력한 증거를 제공할 수 있다(Johnson & Onwegbuzie 2004). 그러나, 또한 반사성은 매우 중요하다. 즉, 연구자들은 독자들에게 자신이 연구를 수행한 배경과 렌즈, 그리고 기존의 가정과 기대치에 대한 정보를 제공해야 한다. 이 정보를 바탕으로 독자들이 연구의 결과를 비판적으로 해석할 수 있다. (Bunniss & Kelly 2010).

Triangulation of data sources and data methods is therefore of crucial importance (McKenney et al. 2006). The strengths of an additional method or data source can be used to overcome the weaknesses in another method and mixed methods can provide stronger evidence because of corroborating evidence (Johnson & Onwuegbuzie 2004). But, also, reflexivity is of crucial importance; i.e., the researchers should make the reader clear and give them information about their backgrounds and their lenses through which they conducted the study as well as what their pre-existing assumptions and expectations are, based on which readers can critically interpret the findings of the study (Bunniss & Kelly 2010).


DBR은 위험하고 복잡하며 시간이 많이 소요됨

DBR is risky, complicated, and time-consuming


그렇다, 실제로 DBR은 여러 가지 이유로 위험하고 복잡하며 시간이 많이 걸린다. 그 이유 중 하나는 설계가 이론에 근거해야 하고 연구자, 디자이너, 교사와 긴밀한 협업을 통해 개발되어야 하며, 교사와 학습자가 밀접하게 협력하여 실제적으로 구현되어야 한다는 것이다. 그 후에, 그것은 평가될 수 있고 재설계되어야 한다.

Yes, indeed DBR is risky, complicated, and time-consuming, because of several reasons. One of the reasons is that the design must be based on theories and must be developed in close collaboration with researchers, designers, and teachers, and needs to be implemented in practice in close collaboration with teachers and learners. Thereafter, it can be evaluated and it should be redesigned.


이 순환 과정은 위험하고 복잡하며 시간이 많이 걸린다. 교사나 학습자가 철수할 수 있고 상황이 바뀔 수 있기 때문에 연구 설계가 계속 변경될 수 있기 때문에 위험하다. 계속 변화하는 연구 설계는 약하다. 그럼에도 불구하고, 실제 실무에서 유용한 개입을 설계하기 위해서는 여러 이해관계자들과 긴밀히 협력하여 설계에 대한 조정이 이루어져야 한다(McKenney et al. 2006).

This cyclic process is risky, complicated, and time-consuming. It is risky because teachers or learners may withdraw and circumstances may change, from which the research design keeps changing. A research design that keeps changing is weak. Nevertheless, it is important that adjustments can be made to the design in close collaboration with the different stakeholders in order to design interventions that are useful in real practice (McKenney et al. 2006).


실무에서 혁신을 구현하는 것은 종종 [모든 이해관계자의 요구를 충족시키기 위해 변경이 이루어져야 한다]는 것을 암시한다. 다시 말해 실제 현실에서 일어나는 일이다. 또 다른 문제는 DBR이 설계, 평가, 재설계라는 반복적인 과정 때문에 시간이 많이 걸린다는 것이다. 오늘날 연구 프로그램은 종종 여러 연구가 발표되어야 하고 많은 위험을 감수할 수 없는 3, 4년 동안 지속되는 단일 프로젝트로만 구성된다. 그럼에도 불구하고 설계 연구는 여러 연구자들이 함께 일하고 서로 다른 연구가 구축되는 오래 지속되는 잘 정의된 연구 라인이나 연구 프로그램 내에서 수행되어야 한다. DBR 연구자들은 서로 밀접하게 연관되어 있고 서로에게 구축될 수 있는 연구의 양적 방법론과 질적 방법론 모두에 대해 구체적인 전문지식을 가진 다양한 실무자 및 다양한 연구자들과 함께 일하는 팀으로 일해야 한다.

Implementing innovations in practice often implies that changes must be made in order to meet the needs of all stakeholders. In other words, this is what happens in real practice. Another problem is that DBR is time-consuming because of its iterative process of design, evaluation, and redesign. Research programs nowadays often only consist of single projects that last for 3 or 4 years in which several studies need to be published and in which not much risks can be taken. Nevertheless, design studies should be conducted within long-lasting well-defined research lines or research programs in which different researchers work together and in which different studies are built upon each other. DBR researchers should work in teams in which they work together with various practitioners and various researchers with specific expertise on both quantitative and qualitative methodologies on studies that are closely related to each other and can be built upon each other.


실무에서 DBR의 함정과 과제에 대처

Dealing with pitfalls and challenges of DBR in practice


현지 상황을 벗어난 실질적인 관련성

Practical relevance beyond the local situation


첫째로, 개발 과정을 이론적 합리성에 토디를 두고, 이러한 합리성을 이용하여 우리의 연구 결과를 설명함으로써, 우리의 연구는 더 많은 청중들이 관심을 가질 수 있도록 하기 위한 것이었다.

First, by grounding the development process on theoretical rationales, and using these rationales to explain our findings, our studies were aimed to be of interest to a broader audience.


둘째, 명확한 맥락적 정보를 제공하고, 우리의 분석 방법에 투명함을 제공함으로써, 우리는 독자들이 자신의 맥락에서 우리의 발견의 적용 가능성을 판단할 수 있도록 돕고 싶었다.

Second, by providing clear context information, and by being transparent in our analysis methods, we wanted to assist our readers in being able to judge applicability of our findings to their own contexts.


셋째, 이론과 실천 사이의 반복적인 프로세스에서 우리의 설계 원리를 생성하고, 우리의 설계 원리와 이론적 합리성의 관계를 보여줌으로써, 우리는 우리의 발견과 다른 초기 연구를 토대로 하여 독자들이 포트폴리오 설계 프로세스를 그들 자신의 맥락에서 수행하도록 고무하는 것을 목표로 했다.

Third, by generating our design principles in an iterative process between theory and practice, and by showing the relationship between our design principles and our theoretical rationales, we aimed at inspiring the reader to carry out portfolio design processes in their own contexts, by building on our findings and other earlier studies.


소견의 적용성에 관한 연구의 제한은 종합 평가 절차의 설계에 대한 세부사항의 결여, 프로토타입이 두 번밖에 시험되지 않았다는 사실, 그리고 연구의 범위, 특히 고등교육에 초점을 맞춘다는 것이었다. 따라서 포트폴리오 프로세스의 모든 요소를 세부적으로 조정할 수 있도록 포트폴리오를 먼저 서로 다른 설정에 걸쳐 테스트할 것을 권고했다.

A limitation to our study with respect to applicability of findings was the lack of detail in the design of the summative assessment procedure, the fact that the prototype was tested only twice, and the scope of the research, being particularly focused on higher education. Therefore, we recommended that a portfolio should first be tested across different settings to enable fine-tuning of all the elements in the portfolio process.


이론의 진보

Advancing theories


우리 연구의 주요 초점은 이론(즉, 개발 연구)을 사용함으로써 포트폴리오에 대한 설계 원리의 발전에 기여하고 이론(즉, 검증 연구)을 시험하거나 입증하는 것이 아니었다(Nieven et al. 2006). 다만 기존 문헌을 바탕으로 디자인 가이드라인을 짜는 것부터 시작했다. 게다가, 우리는 우리의 발견에 기초하여 이론적 합리성theoretical rationales을 다듬었다. (이 문제에 대한 자세한 내용은 "이론 테스트 및 정제 및 선진화 관행" 섹션 참조) 이러한 이론적 합리성theoretical rationales은 다른 환경에서 시험할 필요가 있다.

The main focus of our studies was to contribute toward the advancement of design principles for portfolios by the use of theories (i.e., a development study) and not on testing or proving theories (i.e., validation studies) (Nieveen et al. 2006). However, we started with formulating design guidelines based on existing literature. Furthermore, we refined our theoretical rationales, based on our findings (for more on this issue, see section ‘‘testing and refining theory and advancing practice’’). These theoretical rationales need to be tested in other settings.


연구원의 참여에 의한 소견의 편향 방지

Preventing bias of findings by involvement of the researcher


다른 많은 DBR 연구와 마찬가지로, 연구자와 설계자의 역할은 동일한 사람에 의해 수행되었다. 연구의 결과가 연구자의 편향에 의해 영향을 받는 것을 방지하기 위해, 데이터 출처와 데이터 방법의 삼각 측량을 사용했다(McKenney et al. 2006). 이것은 앞에서 설명한 것처럼 연구의 평가 단계에서 특히 행해졌다.

Similar to many other DBR studies, the roles of researcher and designer were fulfilled by the same persons. In order to prevent the findings of the study to be influenced by the researchers’ biases, we used triangulation of data sources and data methods (McKenney et al. 2006). This was particularly done in the evaluation phase of the research, as explained before.


게다가, 우리는 우리가 연구를 수행한 렌즈에 대한 정보와 기존의 가정과 기대가 무엇인지를 명확히 함으로써 반사성의 원리를 적용했다. 이것은 우리의 이론적 합리성을 명확하게 기술하고 우리의 결과를 분석하는 투명한 방법에 의해 이루어졌다. 이것은 또한 데이터의 독립적 분석 후에 저자가 서로의 해석에 도전하도록 하는 등 데이터 분석의 품질 보증 조치를 포함시키고, 해석에 대한 의견 불일치가 있을 경우 원래의 데이터로 되돌아가는 방식으로 수행되었다.

Furthermore, we applied principles of reflexivity by making them clear and providing information about the lenses through which we conducted our study as well as what our pre-existing assumptions and expectations were. This was done by clearly describing our theoretical rationales and by a transparent way of analyzing our results. This was also done by including measures for quality assurance of data analysis, such as having the authors challenge each others’ interpretations after an independent analysis of the data, and by going back to the original data in case of disagreements about interpretations.


위험 및 복잡성 감소: 연구가 너무 많은 시간을 소모하는 것을 방지

Reducing risks and complications: Preventing the research from being too time-consuming


이 포트폴리오는 실생활 환경에서 단 한 번, 그리고 소규모로 시험되었는데, 5명의 교사와 5명의 코치가 참여하여 연구가 너무 많은 시간이 걸리는 것을 방지했다. 실생활 환경에서 또 다른 시험 주기가 연구를 더 강하게 만들었겠지만, 우리는 포트폴리오가 교사의 전문적 발전에 미치는 영향에 대한 풍부한 데이터를 생성하기 위해 다른 데이터 출처와 방법을 사용하는 데 투자했다. 나아가, 비록 우리의 연구 설계와 설계 과정의 다른 단계는 처음부터 분명했지만, 연구를 전체적으로 특징짓는 끊임없는 형성적 평가의 결과에 따라 설계를 조정할 수 있었다. 이는 예비 연구 문항이 우리의 결과에 따라 다듬어지고, 그 과정에서 우리 연구에 대한 이론적 합리성이 미세 조정되었다는 것을 의미한다. 또한 연구 개발팀은 다양한 종류의 전문성을 가진 구성원으로 구성하여 서로 다른 연구 관점이 결합될 수 있도록 하였다. 마지막으로, 우리는 연구를 수행하기 위해 기존 연구 라인에 구축된 명확한 이론적 합리성을 이용했다.

The portfolio was tested in a real-life setting only once, and on a small scale, involving five teachers and their five coaches to prevent that the research would become too time-consuming. Although another cycle of testing in a real-life setting would have made the research stronger, we invested in using different data sources and methods in order to generate rich data on the impact of the portfolio on the teachers’ professional development. Furthermore, while our research design and the different steps in the design process were clear from the beginning, it was possible to make adjustments to the design according to the results of the constant formative evaluations that characterized the research as a whole. This means that preliminary research questions were refined according to our results, and that the theoretical rationales to our research were fine-tuned along the process. In addition, the research and development team consisted of members with different kinds of expertise, so that different research perspectives could be combined. Finally, we used clear theoretical rationales which built on existing research lines in order to carry out our research.



향후 애플리케이션 및 개발

Future applications and developments


물론 DBR은 의료 교육 연구에 적용할 수 있는 접근방식은 다른 것 중 단 한 가지에 불과하다. 어떤 접근법을 선택해야 하는지는 물론 답해야 할 구체적인 연구 질문에 달려 있다. DBR은 디자인 포커스가 있는 교육 연구에 잘 맞는 접근법이다(Elives et al. 2005). 디자인 포커스가 있는 많은 연구, 예를 들어, 혁신적인 학습 환경을 만들고 테스트하는 연구, 교육에 교수 기술을 도입하거나, 혁신 학습 환경을 위한 평가 프로그램을 설계하는 연구 등에 적용할 수 있다. 

DBR is, of course, only one approach among others that can be applied in medical education research. Which approach should be chosen is, of course, dependent on the specific research questions to be answered. DBR is an approach that fits well for educational research with a design focus (Reeves et al. 2005). It can be applied in many studies with a design focus, e.g., studies that focus on 

  • creating and testing innovative learning environments, 

  • introducing instructional technology in education, or 

  • designing assessment programs for innovative learning environments. 

DBR 연구는 '어떻게 작용하는가'와 '왜 작용하는가?'와 같은 질문에 답하고자 하는 명확화 연구와 의학 교육에 대한 우리의 이해를 심화시키고 발전시키는 연구로 분류될 수 있다(Cook et al. 2008).

DBR studies can be classified as clarification studies which seek to answer questions such as ‘‘How does it work?’’ and ‘‘Why does it work?’’ and studies that deepen and advance our understanding of medical education (Cook et al. 2008).


업무 기반 학습

Work-based learning


업무 기반 학습 영역에 대한 연구는 이러한 학습 환경에 대한 몇 가지 통찰력을 밝혀냈다; WBL은 의료 교육에서 지배적인 역할을 하는 환경이다. 작업 기반 학습 환경은 학생들에게 환자 및 의료 전문가와 상호작용하거나 임상 실습에 참여할 수 있는 많은 가능성을 제공한다(Dornan et al. 2007; Teunissen et al. 2007). 학생에 대한 감독 부족 및 피드백 부족과 같은 이러한 환경 내에서 직면하는 어려움에 대해 많은 연구가 보고되었다(Grant et al. 2003; Daelmans et al.). 2004; Hofman & Donaldson 2004; Dolmans et al. 2008).

Research in the domain of work-based learning has revealed several insights about this learning environment; an environment that plays a dominant role in medical education. Workbased learning environments offer students many possibilities to interact with patients and medical experts or to participate in clinical practice (Dornan et al. 2007; Teunissen et al. 2007). Many studies reported about the difficulties encountered within this environment, such as a lack of supervision of students and lack of feedback (Grant et al. 2003; Daelmans et al. 2004; Hofman & Donaldson 2004; Dolmans et al. 2008).


이것은 큰 문제인데, 왜냐하면 슈퍼비전은 직장에서 효과적인 학생 학습을 위한 핵심 성공 요인이기 때문이다(Wimmers et al. 2006; Kilminster et al. 2007). 예를 들어, 이 분야에서의 연구는 임상 학습 환경의 품질 평가(Boor et al. 2007) 또는 임상 감독자의 성과를 평가하는 데 사용할 수 있는 기구의 개발 및 구현으로 이어졌다(Scalmeijer et al. 2008). 최근에는, 환자·감독자와의 학생 연속성을 높이기 위해 학부 의료 연수 프로그램에 longitudinal attachment을 실시하는 것으로 이어지고 있다(Wamsley et al.). 2009). 또한 인지 도제 이론에 기초한 임상 교수 모델의 개발로 이어져서, 가이드라인을 제공하기 위한 3단계 임상 교수 교사 접근법을 설명하기도 했다.

This is a big problem, because supervision is a key success factor for effective student learning at the workplace (Wimmers et al. 2006; Kilminster et al. 2007). Studies within this field have, for example, led to the development and implementation of instruments that can be used to evaluate the quality of the clinical learning environment (Boor et al. 2007) or to evaluate the performance of clinical supervisors (Stalmeijer et al. 2008). Recently, it has led to the implementation of longitudinal attachments in undergraduate medical training programs to increase student continuity with patients and supervisors (Wamsley et al. 2009). It has also led to the development of a clinical teaching model, based on theories of cognitive apprenticeship, describing a three-step clinical teaching teachers approach, that provides guidelines for (Stalmeijer et al. 2010).


그러나 직장 학습을 개선하려면 교육 실무에서 새로운 도구나 디자인의 도입뿐만 아니라, 직장 내 모든 참여자의 문화적 변화, 헌신, 참여가 필요하다. 이는 의료진, 학생, 설계자, 연구자 모두가 밀접하게 협업하는 DBR을 실시함으로써 강화될 수 있다. DBR은 업무 기반 학습 환경에 대한 보다 풍부한 이해에 기여하고, 견습 학습 이론에 기여하며, 업무 기반 학습의 추가 개선에도 기여할 수 있다.

But, improving workplace learning requires not only the introduction of new tools or designs in educational practice, but also a cultural change, commitment, and involvement from all participants at the workplace. This can be enhanced by conducting DBR in which both clinical staff, students, designers, and researchers closely collaborate. DBR could contribute toward richer understanding of work-based learning environments, contribute toward apprenticeship learning theories, and also toward further improvement of work-based learning.


평가

Assessment


여전히, 평가가 어떻게 학생들을 심층 학습으로 이끌 수 있는지 또는 학습을 강화시킬 수 있는지에 대해서는 거의 알려져 있지 않다. 어떻게 평가와 학습이 분리되어 있는 것이 아니라 통합되어 있다는 것을 보장할 수 있을까? 셰퍼드(2000년)는 평가가 학습을 강화해야 한다는 기대를 학생과 교사가 함께 가질 수 있는 학습문화를 만들어야 한다고 주장한다. 교사와 학생들은 평가를 보상과 처벌의 출처source가 아니라, 통찰력과 도움의 원천으로 보아야 한다. 슈와르트와 반데르 벨레우텐(2004)도 평가와 학습이나 가르침이 서로 일치해야 하며, 예를 들어 동료와 자기 평가를 도입하는 등의 방법으로 학생들을 평가에 참여시켜야 한다고 주장한다. 또 다른 최근의 plea는 다른 평가 방법과 학생 학습을 유도하고 의사결정을 위해 취합할 수 있는 데이터의 조합으로 구성된 교육에서 평가에 대한 프로그램적 접근법을 사용하라는 것이다(Van der Vleuten & Schuwirth 2005; Van der Vleuten et al. 제출). 이를 위해서는 학습과 평가가 얽혀 있는 실제 실천에서의 연구가 필요하다.

Still, little is known about how assessment can drive students toward deep learning or enhance learning. How can we insure that assessment and learning are not separate, but integrated? Shephard (2000) argues that we should create a learning culture where students and teachers would have a shared expectation that assessment should enhance learning. Teachers and students should look to assessment as a source of insight and help instead of a source for rewarding and punishing. Schuwirth and van der Vleuten (2004) also argue that assessment and learning or teaching should be congruent with each other and that we should involve students in our assessments, e.g., by means of introducing peer and selfassessments. Another recent plea is to use a programmatic approach about assessment in education which consists of a combination of different assessment methods and data that drive student learning and can be aggregated for making decisions (Van der Vleuten & Schuwirth 2005; Van der Vleuten et al. submitted). This requires research in actual practice in which learning and assessment are intertwined.


미래 발전

Future developments


이론은 복잡한 문제들을 살펴보는 다른 "렌즈"를 준다. 이론은 상황에 대한 우리의 이해를 넓히고 실제로 적용될 수 있다(리브스 외 2008). DBR은 이론과 실제 사이의 교량 구축에 기여할 수 있다. 의학 교육 같은 복잡한 환경에서 더 깊은 통찰력을 얻기 위해서는 DBR의 연구원, 설계자 및 실무자 간의 긴밀한 협업과 상호작용이 필수적이다. DBR은 혼합 방법을 사용하고 특정 목적을 가진 개입이 어떤 상황에서 어떤 맥락에서 성공하는지를 설명하는 다양한 정보 출처를 삼각측량한다.

Theories give different ‘‘lenses’’ through which to look at complicated issues. Theories broaden our understanding of situations and can be applied in practice (Reeves et al. 2008). DBR can contribute to bridge building between theory and practice. A close collaboration and interaction between researchers, designers, and practitioners in DBR is crucial to obtain deeper insight in such complex settings as medical education. DBR uses mixed methods and triangulates different sources of information that explain why an intervention with a particular aim is successful under which circumstances and in which context.


결론 Conclusions


DBR은 설계 연구에 있어 생산적인fruitful 접근법으로, 한편으로는 실무와 관련성이 높은 연구에 기여하고, 다른 한편으로는 이론 시험과 정교화에 기여한다. DBR은 학습이 정상적으로 이루어지는 진정한 실생활 환경에서 진행된다. 나아가 DBR에서는 연구자, 디자이너, 실무자(교사와 학생)가 서로 밀접하게 교류하며 아이디어를 공유한다. 두 가지 특성 모두 교육 실무에 대한 이러한 유형의 연구의 유용성에 기여한다. 또한 좋은 DBR은 이론의 시험과 정교화로 이어지며, 특정 목적을 가진 특정 설계가 특정 맥락에서 작동하는 이유를 명확히 하는 데 초점을 맞추고 있으며, 따라서 이론과 설계 원리의 발전에 기여한다.

DBR is a fruitful approach in design research that on the one hand contributes toward studies that are highly relevant for practice and on the other hand contribute toward theory testing and refinement. DBR is conducted in authentic real-life settings where learning normally takes place. Furthermore, in DBR, researchers, designers, and practitioners (teachers and students) closely interact with each other and share their ideas. Both characteristics contribute to the usefulness of this type of research for educational practice. Good DBR also leads to testing and refinement of theories and focuses on clarifying why a specific design with a specific aim does work in a specific context and as such contributes toward the advancement of theories and design principles.





. 2012;34(1):1-10.
 doi: 10.3109/0142159X.2011.595437.

Building bridges between theory and practice in medical education using a design-based research approach: AMEE Guide No. 60

Affiliations 

Affiliation

  • 1Department of Educational Development & Research, Maastricht University, The Netherlands. d.dolmans@maastrichtuniversity.nl

Abstract

Medical education research has grown enormously over the past 20 years, but it does not sufficiently make use of theories, according to influential leaders and researchers in this field. In this AMEE Guide, it is argued that design-based research (DBR) studies should be conducted much more in medical education design research because these studies both advance the testing and refinement of theories and advance educational practice. In this Guide, the essential characteristics of DBR as well as how DBR differs from other approach such as formative evaluation are explained. It is also explained what the pitfalls and challenges of DBR are. The main challenges deal with how to insure that DBR studies reveal findings that are of a broader relevance than the local situation and how to insure that DBR contributes toward theory testing and refinement. An example of a series of DBR studies on the design of a teaching portfolio in higher education that is aimed at stimulating a teacher's professional development is described, to illustrate how DBR studies actually work in practice. Finally, it is argued that DBR-studies could play an important role in the advancement of theory and practice in the two broad domains of designing or redesigning work-based learning environments and assessment programs.


두 개입이 동일하다는 것은 무엇인가? 교육에서 보고 가이드라인의 함의 (Med Educ, 2018)

When are two interventions the same? Implications for reporting guidelines in education

Tanya Horsley1 & Glenn Regehr2



보건전문교육(HPE) 문헌에는 '임상의 교육자가 [효과적인 것으로 입증된 개입에 대한 연구 증거]를 실제로 translate할 수 있도록 하기 위해, 증거 기반 실무 교육 시험의 [개입 세부사항에 대한 완전한 보고]가 필수적'이라는 목소리가 높아지고 있다.1 이러한 노력을 지원하기 위해, 교육 개입에 대한 보고의 완전성을 평가하기 위해 특별히 고안된 체크리스트(GHEET2, TIDieR3)의 수가 증가하고 있다. 흥미롭게도, 이 운동은 그들 자신의 기관에서 교육적 개입을 복제하기를 원하는 교육자들뿐만 아니라, 연구 전반에 걸쳐 증거를 종합하려는 연구자들에게도 가치가 있을 수 있다.

there is a growing chorus of voices in the health professional education (HPE) literature suggesting that ‘complete reporting of intervention details of evidence-based practice education trials is essential to enable clinician educators to translate research evidence about interventions shown to be effective into practice’.1 To support such efforts, the number of checklists specifically designed to assess the completeness of reporting for educational interventions (such as the GREET2 and TIDieR3) is increasing. Interestingly, this movement may be valuable not only for educators who are hoping to replicate an educational intervention in their own institution, but also for researchers who are trying to synthesise evidence across studies


이러한 근거 합성 과정에 참여하는 사람들에게 중요한 질문은 [특정 교육 모델을 나타낸다고 알려진 어떤 연구를 "실제로 그 모델의 구현"이라고 판단받을 자격이 있는가] 하는 것이다.

For those engaging in this process of evidence synthesis, the key question is which studies, purported to represent a particular educational model, actually qualify for inclusion as an implementation of that model?


그러나 일반적 및 개입적 특정 보고 지침을 모두 작성하려는 이러한 노력은 특정 개입을 제정하거나 상황에 따라 개입을 완전히 복제하는 것이 무엇을 의미하는지 의문을 제기한다.

However, these efforts to create both general and intervention-specific reporting guidelines raise questions about what it means to enact a particular intervention or to wholly replicate that intervention across contexts.


복제는, 그 정의상, 특정 개입이 높은 수준의 '동일성'으로 복제, 재생산 또는 반복된다는 것을 암시한다. 그러나 Varpio와 동료들은 교육 프로그램이나 혁신을 다른 환경에서 구현하는 것은 표면 구현에서 거의 확실히 타협이 필요할 것이라고 제안했다. 이러한 변화(또는 아이러니하게도 표면 특성 또는 개입 요소를 동일하게 유지하려는 노력)는 기술혁신의 기본 원칙이 새로운 환경에서 이전, 변형 또는 폐기되는 결과를 초래할 수 있다.6

Replication by its very definition suggests an intervention is duplicated, reproduced or repeated with a high-level of ‘sameness’. Yet, Varpio and colleagues have suggested that implementing an educational programme or innovation in a different setting will almost certainly require compromises in the surface implementation. These changes (or, ironically, efforts to keep the surface characteristics, or intervention elements, the same) may result in the innovation’s underlying fundamental principles being either transferred, transformed or abandoned in the new setting.6


이러한 생각은 Hawe의 '개입 무결성intervention integrity' 개념과 일치한다.7 Hawe는 어떤 복잡한 개입도 [(표준 요소의 집합이 아닌) 원칙이나 이론에 근거한 유연한 적용]으로 개념화되어야 한다고 주장해왔다. 이러한 개념화에서, 표준 요소 집합은 더 이상 개입의 능동적active 구성요소로 보이지 않고 단지 기초적인 원리나 이론을 표현하는 메커니즘으로만 보여진다. 따라서, "개입 무결성"은 [가설로 세운 복잡성(교육적) 과정의 이론이나 원리가 '적합성의 증거evidence of fit'를 갖는 것]으로 정의된다.7

This idea is consistent with Hawe’s notion of ‘intervention integrity’.7 Hawe has argued that any complex intervention should be conceptualised as a flexible application based on principles or theories, rather than as a set of standard elements. In this conceptualisation, the set of standard elements are no longer seen as the active ingredients of an intervention, but merely as the mechanism to express the underlying principles or theories. Thus, intervention integrity is defined as having ‘evidence of fit’ with the theory or principles of the hypothesised complex (educational) process.7


이는 교육 개입의 적용과 보고를 표준화하려는 현재의 노력에 대해 비판적인 의문을 제기한다. 우리가 특정한 맥락에서 교육적 개입을 시행할 때, 성공적인 구현이 이루어졌음을 보장하기 위해 우리는 무엇을 주의해야 하며, 그리고 맥락에 걸친 구현 사이에 충분한 '동일성'을 결정할 수 있도록 무엇을 보고해야 하는가? 요컨대, 교육 모델은 구체적인 실천요강인가, 아니면 실천요강이 창조하고자 하는 학습조건인가? 복제(교육자용) 또는 통합(연구자용)이 가능하도록 어느 정도 동일성의 측정치를 달성하는 것이 목표라는 데 동의한다면, 복잡한 개입의 모든 가시적 요소(예: 워크숍 기간)를 '체크-리스팅'하는 것에서 벗어나서, [개입을 뒷받침하는 원칙이나 이론에 따르는 보고]로 진화해나가야 함을 상상해야 할지도 모른다.

This raises critical questions for current efforts to standardise the application and reporting of educational interventions. As we implement an educational intervention in a particular context, to what should we be attentive to ensure successful implementation has occurred, and what should be reported to enable the determination of sufficient ‘sameness’ between implementations across contexts? In short, is the educational model the specific practices or is it the conditions of learning that the practices intend to create? If we agree that the goal is to achieve some measure of sameness so as to allow for replication (for educators) or aggregation (for researchers), we might have to imagine an evolution of reporting that moves away from ‘check-listing’ all visible elements of a complex intervention (e.g. length of workshop) and instead attends to the principles or theories that underlie it.


이러한 생각들은 의학 교육에서 이론과 실천의 접점, 그리고 우리가 우리의 실험 연구에서 확립하기를 바라는 인과관계의 수준에 대한 오랜 논의를 촉발시킨다.8

These ideas invoke the long-standing discussions about the interface of theory and practice in medical education and the level of causality that we are hoping to establish in our experimental studies.8


즉, 어떤 개입이 연구에서 '성공'을 입증하지 못한다면, 우리는 다음 중 어떻게 결론을 내려야 하는가?. 

  • 교육 개입을 뒷받침하는 학습의 이론적 모델을 의심해야 하는가?(즉, 교육 모델의 철학이 잘못되었는가?).

  • 또는 지 이 맥락에서 특정 교육적 practice가 교육 모델의 기반이 되는 학습 조건을 만들지 못했다고 생각해야 하는가?(즉, 교육 모델을 성공적인 구현하지 못했기 때문인가?) 

그리고 도입implementation 후 긍정적인 효과가 나타난다면, 어느 정도까지 그 성과가 [교육 모델에 의해 가정된 학습 조건에 적절하게 특정 practice를 실행]했기 때문이라고 봐야 하는가? 혹은 심리학적 또는 사회적 절차와 같은 다른 메커니즘을 통해 학습에 영향을 받은 것으로 보면 안 되는가?

That is, if an intervention fails to demonstrate ‘success’ in a study, should we conclude 

  • that the theoretical model of learning underpinning the educational intervention must be questioned (i.e. that the philosophy of the educational model is wrong) or 

  • merely that the particular educational practices in this context failed to create the learning conditions upon which the educational model is based (i.e. that this was an unsuccessful implementation of the educational model)? 

And if we see a positive effect following implementation, to what extent can we confidently attribute this to the particular practices having properly invoked the conditions of learning hypothesised by the educational model, rather than those practices having influenced learning through some other mechanism, such as psychological or social processes (e.g. a novelty effect)?


아마도 이러한 이유로 전통적인 역학접근법을 이용하여 '대교육grand educational experiment 실험'9을 실시하려는 노력이 비난받아온 것일지도 모른다.

It is, perhaps, for this reason that efforts to conduct ‘grand educational experiments’9 using traditional epidemiological approaches have been criticised.


복잡한 개입의 보고 가이드에는 두 가지를 고려해야 한다. 

  • 첫째, 학습방법의 세부적인 내용을 보고할 필요가 있는 것처럼, 교육개입의 세부사항(하웨이가 '표준요소'라고 부를 것)도 철저히 보고해야 한다. 그러나 연습이 필수 학습 조건에 미치는 영향에 영향을 미칠 수 있는 모든 변수의 보고는 불가능하다.

two conditions require consideration within reporting guidelines of complex interventions. 

First, just as it is necessary to report the details of the study methods,10,11 the details of the educational intervention (what Hawe would call the ‘standard elements’) should be reported thoroughly. However, the reporting of all variables that might affect the impact of practices on the required learning conditions is untenable.


  • 따라서 [표준 요소 보고] 외에도 [특정 현장에서 구현된 표준 요소가 개입의 기반이 되는 교육 모델을 뒷받침하는 학습 조건을 만든 정도]를 보고하는 메커니즘의 개발을 제안할 것이다. 즉, 무작위 조정 시험에서 무작위화 절차가 성공적이었음을 입증하기 위해 인구통계학적 보고와 동등한 교육적 '조작 검사'를 사용하고 보고할 것을 제안한다.

 Thus, in addition to reporting the standard elements, we would propose the development of mechanisms that report the extent to which the standard elements, as implemented at a particular site, created the learning conditions that underpin the educational model on which the intervention was based. In other words, we suggest the use and reporting of educational ‘manipulation checks’, the educational equivalent of demographic reporting to demonstrate that the randomisation procedure was successful in randomised controlled trials.





Comment

 

. 2018 Feb;52(2):141-143.
 doi: 10.1111/medu.13496.

When are two interventions the same? Implications for reporting guidelines in education

Affiliations 

Affiliations

  • 1Ottawa, Ontario, Canada.
  • 2Vancouver, British Columbia, Canada.


의학교육연구에 일반화가능성과 편향의 적용가능성 (Med Educ, 2020)

The applicability of generalisability and bias to health professions education's research

Lara Varpio1 | Bridget O'Brien2 | Charlotte E. Rees3,4 | Lynn Monrouxe5 | Rola Ajjawi6 | Elise Paradis7




1 도입 

1 | INTRODUCTION


HPE의 초기의 학자들은 객관적인 데이터 수집과 분석에 착수하면서 전형적으로 포스트 포시티브 패러다임에 의존했다(이 원고에 사용된 주요 용어의 정의는 표 1 참조). 다른 패러다임(예: 구성주의)에서 일하는 연구자들은 그들의 방법론과 방법의 정당성을 도입하고 옹호함으로써 이러한 조상에 직면해야 했다.1 그럼에도 불구하고, 이 유산의 영향은 여전히 널리 감지되고 있다.

HPE's founding scholars typically relied on the post-positivist paradigm, setting out to engage in objective data collection and analysis (see Table 1 for definitions of key terms used in this manuscript). Researchers working from other paradigms (e.g., constructivism) have had to confront this ancestry by introducing and defending the legitimacy of their methodologies and methods.1 And yet, the influence of this heritage is still widely felt.


구성주의 

구성주의에서, 인간은 외부 현실에 대한 진실을 발견하거나 발견하는 것으로 생각되지 않고 대신, 사람들은 스스로 지식을 쌓거나 만든다. 사람들은 세상과 그들의 경험을 이해하기 위해 개념, 모델, 그리고 스키마를 만든다. 이 건축은 타인을 격리하여 이루어지는 것이 아니라, 개인이 타인과 공유되는 언어, 관행, 문화 등을 배경으로 의미를 구성한다.24

Constructivism Constructivism is a paradigm wherein humans are not conceived of as discovering or finding truths about external reality; instead, people build or make knowledge. People construct concepts, models and schemas to understand the world and their experiences. This construction does not happen in isolation of others; instead, individuals construct meaning against a backdrop of the languages, practices, cultures, etc. that are shared with others.24


인식론

인식론은 지식의 발달과 관련이 있다. 패러다임의 인식론을 이해하려면 '우리는 진짜가 무엇인지 어떻게 알까?' '지식의 본질은 무엇인가?'와 같은 질문에 대답할 수 있어야 한다. 인식론학은 '연구자들이 합법적이고 가치 있는 것으로 여겨질 지식을 개발하기 위해 연구에 어떻게 참여해야 하는지에 대해 성찰할 것을 요구한다.'2

Epistemology Epistemology is concerned with the development of knowledge. To understand a paradigm's epistemology, we must be able to answer questions like: ‘How do we know what is real?’ and ‘What is the nature of knowledge?’ Epistemology ‘requires us to reflect on how researchers should engage in inquiry to develop knowledge that will be considered legitimate and valuable’.2


방법론

방법론은 연구가 어떻게 수행되어야 하는지를 구체화하는 일련의 지침과 원칙이다. 그것은 '탐구inquiry에 대한 특정 접근방법의 가정, 원칙 및 절차에 대한 분석'.24(페이지 193)

Methodology Methodology is a set of guidelines and principles that shape how research should be carried out. It ‘involves analysis of the assumptions, principles, and procedures in a particular approach to inquiry’.24(pg. 193)


객관주의 

객관주의는 단일의 외부 현실이 존재하며, 연구는 [중립적이고 분리된 방식으로 질문에 답하여, 개인 및 사회 현상에 대한 우리의 이해]에 기여하도록 노력해야 한다는 가정으로부터 작용한다.3,4

Objectivism Objectivism works from the assumption that a single, external reality exists and that research should strive to answer questions in a neutral and detached manner to contribute to our understanding of individual and social phenomena that exist.3,4


온톨로지 

온톨로지(Ontology Ontology)는 현실 자체의 본질과 관련이 있다. 패러다임의 온톨로지(Ontology)를 이해하려면 '현실의 본질은 무엇인가?' '존재의 본질은 무엇인가?'와 같은 질문에 대답할 수 있어야 한다.2

Ontology Ontology is concerned with the nature of reality itself. To understand a paradigm's ontology, we must be able to answer questions like: ‘What is the nature of reality?’ and ‘What is the nature of being?’2


패러다임 

쿤은 패러다임을 [과학자들이 문제를 어떻게 이해하고 연구해야 하는지에 대해 공유하는 믿음과 합의]로 정의했다.30 패러다임은 '과학에 대한 특정 접근방식을 정의하는 개념, 관행 및 언어'로 구성된다.2(pg. 687)

Paradigm Kuhn defined a paradigm as the beliefs and agreements that scientists share about how problems should be understood and studied.30 A paradigm consists of ‘the concepts, practices, and language that define a particular approach to science’.2(pg. 687)


후기실증주의 

후기실증주의는 [인간이 지식을 발견하는 것]으로 착상되는 패러다임이다. 이 패러다임에서는 하나의 객관적 현실이 존재한다고 믿으며, 연구자들은 외부 현실의 진리를 알기 위해 노력한다. 포스트 실증주의는 연구자들이 그러한 진실을 포착하고 완전히 이해할 수 없다는 것을 인정한다; 대신에, 연구자들은 그들의 서술이 항상 불완전하다는 것을 알면서, 이 진실을 묘사하기 위해 끊임없이 노력한다.

Post-positivism Post-positivism is a paradigm in which humans are conceived of as discovering knowledge. In this paradigm, a single, objective reality is believed to exist, and researchers strive to know the truth of the external reality. Post-positivism acknowledges that researchers cannot capture and fully understand such truth; instead, researchers continually strive to describe this truth, knowing that their descriptions are always incomplete.


주관주의 

주관주의는 사람들이 신념, 인식, 경험을 바탕으로 스스로 현실을 구축한다는 전제에서 작용한다. 연구자들은 사람들이 형성하는 개별적이고 특정한 현실에 대한 이해를 탐구하고 구성하고자 한다. 5,6

Subjectivism Subjectivism works from the premise that people build reality for themselves based on beliefs, perceptions, and experiences. Researchers seek to explore and compose understandings of the individual and particular realities that people build.5,6


저널 편집자와 리뷰어로서, 우리는 엄격한 정성적 연구 논문에서, 연구에 참여한 참가자가 소수임을 한탄하는 부분이 포함되어 있는 것을 보아왔다. 이러한 이해의 차이를 메우기 위해 많은 작업이 이루어졌지만, 이러한 브리징(다리놓기)은 각 연구 접근방식과 관련된 품질 측정에 대해 무심코 혼란을 야기했다. HPE 연구의 독자들은 각각의 원고를 면밀히 검토하여 패러다임 기반(즉, 온톨로지, 인식론, 방법론)2를 추론할 필요가 있다. 왜냐하면 어떤 특정한 연구에 대한 엄격함의 marker는 그들의 근본적인 철학적 가정에 따라 크게 다르기 때문이다. 요컨대, 한 HPE 연구에서 엄격함이 입증되는 방식이 반드시 다른 HPE 연구에서 미러링되는 것은 아니다.

As journal editors and reviewers, we have seen rigorous qualitative research papers include limitation sections lamenting the small number of participants engaged in the studies. Much work has been done to bridge such differences in understanding, but this bridging inadvertently generated confusion about the measures of quality associated with each research approach. Readers of HPE research are required to closely examine each manuscript to deduce its paradigmatic underpinnings (i.e., ontology, epistemology, methodology)2 because markers of rigour for any particular study vary greatly depending on their underlying philosophical assumptions. In short, the way rigour is demonstrated in one HPE study will not necessarily be mirrored in another;


우리는 지식과 연구에 대한 두 가지 다른 지향점 즉 객관주의와 주관주의를 중심으로 이 토론을 구성한다.

We construct this discussion around two different orientations towards knowledge and research—objectivist and subjectivist.


[객관주의 지향]단일의 외부 현실이 존재하고, 연구가 중립적이고 분리된 방식으로 질문에 답하여 현상에 대한 우리의 이해에 기여하도록 노력해야 한다는 전제하에 있다.3,4 객관주의 지향으로부터, 연구 과정은 [현실을 공정하게 이해하는 연구자의 능력을 모호하게 만드는] 내적 요인과 외적 요인을 측정하거나 설명할 수 있어야 한다. 

An objectivist orientation rests on the premise that a single, external reality exists and that research should strive to answer questions in a neutral and detached manner to contribute to our understanding of phenomena.3,4 From the objectivist orientation, the research process must be able to measure or account for intrinsic and extrinsic factors that obscure a researcher's ability to understand reality impartially.


이와는 대조적으로 [주관주의 지향]사람들이 신념, 인식, 경험에 기초하여 스스로 현실을 구성한다는 전제에서 출발한다. 주관주의적 지향의 연구는 사람들이 형성하는 개별적이고 특정한 현실에 대한 이해를 탐구하고 구성하는 것을 목표로 한다.5,6 이에 상응하여, 개인과 사회 현상은 시간, 장소, 사람, 문화 등에 위치한situated 것으로 이해되어야 한다. 즉 내적 요인과 외적 요인은 진리를 이해하는 데 결정적이며 더 깊이 또는 보편적으로 경험하는 진리에 도달하기 위해 제거되거나 통제될 수 없다.

In contrast, a subjectivist orientation starts from the premise that people construct reality for themselves based on beliefs, perceptions, and experiences. Research from a subjectivist orientation aims to explore and compose understandings of the individual and particular realities that people build.5,6 Correspondingly, individual and social phenomena must be understood as situated in time, place, persons, cultures, etc. In other words, intrinsic and extrinsic factors are crucial to understanding truth and cannot be removed or controlled to reach a deeper or universally experienced truth.


우리는 일반성과 편견의 개념이 모든 HPE 연구의 엄격함을 확립하는 데 보편적으로 적용될 수 없다고 주장한다. 첫째, 우리는 객관주의 지향과 관련하여 일반성을 정의하며, 주관주의적 지향의 연구에 적용되었을 때 그것이 어떻게 다시 개념화되어야 하는지를 기술한다. 다음으로, 우리는 객관주의자들이 어떻게 편견에 대해 연구자의 주관성이 데이터를 오염시키는 사례로 생각하나 주관주의자들이 데이터의 구성 요소이기 때문에 편견을 수용하는 방법에 주목함으로써 편향을 다룬다. 이러한 주제를 설명하기 위해 박스 1에 사례 시나리오를 포함시키고 객관주의와 주관주의 지향성이 일반성과 편향성의 문제를 어떻게 다르게 다루는지 강조한다.

We argue that the concepts of generalisability and bias are not universally applicable to establish the rigour of all HPE research. First, we define generalisability in relation to an objectivist orientation, and we describe how it must be re-conceptualised when applied to research from a subjectivist orientation. Next, we address bias by attending to how objectivists conceive of bias as instances when researchers' subjectivities contaminate data but how subjectivists embrace bias because subjectivities are constitutive elements of data. To illustrate these topics, we include a case scenario in Box 1 and highlight how objectivist and subjectivist orientations would handle issues of generalisability and bias differently.



2 | 객관주의 및 주관주의 연구 접근법

2 | OBJECTIVIST AND SUBJECTIVIST RESEARCH APPROACHES


객관주의 대 주관주의 지향성이 일반성과 편향성에 미치는 영향을 설명하기 위해, 우리는 이러한 입장을 HPE 연구에서 일반적으로 사용되는 두 가지 패러다임인 [후기 실증주의]와 [구성주의]의 근본 요소로서 설명한다.

To illustrate the impact of an objectivist vs subjectivist orientation on generalisability and bias, we explain these positions as foundational elements of post-positivism and constructivism, two paradigms commonly used in HPE research.


  1. 후기실증주의가 채택하는 존재론(즉, 연구자들이 무엇이 진짜인지 어떻게 이해하는가)2는 [객관주의]적인 것이다. 후기실증주의는 '단일한, 객관적이고, 외적인, 유형적이고, 측정할 수 있는 현실'7이 존재하며, 이 현실은 한 명의 인간의 바깥에 존재하고, 영속된다persist고 주장한다. 

  2. 이러한 존재론은 특정한 인식론(즉, 연구자들이 지식의 본질과 알 수 있는 것을 어떻게 상상하는지)을 낳는다.2 사후 추정론자들은 외부 현실의 진리를 아는 것이 가능하다고 주장하지만, 그러한 진리를 포착하고 이해하는 연구자들의 능력은 절대적이지 않다는 것을 인정한다.7 연구자들은 이 진리를 명확하게 설명하기 위해 끊임없이 노력하지만, 그것을 완전히 아는 것은 불가능하다는 것을 알고 있다.

  3. 7 이러한 인식론을 고려할 때, 사후 포시티브론자들은 현실의 근사치를 돕는 구체적인 방법론(즉, 현실을 알고 지식을 쌓는 방법)2을 고수하지만, 이러한 연구자들은 그들이 질문하는 방식, 즉 그 방법들을 인정한다. 그들이 설계하는 연구와 그들이 개발한 발견에 대한 해석은 그들의 사전 지식, 가치, 신념에 의해 영향을 받을 위험이 있다.7 그러므로 포스트 포시티브리스트들은 그들의 연구에 대한 주관성의 영향을 완화시키기 위해 노력한다. 후기실증주의적 연구의 엄격성은 주관성의 영향력을 최소화하고, 그럼으로써 객관성이 뒷받침되고 유지되는 정도에 의해 평가된다.7

  1. The ontology (i.e., how researchers understand what is real)2 that post-positivism adopts is an objectivist one. Post-positivism maintains that there is ‘a single, objective, external, tangible, measurable reality’7 that exists outside of, and persists beyond, any single human. 

  2. This ontology gives rise to a specific epistemology (i.e., how researchers conceive of the nature of knowledge and what can be known).2 Post-positivists maintain that it is possible to know the truth of the external reality; however, they acknowledge that researchers' abilities to capture and understand such truth are not absolute.7 Researchers continually strive to articulate this truth, but know that it is impossible to ever fully know it.7 

  3. Given this epistemology, post-positivists adhere to specific methodologies (i.e., ways of knowing reality and building knowledge)2 that help them approximate reality, but these researchers acknowledge that the way they ask questions, the studies they design, and the interpretations of findings they develop are at risk of being influenced by their prior knowledge, values, and beliefs.7 Therefore, post-positivists work to mitigate the influence of their subjectivities on their research. The rigour of a post-positivist study is assessed by the extent to which that influence is diminished and that objectivity is supported and maintained.7


이와는 대조적으로, 구성주의자들의 주관주의적 지향은 극명하게 다른 개념화를 유지한다

  1. 그들의 온톨로지(Ontology)는 '여러가지 정신구축, 사회적이고 경험적으로 기초하고, 지역적이고 구체적이며, 그들을 안고 있는 사람에 대한 그들의 형태와 내용에 의존한다'는 형태로 다중적인 현실multiple realities이 존재한다고 주장한다.8(pg 27) 현실은 개인이 살아 있는 경험을 통해, 그리고 그들의 사회적 맥락에서 다른 사람들과 연계하여 자신을 위해 건설하는 것이다. 

  2. 무엇이 진짜인지 알고 현실을 구성하기 위해 구성주의자들은 주관성을 수용한다; 연구자들과 참여자들은 함께 연구되고 있는 현상을 이해하기 위해 의미와 데이터를 공동 구성한다.9 이 인식론은 '궁극적인 또는 "정확한" 알 수 있는 방법은 하나도 없다'고 주장한다.10 대신, 모든 개인은 현실에 대한 그들만의 독특한 이해를 가지고 있다. 

  3. 이러한 관점을 고려할 때, 방법론적으로 구성주의자들은 종종 관찰과 인터뷰와 같은 질적인 방법에 의존하여 개인의 경험 설명과 현실구성을 이끌어낸다. 주관성은 구성론적 연구의 기본 요소이기 때문에, 그것을 제거하려는 어떠한 노력도 연구에는 반대antithetical되는 것이다. 왜냐하면, 이 패러다임에서 주관성은 현실과 그 현실에 대한 지식의 초석이기 때문이다. 따라서, 구성주의 연구의 엄격성은 [저자가 자신의 주관성에 대해 성찰하고 데이터를 성공적으로 사용하여 이러한 데이터로부터 창출한 설명을 서포트하는 정도]에 의해 평가된다.11

In contrast, constructivists' subjectivist orientation maintains starkly different conceptualisations. 

  1. Their ontology asserts that multiple realities exist in the form of ‘multiple mental constructions, socially and experientially based, local and specific, dependent for their form and content on the persons who hold them’.8(pg. 27) Reality is something that individuals construct for themselves through lived experiences and in conjunction with others in their social contexts. 

  2. To know what is real and to construct reality, constructivists embrace subjectivity; the researchers and participants co-construct meaning and data to make sense of the phenomenon being studied together.9 This epistemology asserts that ‘there is no one ultimate or “correct” way of knowing’.10 Instead, every individual holds their own unique understanding of reality. 

  3. Given these perspectives, methodologically, constructivists often rely on qualitative methods, such as observations and interviews, to elicit individuals' descriptions of experiences and their constructions of reality. Since subjectivity is a foundational component of constructivist research, any effort to remove it is antithetical to the research enterprise because, in this paradigm, subjectivity is the cornerstone of reality and knowledge of that reality. Therefore, the rigour of a constructivist study is assessed by the extent to which authors reflect on their own subjectivity and successfully use data to support the account that they have created from these data.11


요약하자면, 

  • 포스트 포시티브 연구자들은 보편적 진리가 바깥 세상에 존재하며(즉, 인간 사상과는 무관) 연구의 목적은 그 현실의 패턴(예: 일관성, 규칙성, 법칙)을 설명하는 것이라고 믿는다. 포스트 포시티브는 객관성을 인정하고 연구 샘플을 넘어 더 넓은 인구로 확장될 수 있는 연구 결과를 개발하기 위해 노력한다. 

  • 반면에 구성주의자들은 복수의 진리가 존재하며(즉, 인간구조에 의존함) 연구의 목적은 개별적인 사례(예: 특이성, 특수성)를 깊이 이해하는 것이라고 주장한다. 그러므로, 구성주의자들은 주관성에 특권을 부여하고 어떤 현상에 대한 다중적이고 다양한 해석을 옹호한다.12

To summarise, 

  • post-positivist researchers believe that a universal truth exists out there (i.e., independent of human thought) and that the purpose of research is to explain patterns (e.g., consistencies, regularities, and laws) of that reality. Post-positivists prize objectivity and strive to develop research findings that can extend beyond a study sample to the broader population. 

  • Constructivists, on the other hand, maintain that multiple truths exist (i.e., dependent on human constructions) and that the purpose of research is to deeply understand individual cases (e.g., idiosyncrasies, particularities). Therefore, constructivists privilege subjectivity and champion multiple, diverse interpretations of a phenomenon.12


3 일반화가능성

3 | GENERALISABILITY


[특정 효과를 적용할 수 있는 모집단, 설정, 치료 변수 및 측정 변수]로 정의되는 일반화가능성은 종종 엄격함의 필수적인 표시로 간주된다. 그러나 1993년의 획기적인 기사에서 파이어스톤은 연구자들을 초청하여 일반성에 대한 세 가지 다른 주장에 대해 생각해 보게 했다. 그는 이러한 주장이 연구자들이 불완전한 자료에서 확실한 결론으로 나아갈 수 있도록 하는 것이라고 주장했다. 이 세 가지 일반성 주장은 '

  • (a) 표본에서 모집단으로의 외삽, 

  • (b) 이론을 이용한 분석 일반화 또는 외삽, 

  • (c) 사례 대 사례 중개translation'이다.14

Defined as the populations, settings, treatment variables, and measurement variables to which particular effects can be applied,13 generalisability is often considered an essential marker of rigour. In a landmark 1993 article, however, Firestone invited researchers to think about three different claims to generalisability. These claims, he argued, are what allow researchers to go from imperfect data to solid conclusions. These three generalisability claims are ‘

  • (a) extrapolation from sample to population, 

  • (b) analytic generalisation or extrapolation using a theory, and 

  • (c) case-to-case translation’.14


  • 표본에서 모집단으로의 확장인 첫 번째 주장은 통계적 일반성과 관련이 있다. 이러한 형태의 일반성은 특히 포스트 실증주의와 관련된 객관주의적 가정과 관련이 있지만, 구성주의적 연구의 주관주의적 가정과는 무관하다. 대부분의 구성주의적 방법론(종종 질적 연구와 관련됨)의 주관주의적 토대를 고려할 때, 통계적 일반성을 달성하는 것은 가능하지도 바람직하지도 않다.

The first argument—extrapolation from sample to population—relates to statistical generalisability. This form of generalisability is particularly relevant to the objectivist assumptions associated with postpositivism, but it is irrelevant for the subjectivist assumptions of constructivist research. Given the subjectivist foundations of most constructivist methodologies (often associated with qualitative research), achieving statistical generalisability is neither possible nor desirable.


  • 두 번째 주장은 분석적 또는 이론적 일반화가능성이며, 여기서 연구자들은 [이론을 개발하거나 기존 이론에 기여함으로써 국소적인 발견을 일반화하는 것]을 목표로 한다.14,15 일반성에 대한 이러한 접근방식에서, 연구자들은 많은 연구 참여자들과 관련된 고차원적 추상화를 생성하기 위해 유도적이고 심층적인 데이터 분석에 참여한다. 이러한 추상화(연구 노력에 의해 개발되고 있는 이론이나 개념)는 일반화가능한 결과이다. 따라서, 연구 설계가 통계적 일반성의 표준을 허용하지 않거나 도달하지 못함에도 불구하고, 연구는 이론적 또는 개념적 일반성을 달성할 수 있다. 많은 주관주의적 연구는 일반성의 개념화와 상당히 관련이 있다고 생각하지만, 연구자들은 그들의 지식 생산 노력을 지원하기 위해 [이론적 일반화가능성theoretical generalisability]이라는 용어를 거의 동원하지 않는다. 이론적 일반성은 '연구가 수행되는 조건과 다양한 이론multiple theories과의 관련성을 명시'함으로써 촉진될 수 있고, 이 작업은 많은 구성주의적 연구를 단단하게 뒷받침해주는 심층 분석적 작업deep analytic work와 유사한 과정이다.

The second argument is analytic or theoretical generalisability, where researchers aim to generalise local findings by developing theories or contributing to pre-existing theories.14,15 In this approach to generalisability, researchers engage in inductive, in-depth data analysis to generate higher-order abstractions relevant to many of their research participants. These abstractions—the theories or concepts being developed by the research effort—are the outcomes that are generalisable. Thus, despite research designs not allowing for—or reaching—the standards of statistical generalisability, research can achieve theoretical or conceptual generalisability. While much subjectivist research would find this conceptualisation of generalisability quite relevant, researchers seldom mobilise the language of theoretical generalisability in support of their knowledge production efforts. Theoretical generalisability can be facilitated by ‘specifying the conditions under which a study is done and their relevance to multiple theories’,14 a process akin to the deep analytic work undergirding much constructivist research.


  • 마지막으로, Firestone의 세 번째 주장은 독자나 자연주의적 일반성과 유사하게 사례 대 사례 번역이다.16 Firestone은 이러한 종류의 일반성을 '한 세팅에 있는 사람이 다른 세팅에서 프로그램이나 아이디어를 채택하는 것을 고려하는 것'.을 의미한다14 이것은 링컨과 구바의 전달 가능성transferability 개념과 유사하다.17 Firestone의 case-to-case translation은 연구자들을 그들의 원고에 사례에 대한 두꺼운 설명thick description을 제공하도록 초청하여 다른 사람들이 연구의 통찰력이 그들 자신의 사례에 적용되는지 여부를 결정하는 데 필요한 정보를 얻도록 한다. 폴리트와 벡이 분명히 말했듯이, 이 노력은 저자와 독자에 의해 실현된 '협업적 사업collaborative enterprise'으로 가장 잘 이해된다.

Finally, Firestone's third argument is case-to-case translation, akin to reader or naturalistic generalisability.16 Firestone describes this kind of generalisability as instances when ‘a person in one setting considers adopting a program or idea from another one’.14 This is similar to Lincoln and Guba's concept of transferability.17 Firestone's case-to-case translation invites researchers to offer thick descriptions of cases in their manuscripts so that others have the necessary information to decide whether insights from research apply to their own cases. As Polit and Beck articulated, this effort is best understood as a ‘collaborative enterprise’,15 realised by author and reader.


우리가 이런 방식으로 일반성을 재구성할 때, 우리는 명확한 패러다임 차이를 볼 수 있다. 

When we reframe generalisability in this manner, we can see clear paradigmatic differences. 


  • 객관주의적 성향과 추론 통계에 의존하는 포스트 실증주의 연구자들은 [개별 표본에서 더 큰 모집단으로 추론을 이끌어내기 위해 노력한다]. 이러한 추론에 대한 방어 가능한 주장을 구축하기 위해, 연구자들은 표본이 무작위로 선택되었고, 더 큰 모집단을 합리적으로 대표하며, 분석적 주장을 뒷받침할 만큼 충분히 검정력power이 크다는 것을 확인하려고 한다. 본질적으로, 표본으로부터 도출된 모집단에 대한 추론이 일반화된다는 가정은 현상이 다른 맥락에 복제될 수 있다는 것을 의미한다. 후기실증주의적 연구자들 또한 이론적 일반성과 사례 대 사례 번역에 도달하기 위해 노력할 수 있지만, 통계적 일반성이 객관주의적 기초의 핵심이다.

Post-positivist researchers relying on an objectivist orientation and inferential statistics endeavour to draw inferences from samples of individuals to larger populations. To build defensible arguments for these inferences, researchers seek to ensure that samples have been randomly selected, are reasonably representative of larger populations, and are sufficiently large to support, or ‘power’,18 analytic claims. In essence, the assumption that inferences made from samples generalise to the populations from which they are drawn means that phenomena are replicable to other contexts. Post-positivist researchers can also strive to reach theoretical generalisability and case-to-case translation, but statistical generalisability is a linchpin of their objectivist underpinnings.


  • 이와는 대조적으로 주관주의적 지향성이 지배하는 구성주의적 패러다임에서 수행된 연구는 이론적 또는 자연주의적 일반성에 도달하기 위해 노력할 것이다. 위에서 논의한 바와 같이, 구성론적 연구와 같은 주관주의적 사고에 기반을 둔 연구는 일반적으로 개별 사례의 특수성에 초점을 맞추고, 관련 연구 참여자의 선별된 수를 식별하기 위해 목적적 샘플링을 채택한다. 그러한 목적적 표본의 결과의 목적은 더 넓은 집단에 일반화하는 것이 아니다. 그 대신, 그러한 연구는 [이론에 기여하는 통찰력을 제공하거나, 이론을 통한 다른 사례와 관련되거나, 전이성을 통해 다른 영역의 경험을 반영하는 것]을 목적으로 한다. 더욱이, 다중적 주관성multiple subjectivities에 특권을 주고서는privileging, 참가자들의 현실이 연구 표본 밖의 다른 사람들의 현실에 반드시 외삽가능하다고 주장하는 것은 이치에 맞지 않는다.19

In contrast, research carried out from a constructivist paradigm— where subjectivist orientations hold sway—might endeavour to reach theoretical and/or naturalistic generalisability. As discussed above, research grounded in subjectivist thinking—like constructivist research— typically focuses on the particularities of individual cases and employs purposive sampling to identify select numbers of relevant study participants. The aim of results from such purposive samples is not to generalise to broader populations. Instead, such research aims to provide insights contributing to theory, relating to other cases through theory, or echoing experiences in other domains through transferability. Furthermore, with a privileging of multiple subjectivities, it does not make sense that participants' realities would necessarily extrapolate to the realities of others outside of the research sample.19


후기실증주의적 사고의 잔재가 HPE에서 우위를 점할 때, 일반 가능성(특히 통계적 일반성)은 연구의 패러다임과 관계없이 모든 연구에서 예상되는 엄격성의 기준이 된다결과적으로, 구성주의 내 접근방식에서 수행된 것을 포함하여 주관적 연구에 대한 많은 HPE 원고 보고가 [이러한 형태의 일반성이 그들의 연구 설계에 대한 적절한 기대치가 아님에도 불구하고] 통계적 일반성의 결여를 한탄하는 '내 탓이로소이다' 식의 진술을 제공한다(예를 들어, 본 연구의 결과는 모든 건강관리 학생을 대표할 수 없는 견해를 가진 한 의과대학의 소수의 의대생을 기반으로 한다. ) 

When remnants of post-positivist thinking hold sway in HPE, generalisability—particularly statistical generalisability—becomes an expected criterion of rigour for all research, regardless of a study's paradigm. Consequently, many HPE manuscripts reporting on subjectivist research, including those conducted from within constructivist approaches, offer mea culpa statements lamenting the lack of statistical generalisability (e.g., findings from this study are based on a small number of medical students from one medical school whose views may not be representative of all healthcare students), despite the fact that this form of generalisability is not an appropriate expectation for their research designs.19 


따라서 일부 구성주의 연구자들은 연구목표로서의 일반성을 노골적으로 거부하며, 대신에 질적 데이터의 논리, 구조 및 의미에 대한 깊은 해석을 선호한다. 다른 (Firestone 포함)은 주관주의적 지향에 부합하는 적절한 개념으로 전달 가능성transferability(자연주의적 일반성에 대한 개념과 유사)으로 구별했다.17

Some constructivist researchers therefore reject generalisability as a research goal outright, instead favouring deep interpretations of the logic, structure, and meaning of qualitative data.20 Others (including Firestone) have identified transferability (akin to naturalistic generalisability) as a suitable concept aligning with subjectivist orientations.17


궁극적으로 어떤 종류의—일반성이 관련성이 있는지 결정하기 위해서는 연구의 존재론적 뿌리에 대한 세심한 고려가 필요하다. 

  • 연구가 객관적 현실과 관련된 보편적 진리를 설명하고자 하는 경우 통계적 일반성이 핵심이고, 

  • 연구가 개인이 구성한 주관적 현실을 사회적 상호작용을 통해 이해하고자 하는 경우 이론적 일반성 또는 자연주의적 일반성이 필요할 수 있다.

Ultimately, to decide what kind of—generalisability is relevant, careful consideration of a study's ontological roots is required. 

  • If an investigation seeks to explain a universal truth associated with an objective reality, then statistical generalisability is key; 

  • if a study seeks to understand subjective realities constructed by individuals and through social interactions, then theoretical and/or naturalistic generalisability may be necessary.


따라서, 주관적 HPE 연구(예: 구성주의적 연구)의 연구자와 독자들은 (통계적 일반성의 결여를 한탄하기보다는) 일반성의 다양한 형태를 더 잘 이해하고 연구의 패러다임적 토대를 바탕으로 그 타당성을 평가할 필요가 있다. 그들은 또한 그들의 연구를 ['사소하고, 대수롭지 않으며, 거의 가치가 없는' 것으로 변질시키거나, 그들 자신의 합법화 노력을 훼손하지 않도록] 보다 뉘앙스를 가지고 일반성의 개념에 관여해야 한다. 21

Therefore, instead of lamenting a lack of statistical generalisability, researchers and readers of subjectivist HPE research (eg, constructivist research) need to better understand the varied forms of generalisability and evaluate their appropriateness based on the paradigmatic underpinnings of the research. They also should engage with the concept of generalisability with more nuance lest they undermine their own legitimation efforts, turning their research into something that ‘is of little use, insignificant, and hardly worth doing’. 21


좀 더 구체적으로, 파이어스톤의 세 가지 주장 측면에서 일반성에 대해 생각하는 것은 HPE 연구자들이 그들의 발견의 중요성과 도달 범위를 더 잘 정당화할 수 있게 할 수 있다. 주관주의적 지향성을 가진 대부분의 프로젝트는 통계적 일반성을 달성할 수 없고, 달성하려고 노력해서는 안 되지만, 데이터와 이론과의 깊은 관계를 통해 분석적 기여와 전달 가능성 잠재력을 설명해야 한다.15

More concretely, thinking about generalisability in terms of Firestone's three arguments can enable HPE researchers to better justify the importance and reach of their findings. While most projects with subjectivist orientations will not be able to— and should not strive to—achieve statistical generalisability, they should describe their analytic contributions and transferability potential through deep engagement with their data and theory.15


4 편향 4 | BIAS


질적 연구의 Sage 사전에는 편향의 두 가지 정의가 나열되어 있다.24 

  • 첫째는 연구자가 데이터 수집이나 해석에 영향을 미침으로써 [연구 결정, 데이터 출처 및 판단을 편견을 갖게 하는] 견제받지 않는 관행이나 행동이라고 정의한다. 예를 들어, 연구자들이 연구 목적에 대해 참가자들에게 너무 많은 것을 드러내면, 참가자들의 반응은 연구자들을 기쁘게 하는 것을 목표로 하기 때문에 편향될 수 있다( 이른바 '사회적 만족도 편견')

  • 두 번째 정의는 편견을 '개인의 선호, 성향 또는 중립성과 객관성을 막는 성향'으로 특징짓는다. 예를 들어, 연구자가 특정 요인이 특정 현상의 발현에 영향을 미친다고 가정할 경우(예: 계층 구조는 안전성 우려의 목소리를 내는 의지에 영향을 미친다), 그러면 그들은 다른 영향력 있는 요소(예: 불확실성, 문화적 규범)를 무시하거나 전체 참여자 관점을 도출하는 질문을 하지 않을 수 있다.

The Sage Dictionary of Qualitative Research lists two definitions of bias.24 

  • The first defines bias as unchecked practices or actions where researchers influence data collection or interpretation and thus prejudice research decisions, data sources, and judgements.24 For example, when researchers reveal too much about a study's purpose to participants, participants' responses can be biased as they aim to please researchers (the so-called ‘social desirability bias’).25 

  • The second definition characterises bias as ‘individual preferences, predispositions, or predilections that prevent neutrality and objectivity’.24 For example, if researchers assume that certain factors impact the manifestation of a particular phenomenon (e.g., hierarchy influences willingness to voice safety concerns), then they may ignore other influential factors (e.g., uncertainty, cultural norms) or fail to ask questions eliciting the full range of participant perspectives.


이 두 가지 정의는 연구의 편견이 [이원론]과 [객관주의]라는 두 가지 원칙의 위반을 구성한다는 주장과 일치한다.26 

  • 이원론은 연구에 관여하는 연구자와 연구 참여자를 분리하여 편견을 최소화해야 한다는 믿음(후기 실증주의 연구에서의 공통점)이다.7 

  • 객관주의는 앞에서 서술한 바와 같이 [연구자의 가치, 신념 또는 가정으로부터 야기될 수 있는 편견]이 연구에 없는 것을 말한다.7

These two definitions align with the claim that bias in research constitutes the violation of two principles: dualism and objectivism.26 

  • Dualism is the belief (common in post-positivist research) that researcher and research participants involved in a study should be separated to minimise bias.7 

  • Objectivism, as previously articulated, refers to the absence of bias in a study that could result from researchers' values, beliefs or assumptions.7


  • 객관주의적 지향에서 일하는 사람들은 편견을 주관성과 부정적으로 동일시하는 경향이 있는 반면, 

  • 구성주의적 패러다임 내에서 일하는 사람은 일반적으로 연구자들의 행동, 선호도 및 성향은 연구 과정과 제품과 불가분하게 연관되어 있으며, 편견은 그 과정에서 제거될 수 없다는 것을 인식한다. 

주관주의적 지향으로부터, 구성주의 연구자들의 주관성은 현실 자체의 본질과 그것으로부터 우리가 개발할 수 있는 지식에 기초하기 때문에 연구 과정 내내 그들의 학문적 노력을 알려준다. 간단히 말해서, 연구자들은 그들의 연구 과정을 통해 그들이 이해하는apprehending 현실을 구성한다.

  • While those working from an objectivist orientation tend to negatively equate bias with subjectivity,27 

  • those working within a constructivist paradigm typically recognise that researchers' actions, preferences, and predispositions are inextricably linked with research processes and products; they cannot be removed from the process. 

From a subjectivist orientation, constructivist researchers' subjectivities inform their scholarly efforts throughout the research process because subjectivity is foundational to the nature of reality itself and the knowledge we can develop from it. Put simply: the researchers construct the reality that they are apprehending through their research processes.


[구성주의 연구자들의 주관성]은 연구가 어떻게 설계되고, 데이터가 수집되고, 연구 결과가 분석되는지를 형성할 뿐만 아니라, 원고에 그들의 연구 결과를 어떻게 나타내는지에도 영향을 미친다. 예를 들어, 구성주의 연구자들은 종종 발췌한 데이터를 참여자의 목소리로 해석하는 근거에 포함시킨다. 이는 연구의 엄격함rigour을 보여주기 위해 권장되는 접근법이다. 11 면접, 초점 그룹 또는 관찰을 통해 생성된 데이터는 참여자와 연구자 간에 공동 구성된 것으로 보인다. 이 경우에 데이터는 참가자의 목소리를 엄격하게 반영하지 않는다. 그보다, 이런 데이터는 연구자들에 의해 도출되고, 형성되고, 해석된 참가자의 목소리를 반영한다. 이러한 고려를 고려할 때, HPE의 구성주의적 연구의 많은 부분이 이원론자와 객관주의자가 보기에는 변명의 여지가 없을 정도로 주관적이거나 '편향적'이라는 것은 분명하다.

Constructivist researchers' subjectivities not only shape how research is designed, data are collected, and findings are analysed, but their subjectivities also affect how they represent their findings in manuscripts. For example, constructivist researchers often incorporate data excerpts into the findings of articles to ground their interpretations in participants' voices—an approach encouraged to show rigour.11 The data generated through interviews, focus groups, or observations are seen as co-constructed between participants and researchers. In this way, data do not strictly mirror the voices of participants; rather, data reflect the voices of participants as they were elicited, shaped, and interpreted by researchers. Given these considerations, it is clear that much of HPE's constructivist research is unapologetically subjective—or ‘biased’ in both the dualist and objectivist senses.


그러나 구성주의적 접근법을 통해 생성된 데이터가 주관적이라면, 어떻게 독자는 발견이 그들 자신의 맥락에서 추가적인 고려나 구현을 할 가치가 있는지 알 수 있는가? 주관주의적 연구 결과와 통찰력을 평가하기 위해, 우리는 엄격함에 대한 객관주의적 수단을 사용할 수 없다. 사실, 주관성을 수용하게 되면 [편견이 없는 연구]에 대한 어떠한 기대도 터무니없는 것으로 만든다.

But if data generated through constructivist approaches are subjective, how then does the reader know if findings merit further consideration or implementation in their own context? To evaluate subjectivist research findings and insights, we cannot use objectivist measures of rigour. In fact, embracing subjectivity makes any expectation of bias-free research nonsensical.


한 가지 진일보한 방법은 연구자 자신의 개인적 존재론적 및 인식론적 입장과 연구 과정에 미치는 영향을 탐구하는 것을 목표로 하는 성찰적 실천reflexive practices을 통해 연구 중 작용하는 역동dynamics을 탐구하고 문서화하는 것이다.28 이를 위해 롤스턴과 쉘튼27은 세 가지 기법을 제안한다. 

  • 첫 번째 기법(주제론적 연구와 객관주의적 연구에 모두 적용됨)에서 조사자들은 연구의 이론적 기초와 연구 설계, 방법 및 행동 사이에 명확한 일치를 보장하기 위해 연구 설계를 성찰한다. 

  • 두 번째 기법은 연구자들에게 질문의 작성, 샘플링 선택, 연구 참여자와의 상호작용, 데이터 분석, 연구 결과의 제시를 포함한 연구 과정의 모든 단계에서 그들의 역할과 위치positioning를 검토examine하도록 요구한다. 

  • 세 번째 기법은 한 걸음 더 나아가 연구자들을 자신의 연구에 대해서 분석하는 것이다. 예를 들어, 연구 참가자들에게 제시된 질문을 체계적으로 검토하거나, 이런 질문에 연구자들의 관점을 어떻게 반영되었는지 검토하거나, 그 질문들이 어떻게 특정 유형의 반응을 고무시키거나 다른 사람들을 배제시켰는지를 고려한다.

One way forward is to explore and document the dynamics at play during research through reflexive practices aimed at exploring the researcher's own personal ontological and epistemological positions and their influence on the research process.28 To do this, Roulston and Shelton27 propose three techniques. 

  • In the first technique (applicable to both subjectivist and objectivist research), investigators reflect on study designs to ensure clear alignment between studies' theoretical underpinnings, and their research designs, methods, and conduct. 

  • The second technique asks researchers to examine their roles and positioning within every stage of the research process including crafting of questions, sampling choices, interaction with study participants, analysis of data, and presentation of findings. 

  • The third technique goes a step further by engaging researchers in an analysis of their own work—for example systematically reviewing the questions posed to study participants, considering how these reflect researchers' own perspectives, and how the questions may have inspired certain types of responses or precluded others.


이러한 서로 다른 기법들은 성찰적 연구reflexive research 저널에 기록될 수 있고 연구 팀 내에서 논의될 수 있다. 집합적으로, 이러한 전략은 연구자들이 데이터가 어떻게 구성되는지에 대해 세심한 주의를 기울이고 연구 목적과 맥락에 기초하여 연구 과정에 대한 조정이 보장되는지 여부를 결정하는 데 도움이 되어야 한다. 연구팀이 연구 결과를 분석 및 작성하기 위해 협력할 때, 그들은 데이터와 관련하여 어떻게 스스로를 포지셔닝하는지에 주목하면서 이러한 반사성reflexivity을 계속해야 한다.29

These different techniques can be documented in reflective research journals and discussed within research teams. Collectively, these strategies should help researchers pay close attention to how data are constructed and decide whether adjustments to research processes are warranted based on study purposes and contexts. As research teams work together to analyse and write up study findings, they must continue this reflexivity, noting how they position themselves in relation to their data.29


연구자가 연구과정에 미치는 주관적 영향을 따지는 대신, 연구자와 검토자는 다음과 같은 질문을 할 수 있다. 

  • 이 연구의 가이딩guiding 이론과 가정은 데이터 해석에 어떤 영향을 미치고 있는가? 

  • 데이터 표현에서 이론과 가정은 어떻게 표현되는가? 

  • 조사 결과 발표에서 연구자와 참여자의 목소리는 어떤 관계인가? 

  • 제시된 자료는 저자들이 만든 더 넓은 주장을 설득력 있고 예증하고 있는가?

Instead of decrying the subjective influence of researchers on the research process, researchers and reviewers can ask: 

  • How are the study's guiding theories and assumptions influencing data interpretations? 

  • How are theories and assumptions represented in data representations? 

  • What is the relationship between researchers' and participants' voices in the presentation of findings? 

  • Are the data presented convincing and illustrative of the broader arguments made by the authors?


5 결론 

5 | CONCLUSION


본질적으로 우리는 주관성을 수용하는 패러다임 내에서 일반성과 편견이 문제가 된다고 주장한다. 실제로 이러한 용어의 기원을 이해함으로써 주제론적 HPE 연구에서 엄격함을 달성하기 위한 대안적 접근법을 성찰하고 명확히 할 수 있다. 우리는 이러한 문제들을 무시하거나 사과하거나 위장하기 보다는, 우리의 선택을 드러내는 데 있어서 목적성purposiveness을 갖추기를 주장한다.27

Essentially, we argue that generalisability and bias are problematic within paradigms that embrace subjectivity. Indeed, by understanding the origins of these terms, we are able to reflect on and clarify alternative approaches to achieving rigour in subjectivist HPE research. Rather than ignoring, apologising for or camouflaging these issues, we instead argue for purposiveness in illuminating our choices.27


모든 HPE 연구에서, 연구자들은 특정 패러다임에서 그들의 연구를 뿌리내린다. 이것은 그 연구자들이 항상 같은 패러다임에서 일한다는 것을 의미하지는 않는다. 오히려 그 반대이다. 각각의 연구는 연구자들이 그들이 묻고 있는 질문의 유형, 그들이 만들고자 하는 지식의 종류, 그리고 그들이 조사하고 있는 현실의 성격을 고려하도록 요구한다. 한 연구에서 HPE 연구자는 사후 포시티브 지향 내에서 작업할 수 있으며, 다른 연구에서는 구성주의적 접근법을 채택할 수 있다. 하나의 패러다임이 다른 패러다임보다 우월한 것은 아니다. 그 대신, 그것들은 서로 다르다.

In every HPE study, researchers root their investigations in a specific paradigm. This does not mean that those researchers always work from that same paradigm. Far from it. Each study requires researchers to consider the types of questions they are asking, the kinds of knowledge they hope to build and the nature of the reality they are investigating. For one study, an HPE researcher might work from within a post-positivist orientation; for another, they may adopt a constructivist approach. One paradigm is not superior to the other; instead, they are importantly different from each other.







. 2020 Aug 11.
 doi: 10.1111/medu.14348. Online ahead of print.

The applicability of generalisability and bias to health professions education's research

Affiliations 

Affiliations

  • 1Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, MD, USA.
  • 2Department of Medicine and Center for Faculty Educators, University of California, San Francisco, CA, USA.
  • 3College of Science, Health, and Education (SHEE), Murdoch University, Murdoch, WA, Australia.
  • 4Monash Centre for Scholarship in Health Education (MCSHE), Monash University, Clayton, Vic, Australia.
  • 5Faculty of Medicine and Health, University of Syndey, Sydney, NSW, Australia.
  • 6Centre for Research in Assessment and Digital Learning, Deakin University, Melbourne, Vic., Australia.
  • 7University of Toronto, Toronto, ON, Canada.

Abstract

Context: Research in health professions education (HPE) spans an array of topics and draws from a diversity of research domains , which brings richness to our understanding of complex phenomena and challenges us to appreciate different approaches to studying them. To fully appreciate and benefit from this diversity, scholars in HPE must be savvy to the hallmarks of rigour that differ across research approaches. In the absence of such recognition, the valuable contributions of many high-quality studies risk being undermined.

Methods: In this article, we delve into two constructs---generalisability and bias--that are commonly invoked in discussions of rigour in health professions education research. We inspect the meaning and applicability of these constructs to research conducted from different paradigms (i.e., positivist and constructivist) and orientations (i.e., objectivist and subjectivist) and then describe how scholars can demonstrate rigour when these constructs do not align with the assumptions underpinning their research.

Conclusions: A one-size-fits-all approach to evaluating the rigour of HPE research disadvantages some approaches and threatens to reduce the diversity of research in our field. Generalisability and bias are two examples of problematic constructs within paradigms that embrace subjectivity; others are equally problematic. As a way forward, we encourage HPE scholars to inspect their assumptions about the nature and purpose of research-both to defend research rigour in their own studies and to ensure they apply standards of rigour that align with research they read and review.

성공적인 연구 환경으로 무엇이 중요한가? 현실주의자 합성 (Med Educ, 2018)

What really matters for successful research environments? A realist synthesis

Rola Ajjawi,1 Paul E S Crampton2,3 & Charlotte E Rees3



도입 INTRODUCTION

연구 환경은 중요하다. 견실한 연구 품질의 문화나 연구자에 대한 지원과 같은 환경적 고려는 연구 생산성의 가장 영향력 있는 예측 변수라고 생각된다.  25년 이상 전에 Bland와 Ruffin1은 1960년대 중반부터 1990년(Box 1)까지에 걸친 국제 학술 의학 문헌에서 연구하기 쉬운 환경의 12가지 특성을 확인했다.

Research environments matter. Environmental considerations such as robust cultures of research quality and support for researchers are thought to be the most influential predictors of research productivity.1,2 Over 25 years ago, Bland and Ruffin1 identified 12 characteristics of research-favourable environments in the international academic medicine literature spanning the period from the mid-1960s to 1990 (Box 1).


실제로, 기존 검토가 성공적인 연구 환경에 어떤 영향을 미치는지를 더 잘 이해하도록 돕기 시작했지만, 이 연구는 일반적으로 환경적 특성의 상황별 복잡성과 다양성을 무시하고, [연구 결과물의 양과 같은 생산성의 좁은 표지]에 초점을 맞추었다(예: ref.7).

Indeed, although existing reviews have begun to help us better understand what makes for successful research environments, this research has typically ignored the contextual complexities and multiplicity of environmental characteristics1,3–7 and has focused on narrow markers of productivity such as the quantity of research outputs (e.g. ref.7)


Box 1 성공적인 연구환경의 특성1

Box 1 Characteristics of successful research environments1


1 명확한 조직적 연구 목표

2 연구 생산성을 우선순위로 한다. 최소한 다른 활동과 동등한 우선순위로 한다.

3 연구 가치를 공유하는 견고한 연구 문화

4 긍정적인 그룹 기후

5 참여형 거버넌스 구조

6 비위계적, 분산적 구조

7 팀원들 간의 좋은 소통과 직업적으로 의미 있는 관계

8 인력, 자금, 연구 시설 및 시간과 같은 적절한 리소스

9 더 큰 그룹 규모, 적당히 확립된 팀 및 다양성

10 연구 성공에 대한 보상

11 우수 연구원 채용 및 선발

12 연구 전문지식과 기술을 갖춘 연구중심 리더

1 Clear organisational research goals

2 Research productivity as a priority and at least equal priority to other activities

3 A robust research culture with shared research values

4 A positive group climate

5 Participative governance structures

6 Non-hierarchical and decentralised structures

7 Good communication and professionally meaningful relationships between team members

8 Decent resources such as people, funding, research facilities and time

9 Larger group size, moderately established teams and diversity

10 Rewards for research success

11 Recruitment and selection of talented researchers

12 Research-oriented leaders with research expertise and skill


성공적인 연구 환경을 이해하기 위한 상황별 배경

The contextual background for understanding successful research environments


교육의 대량 생산, 연구에 대한 정부 자금 지원 감소, 고등 교육에서의 '새로운 경영자' 문화, 연구의 양과 질에 대한 조사 증가, 연구가 생산되는 연구 환경과 연구의 영향이 불가피해졌다.  실제로 전 세계 고등교육기관(HEI)에서는 개별 연구자 및 연구그룹의 주요 성과 지표의 일부로 연구 생산성이 측정되고 있다.7

Against a backdrop of the mass production of education, reduced government funding for research and ‘new managerialist’ cultures in higher education,8,9 increased scrutiny of the quantity and quality of research, the research environments in which research is produced and the impacts of research has become inevitable.10 Indeed, in higher education institutions (HEIs) globally, research productivity is being measured as part of individual researcher and research group key performance indicators.7


호주, 홍콩, 뉴질랜드, 영국 등 많은 국가에서 HEI 연구는 정부 주도의 연구 평가를 통해 국가적인 규모로 측정된다. 이러한 연구 측정은 대학의 자금 배분 및 경쟁 시장에서 대학의 차별화에 기여해 왔으며, 일부는 '연구 중심대학'으로 제도적 정체성을 확고히 하고, 다른 일부는 상대적 '연구 중심적' 지위를 강조하였다. (예: 기존의 '교육 중심적' 대학') 이러한 제도적 차별화는 '연구활동' 또는 '교육 중심' 진로를 택하도록 점점 더 장려되고 있는 대학 내 개별 학자들과도 유사하다.8,9

In many countries, such as Australia, Hong Kong, New Zealand and the UK,11 HEI research is measured on a national scale through government-led research assessments. Such research measurement has contributed to the allocation of funding to universities and differentiation of universities in the competitive marketplace, with some solidifying their institutional identities as ‘research-intensive’ and others emphasising their relative ‘newcomer-to-research’ status (e.g. previously ‘teaching-intensive’ universities).9,12,13 Such institutional differentiation also parallels that of individual academics within universities, who are increasingly encouraged to take either ‘researchactive’ or ‘education-focused’ career pathways.8,9


표 S1은 주요 용어의 정의를 제공한다.

Table S1 provides definitions of key terms.


이전 리뷰에서 확인된 연구 환경의 주요 특징

Key features of research environments identified in previous reviews


Evans는 다음과 같이 연구 환경을 정의한다: '연구 관행과 산출물을 가치 있고 가치 있고 앞선 활동으로 수용하고 인식하는 것이 중심인 공유된 가치관, 가정, 신념, 의식 및 기타 형태의 행위' 14 이전의 검토는 [연구 역량 구축과 같은 개별 연구자를 대상으로 한 개입]과 [보조금이나 출판물 수 증가와 같은 개인 수준의 결과]에 초점을 맞추는 경향이 있었다. 기존 검토는 일반적으로 연구 역량 강화 개입이 긍정적인 연구 성과로 이어진다는 결론을 내렸다.

Evans defines a research environment as including: ‘shared values, assumptions, beliefs, rituals and other forms of behaviour whose central focus is the acceptance and recognition of research practice and output as valued, worthwhile and pre-eminent activity.’14 Previous reviews have tended to focus on interventions aimed at individual researchers, such as research capacity building,4,5,7 and with individual-level outcomes, such as increased numbers of grants or publications.4,5,7 These reviews have typically concluded that research capacity-building interventions lead to positive research outcomes.4,5,7


게다가, 그 검토들은 연구에 대한 개인과 기관의 enabler를 모두 확인했다. 개인 지원자들은 연구를 수행하려는 연구자들의 내재적 동기를 포함했다. 기관적 enabler로는,

  • 료들의 지지, 격려 및 검토,

  • 멘토링 및 협업,

  • 연구 리더십,

  • 명확한 전략과 같은 연구를 지원하는 제도적 구조, 프로세스 및 시스템

  • 호되는 시간 및 재정적 지원

Furthermore, the reviews have identified both individual and institutional enablers to research. Individual enablers included researchers’ intrinsic motivation to conduct research.6,7 Institutional enablers included 

  • peer support, encouragement and review,7 

  • mentoring and collaboration,4,5 

  • research leadership,5,6 

  • institutional structures, processes and systems supporting research, such as clear strategy,5,6 

  • protected time and financial support.5


비록 이러한 검토들이 성공적인 연구 환경의 특징들을 밝히기 시작했지만, 마즈마니아어 외 연구진들은 검토에서 '...어떤 상황에서 무엇이 가장 잘 작동하는지에 대해 거의 알려져 있지 않다'고 결론지었다.

Although these reviews have begun to shed light on the features of successful research environments, Mazmanian et al.4 concluded in their review: ‘...little is known about what works best and in what situations.’


개념 체계: 현실주의 접근법

Conceptual framework: a realist approach


우리는 현실주의 합성이 복합적인 개입이 성공에 어떻게 영향을 미칠 수 있는지를 설명해줄 것이라고 생각했다. 현실주의realism는 외부 현실(실제 세계)의 존재를 전제로 하지만 인간의 감각, 의지, 언어, 문화를 통해 현실(즉, 인지, 해석, 대응)이 여과된다는 것을 전제로 한다현실주의적 접근방식은 왜 개입이 효과가 있을 수 있고 없을 수 있는지, 누구를 위해 그리고 어떤 상황에서든 이론의 개발과 시험을 가능하게 한다. 현실주의적 접근은 개입이 직접적으로 결과를 초래하지 않는다는 것을 인식함으로써 이를 수행한다. 대신, 개입에 의해 제공되는 기회에 대한 [참가자의 반응과 반응]이 결과를 유발한다.

we thought a realist synthesis would bemost likely to elucidate how multiple complex interventions can influence success. Realism assumes the existence of an external reality (a real world), but one that is filtered (i.e. perceived, interpreted and responded to) through human senses, volitions, language and culture.15 A realist approach enables the development and testing of theory for why interventions may or may not work, for whom and under what circumstances.16 It does this through recognising that interventions do not directly cause outcomes; instead, participants’ reactions and responses to the opportunities provided by the intervention trigger outcomes. 


이 접근방식은 연구자들이 개입과 그들이 일하는 상황 사이의 관계, 그들이 어떻게 작용하는지(메커니즘) 그리고 그들의 결과와 같은 복잡한 상황에서의 인과 관계를 식별할 수 있게 할 수 있다. CMO(Context-mechanism-Outcome) 접근법이 반드시 선형적인 것은 아니지만, 상황별 가변성을 우선적으로 고려한 설명을 제공하는 데 도움이 될 수 있다.

This approach can allow researchers to identify causal links in complex situations, such as those between interventions and the contexts in which they work, how they work (mechanisms) and their outcomes.17 Although the context–mechanism– outcome (CMO) approach is not necessarily linear, it can help to provide explanations that privilege contextual variability.18


성공적인 연구 환경의 특징은 무엇이며, 누구에게, 어떻게, 그리고 어떤 환경에서인가?

What are the features of successful research environments, for whom, how and in what circumstances?


방법

METHODS


우리는 (i) 범위 명확화, (ii) 증거 검색, (iii) 품질 평가, (iv) 데이터 추출, (v) 데이터 합성 등 5단계 리얼리스트 종합을 따랐다.19 우리의 방법 또한 RAMES(현실주의 및 메타해설 근거 합성: 진화하는 표준) 보고 지침을 따른다.20

We followed five stages of realist synthesis: (i) clarifying scope; (ii) searching for evidence; (iii) assessing quality; (iv) extracting data, and (v) synthesising data.19 Our methods also follow the RAMESES (realist and meta-narrative evidence synthesis: evolving standards) reporting guidelines.20


범위 명확화

Clarifying the scope


먼저 연구 우수성 프레임워크(REF) 2014년 환경 평가 기준에 근거해 관련 개입을 파악함으로써 현실주의 종합의 범위를 명확히 했다. REF는 영국 HEI가 생산하는 연구의 질, 학계를 넘어선 영향, 연구를 지원하는 환경을 평가하는 국가적 행사다. REF2014 환경 템플릿에 표시된 평가 기준에는 해당 유닛의 연구 전략, 인력(인력 전략, 인력 개발 및 연구 학생 포함), 소득, 인프라 및 시설(IIIF)과 협업의 특징이 포함되었다.21

We first clarified the scope of our realist synthesis by identifying relevant interventions based on the Research Excellence Framework (REF) 2014 environment assessment criteria. The REF is a national exercise assessing the quality of research produced by UK HEIs, its impact beyond academia, and the environment that supports research. The assessment criteria indicated in the REF2014 environment template included the unit’s research strategy, its people (including staffing strategy, staff development and research students), its income, infrastructure and facilities (IIF), as well as features of collaboration.21


(그림 1은 초기 프로그램 이론에 대한 자세한 내용을 제공한다.)

(Fig. 1 gives further details of our initial programme theory).


 


경험적 증거 검색

Searching for empirical evidence


우리는 팀으로 검색어를 고안했고 검색에 경험이 있는 보건 사서의 도움을 받아 반복적으로 이를 다듬었다. 우리는 연구 질문을 세 가지 핵심 개념으로 나누었다: (i) 연구 환경, (ii) 분야, (iii) 연구 지표(즉, 긍정적 또는 부정적)

We devised search terms as a team and refined these iteratively with the help of a health librarian experienced in searching. We split the research question into three key concepts: (i) research environment; (ii) discipline, and (iii) research indicator (i.e. positive or negative).


스터디 선택

Study selection


첫 번째 최상위 검색은 모든 데이터베이스에 걸쳐 8527개의 저널 기사를 도출했다. 중복된 결과가 제거되고 '주제'와 '최근' 연구 매개변수가 강화되면 420개의 논문이 남아 있었다. 검색 및 선택 프로세스는 체계적 검토 및 메타분석(meta-analysses)을 위해 선호되는 보고 항목으로 요약된다(그림 2).

The first top-level search elicited 8527 journal articles across all databases. Once duplicate results had been removed, and ‘topic’ and ‘recentness’ study parameters reinforced, 420 articles remained. The searching and selection process is summarised in a PRISMA (preferred reporting items for systematic reviews and meta-analyses) diagram (Fig. 2).



품질평가

Assessment of quality


우리는 저널의 관련성과 엄격함을 평가했다.20 우리는 '이론이 구축되고/또는 시험에 기여할 수 있는지'에 따라 기사의 관련성을 정의했다.20

We assessed the journal articles for relevance and rigour.20 We defined an article’s relevance according to ‘whether it can contribute to theory building and/or testing’.20


우리는 엄격함을 '특정 데이터를 생성하는 데 사용되는 방법이 신뢰할 수 있고 신뢰할 수 있는지의 여부'를 결정하는 것으로 정의했다.20 연구 품질을 평가하기 위해 두 가지 사전 검증된 도구를 사용했다: 정량적 연구의 품질을 평가하기 위해 MERSQI(Medical Education Research Study Quality Instrument)와 CASP(Critical Emissing Technology Program) 질적 연구와 혼합 연구를 위한 질적 체크리스트.

We defined rigour as determining ‘whether the method used to generate the particular piece of data is credible and trustworthy’.20 We used two prevalidated tools to assess study quality: the Medical Education Research Study Quality Instrument (MERSQI) to assess the quality of quantitative research,27,28 and the Critical Appraisal Skills Programme (CASP) qualitative checklist for qualitative and mixed-method studies.29


5편의 논문은 우리의 이론구축에 기여하지 못하거나 CMO 구성(CMO 구성)이 부족하여 제외되었다. 연구를 배제한 이유를 메모해 두고 토론을 통해 의심을 해소했다(그림 2).

Five papers were excluded as they did not contribute to our theory building or lacked CMO configurations (CMOCs). We kept notes of the reasons for excluding studies and resolved doubts through discussion (Fig. 2).


데이터 추출

Data extraction


복수의 CMOC를 포함하는 데이터가 풍부한 두 기사는 일관성을 보장하기 위해 우리 모두가 유도적으로 그리고 연역적으로 (초기 프로그램 이론에 근거하여) 코드화되었다. 그리고 나서 우리는 우리의 코딩에서 어떤 유사점과 차이점을 토론했다. 현실주의 접근법의 도전에 내재되어 있듯이, 우리는 CMOCs의 식별에서 차이를 발견했는데, 이는 종종 한 특정 구성요소(예: 시간)가 어떻게 한 순간에 결과가 되고 다음 메커니즘이 될 수 있는가와 관련이 있다.

Two data-rich articles containing multiple CMOCs were inductively and deductively (based on the initial programme theory) coded by all of us to ensure consistency. We then discussed any similarities and differences in our coding. As is inherent in the challenges of realist approaches, we found differences in our identifications of CMOCs, which often related to how one particular component (e.g. time) could be an outcome at one moment and a mechanism the next.


데이터 합성

Data synthesis


결과 RESULTS


연구의 특성

Characteristics of the studies


42개의 논문은 의학교육(n = 4, 10%; 31–34 교육(n = 18, 43%), 35–52 및 의학(n = 20, 48%)을 대표했다.53–72 질적 연구 26개(62%)와 정량 연구 11개(26%) 및 혼합 방법 연구 5개(12%)가 있었다(표 S5). 연구는 호주(n = 10, 24%), 미국(n = 7, 17%), 영국(n = 6, 14%), 캐나다(n = 4, 10%), 남아프리카공화국(n = 4, 10%), 덴마크(n = 2, 5%), 터키(n = 7, 17%) 등 전 세계 국가(e)에서 나왔다.

The 42 papers represented the following disciplines: medical education (n = 4, 10%);31–34 education (n = 18, 43%),35–52 and medicine (n = 20, 48%).53–72 There were 26 (62%) qualitative studies, 11 (26%) quantitative studies and five (12%) mixed-methods studies (Table S5). The studies were from countries across the globe, including Australia (n = 10, 24%), the USA (n = 7, 17%), the UK (n = 6, 14%), Canada (n = 4, 10%), South Africa (n = 4, 10%), Denmark (n = 2, 5%), Turkey (n = 2, 5%) and others (n = 7, 17%) (e.g. Belgium, China, Germany, New Zealand and the Philippines).


초기 프로그램 이론 확장

Extending our initial programme theory


우리의 현실주의 종합에서 중요한 발견은 [동일한 개입이 문맥에 따라 각각 긍정적이거나 부정적인 결과를 초래하는 메커니즘]을 보여주었다는 것이다. 놀랍게도, CMOC는 대부분 3개 분야(예: 의료 교육, 교육 및 의료)에 걸쳐 일관성이 있었으며, 겉으로 보기에는 지역적 맥락이 결과와 더 강하게 상호 작용하는 것처럼 보였다.

A key finding from our realist synthesis was that the same interventions fired either positive or negative mechanisms leading to positive or negative outcomes, respectively, depending on context. Surprisingly, the CMOCs were mostly consistent across the three disciplines (i.e. medical education, education and medicine) with local contexts seemingly interplaying more strongly with outcomes.


적절한 자원(시간 포함)과 연구의 가치평가valuing가 가능했을 때, 연구전략을 수립하는 것은 성공적인 연구환경을 촉진했지만, 산출물, 인센티브, 보상에 너무 좁게 초점을 맞추었을 때는 부정적인 결과를 낳았다. 

    • 사람 면에서는 개별 연구자가 내부적으로 동기부여를 받고 소속감을 가질 필요가 있었으며, 연구를 하기 위해서는 역량강화 활동에 대한 시간과 접근을 보호할 필요가 있었다. 지식, 연구자 정체성, 네트워크 및 시간 부족과 더불어 제한된 리더십 지이 부정적인 연구 결과를 초래하는 메커니즘으로 작용했다. 

    • IIF의 존재는 성공적인 연구 환경을 위해 필요한 것으로 압도적으로 지적되었고 그들의 부재는 전형적으로 해로웠다. 흥미롭게도, 몇몇 논문들은 단기 계약, 고용 안정성의 저하, 임시 하급 직원의 사용이 취약한 연구 환경으로 이어질 수 있기 때문에 외부 자금 지원이 부정적인 결과를 초래할 수 있다고 보고했다.

    • 마지막으로, 협력은 신뢰하는 존경심, 지지적인 리더십, 소속감을 통해 중재된 성공적인 연구를 위해 결정적이었다. 그러나, 부실한 의사소통경쟁 문화는 협업을 저해하고 고립과 낮은 자존감을 초래했으며, 연구 참여와 생산성의 저하를 초래했다.

Having a research strategy promoted a successful research environment when it enabled appropriate resources (including time) and valuing of research; however, it had negative consequences when it too narrowly focused on outputs, incentives and rewards. 

    • In terms of people, individual researchers needed to be internally motivated and to have a sense of belonging, and protected time and access to capacity-building activities in order to produce research. Lack of knowledge, researcher identity, networks and time, plus limited leadership support, acted as mechanisms leading to negative research outcomes. 

    • The presence of IIF was overwhelmingly indicated as necessary for successful research environments and their absence was typically detrimental. Interestingly, a few papers reported that external funding could have negative consequences because short-term contracts, reduced job security and the use of temporary junior staff can lead to weak research environments.40,67,71 

    • Finally, collaboration was crucial for successful research mediated through trusting respectful relationships, supportive leadership and belongingness. Poor communication and competitive cultures, however, worked to undermine collaboration, leading to isolation and low self-esteem, plus decreased research engagement and productivity. Table 1



주요 교차 절단 메커니즘: 시간, ID 및 관계

Key cross-cutting mechanisms: time, identity and relationships


표 1에서 알 수 있듯이, 동일한 개입도 그것이 촉발된 특정 맥락과 메커니즘에 따라 긍정적이거나 부정적인 결과를 초래할 수 있다. 이것은 언뜻 보기에 명백하게 보이는 것보다 더 큰 복잡성을 강조한다. 이러한 네 가지 개입을 교차 차단하는 것은 연구 환경의 성공(또는 그렇지 않음)에 대해 정기적으로 확인된 세 가지 메커니즘, 즉 시간, 연구자의 정체성 및 관계였다. 이제 이러한 각 cross-cutting 메커니즘에 대한 주요 결과를 제시하고 이들의 상호 관계가 어떻게 우리의 수정된 프로그램 이론으로 이어지는지에 대해 논의한다(그림 3). 우리가 읽기 쉽도록 이 세 가지 메커니즘을 분리하려고 노력했음에도 불구하고, 그것들은 종종 엉망이 되어 있었다. 표 2는 각 메커니즘이 특정 상황에서 결과를 중재하는 방법을 설명하는 인용구를 제시한다.

As Table 1 shows, the same intervention can lead to positive or negative outcomes depending on the particular contexts and mechanisms triggered. This highlights greater complexity than is evident at first glance. Cross-cutting these four interventions were three mechanisms that were regularly identified as critical to the success (or not) of a research environment: time; researcher identities, and relationships. We now present key findings for each of these cross-cutting mechanisms and discuss how their inter-relations lead to our modified programme theory (Fig. 3). Note that although we have tried to separate these three mechanisms for ease of reading, they were often messily entangled. Table 2 presents quotes illustrating the way in which each mechanism mediates outcomes within particular circumstances.



시간 Time


시간은 우리의 세 분야에 걸쳐 연구 결과를 모을 수 있는 중요한 메커니즘으로 확인되었다. 시간은 다음과 같이 구분하여 개념화되었다. 

        • 호 시간; 

        • 가용 시간에 영향을 미치는 워크로드 압력 

        • 시간의 효율적 사용 

        • 시간의 유연한 사용. 

        • 간 벌기, 경력 쌓기, 시간 벌기, 경력 쌓기. 

가장 일반적으로 고려된 두 가지 측면은 [보호된 시간]과 [업무량]이였다.

Time was identified as an important mechanism for mobilising research outcomes across our three disciplines. Time was conceptualised severally including as: 

        • protected time; 

        • workload pressures influencing time available; 

        • efficient use of time; 

        • flexible use of time; 

        • making time, and time in career. 

The two most commonly considered aspects were protected time and workload implications.


[보호 시간]의 부족이 연구자의 참여 또는 활동 부족을 초래하고 연구 생산성이 저하되는 등 다양한 맥락과 분야에 걸쳐 대체로 부정적인 측면에서 보호 시간이 언급되었다.32,35–37,41,44,47–49,61–63,67 또한 [이용 가능한 보호 시간은] 다양한 맥락과 학문에 걸쳐서, 그리고 긍정적인 메커니즘의 역할을 하면서, 연구 생산성 향상과 적극적인 연구 참여로 이어지는 것으로 밝혀졌다.

Protected time was largely talked about in the negative across a variety of contexts and disciplines, with lack of protected time leading to lack of researcher engagement or inactivity and reduced research productivity.32,35–37,41,44,47–49,61–63,67 Also across a variety of contexts and disciplines, and acting as a positive mechanism, available protected time was found to lead to increased research productivity and active research engagement.31,36,40,48,49,63,65


[업무량]과 관련하여, 과도한 다른 업무량으로 인한 연구시간의 제한은 다음을 유발했다.

      • 연구 활동 감소, 

      • 연구 생산성 저하, 

      • 질 낮은 연구

      • 연구 교육에 참석할 수 있는 기회 감소

With regard to workload, limitations on the time available for research imposed by excessive other workloads led to 

      • reduced research activity, 

      • lower research productivity, 

      • poor-quality research and reduced – opportunity to attend research training.40,41,47 49,60,67 


임상, 교수, 행정 및 리더십 역할과 같은 여러 책임을 저글링하는 것 또한 연구에 이용 가능한 시간을 단축시킴으로써 연구 생산성을 억제했다.35,40,49 다른 비연구 작업과의 연계는 시간 사용 시 효율성이 향상되어 연구 생산성이 향상되는 것으로 설명되었다. (표 2, 인용문 1)

Juggling of multiple responsibilities, such as clinical, teaching, administrative and leadership roles, also inhibited research productivity by diminishing the time available for research.35,40,49 The alignment of research with other non-research work was described as driving efficiencies in the use of time leading to greater research productivity (Table 2, quote 1).


정체성 Identity


[정체성]은 또한 우리의 세 분야에 걸친 연구 결과를 동원하기 위한 중요한 메커니즘이었다. 해석에는 개인적 정체성(예: 성별), 직업적 정체성(예: 1차 시술자 또는 1차 연구자) 및 사회적 정체성(예: 소속감)이 포함되었다. 연구자 정체성은 흔히 1차 진료자(따라서 2차 진료자)와 관련하여 언급되었다.

Identity was also an important mechanism for mobilising research outcomes across our three disciplines. Interpretations included 

      • personal identities (e.g. gender), 

      • professional identity (e.g. as a primary practitioner or a primary researcher), and 

      • social identity (e.g. sense of belongingness). 

Researcher identity was often referred to in relation to first-career practitioners (and therefore second-career researchers).


샤프 외 연구진은 이를 박사학위 연구로부터 직접가 아니라 광범위한 'first-order' 지식과 교육학적 전문지식에 기초하여 고등교육에 채용된 참가자로 정의했다. 이들은 또한 학교나 병원에서 연구를 수행하는 실무자들이었다. 정체성은 초기 연구자, 중간 연구자 또는 선임 연구자와 관련하여 언급되기도 하였다. 학회에서 일하는 학계 직원들은 그들의 만족도, 역량, 연구 활동을 증대시키기 위해 [연구자로서 정체성, 소속성, 연구에 대한 자기 만족도, 자율성] 등을 계발할 필요가 있었다.

Sharp et al.48 defined these as participants recruited into higher education not directly from doctoral study but on the basis of their extensive ‘first-order’ knowledge and pedagogical expertise. These were also practitioners conducting research in schools or hospitals. Identities were also referenced in relation to early, mid-career or senior researchers. Academic staff working in academic institutions needed to develop a sense of researcher identity, belongingness, self-efficacy for research and autonomy to increase their satisfaction, competence and research activity.39,40,44,46,51,67


first-career practitioner실무자(즉, 교사, 의사)의 경우, 동기를 부여하기 위해 연구는 [높은 관련성을 가져야 했으며, 일차적 정체성 업무와 일치]해야 했다.53,59,62,65 이러한 [정렬]은 강력한 연구-교육 넥서스를 갖는 것으로 설명되었다.40,48 이 개념과 연계된 것은 first-career practitioner는 1차적 업무(예: 환자 또는 학생 지향)와 관련하여 연구의 영향을 인식하여, 동기부여를 촉진하고, 연구자 정체성을 개발해야 한다는 것이었다.

For first-career practitioners (i.e. teachers, doctors), the research needed to be highly relevant and aligned to their primary identity work in order to motivate them.53,59,62,65 This alignment was described as having a strong research–teaching nexus.40,48 Linked to this concept was the need for first-career practitioners to see the impact of research in relation to their primary work (e.g. patient- or student-oriented) to facilitate motivation and to develop a researcher identity (Table 2, quote 2).36,37,41,49,53,54,67


연구가 일차적 정체성 작업(예: 영어 교육, 일반 실습)과 무관하다고 여겨진 경우, 연구 중단이 있었다.37,48,52,59,67

Where research was seen as irrelevant to primary identity work (e.g. English language teaching, general practice), there was research disengagement.37,48,52,59,67


관계 Relationships


긍정적인 연구 관계는 상호 신뢰와 존중에 의해 특징지어졌다, 40–43,54,66,72 반면에 다른 이들은 그것을 [발전하는데 시간이 걸리는 우정]이라고 묘사했다.51 상호 지지적 관계는 자신감, 자존감 및 연구 능력을 개발하고 정체성을 전환한다는 측면에서 ECR과 특히 관련이 있는 것처럼 보였다.35,43,48,58,67 네트워크 형태의 관계는 다원적 연구를 통해 연구의 질을 향상시키고 협업의 질을 향상시키는 것으로 고려되었다.33,60

Positive research relationships were characterised by mutual trust and respect,40–43,54,66,72 whereas others described them as friendships that take time to develop.51 Mutually supportive relationships seemed to be particularly relevant to ECRs in terms of developing confidence, self-esteem and research capacity and making identity transitions.35,43,48,58,67 Relationships in the form of networks were considered to improve the quality of research through multicentre research and improved collaboration.33,60


관계의 특정한 형태로서의 지지적 리더십은 성공적인 연구 환경을 촉진하는 중요한 메커니즘이었다. 지지적 리더는 업무량 모니터링, 비전 설정, 연구 가치에 대한 인식 제고 및 긍정적 역할 모델링을 갖춰야 했으며, 이를 통해서 생산성 향상, 연구자 정체성 제고, 연구 환경 조성을 할 수 있었다.

Supportive leadership as a particular form of relationship was an important mechanism in promoting a successful research environment. Supportive leaders needed to monitor workloads, set the vision, raise awareness of the value of research, and provide positive role-modelling, thereby leading to increased productivity, promoting researcher identities and creating thriving research environments (Table 2, quote 3).31,34,37,38,40,41,43,44,46,48,49,53,55,62


성공적인 연구 환경 내에서 시간, 정체성 및 관계 사이의 교차점

Intersections between time, identity and relationships within successful research environments


시간과 정체성

Time and identity


첫째, 시간은 연구자 정체성 개발에 필요한 enabler였다.37,38,41,48,49,54,61,61,61,63,65,67,69 

둘째, 연구자로 스스로를 정체성화한 사람들(즉, 1차 연구자 정체성 보유자)은 보호시간이 부족함에도 불구하고 연구활동 결과를 내기 위해 시간을 효율적으로 사용했다.35,43 반대로, 연구에 대한 개인적인 결정과 탄력성이 부족했고, 시간을 보호한 것이 더 나은 연구 활동으로 이어지지 않았다.43 

Firstly, time was a necessary enabler for the development of a researcher identity.37,38,41,48,49,54,59,61,63,65,67,69 Secondly, those who identified as researchers (thus holding primary researcher identities) used their time efficiently to favour research activity outcomes despite a lack of protected time.35,43 Conversely, for other professors who lacked personal determination and resilience for research, having protected time did not lead to better research activity.43 


즉 [시간만으로는 성공적인 연구 환경을 지원하기에 불충분]하며, 시간을 어떻게 활용하고, 연구자들이 우선순위를 정하는가를 강조한다(표 2, 인용 4).

This highlights the fact that time alone is insufficient to support a successful research environment, and that it is how time is utilised and prioritised by researchers that really matters (Table 2, quote 4).


정체성과 관계

Identity and relationships


연구자로 정체성 전환을 지원하는 개입으로는 공식적인 연구 교육, 44,48,52,68 멘토링, 41,48,57,65,72 논문작성 그룹, 72, 또래 및 다른 연구자들과의 협업, 관계를 포함한 여러 메커니즘을 통해 운영되는 39,41,41,43이 포함되었다. 

The interventions that supported identity transitions into research included formal research training,44,48,52,68 mentoring,41,48,57,65,72 writing groups,72 and collaboration with peers and other researchers,39,41,43 operating through multiple mechanisms including relationships. 


메커니즘에는 자존감/신뢰감 증가, 네트워크 증가, 연구자로서의 외부 인식, 소속성 및 자기 만족도가 포함되었다.35,41,43–45,52,52,572,72

The mechanisms included self-esteem/ confidence, increased networks, external recognition as a researcher, belongingness, and selfefficacy.35,41,43–45,52,57,72


게다가, 우리의 데이터는 리더십이 연구자 정체성 개발에 도움이 될 수 있다는 것을 암시한다. 특히 리더십은 연구 자율성, 인정, 권한을 부여하고 지원 멘토링 환경을 조성해 연구자 정체성 개발 및 연구 생산성을 이끌어냈다(표 2, 인용 5).34,38,46,48

Furthermore, our data suggest that leadership can be an enabler to the development of a researcher identity. In particular, leadership enabled research autonomy, recognition and empowerment, and fostered supportive mentoring environments, leading to researcher identity development and research productivity (Table 2, quote 5).34,38,46,48


시간과 관계

Time and relationships


관계는 시간이 지남에 따라 발전되고 지속되었다(표 2, 인용 6). 세 가지 분야에 걸쳐 리더(매니저, 이사, 학장 등)의 역할은 연구에 대한 인식을 높이고, 그 다음 상충하는 요구에 중 연구 시간을 우선시하여 효과적인 연구 네트워크, 화합 및 협업을 이끌어 내는 것이었다.31,34,38,43,46,48–50,53,55,70

Relationships were developed and sustained over time (Table 2, quote 6). Across the three disciplines, the role of leaders (managers, directors, deans) was to acknowledge and raise awareness of research, and then to prioritise time for research against competing demands, leading to effective research networks, cohesion and collaboration.31,34,38,43,46,48–50,53,55,70


그러나 연구 리더십은 현재의 대학 문화의 compliance와 counting의 맥락에 의해 [관계를 해치고, 동기를 잃게하며, 평가절하devalue된 감정을 불러일으켜서] 부정적인 영향을 받을 수 있다. 실제로 지도자들이 연구자의 정체성을 인식하지 못한 것은 부정적인 연구 생산성으로 이어졌다.36–38,43,46,48,49

Research leadership, however, could be influenced negatively by the context of compliance and counting in current university cultures damaging relationships, creating a loss of motivation, and raising feelings of devalue. Indeed, the failure of leaders to recognise researcher identities led to negative research productivity.36–38,43,46,48,49


(원래 학문에서 이미 강력한 지원 네트워크를 가지고 있었기 때문에) 새로운 학문의 연구자들과 관계를 맺는데 시간을 투자하지 않았던 second-career PhD 학생들은 졸업 후 연구 네트워크가 제한적이라는 것을 발견했다.48

Second-career PhD students who did not invest time in establishing relationships with researchers in their new disciplines (as they already had strong supportive networks in their original disciplines) found that they had limited research networks following graduation.48



고찰 DISCUSSION


주요 소견 요약

Summary of key findings


  • 첫째로, 우리는 주요 개입이 다양한 맥락에서 긍정적인(주관적이고 객관적인) 결과와 부정적인(주관적이고 객관적인) 결과 둘 다로 이어진다는 것을 발견했다. 흥미롭게도, 우리는 출판물의 수, 보조금 소득, h-지표와 같은 정량적 지표와 함께 오늘날 연구 성공의 두드러진 지표로 여겨지고 있음에도 불구하고, 이것들과 연구 영향과 관련된 어떠한 결과도 확인하지 않았다.21 

  • 둘째로, 우리는 [학문분야의 맥락]은 [개인, 지역, 그리고 제도적 맥락]보다 영향력이 낮은 것으로 보인다는 것을 발견했다. 

  • 마지막으로, 우리의 수정된 프로그램 이론은 성공적인 연구 환경과 실패한 연구 환경 모두를 뒷받침하는 메커니즘으로서 세 가지 cross-cutting 메커니즘(시간, 연구자 정체성 및 관계) 사이의 복잡한 상호작용을 보여준다.

Firstly, we found that key interventions led to both positive (subjective and objective) and negative (subjective and objective) outcomes in various contexts. Interestingly, we did not identify any outcomes relating to research impact despite impact nowadays being considered a prominent marker of research success, alongside quantitative metrics such as number of publications, grant income and h-indices.21 

Secondly, we found that disciplinary contexts appeared to be less influential than individual, local and institutional contexts. 

Finally, our modified programme theory demonstrates a complex interplay among three cross-cutting mechanisms (time, researcher identity and relationships) as mechanisms underpinning both successful and unsuccessful research environments.


주요 결과 및 기존 문헌과의 비교

Key findings and comparisons with the existing literature


우리의 연구는 명확한 연구 전략, 연구를 중시하는 조직, 연구 지향적 리더십, 자원(사람, 자금, 연구 시설 및 시간 등)에 대한 접근성, 그리고 의미 있는 관계를 갖는 것의 중요성에 관한 이전의 검토 1,5–7의 결과를 뒷받침한다. 그러나, 우리의 연구는 이러한 개입이 반드시 성공적인 연구 환경을 초래하는 명확한 선형 관계가 존재하지 않는다는 암시를 강화함으로써 이러한 발견을 상당히 확대한다. 예를 들어, 연구전략을 수립하는 것은 지표가 지나치게 초점이 좁거나 지나치게 결과물 지향적으로 보인다면 부정적인 영향을 미칠 수 있다.38,40,46,47,64 마찬가지로, 프로젝트성 자금으로 인해 기간제 계약에 더 많은 시간제 직원이 고용될 수 있으며, 이로 인해 불안정성, 이직성 및 연구팀의 전문지식이 부족해질 수 있다.40,671,71

Our research supports the findings of earlier reviews1,5–7 regarding the importance of having a clear research strategy, an organisation that values research, research-oriented leadership, access to resources (such as people, funding, research facilities and time), and meaningful relationships. However, our research extends these findings considerably by flagging up the indication that a clear linear relationship, whereby the presence of these interventions will necessarily result in a successful research environment, does not exist. For example, instituting a research strategy can have negative effects if the indicators are seen as overly narrow in focus or output-oriented.38,40,46,47,64 Similarly, project money can lead to the employment of more part-time staff on fixed-term contracts, which results in instability, turnover and lack of research team expertise.40,67,71


대다수의 논문에서 시간이 연구 성과에 영향을 미치는 중요한 메커니즘으로 확인되었지만, 연구자의 정체성은 시간이 부족한 상황에서도 연구 성과에 긍정적인 영향을 미쳤다. 실제로, 우리는 정체성이 개인의 동기와 탄력성을 통해 연구의 우선순위를 정하는 시간을 효율적으로 찾아냄으로써 제한된 시간을 극복할 수 있는 연구 생산성의 메커니즘으로 작용한다는 것을 발견했다.35,43 따라서 [시간은 단순히 연구를 하는 시간 이상의 것]이었지만, [연구자로서의 정체성 개발에 대한 투자]와 [시간이 지나면서의 다른 연구자들과의 관계]를 포함했다 .37,38,41,48,49,54,59,61,61,63,65,67,69

Although time was identified as an important mechanism affecting research outcomes within the majority of papers, researcher identity positively affected research outcomes even in time-poor situations. Indeed, we found that identity acted as a mechanism for research productivity that could overcome limited time through individuals efficiently finding time to prioritise research through their motivation and resilience.35,43 Time was therefore more than just time spent doing research, but also included investment in developing a researcher identity and relationships with other researchers over time.37,38,41,48,49,54,59,61,63,65,67,69


[관계 구축 개입]은 ECR과 초진료 경력이 있는 연구로 어려운 정체성 전환을 지원하는 데도 효과가 있는 것으로 나타났다. 지지적 리더십은 특정 형태의 관계로서, 보호되는 시간과 합리적인 업무량을 제공하여 연구와 연구자 정체성 형성을 위한 시간에 대한 enabler로 보일 수 있다.343,38,46,48

Relationship-building interventions were also found to be effective in supporting difficult identity transitions into research faced by ECRs and those with firstcareer practitioner backgrounds. Supportive leadership, as a particular form of relationship, could be seen as an enabler to the provision of protected time and a reasonable workload, allowing time for research and for researcher identity formation.34,38,46,48


실제로, 우리의 현실주의 종합 연구결과는 연구자 정체성의 중심적 중요성을 강조하여 연구전략, 자원(예: 시간) 및 연구의 가치평가가 존재하는 곳에서도 연구환경이 번창하지 않는 이유에 대한 참신한 설명을 제공한다.

Indeed, our realist synthesis findings highlight the central importance of researcher identity and thus offer a novel explanation for why research environments may not flourish even in the presence of a research strategy, resources (e.g. time) and valuing of research.


연구자의 정체성은 복잡하고 의사, 교사, 지도자 등의 다른 정체성과 교차한다.

Researcher identity is complex and intersects with other identities such as those of practitioner, teacher, leader and so on.


자신의 정체성을 연구자로 식별한 사람들은 자신의 작업에 우선순위를 다르게 정했다. 연구 생산성이 높은 사람들은 연구를 우선시하는 반면, 연구 생산성이 낮은 집단에 속한 사람들은 가르치는 것을 우선시했다.73

Those who identified as researchers prioritised their work differently: those who were highly productive prioritised research, whereas those in the low-productivity group prioritised teaching.73


흥미롭게도, 고도로 생산적인 연구자들은 연구를 사회적 현상으로 보는 경향이 있었고, 출판물, 발표물 및 보조금이 학문적 네트워크에서 '거래'되고 있었다. Brew 외 연구진 39는 다음과 같이 설명한다: 

'...'거래'라는 관점은 자가 생성 연구자 정체성과 관련이 있다. 연구자 정체성은 출판, 네트워크, 협업 및 동료 검토의 활동에서 개발된다. 이러한 활동들은 연구자로서 한 개인의 정체성 증명을 뒷받침한다. 그들은 또한 성과 측정과 지표에 영향을 미친다.'

Interestingly, highly productive researchers tended to view research as a social phenomenon with publications, presentations and grants being ‘traded’ in academic networks. Brew et al.39 explain that: 

‘...the trading view relates to a self-generating researcher identity. Researcher identity develops in the act of publication, networks, collaborations and peer review. These activities support a person’s identification as a researcher. They also, in turn, influence performance measures and metrics.’


방법론적 강점과 한계

Methodological strengths and limitations


교육 및 연구에 미치는 영향

Implications for education and research


성공적인 연구 환경을 촉진하기 위해 개입을 더 잘 동원하기 위해서는 시간, 정체성, 관계(리더십 포함)에 초점을 맞출 필요가 있다.

We need to focus on time, identity and relationships (including leadership) in order to better mobilise the interventions to promote successful research environments.


    • 연구자 개개인은, 단순히 연구가 외부적 동력에 의해서 추진되는 것이 아니라, 내적으로 동기가 부여될 수 있도록 연구자 정체성 개발을 위하여 [연구에 대한 개념과 연구자 정체성 개발을 위한 노력 등] 자기자신을 연구자로 identify하는 방법과 이유에 대해 성찰할 필요가 있다. 제2경력 연구자 또는 중요한 교수나 실무자 역할을 가진 사람들은 더 넓은 연구 네트워크를 구축하는 동안 그들의 실무에 연구를 맞추는 것을 모색할 수 있다.

Individuals need to reflect on how and why they identify as researchers, including their conceptions of research and their working towards the development of a researcher identity such that research is internally motivated rather than just externally driven. Those who are second-career researchers or those with significant teaching or practitioner roles could seek to align research with their practice while they establish wider research networks.


    • 연구 리더들은, 개별 연구자들이 자신의 연구자 정체성을 개발하고, 연구를 가치 있게 여기고, 연구가 시간이 걸린다는 것을 인식하고, 연구 역량 구축, 강한 관계와 협업을 촉진하는 기회에 접근할 수 있도록 지원할 것을 권고한다. 예를 들어, 리더는 경쟁적 또는 협력적 문화가 육성되는 방법에 주목하면서 연구자의 정체성을 증진하고 연구 관계를 구축하는 개입을 도입할 수 있다.

We recommend that research leaders support individuals to develop their researcher identity, be seen to value research, recognise that research takes time, and provide access to opportunities promoting research capacity building, strong relationships and collaboration. Leaders, for example, may introduce interventions that promote researcher identities and build research relationships (e.g. collaborations, networking, mentoring, research groups etc.), paying attention to the ways in which competitive or collaborative cultures are fostered.


브라운 외 연구진은 최근 정체성 전환을 촉진하기 위해 네 가지 범주에 대한 논의를 권고했다. 

    • 신에 대한 성찰 (추상, 경험 및 기대) 

    • 상황의 고려(의견, 우려) 

    • 서포트 (사용 가능한 항목 및 필요한 항목) 및 

    • 략(변화에 대응하고 번창하기 위한 개인 전략).

Browne et al.75 recently recommended discussions around four categories for promoting identity transition: 

    • reflection on self (values, experiences and expectations); 

    • consideration of the situation (circumstances, concerns); 

    • support (what is available and what is needed), and 

    • strategies (personal strategies to cope with change and thrive).


의학 교육의 전문화로, 연구 단위가 1차 및 2차 진료 연구자의 혼합을 포함할 가능성이 점점 높아지고 있으며, 우리의 리뷰는 연구 개념과 연구자 정체성에 대한 논의가 가치 있게 될 것임을 시사한다.

With the professionalisation of medical education,76 research units are increasingly likely to contain a mixture of first- and second-career researchers, and our review suggests that discussions about conceptions of research and researcher identity would be valuable.


마지막으로, 조직은 연구를 중시하고 자원 및 연구 역량 구축 활동에 대한 접근을 제공해야 한다. HEI의 관리주의 문화 내에서, compliance and counting은 이미 승진과 성공 면에서 지배적인 담론이 되었다. 따라서 정책 입안자들은 HEI가 연구 환경에 대한 정책의 완전한 영향을 결정하기 위해 모든 형태의 연구(양적, 품질 및 영향의 주관적이고 객관적인 측정 포함)를 인식하고, 인센티브를 부여하고 보상하는 방법을 고려해야 한다.

Finally, organisations need to value research and provide access to resources and research capacity-building activities. Within the managerialist cultures of HEIs, compliance and counting have already become dominant discourses in terms of promotion and success. Policymakers should therefore consider ways in which HEIs recognise, incentivise and reward research in all its forms (including subjective and objective measures of quantity, quality and impact) to determine the full effects of their policies on research environments.




Supplementary Table 1: Glossary of Terms (in alphabetical order)

Term

Definition

CMOCs

CMOCs spell out the relationship between identified features of the context-mechanism-outcome configuration. CMOCs respond to the question: “How are changes in outcomes produced by interventions introduced to modify the context and balance of mechanisms triggered?” (1)

Context

Responds to the question: “What conditions are needed for an intervention to trigger mechanism(s) to produce outcome(s)?” (1)

Demi-regularity

Semi-predictable patterns of CMOCs. They are the broad lessons for whom, in what circumstances and in what respects an intervention is more likely to succeed.

Environment

Research environment includes: ‘shared values, assumptions, beliefs, rituals and other forms of behaviour whose central focus is the acceptance and recognition of research practice and output as valued, worthwhile and pre-eminent activity’ (2)

Impact

Research impact is any effect on, change or benefit to the economy, society, culture, public policy or services, health, the environment or quality of life, beyond academia. (3)

Intervention

Based on previous work and literature reviews, possible interventions here relate to having a research strategy; people (including research capacity building activities); infrastructure, income and funding (IIF); and research collaborations. (4)

Mechanisms

A mechanism is hidden and brings about changes through the implementation of an intervention in a given context. It involves changes in individuals’ reasoning and their capacity to respond when an intervention is applied in a specific context. Therefore, mechanisms are much more than enablers or barriers to the outcomes of interventions. (5) Mechanisms respond to the question: “What is it about an intervention, which may lead it to have a particular outcome pattern in a given context?” (1)

Outcome

Outcomes respond to the question: “What are the practical effects produced by causal mechanisms being triggered in given contexts?” (1)

Outputs

Outputs are the published products of any form of research including journal articles, monographs and chapters in books, as well as outputs disseminated in other ways such as designs, performances and exhibitions. (3)

Program theory

Sets out how and why outcomes occur within an intervention. The differences between the initial and modified program theory indicate the novel findings of a particular research study. (6)

RAMESES

RAMESES stands for: Realist And Meta-narrative Evidence Syntheses: Evolving Standards. (6)

Realism

‘Realism’ agrees that there is a real world but that our knowledge of it is processed through human senses, brains, language and culture. Realism also argues that we can improve our understandings of reality but the ‘real world’ constrains the interpretations we can reasonably make of it. (7)

REF

The Research Excellence Framework (REF) is the UK’s current national system for assessing the quality of research in UK higher education institutions. (4, 8)




. 2018 Jul 24;52(9):936-950.
 doi: 10.1111/medu.13643. Online ahead of print.

What really matters for successful research environments? A realist synthesis

Affiliations 

Affiliations

  • 1Centre for Research in Assessment and Digital Learning (CRADLE), Deakin University, Geelong, Victoria, Australia.
  • 2Research Department of Medical Education, University College London, London, UK.
  • 3Monash Centre for Scholarship in Health Education (MCSHE), Faculty of Medicine, Nursing and Health Sciences, Monash University, Clayton, Victoria, Australia.
Free PMC article

Abstract

Context: Research environments, or cultures, are thought to be the most influential predictors of research productivity. Although several narrative and systematic reviews have begun to identify the characteristics of research-favourable environments, these reviews have ignored the contextual complexities and multiplicity of environmental characteristics.

Objectives: The current synthesis adopts a realist approach to explore what interventions work for whom and under what circumstances.

Methods: We conducted a realist synthesis of the international literature in medical education, education and medicine from 1992 to 2016, following five stages: (i) clarifying the scope; (ii) searching for evidence; (iii) assessing quality; (iv) extracting data, and (v) synthesising data.

Results: We identified numerous interventions relating to research strategy, people, income, infrastructure and facilities (IIF), and collaboration. These interventions resulted in positive or negative outcomes depending on the context and mechanisms fired. We identified diverse contexts at the individual and institutional levels, but found that disciplinary contexts were less influential. There were a multiplicity of positive and negative mechanisms, along with three cross-cutting mechanisms that regularly intersected: time; identity, and relationships. Outcomes varied widely and included both positive and negative outcomes across subjective (e.g. researcher identity) and objective (e.g. research quantity and quality) domains.

Conclusions: The interplay among mechanisms and contexts is central to understanding the outcomes of specific interventions, bringing novel insights to the literature. Researchers, research leaders and research organisations should prioritise the protection of time for research, enculturate researcher identities, and develop collaborative relationships to better foster successful research environments. Future research should further explore the interplay among time, identity and relationships.

응답자들은 우리가 물어보는 것에 대해서 뭘 생각하는가? 인지 인터뷰 사용하기 (J Grad Med Educ . 2013)

What Do Our Respondents Think We’re Asking? Using Cognitive Interviewing to Improve Medical Education Surveys 

Gordon B. Willis, PhD

Anthony R. Artino Jr., PhD





최근 대학원 의학 교육의 저널 2개 사설에서 4,5 저자들은 설문지 설계자들이 사용할 수 있는 6단계 의사결정 과정을 제안했다. 본 기사에서는 6가지 의사결정 단계 중 5번째 단계, 특히 "내 응답자가 내가 의도한 대로 내 항목을 해석할 것인가?"를 고려함으로써 그러한 노력을 확대한다.’’

In 2 recent Journal of Graduate Medical Education editorials,4,5 the authors proposed a 6-step decision process for questionnaire designers to use. In this article, we expand on that effort by considering the fifth of the 6 decision steps, specifically, the following question: ‘‘Will my respondents interpret my items in the manner that I intended?’’


설문지는 의학 교육 연구의 주제를 조사하기 위해 정기적으로 사용되며, 표준화된 설문 조사 질문을 대본으로 작성하는 간단한 과정으로 보일 수 있다. 그러나, 연구자들이 완벽히 명확하다고 생각되는 항목들이 종종 유의미한 오해를 받거나, 그렇지 않으면 의도된 바를 측정하지 못한다는 것을 많은 증거들이 증명한다.1.2 예를 들어, "보건전문직"과 같은 추상적인 용어들은 질문지를 만든 사람이 생각한 것을 현저하게 벗어날 수 있는 광범위한 해석을 떠올리게 하는 경향이 있다.

Questionnaires are regularly used to investigate topics in medical education research, and it may seem a straightforward process to script standardized survey questions. However, a large body of evidence demonstrates that items the researchers thought to be perfectly clear are often subject to significant misinterpretation, or otherwise fail to measure what was intended.1,2 For instance, abstract terms like ‘‘health professional’’ tend to conjure up a wide range of interpretations that may depart markedly from those the questionnaire designer had in mind.


여기서 설명하는 방법, 즉 '인지 면접' 또는 '인지 시험'조사 질문(특성, 행동 또는 본질적으로 사실)이 의도한 목적(BOX)을 달성하는지 여부를 조사하기 위해 특별히 고안된 증거 기반의 정성적 방법이다그 방법은 구체적으로 모집된 개인과의 인터뷰에 의존한다. 이들 개인에게는 설문지 최종 초안을 관리하는 것과 동일한 방식으로 설문지 질문을 제시한다. 인지면접은 품질보증 절차로서 자료수집(예측) 전, 자료수집 중 또는 조사를 실시한 후에도 실시된다.

The method we describe here, termed ‘‘cognitive interviewing’’ or ‘‘cognitive testing,’’ is an evidence-based, qualitative method specifically designed to investigate whether a survey question—whether attitudinal, behavioral, or factual in nature—fulfills its intended purpose (BOX). The method relies on interviews with individuals who are specifically recruited. These individuals are presented with survey questions in much the same way as survey respondents will be administered the final draft of the questionnaire. Cognitive interviews are conducted before data collection (pretesting), during data collection, or even after the survey has been administered, as a quality assurance procedure.


1980년대에 인지 인터뷰는 실험 심리학 분야에서 성장했다; 인지 인터뷰의 일반적인 정의는 그러한 기원과 강조를 반영한다. 예를 들어 윌리스는 '인지 인터뷰는 개인이 정신적으로 설문지를 처리하고 응답하는 방식을 경험적으로 연구하기 위한 심리학적 지향적 방법이다'라고 말한다. 그 이론적 기반 때문에 인지 인터뷰는 전통적으로 투란게우가 도입한 4단계 인지 모델에 의존해 왔다. 이 모델은 설문조사 응답 프로세스는 다음의 네 단계를 포함하는 것으로 설명한다. 

  • (1) 이해, 

  • (2) 정보의 검색, 

  • (3) 판단 또는 추정, 

  • (4) 질문에 대한 응답 선택

During the 1980s, cognitive interviewing grew out of the field of experimental psychology; common definitions of cognitive interviewing reflect those origins and emphasis. For example, Willis6 states, ‘‘Cognitive interviewing is a psychologically oriented method for empirically studying the way in which individuals mentally process and respond to survey questionnaires.’’ For its theoretical underpinning, cognitive interviewing has traditionally relied upon the 4stage cognitive model introduced by Tourangeau.7 This model describes the survey response process as involving 

  • (1) comprehension, 

  • (2) retrieval of information, 

  • (3) judgment or estimation, and 

  • (4) selection of a response to the question.


예를 들어, ''지난 해에, 정식 교육 프로그램에 몇 번이나 참여하셨습니까?''라는 질문에 대한 정신적 처리는 아마도 다음의 것이 필요할 것이다. 

  • 요한 용어와 구문을 이해하고 해석한다(예: "지난 해" 및 "교육 프로그램"). 

  • 정답을 회상하고, 정확한 숫자를 보고하기로 결정(예를 들어, 더 높은 값을 제공하는 것보다 더 높음)한다. 

  • 그런 다음, 조사 요건에 부합하는 답변을 작성한다(예: "실제"가 아닌 "5회" 보고). 

For example, mental processing of the question ‘‘In the past year, how many times have you participated in a formal educational program?’’ presumably requires a respondent 

  • to comprehend and interpret critical terms and phrases (eg, ‘‘in the past year’’ and ‘‘formal educational program’’); 

  • to recall the correct answer; to decide to report an accurate number (rather than, for example, providing a higher value); and 

  • then to produce an answer that matches the survey requirements (eg, reporting ‘‘5 times’’ rather than ‘‘frequently’’). 


가장 흔히 이해력 문제가 지배적이다. 예를 들어, '공식 교육 프로그램'이라는 용어가 다양하게 해석되고 있는 것을 발견할 수 있다. 즉, 응답자는 어떤 활동을 세어야 할지 확실하지 않을 수 있고, 나아가 어떤 유형의 참여에 대해 질문받고 있는지 모를 수 있다(예: 학생, 교사 또는 관리자로서의 참여).

Most often, comprehension problems dominate. For example, it may be found that the term ‘‘formal educational program’’ is variably interpreted. In other words, respondents may be unsure which activities to count and, furthermore, may not know what type of participation is being asked about (eg, participation as a student, teacher, or administrator).


보다 최근에 인지 인터뷰는 사회학적/인류학적 노력으로 어느 정도 재개념화되었다. 왜냐하면 조사 항목에 대한 개인주의적 정신 처리뿐만 아니라, 응답자의 삶을 의미 있게 포착하는 질문이 얼마나 잘 표현되는가에 영향을 미칠 수 있는 배경 사회적 맥락도 강조하기 때문이다. 특히 설문조사가 다양한 환경과 문화의 범위를 점점 더 반영함에 따라, 이러한 관점은 점점 더 대중화되었다. 이러한 관점에서 볼 때, 겉보기에는 '졸업후의학교육'처럼 간단해 보이는 용어의 정의 자체에는 통일성이 결여되어 있을 수 있다.

More recently, cognitive interviewing has to some extent been reconceptualized as a sociological/anthropological endeavor, in that it emphasizes not only the individualistic mental processing of survey items but also the background social context that may influence how well questions meaningfully capture the life of the respondent.8 Especially as surveys increasingly reflect a range of environments and cultures that may differ widely, this viewpoint has become increasingly popular. From this perspective, the definition of a term as seemingly simple as ‘‘graduate medical education’’ might itself lack uniformity.


인지 인터뷰(또는 인지 테스트)—조사 질문이 의도된 목적을 충족하는지 여부를 조사하기 위해 특별히 고안된 증거 기반의 정성적 방법.

Cognitive interviewing (or cognitive testing)—an evidence-based qualitative method specifically designed to investigate whether a survey question satisfies its intended purpose.


동시 탐색 - 응답자가 각 조사 항목을 소리 내어 읽고 답한 후 바로 면접관이 탐색 질문을 관리하는 구두 탐색 기법.

Concurrent probing—a verbal probing technique wherein the interviewer administers the probe question immediately after the respondent has read aloud and answered each survey item.


사전주도적 구두 탐색—잠재적인 문제를 찾기 위해 인지 면접 전에 체계적으로 제작된 구두 조사.

Proactive verbal probes—a verbal probe that is systematically fashioned before the cognitive interview in order to search for potential problems.


반응성 구두 탐색—인지 인터뷰 동안 종종 응답자의 행동에 대응하여 비표준화된 방식으로 개발된 구두 조사.

Reactive verbal probes—a verbal probe that is developed in a nonstandardized way during the cognitive interview, often in response to a respondent’s behavior.


반응성 효과—프로빙 질문에 대한 응답과 그 대답에 대한 설명과 관련된 추가적인 인지적 요구로 인해 발생하는 응답자의 행동의 불편함(대부분 조사 응답자의 일반적으로 행동보다 더 신중하게 고려한 답변을 하게 만든다).

Reactivity effects—bias in a respondent’s behavior caused by the additional cognitive demands related to answering probe questions and explaining those answers (most likely by leading to more carefully thought-out answers than a survey respondent might typically provide).


구두 조사—면접자가 일련의 조사 질문을 관리하는 인지 인터뷰 기법. 일반적으로 응답자가 제공하는 것보다 더 상세한 정보를 이끌어내기 위해 특별히 고안된 것이다.

Verbal probing—a cognitive interviewing technique wherein the interviewer administers a series of probe questions specifically designed to elicit detailed information beyond that normally provided by respondents.


후향적 조사—응답자가 전체 조사(또는 조사의 일부)를 완료한 후 면접관이 조사 질문을 관리하는 구두 조사 기법.

Retrospective probing—a verbal probing technique wherein the interviewer administers the probe questions after the respondent has completed the entire survey (or a portion of the survey).


Think-aloud 면접—조사에서 응답자들이 평가된 조사 항목에 답하려고 할 때 자신의 생각을 적극적으로 말하도록 요구하는 인지 인터뷰 기법.

Think-aloud interviewing—a cognitive interviewing technique wherein survey respondents are asked to actively verbalize their thoughts as they attempt to answer the evaluated survey items.



프로세스 개괄

Process Overview


인지면접은 2가지 주요 절차를 이용하여 실시한다.

Cognitive interviewing is conducted using 2 key procedures


첫째, 설문 응답자(종종 주제나 참여자로 개명)가 설문 질문에 답하려고 할 때 적극적으로 자신의 생각을 구두로 표현해 줄 것을 요청하는 think-aloud 방식의 인터뷰가 필요하다.9 여기서 인터뷰 진행자의 역할은 주로 피험자에게 '계속 이야기'를 하도록 요청함으로써 이러한 활동을 지원하고, 그 결과의 구두 기록, 즉 소위 인지 프로토콜이라고 불리는 것을 나중에 분석하기 위해 기록하는 것이다. 이 절차가 효과적이 되려면, 대상자의 think-aloud 스트림에는 접선적 또는 교묘한 자유 연관성이 아닌 조사 질문 기능의 평가와 관련된 진단 정보가 포함되어야 한다.

First, think-aloud interviewing requests that the survey respondents (often renamed subjects or participants) actively verbalize their thoughts as they attempt to answer the survey questions.9 Here the role of the interviewer is mainly to support this activity by asking the subject to ‘‘keep talking’’ and to record the resultant verbal record, or so-called cognitive protocol, for later analysis. For this procedure to be effective, it is necessary that the subject’s think-aloud stream contain diagnostic information relevant to the assessment of survey question function, as opposed to tangential or meandering free association.


지난 20년간 상당한 영향력을 획득한 [대안적 절차]는 구두 조사로, 인지 면접관이 일반적으로 응답자가 제공하는 것 이상의 상세한 정보를 유도하기 위해 특별히 고안된 일련의 조사 질문을 관리하는 보다 적극적인 형태의 데이터 수집이다. 일반적으로 사용되는 탐침은 TABLE 1. 

  • 잠재적인 문제를 찾기 위해 면접 전에 체계적으로 제작하거나(프로액티브 프로브) 

  • 면접 중에 대상 행동에 대응하여 비표준화된 방식으로 개발할 수 있다(리액티브 프로브). 

이와 같이 프로빙은 대개 엄격한 재료 표준화보다는 [면접관의 적응성에 크게 의존]하는 유연한 절차다.

The alternative procedure, which has gained considerable traction over the past 20 years, is verbal probing, which is a more active form of data collection in which the cognitive interviewer administers a series of probe questions specifically designed to elicit detailed information beyond that normally provided by respondents. Commonly used probes are provided in TABLE 1. 

  • Probes may be systematically fashioned before the interview, in order to search for potential problems (proactive probes), or 

  • they may be developed in a nonstandardized way during the interview, often in response to subject behavior (reactive probes). 

As such, probing is usually a flexible procedure that relies to a significant degree on interviewer adaptability rather than on strict standardization of materials.



think-aloud 절차의 장점은 면접관에 대한 요구를 훈련하는 방식에 거의 영향을 주지 않고, [반응을 편향시킬 수 있는 방식으로 지시하는 것]을 피한다는 것이다. 그렇게 말하는 것은, 큰 소리로 생각하는 것은 [피험자들에게 상당한 부담]을 주는데, 그들 중 많은 사람들은 그 과정이 부자연스럽고 어렵다고 생각한다. 게다가, 때때로 어설픈 말로 얻어지는 순전히 많은 양의 think-aloud 분석은 어려운 과제가 될 수 있다.

The advantages to a think-aloud procedure is that it presents little in the way of training demands on the interviewer and avoids being too directive in ways that could bias responses. That being said, thinking aloud places a significant burden on subjects, many of whom find the process to be unnatural and difficult. Further, analysis of think-aloud transcripts can be a daunting task because of the sheer quantity of the sometimes meandering verbalizations obtained.


반면에 구두 탐구는 면접관의 입장에서 더 많은 훈련과 생각을 필요로 하며, 주의 깊게 하지 않으면 [반응성 효과]를 일으킬 수 있다. 즉, 구두 탐구는 탐침 질문에 대답하고 그 대답을 설명하는 것과 관련된 추가적인 인지적 요구를 통해 [피험자의 행동에 편견]을 일으킬 수 있다. 예를 들어, 탐구는 설문 조사 응답자가 일반적으로 제공할 수 있는 것보다 더 세심하게 심사숙고된 답변을 이끌어 낼 수 있다. 그러나 구두 탐구는 일반적으로 효율적이며, 특정 인지 과정(예: 용어 또는 구문의 이해)을 대상으로 할 수 있으며, 피험자가 잘 수용하며, think-aloud 스트림보다 [세그먼트와 코드로 분리하기 쉬운 데이터]를 제공한다.

Verbal probing, on the other hand, requires more training and thought on the part of the interviewer and, if not done carefully, can create reactivity effects. That is, verbal probing may create bias in the subject’s behavior through the additional cognitive demands related to answering probe questions and explaining those answers. For example, probing may lead to more carefully thought-out answers than a survey respondent might typically provide. However, verbal probes are generally efficient, can be targeted toward specific cognitive processes (eg, comprehension of a termor phrase), are wellaccepted by subjects, and provide data that are easier to separate into segments and code than think-aloud streams.


표2

TABLE 2



인지면접 분석 

Analysis of Cognitive Interviews


인지면접은 정성적 절차이기 때문에 분석은 수치 데이터의 엄격한 통계적 분석이 아니라 면접 중(종종 면접자가) 또는 그 이후에(면접자나 분석가가) 취하는 서면 메모의 코딩과 해석에 의존한다.

Because cognitive interviewing is a qualitative procedure, analysis does not rely on strict statistical analysis of numeric data but rather on coding and interpretation of written notes that are taken during the interview (often by the interviewer) or after it (by either the interviewer or an analyst).


일련의 인터뷰는 일반적으로 각 평가 항목과 관련된 노트를 결합하고, 인터뷰 전체에서 취합하며, 공통의 주제를 찾고, 조사 개발자들이 원하는 해석에서 벗어나는 것을 나타낼 수 있는 주요 결과를 식별하여 분석한다. 예를 들어, 만약 "공식 교육 프로그램"의 의미에 대해 (광범위한 주제에서) 거의 일치성이 없다는 것을 발견한다면, 잠재적인 해결책은 조사에서 이 용어를 명시적으로 정의하는 것일 수 있다.

A set of interviews are typically analyzed by combining the notes pertaining to each evaluated item, aggregating across interviews, seeking common themes, and identifying key findings that may indicate departures from the interpretation desired by survey developers. For example, if one finds that there is little concurrence across a range of subjects about what is meant by ‘‘formal educational program,’’ a potential solution may be to explicitly define this term in the survey.


현실적 고려 

Practical Considerations


인지 인터뷰 프로젝트는 일반적으로 범위가 작고 총 10명에서 30명의 과목만 참여할 수 있다. 소규모 GME 프로젝트의 경우, 조사 개발자들이 매우 작은 표본의 편향 가능성에 민감하다면, 5~6명의 대상자만으로도 조사 항목 개선에 유용한 정보를 제공할 수 있다. 인지면접은 종종 반복적인 절차로 수행되는데, 이 절차에서는 소규모 면접(예: 10)이 실시된다. 조사 개발자는 자신의 결과를 분석하고 평가하고, 필요한 경우 조사 항목을 변경한 후 수정된 항목을 사용하여 추가 시험을 한다.

Cognitive interviewing projects are normally small in scope and may involve just 10 to 30 total subjects. For small-scale GME projects, as few as 5 or 6 subjects may provide useful information to improve survey items, as long as the survey developers are sensitive to the potential for bias in very small samples. Cognitive interviewing is often conducted as an iterative procedure, in which a small round of interviews is conducted (eg, 10); the survey developers analyze and assess their results, make alterations to survey items where necessary, and then conduct an additional round of testing using the modified items.


인지 면접은 면접관 주관식 및 자기 주관식 모두에 공통적으로 적용된다.

Cognitive interviewing is commonly applied to both interviewer-administered and self-administered


  • Interviewer-administration에서는, 평가된 각 질문을 소리 내어 읽고 답한 후 탐색으로 구성되는 동시 탐사에 의존하는 것이 일반적이다. 질문을 제시해 응답자가 답하게 한 다음 targeted probe를 묻는 앞뒤로의 반복 과정은 면접관 주관식 설문조사에 잘 기능하는 것으로 보이며 대부분의 사람들에게는 별 어려움이 없다.

Under interviewer administration, it is common to rely on concurrent probing, which consists of probing after each evaluated question is read aloud and answered. The back and forth process of presenting a question, having the subject answer it, and then asking targeted probes appears to function well for interviewer-administered surveys and poses little difficulty for most people.


  • Self-administration에서 interviewer는 보통 침묵하거나 부재한 상태에서 응답자가 아무런 도움 없이 설문조사를 완료하한다. 이 때는 후향적 조사 과정이 적용되는 경우가 많다. 후향적 조사에서는 응답자가 질문지를 완료한 후 인터뷰어 질문은 디브리프 세션에서 이뤄진다.

Under self-administration, where the interviewer is normally silent or absent and the respondent completes the survey unaided, the process of retrospective probing is often applied. In retrospective probing, interviewer questions are reserved for a debriefing session that occurs after the subject has completed the questionnaire.


[동시 탐색]은 그들의 생각이 최근일 때 그리고 아마도 신선할 때 탐구에 응답할 수 있도록 하는 반면, [소급 탐색]은 시간적으로 더 멀리 떨어져 있는 생각을 재방문해야 한다. 그러나 동시 탐구는 중간에 탐색질문을 던지기 때문에 interview를 방해할 수 있다.

Concurrent probing allows the subject to respond to probes when their thoughts are recent and presumably fresh, whereas retrospective probing requires revisiting thoughts that are more remote in time. However, concurrent probing can disrupt the interview through its imposition of probes in a way that retrospective probing does not.


일반적으로 인지인터뷰에서 recruitment의 목적은 [특정 유형의 통계적 표현도 달성하는 것]이 아니라 [시간과 비용의 제약이 있는 상황에서 가능한 한 광범위한 대상자를 포함하여 많은 영역을 포괄하는 것]이다. 인지 인터뷰에 사용된 데이터와 응답자는 최종 조사 연구의 일부로 사용되어서는 안 된다는 점에 유의해야 한다.

Usually the objective of recruitment is not to achieve any type of statistical representation but rather to cover the territory by including as wide a range of subjects as possible, given the constraints of time and cost. It is important to note, these data and the respondents used for the cognitive interviews should not be used as part of the final survey study.


결론 Concluding Thoughts

인지 인터뷰는 설문 조사 개발자가 설문 조사 내용에 근거한 타당성 증거와 참가자들이 설문 조사 질문에 답하면서 수행하는 사고 과정을 수집하는 데 도움이 될 수 있는 증거 기반 도구다.2,8–10

Cognitive interviewing is an evidence-based tool that can help survey developers collect validity evidence based on survey content and the thought processes that participants engage in while answering survey questions.2,8–10



4 Magee C, Byars L, Rickards G, Artino AR Jr. Tracing the steps of survey design: a graduate medical education research example. J Grad Med Educ. 2013;5(1):1–5.


5 Rickards G, Magee C, Artino AR Jr. You can’t fix by analysis what you’ve spoiled by design: developing survey instruments and collecting validity evidence. J Grad Med Educ. 2012;4(4):407–410.










. 2013 Sep;5(3):353-6.
 doi: 10.4300/JGME-D-13-00154.1.

What Do Our Respondents Think We're Asking? Using Cognitive Interviewing to Improve Medical Education Surveys

Free PMC article
No abstract available


의학모델을 넘어서: 의학교육과 의학교육연구에 대하여 다르게 생각하기(Teach Learn Med, 2020)

Beyond the Medical Model: Thinking Differently about Medical Education and Medical Education Research

Gert J. J. Biestaa,b and Marije van Braakc




도입: 의료교육과 실천과 연구의 의료모델

Introduction: medical education and the medical model of practice and research


교육 연구와 실천의 광범위한 분야에서 교육의 역학관계에 대한 특정한 이해를 '의료 모델medical model'로 지칭하는 것이 상당히 보편화되었다.1~5 이 문구는 가르치는 것이 학생들에게 학습을 불러오기 위한 개입이라는 생각을 지칭하는 데 사용된다. 어떤 공식들은 심지어 [가르치는 것을 학습의 원인]이라고 말하고 교육을 측정 가능한 '학습 결과'의 생산에 불과하다고 본다.

In the wider field of educational research and practice it has become quite common to refer to a particular understanding of the dynamics of education as the ‘medical model.’1–5 This phrase is used to refer to the idea that teaching is an intervention to bring about learning in students. Some formulations even speak about teaching as the cause of such learning and see education as nothing but the production of measurable ‘learning outcomes.’


이러한 관점을 가진 연구에서, 초점은 가르치는 것이 의도된 학습 결과를 가져올 수 있는 가장 효과적인 방법을 찾는 데 있다. 여기서의 생각은 '무엇이 효과가 있는지'를 알아내야 하고, 교사들이 그러한 증거에 근거해야 한다는 것인데, 단순히 증거가 시키는 대로 따라 하거나 최근의 연구 증거에 의해 그들의 행동이 확실히 전달되도록 함으로써 말이다. 교육 분야 내에서 그러한 접근법의 가능성과 만족도에 대한 지속적인 논의가 이루어지고 있다.4–8

In this research, the focus lies on finding the most effective ways in which teaching can bring about intended learning outcomes. The idea here is that research should find out ‘what works’ and that teachers should base their classroom practice on such evidence, either by simply following what the evidence tells them to do or by making sure that their actions are informed by the latest research evidence. Within the field of education there are ongoing discussions about the possibility and desirability of such an approach.4–8


지난 20년 동안 의료 교육 및 관련 연구 분야도 의료 모델을 채택했다. 1,2,7,9 의학교육 관행은 어떤 식으로든 가르치는 것이 학습을 유발한다는 생각에 크게 의존한다. 이 견해에서, 가르침은 [학습 결과를 산출하는 개입]으로 이해된다(예를 들어, Smith11에 근거한 Fincher와 Work, 10(p293)에서 가르침의 정의는 "학습 촉진 활동의 설계 및 실행"임을 참고하라). 여기서의 관례적인 근거는 [더 나은 가르침은 더 나은 학습을 유발]하며, 이것은 [더 나은 환자 치료]를 제공하고, 결과적으로 [환자의 결과를 향상]시킨다(예: Chen, Lui, Martinelli;12 Harden et al.9 참조).

Medical education and its related research field have, over the past two decades, also adopted the medical model.1,2,7,9 Medical educational practice relies heavily on the idea that teaching in some way causes learning. In this view, teaching is understood as an intervention that produces learning outcomes (see for example the definition of teaching as “the design and implementation of activities to promote learning” in Fincher and Work,10(p293) based on Smith11). The customary rationale here is that better teaching causes better learning, which provides for better patient care, which in turn improves patient outcomes (see for example, Chen, Lui, and Martinelli;12 Harden et al.9).


[개입으로서의 가르침]의 개념과 그 개입의 의학 교육 연구의 효과로서 그 가르침의 개념을 준수하면서, 의료 모델의 논리에 따라, 개입과 결과 사이의 상관관계를 찾는다.13 현재의 의학 교육 연구는 주로 특정 교습 관행이 '작동한다work'이라는 증거를 제공하도록 설계되어 있다. 광범위한 맥락에서 응용을 육성하기 위한 「일반적인 단순성」을 목표로 한다교육적 맥락에서 제한된 중요성으로 인해 논란이 되고 있음에도 불구하고, 무작위 통제 실험은 여전히 의학 교육 연구에서 높이 평가되고 있다. 또한 학습에 대한 교수효과 분석을 기반으로 한 메타분석이나 체계적 검토 등이 향후 교육 상황에 대한 가이드라인으로 자주 제시되고 있다.

In keeping with notions of teaching as an intervention and learning as the effect of that intervention medical educational research, following the logic of the medical model, looks for correlations between interventions and outcomes.13 Current medical education research is predominantly designed to provide proof that particular teaching practices ‘work’. It aims for “generalisable simplicity” to foster application in a wide range of contexts.13(p31) Despite being contested for their limited significance in educational contexts,4–6,8,13,14 randomized controlled trials are still held in high regard in medical education research.3,15 Building on analyses of teaching effects on learning, meta-analyses, and systematic reviews are frequently presented as guidelines for future educational situations16,17


교육을 '의료 모델'로 보는 것은 어느 정도 그럴듯해 보인다. 결국, 선생님들은 그들의 가르침에 개입하고 그들은 학생들이 배우기를 원하는 좋은 이유로 그렇게 한다. 게다가, 만약 선생님들이 그들이 하는 일의 효과를 향상시킬 수 있다면, 학생들은 분명히 이익을 얻을 것이다. 피상적인 수준에서 이것은 말이 되겠지만, 면밀한 점검은 몇 가지 문제점을 드러내기 시작한다. 이 논문에서 우리는 의료 모델의 두 가지 주요 문제를 식별하는 것을 목표로 한다.

At one level the medical model of education looks quite plausible. After all, teachers do intervene with their teaching and they do so for good reasons as they want their students to learn. Moreover, if teachers can enhance the effectiveness of what they do, students definitely are to benefit. While at a superficial level this may make sense, a closer inspection begins to reveal several problems. In this paper we aim to identify two main problems of the medical model.


교육이란 무엇인가? 그리고 그것은 무엇을 위한 것인가?

What is education? And what is it for?


의료 모델이 교육의 역동성을 너무 단순하게 표현하는 것에 해당한다고 제안하는 것은, 이러한 역동성이 실제로 무엇인지, 그 이전에 교육이 실제로 무엇인지에 대한 의문을 제기한다. 흔히 '교수학습'이라는 단어가 된 것처럼 느낄 정도로 쉽게 사용되는 현재 유비쿼터스 언어인 '교수와 학습'은 교육이 무엇에 관한 것인지 간결하고 의미 있게 요약한 것 같다.

To suggest that the medical model amounts to a too simplistic representation of the dynamics of education, raises the question of what these dynamics actually are and, before that, what education actually is. The now ubiquitous language of ‘teaching and learning’– used so easily that it often feels as if ‘teachingandlearning’ has become one word – seems to be a concise and meaningful summary of what education is about.


그러나, 가르침이 학생들의 학습을 이끌어내기 위해 그곳에 있다는 제안의 한 가지 중요한 문제는 [학습]이라는 언어가 충분히 정확하지 않다는 것이다. 결국, 학생들은 그들이 교육적인 환경에 있을 때 많은 것을 배울 수 있는 것처럼, 그러한 환경 밖에서 많은 것을 배울 수 있다.

However, one key problem with the suggestion that teaching is there to bring about student learning is that the language of learning is not sufficiently precise. After all, students can learn many things when they are in educational settings, just as they can learn many things outside of those settings.


그러나 교육의 핵심은 학생들이 무언가를 배우도록 하는 것이 아니라, 무언가를 배우고, 이유가 있어서 배우고, 누군가로부터 배우도록 하는 것이다. 그러므로 교육은 항상 [내용, 목적, 관계], 즉 어떤 의미에서 교육을 구성하는 세 가지 '요소'에 대한 의문을 제기한다. 우리가 '교육과 학습'이라는 관점에서 교육을 묘사할 때, 이러한 질문들은 종종 빠져있다.

The whole point of education, however, is not to ensure that students learn, but that they learn something, learn it for a reason, and learn it from someone. Education thus always raises questions about content, purpose, and relationships – the three ‘elements’ that in a sense constitute education. These questions are often absent when we just describe education in terms of ‘teaching and learning’,


내용, 목적, 관계에 관해서는 [목적의 문제]가 실제로 다루어져야 할 첫 번째 질문이라고 주장할 수 있다. 어떤 특정한 교육 활동과 준비가 어떤 것인지 명확하게 설명할 수 없다면, 학생들이 어떤 컨텐츠에 참여해야 하고 어떤 종류의 관계가 자신이 성취하고자 하는 것에 가장 도움이 될 것인지를 결정할 수 있는 방법이 없다.

With regard to content, purpose, and relationships it can be argued that the question of purpose is actually the first question that needs to be addressed. If one is not able to articulate what particular educational activities and arrangements are for, there is no way in which one can decide which content students should engage with and what kind of relationships will be most conducive for what one seeks to achieve.


교육을 특히 흥미롭게 하는 것은 하나의 목적이나 목적을 지향하는 것이 아니라 모든 교육이 세 가지 '목적의 영역'에 관여해야 한다는 점이다.1(예: Biesta, 18 Bruner, 19 Egan, 20, Lam21 참조).

What makes education particularly interesting is that it is not oriented toward one purpose or domain of purpose, but that all education needs to engage with three ‘domains of purpose’1 (see, e.g., Biesta,18 Bruner,19 Egan,20 and Lamm21).


교육의 목적의 첫 번째 영역은 [자격요건]이다. 자격요건은 학생들에게 '뭔가' 할 수 있는 자격요건을 갖추는 것이다. 이러한 '뭔가'는 좁을 수 있다. 예를 들어, 의학교육 분야의 핵심인 특정 직업이나 직업에 대한 자격을 얻는 경우처럼, 또는 학교가 젊은이들에게 복잡한 현대 사회에서 그들의 삶을 살아가기 위한 지식, 기술, 이해를 제공하는 데 있어 수행하는 역할과 같이, 보다 광범위하게 구상될 수 있다. 사회

The first domain of purpose for education is that of qualification, which is about providing students with knowledge, skills, and understanding that will qualify them to do ‘something.’ This ‘something’ can be narrow, such as in the case of becoming qualified for a particular job or profession – which is, of course, key in the field of medical education – or it can be conceived more widely such as the role schools play in providing young people with the knowledge, skills, and understandings for living their life in complex modern societies.


그러나 교육의 목적은 자격에 국한되지 않는다. 교육은 또한 [사회화]의 영역에서 중요한 역할을 한다. 사회화는 학생들에게 직업과 전문 영역을 포함한 특정 분야나 영역에서 오리엔테이션을 제공하는 것이다. 그것은 학생들을 특정한 사회적, 문화적, 실용적, 또는 직업적 전통의 규범과 가치인 [존재와 행동의 방식]으로 유도하는 것이다. 이는 학생들에게 그러한 전통과 관행에 대한 방향감을 주고, 또한 특정한 전통과 관행에 속하게 함으로써 정체성을 발전시키는 데 기여하기 위한 것이다. 학생들이 규칙과 규정을 준수하고 연습이나 전통의 특정한 규범과 가치를 채택하도록 하는 것이 야망인 사회화의 더 강한 형태가 있다. 여기 정체성은 규범적이다.

The purpose of education is, however, not confined to qualification. Education also has an important role to play in the domain of socialization. Socialization is about providing students with an orientation in particular fields or domains including vocational and professional domains. It is about initiating students into the ways of being and doing, the norms and values of particular social, cultural, practical, or professional traditions. This is intended to give students a sense of direction in such traditions and practices and also contributes to developing a sense of identity by becoming part of particular traditions and practices. There are stronger forms of socialization where the ambition is to make sure that students follow the rules and regulations and adopt the particular norms and values of the practice or tradition. Here identities are prescriptive.


예를 들어, 일부 의학 전문가 그룹은 [특정한 행동 방식과 존재 방식]으로 알려져 있을 수 있다. 그러나 학생들에게 방향감각을 주되, 그러한 전통과 관행 안에서 그들 자신의 역할과 위치를 찾을 기회를 주는 것을 목적으로 하는 보다 ['개방적인' 형태의 사회화]도 존재한다.

Some medical specialist groups, for example, may be known for their specific ways of doing and being . There are, however, also more ‘open’ forms of socialization aimed at giving students a sense of direction, but giving them opportunities to find their own role and position within such traditions and practices.


자격요건과 사회화는 대체로 학생들에게 '하는' 행동이라고 주장할 수 있다. 이를 성공적으로 습득했는지 평가를 통해 학생들에게 지식, 기술, 이해 등을 가르치고 확인한다. 마찬가지로, 우리는 그들에게 특정한 관행을 행하고 있는 방법을 가르치고, 학생이 그것들을 성공적으로 받아들였는지 여부를 평가한다.

It could be argued that qualification and socialization are, to a large degree, done ‘to’ students. We teach students knowledge, skills, and understanding and check through assessment whether they have acquired this successfully. Similarly, we teach them the ways of doing and being of particular practices and assess whether they have adopted these successfully.


그러나 이것이 교육의 전부는 아니다. 우리는 우리 학생들이 지식, 기술, 가치관, 규범을 가진 물건으로 끝나는 것을 원하지 않는다. 우리는 항상 [그들이 그들 자신의 권리에 따라 주체로 끝나는 것]을 목표로 한다; 그들 자신의 생각을 결정하고, 그들 자신의 결론을 도출하고, 그들의 행동에 책임을 질 수 있는 개인으로서. 이것은 [주관화 영역]에서 포착된 것으로, 우리는 우리 학생들이 그들 자신의 행동의 주체가 될 수 있도록 격려하고 지원한다. 그러므로 주관화는 행위자성, 자율성, 책임과 같은 핵심 교육 이념과 관련이 있다.2

This, however, is not all there is to education. We do not want our students to end up as objects with knowledge, skills, values, and norms. We always aim for them to end up as subjects in their own right; as individuals who can make up their own mind, draw their own conclusions, and take responsibility for their actions. This is captured in the domain of subjectification where we encourage and support our students to become subjects of their own action. Subjectification thus has to do with key educational ideas such as agency, autonomy, and responsibility.2


[목적의 3개 영역]은 일반교육과 관련이 있을 뿐만 아니라, 의료교육을 포함한 전문교육의 목적에 관하여 더 높은 정확성을 갖추도록 돕는다. 따라서 '학습'에 대한 언급보다 훨씬 더 유용하고 정확한 담론을 제공한다. 학생들이 배우고 있는지 묻기보다는 그들의 교육이 세 가지 목적의 영역을 모두 다루고 있는지 물어 볼 필요가 있다.

three domains of purpose is not only relevant for general education, but also helps to get more precision visa-vis the purposes of professional education including medical education. It thus provides a much more helpful and precise discourse than the reference to ‘learning.’ Rather than asking whether students are learning, we need to ask whether their education addresses all three domains of purpose.


여기서 간단하지만 그럼에도 불구하고 도움이 되는 통찰력은 그러한 교육의 목적이 지식, 기술, 이해의 표현과 습득에만 국한되지 않는다는 것이다

  • 전문적 자격(유능한 의사가 되는 것) 외에도 전문 분야에서 오리엔테이션을 제공하고 성취하는 전문적 사회화가 필요하다. 의학의 전문적 사회화는 의료 전문가로서의 전문적 정체성(실제로 몇몇 사람들에 의해 의료 교육의 주요 목적이라고 설명되어 왔다)을 달성하는 것과 관계가 있다.23-26 

  • 또한, 의료 전문가들은 자격을 갖추고 사회화되어야만 하는 것이 아니라, 그들 자신의 행동의 주체가 되어야 한다. 즉, 어떤 상황에서 어떤 지식, 기술, 이해력을 활용해야 하는지 판단할 수 있어야 하며, 언제 규칙을 고수해야 하는지, 언제 규칙을 따질 것인지, 특정 상황이 이를 요구할 경우 이를 굽히거나 때로는 무시하는 경우도 있다.

The simple but nonetheless helpful insight here is that the purpose of such education is not confined to the presentation and acquisition of knowledge, skills, and understanding. 

  • In addition to professional qualification (becoming a competent doctor), there is also a need for professional socialization: providing and achieving orientation in a professional field. Professional socialization in medicine has to do with achieving a professional identity as a medical professional (which actually has been described by some as the main purpose of medical education).23–26 

  • Also, medical professionals do not just need to be qualified and socialized; they also need to become a subject of their own actions. That is, they need to be able to judge which knowledge, skills, and understandings need to be utilized in which situation and also when they should stick to the rules and when to question the rules or bend or sometimes even ignore them if a particular situation calls for this.


전문직업적 주체화에 초점을 맞추는 의료 교육의 필요성이 있다.

the need for medical education to focus on professional subjectification.


우리는 이제 의학 교육이 전문적인 자격, 전문적인 사회화, 그리고 전문적인 주제화를 목표로 할 필요가 있다고 말할 수 있다. 그것은 또한 이것들이 분리된 칸으로 남아있지 않고 실제로 전문가들에 대한 지식, 행동, 그리고 존재에 통합되도록 할 필요가 있다.

we can now say that medical education needs to aim for professional qualification, professional socialization, and professional subjectification. It also needs to make sure that these do not remain separate compartments but actually become integrated in the knowing, doing, and being of professionals.


그런 다음 이는 교육 과정에서 학생들이 접하고 함께 작업해야 하는 내용과 경험인 [커리큘럼 개발을 위한 프레임워크]를 제시한다. 여기에는 학생들이 '마주쳐야만 하는' 다양한 경험이 포함되어 있다 – 예를 들어, 치료의 한계, 최초 예상치 못한 환자의 사망, 높은 위험의 치료 결정의 모호성 또는 불확실성, 최초 안락사, 저항성(환자 또는 다른 의료인으로부터)을 접하는 것의 중요성을 생각할 수 있다. 독립적으로 만족스럽게 수행된 첫 상담 등

This then suggests a framework for the development of curricula – the content and experiences that students should encounter and work with during their education. This includes a range of experiences students should ‘meet’–one can think, for example, of the importance of encountering the limits of medical treatment, a first unexpected patient death, the ambiguity or uncertainty of a high stakes treatment decision, a first euthanasia, resistance (from patients or other medical professionals) to one’s medical decision, a first consultation carried out independently and satisfactorily, etc.


커리큘럼의 틀 외에도, 제안된 교육에 대한 견해는 의료 교사들이 전문적 자격, 사회화, 주체화를 촉진하기 위해 그들의 학생들과 참여하는 방법인 교육학의 발전을 위한 틀을 제시한다.

In addition to a framework for curricula, the proposed view on education also suggests a framework for the development of pedagogy – the ways in which medical teachers engage with their students in order to promote professional qualification, socialization, and subjectification.


교육은 어떻게 이루어지는가? 그리고 어떻게 하면 성공할 수 있을까?

How does education work? And how can we make it work?


교문 문제를 아직 해결하지 못하다 결국, 우리가 성취하고자 하는 것이 무엇인지에 대해 좀 더 정제된 이해를 갖게 되면, 우리는 세 영역 각각에 대해 어떤 교육 개입이 작용하는지 알아내는 데 연구 노력을 집중해야 한다고 주장할 수 있다. 이 결론은 일반적으로 '무엇이 효과가 있는가?'-질문은 사실 별로 의미가 없다는 것을 보여줄 정도로 도움이 된다. 그보다는 [특정한 교육전략이, 어떤 특정한 목적이나 목적의 영역에, 효과가 있는지]를 물어보는 것으로 시작할 필요가 있다.

not yet resolve the question of teaching. One could, after all, still argue that once we have a more refined understanding of what it is that we seek to achieve, we should focus our research efforts on finding out which teaching interventions work for each of the three domains. This conclusion is helpful to the extent that it shows that asking the general ‘what works?’-question is actually not very meaningful. Rather, we need to begin by asking for which particular purpose or domain of purpose a particular teaching strategy may work.


목적의 세 영역은 따로 존재하는 것이 아니라, 구체적인 교육 실천에 있어서 항상 세 영역 모두 존재한다.

the three domains of purpose do not exist separately but are always all three at play in the concrete practice of education.


동기부여 면담을 가르치는 것은 그 기술을 습득하는 것(자격)만이 아니다. 그것은 또한 해당 직군에서 그 기술의 중요성에 대해 소통하고(사회화) 동시에 학생의 행위자성에 영향을 미친다: 기술을 숙달함으로써 행동을 바꿀 수는 있는데, 이것은 언제 이 기술을 활용하는 것이 적절할 지와 그렇지 않을 때(주체화)에 대한 질문을 하게 만든다.

Teaching motivational interviewing is not just about acquiring that skill (qualification). It also communicates something about the importance of the skill in the profession (socialization) and simultaneously has an impact on the agency of the student: by mastering a skill one is able to act differently, which raises the question when it is appropriate to utilize this skill and when not (subjectification).


세 영역 사이에 시너지가 있을 수 있는 반면, 긴장감과 심지어 갈등도 있을 수 있다. 예를 들어, '시험에 대한 가르침'은 학생들이 책임감 있는 실무자가 되도록 지원하는 방법으로는 거의 도움이 되지 않고(주체화), 실제로 중요한 것은 시험에 합격하는 것(사회화)이라는 메시지를 전달하는 방법이 됨을 생각해 보라. 

Whereas there can be synergy between the three domains, there can also be tensions and even conflicts. Think for example how ‘teaching to the test’ does very little in supporting students becoming responsible practitioners (subjectification) and also sends out the message that what really matters is passing the test (socialization). 


그래서 우리의 교육 전략과 보다 넓은 교육적 배치 중 [어느 것이 '효과가 있는가work' 하는 문제는 사실 그것보다 훨씬 더 복잡]하다. – '효과가 있는 것'에 대한 질문이 세 가지 질문이기 때문만이 아니라, 목적의 한 영역과 관련하여 작용하는 것이 실제로 다르게 작용하거나 목적의 다른 영역에서는 전혀 작용하지 않을 수도 있기 때문이다.

So the question which of our teaching strategies or wider educational arrangements ‘work’ is actually much more complicated than that – not just because the question of ‘working’ is a threefold question, but also because what may work in relation to one domain of purpose may actually work differently, or may not work at all in another domain of purpose.


'무엇이 효과가 있는가'에 대한 증거를 만들어내려고 하는 많은 교육적 연구는 학생들에게 영향을 미치는 요소들의 측면에서 그 야망을 충족시킨다. [가르침이란 특정한 효과를 내는 개입]이라는 가정 하에 종종 메디컬 모델을 참조한다. 의학교육을 포함한 교육에서의 중요한 문제는 이러한 이해가 교육의 역동성을 포착하기에 적합한가 하는 것이다.

Much educational research that seeks to generate evidence about ‘what works’ couches its ambitions in terms of factors that impact on students. It is here that reference is often made to the medical model on the assumption that teaching is an intervention that produces particular effects. The important question for education, including medical education, is whether this understanding is adequate for capturing the dynamics of education.


  • 이상적인 상황에서, 가르침이 원인이고 학습(또는 우리가 선호하는 언어로: 학생들의 전문성 형성)이 효과라고 가정할 수 있는가? 

  • 그리고 우리가 아직 교육적 '투입'(교육)과 교육적 '성과'(학습; 형성) 사이의 확실하고 확고한 연결고리를 확립하지 못했다는 사실이 단지 시간과 돈의 문제일까? 

  • 즉, 더 많은 연구에 대한 투자는 결국 우리에게 어떤 개입이 어떤 영향을 미칠지 말해줄 증거들로 이어질 것인가?

  • Can it be assumed that under ideal circumstances teaching is a cause and learning – or with the language we prefer: students’ professional formation27 – is the effect? 

  • And is the fact that we have not yet established certain and secure connections between educational ‘input’ (teaching) and educational ‘outcome’ (learning; formation), just a matter of time and money? 

  • That is, would investment in more research eventually lead us to the evidence that will tell us once and for all which interventions will produce which effects?


이것은 가능성이 낮다고 우리는 생각한다. 그 이유는 이러한 사고방식으로 가정되는 강한 인과관계가 실제로 [매우 한정적인 상황에서만 발생]하기 때문이다. 즉, 단방향으로 작동하는 폐쇄적이고 결정론적인 시스템을 말한다이 패러다임의 예시는 각 톱니바퀴가 다음 톱니바퀴를 움직이게 하는 시계장치를 들 수 있다. 만약 우리가 시계 장치의 초기 상황을 알고 톱니바퀴 사이의 모든 연결에 대한 완벽한 지식을 가지고 있다면, 우리는 기계가 어떻게 작동할지 100% 확신으로 예측할 수 있고, 영원할 때까지 계속 작동할 것이다. 그러나 이는 교육의 현실이 아니다.

This, we think, is unlikely. The reason for that lies in the fact that the strong causality that is assumed in this way of thinking actually only occurs in very specific situations: in closed, deterministic systems that operate in unidirectional ways. The paradigm case for this is the clockwork where each cogwheel puts the next cogwheel into motion so that, if we know the initial situation of the clockwork and have perfect knowledge of all connections between the cogwheels, we can predict with one hundred percent certainty how the machine will operate, and will continue to operate until eternity. This, however, is not the reality of education.28


  • 여기서 가장 먼저 명심해야 할 것은 교육은 비교적 [개방된 시스템]이라는 점이다. 교육의 '내부'에서 일어나는 일은 교육의 '외부'에서 일어나는 일의 영향을 크게 받는다. 학생들은 교실 밖에서 삶과 경험을 가지고 있고 따라서 그들이 받는 가르침 이상의 영향을 받는다. 교실에서 일어나는 일은 [의도적이고 의도하지 않은 영향력이 드나드는 광범위한 사회적 맥락]의 일부분이다. 

  • 둘째로, 교육은 기계론적 '밀고 당기는'의 결정론적 시스템이 아니라, 소통과 해석의 수단으로 작용하는 기호학적 시스템이다. 간단히 말해서, 학생들은 교사들이 그들에게 말하거나 그들에게 제시하는 것을 이해할 필요가 있고 이것은 해석의 문제이지, 자극과 예측 가능한 대응의 문제가 아니다. 

  • 셋째, 시계와 같은 단방향성과는 달리, 교육시스템은 재귀적이기 때문에 제도상의 '구성요소(교사와 학생)'가 스스로 생각하고 스스로 마음을 정하며, 이를 바탕으로 여러 가지 다른 방식으로 행동하기로 결정할 수 있다. 시스템이 어떻게 진화하느냐가, 다시 말해서 시스템으로 다시 공급되는 것이다.

  • The first thing to bear in mind here is that education is a relatively open system. What happens ‘inside’ education is significantly influenced by what happens ‘outside’ of it. Students have lives and experience outside of the classroom and are therefore influenced by much more than just the teaching they receive. What happens in the classroom is part of a wider social context with intended and unintended influences flowing in and out. 

  • Secondly, education is not a deterministic system of mechanistic ‘push and pull,’ but a semiotic system, that is, a system that works by means of communication and interpretation. Put simply, students need to make sense of what teachers tell them or present to them and this is a matter of interpretation, not of stimulus-and-predictable-response. 

  • Thirdly, unlike the unidirectionality of the clockwork, education systems are recursive, which means that the ‘elements’ in the system (teachers and students) can think for themselves, make up their own minds, and, based on this, can decide to act in a number of different ways. How the system evolves does, in other words, feed back into the system.


교육이 개방적이고, 기호적이며, 재귀적인 시스템이라는 것을 인정하면, 교사들이 하는 일과 학생들이 그것을 통해 얻는 것 사이의 어떤 연관성이 성립될 수 있는지, 확보될 수 있는지에 대해 교육에서 어떤 것이든 전혀 통할 수 있는지 의아하게 생각할 수 있다. 통제할 수 없는 요소들이 많고 복잡하고 개방적인 역학관계가 너무 많기 때문에, 교육은 거의 불가능해 보인다.

Acknowledging that education is an open, semiotic, and recursive system may make one wonder whether anything can work at all in education in that whether any connection between what teachers do and what students take from it can be established or secured. With so many uncontrollable factors, and so many complex, open dynamics, it seems as if education is almost impossible.


하지만 우리가 외부의 영향을 완전히 차단하고, 우리 학생들에게 교과과정을 해석할 수 있는 올바른 방법은 오직 하나뿐이고, 생각하고, 행동하고, 있을 수 있는 올바른 방법 하나라고 말함으로써 이 모든 것에 너무 많은 노력을 한다면, 우리는 갑자기 [교육을 세뇌로 바꾼 것]이다. 이것이 [자격요건]과 강한 [사회화]의 관점에서 '효과적'일지는 몰라도, 세뇌는 주체화의 영역, 즉 우리 학생들이 궁극적으로 스스로 생각하고 행동하며 이에 대한 책임을 질 수 있도록 하기 위한 우리의 야망과 정반대되는 것이다. 우리가 교육 활동에서 구조와 집중을 만드는 것은 중요하지만, 학생들을 통제 대상으로 만들지 않는 것도 중요하다.

Yet if we go too far in all this by closing off the influences from the outside completely, telling our students that there is only one correct way to interpret the curriculum, and only one right way to think, act, and be, we have suddenly turned education into indoctrination. While this may be ‘effective’ from the perspective of qualification and strong socialization, indoctrination is the very opposite of what we should achieve visa-vis the domain of subjectification, that is, our ambition to make sure that our students can ultimately think and act for themselves and take responsibility for this. While it is of crucial importance that we generate structure and focus in our educational activities, it is also important that we never turn our students into objects of our control.


흥미롭게도, 개방성, 해석성, 재귀성을 줄이는 것이 바로 교육자들이 하는 일이다

  • 우리는 학생들의 관심을 집중시키기 위해 학생들을 교실이나 지정된 공부 공간에 우선적으로 배치함으로써 외부로부터의 간섭인 개방성을 줄인다. 

  • 커리큘럼은 학생들이 무엇을 중점적으로 해야 하는지, 무엇을 해야 하는지 구체적으로 명시해 개방성을 떨어뜨리는 한 단계 더 나아가는 과정이다. 

  • 마찬가지로, 해석도 어떤 의미에서 경계가 없지만, 평가의 전체 요점은 우리 학생들이 때때로 해석의 범위를 제한하여 그들이 그것을 절대적으로 올바르게 이해하도록 하고, 때로는 그것들이 의미 있는 것의 경계 내에 있도록 하는 것이다. 

  • 셋째로, 교육자로서 우리는 또한 우리 교실에서 일어나고 있는 재귀성에 영향을 미치려고 노력하는데, 기본적으로 우리 학생들이 특정한 방식으로 생각할 수 있도록 돕는다. 의학 교육에서, 우리는 우리 학생들이 의학 전문가로서 생각하도록 격려한다. 예를 들어, 우리는 이것을 어떤 방향으로든 내버려두기 보다는 특정한 맥락(의료 실무) 안에다 '프레임'하려고 한다.

Interestingly, reducing openness, interpretation, and recursivity is exactly what educators do. 

  • We reduce openness, the interference from the outside, by putting students in classrooms or designated study spaces first and foremost in order to focus the attention of our students. 

  • The curriculum is a further step in reducing openness by specifying what students should focus on and what they should be doing. 

  • Similarly, while interpretation has, in a sense, no boundaries, the whole point of assessment is to limit the range of interpretations our students generate sometimes to make sure that they get it absolutely right, and sometimes to make sure that they remain within the boundaries of what is meaningful. 

  • Thirdly, as educators we also try to influence the recursivity that is happening in our classrooms, basically by helping our students to think in particular ways. In medical education, we encourage our students to think as medical professionals,30 for example, we try to ‘frame’ this within a particular context (medical practice) rather than let it go in any direction.


가르침과 학습 사이에 인과 관계가 있다는 잘못된 가정 그런 연줄은 단순히 교육과 같은 사회제도에는 존재하지 않는다.

the mistaken assumption that there is a causal connection between teaching and learning. Such connections simply do not exist in social systems such as education.


우리의 교육적 노력은 모두 우리가 학생들과 함께 성취하고자 하는 것에 비추어 [더 많은 방향과 구조]를 모든 과정에 제공하는데 기여한다.

our educational endeavors all contribute to giving the whole process more direction and structure in light of what we seek to achieve with our students.


그러나 우리의 요점은, 교육을 개방적이고, 기호적이며, 재귀적인 시스템으로 보는 이러한 방식으로 교육의 역동성을 이해하는 것이 실제로 상당히 도움이 된다는 것이다. 왜냐하면 그것은 그러한 시스템을 보다 예측 가능한 방식으로 작동시키기 위해 무엇을 해야 하는지를 훨씬 정확하게 나타낼 수 있기 때문이다. 여기의 모든 것은 시스템의 '자유도'를 줄이는 데 있다

  • 시스템의 개방성(외부로부터의 영향)을 줄이는 것

  • 시스템의 기호성(해석의 기회)을 줄이는 것

  • 시스템의 재귀성(즉, 시스템이 자신에게 다시 공급되는 방식)을 줄이는 것

Yet the point we wish to make is that understanding the dynamics of education in this way – that is, seeing education as an open, semiotic, and recursive system – is actually quite helpful because it allows to indicate with much precision what needs to be done to make such a system work in a more predictable way. Everything here comes to reducing the ‘degrees of freedom’ of the system: 

  • reducing the openness of the system (the influences from outside), 

  • reducing the semiotics of the system (the opportunities for interpretation), and 

  • reducing the recursivity of the system (that is, the way in which the system feeds back onto itself).


의료 교육 및 의료 교육 연구를 위한 교훈

Lessons for medical education and medical education research


위의 논의에서 의학교육 실천에 대한 한 가지 중요한 시사점은 [의학교육이 무엇을 위한 것인지에 대해 이야기할 때 훨씬 더 정제된 언어를 제공한다는 것]이다.

One important implication for medical education practice from the above discussion is that it provides a much more refined language for talking about what medical education is for


커리큘럼 설계의 경우 이 접근방식은 의료 교육 커리큘럼이 어떻게 보여야 하는지에 대한 유용한 질문을 제기한다. 의대생들의 전문자격, 전문사회화, 전문주제화를 위해 어떤 커리큘럼 콘텐츠가 필요한가? 어떻게 하면 이 콘텐츠가 통합적으로 세 가지 도메인에 모두 기여할 수 있도록 교육 활동을 설계할 수 있을까?

For curriculum design this approach raises helpful questions about what a medical education curriculum should look like. What kind of curricular content do we need to work toward the professional qualification, the professional socialization, and the professional subjectification of medical students? How can we design educational activities such that this content contributes to all three domains in an integrated fashion?


위의 논의는 단순히 학생들이 3개 영역과 관련하여 숙달해야 하는 특정 콘텐츠에 대한 문제뿐만 아니라, 의학교육 중 어떤 종류의 경험을 접해야 하는지에 대한 문제도 제기한다

    • 어떤 만남encounter이 전문적인 자격, 사회화, 주체화 측면에서 교육의 기회를 창출할 것인가? 커리큘럼 재설계는 또한 학생들의 진도를 세 가지 영역 각각에 비추어 확립하기 위한 다른 형태의 평가도 제공될 것이다. 

    • 사회화, 주체화뿐만 아니라 자격의 측면에서 발전을 다루는 방식으로 평가를 설계할 수 있는 방법은 무엇인가? 

    • 통합 평가에서 세 가지를 모두 다룰 수 있는가, 아니면 각각에 대해 별도의 평가가 필요한가?

The above discussion not just raises questions about particular content students should master in relation to the three domains, but also about what kind of experiences they should encounter during their medical education. 

    • Which encounters would create educational opportunities in terms of professional qualification, socialization, and subjectification? With curricular redesign would also come other forms of assessment to establish students’ progress in light of each of the three domains. 

    • How can we design assessment in ways that address development in terms of qualification as well as socialization and subjectification? 

    • Can we address all three in an integrated assessment or do we need separate assessments for each?


게다가, 의대 교육에 대한 학생들의 평가는 세 가지 목적 영역 모두에 더 넓은 초점을 맞출 필요가 있을 것이다. 우리는 학생들에게 그들이 성취했을지도 모르는 지식과 기술, 그리고 이해에 대해 질문할 것이 아니라, 교육이 그들의 직업적 정체성 형성에 기여한 방법과 사려 깊은 판단과 의사 결정 능력에 대해서도 물어볼 필요가 있을 것이다.

In addition, student evaluations of medical education would require a broader focus on all three domains of purpose. We would need to not just ask students about the knowledge, skills, and understanding they may have achieved, but also about ways in which the education has contributed to their professional identity formation31 and their ability for thoughtful judgment and decision making.


이 논의의 두 번째 함의는 의학교육 실무에 종사하는 교사들이 특정 교수 개입이나 방법의 효과성에 대한 연구 결과를 신중하게 고려하는 것이다. 기존 연구는 자격, 사회화, 주체화라는 세 가지 영역 각각과 관련하여 어떤 말을 해야 하는가? 또한 특정 접근방식이 한 도메인이나 도메인의 측면에 대해 작동할 수 있다는 징후가 자동적으로 다른 도메인이나 그 측면에도 적용될 수 있다는 것을 의미하지 않으며 다른 도메인(의 측면들)에 대해서도 중립적이라는 것조차 의미하지 않는다.

A second implication of this discussion is for teachers in medical education practice to carefully consider any research findings about the supposed effectiveness of particular teaching interventions or methods. What does existing research have to say in relation to each of the three domains of qualification, socialization, and subjectification? Also, any indication that a particular approach may work for one domain or aspect of a domain does not automatically mean that it will also work for the other domains or aspects of them and also not that it will be neutral with respect to (aspects of) the other domains.


또한 한 환경(즉, 한 상황의 특정한 조건 하)에서 효과가 있었다고 알려진 것은 다른 조건 하에서 다른 환경에서 전혀 아무 것도 하지 않을 수 있다는 것을 잊지 않는 것이 중요하다. 교사는 현지의 우발적인 상황을 다루면서 연구 증거를 상황과 맥락에 따라 유연하게 번역하고 적용해야 할 제안으로 접근하지 않을 수 없지만, 그 이상도 이하도 아니다

it is crucial also not to forget that what allegedly has worked in one setting – which also means: under the particular conditions of that setting – may not do anything at all in a different setting, under different conditions.1,3,13,32 Dealing with the local contingencies of teaching, teachers cannot but approach research evidence as suggestions to be translated and applied flexibly according to circumstance and context, but as nothing more than that.5


의학교육 연구의 경우, 하나의 영역에만 초점을 맞추는, 그리고 세 가지 영역의 상호작용을 탐구해야 함을 '잊어버리는' 1차원적 연구를 넘을 필요가 있다는 것이 주요 교훈이다. 종종, 더 심각한 것은, '학습'이 무엇이어야 하는지에 관해서 특정하지도 않은 채로, '학습'에 관한 '영향'을 조사하는 것이다.

For medical education research, the main lesson is the need to move beyond one-dimensional research that either focus on just one domain and ‘forget’ to explore the interactions between the three or, even worse, that continue to investigate the ‘impact’ on ‘learning’ without specifying about and for what the learning is supposed to be.


게다가 위에서 설명한 아이디어들은 의료 교육 연구에 다른 초점을 두고 있음을 시사한다. '효과적인 요인'를 식별하기 위한 상관관계를 찾는 것이 아니라, 교육적 '생태학'의 구축에 대한 철저하고 사려 깊은 탐구를 말한다. , 교육적 실천의 개방성, 반증, 재귀성 등을 정리함arrange으로써 어떻게 의미 있는 교육이 정착될 수 있는가에 대한 연구이다.

Moreover, the ideas outlined above suggest a different focus for medical education research – not a search for correlations in order to identify ‘effective factors,’ but rather a thorough and thoughtful exploration of the construction of educational ‘ecologies,’ that is, of how, through arranging the openness, semiosis, and recursivity of educational practices, meaningful education can be established.


그러한 연구는 우리에게 새로운 (또는 그 문제에 있어서 기성) 교육행위가 학생들의 성적에 영향을 미치는지 아니면 전문적 기준을 더 빨리 또는 효율적으로 충족시키는 데 도움이 될지를 알려줄 것이다(자격화). 또한 이러한 교육이 학생들이 적합한 유형의 전문가가 되고, 하고, 느끼는지(사회화), 의미 있고 책임감 있는 방식으로 행동하고 판단하는 능력에 도움이 되는지(주체화)에 있어 중요한 대한 통찰력을 줄 것이다.

Such research would not only tell us whether a new (or, for that matter, an established) practice would influence students’ grades or help them meet professional standards more quickly or efficiently (qualification). It would also give us insight into the ways that this practice helps students be, do, and feel like professionals of their sort (socialization) and is significant for their ability to act and judge in meaningful and responsible ways (subjectification).


결론 Conclusion


여기서 우리는 교육을 [폐쇄적이고 인과적인 시스템으로 이해하는 것]이 아니라 [소통과 해석 그리고 교사와 학생들의 사려 깊은 행동을 통해 작동하는 열린 시스템으로 이해하는 것]이 훨씬 더 타당하다고 제안했다. 그러한 관점에서, 교육, 커리큘럼, 평가, 평가는 더 이상 '결과'를 생산하기 위한 '요인'으로 등장하는 것이 아니라, 교육 과정을 특정한 목적을 향해 이끌기 위한 교육자들의 실천의 의미 있는 측면이 된다.

Here we have suggested that it makes much more sense not to understand education as a closed, causal system but as an open system that works through communication and interpretation and the thoughtful actions of teachers and students. In such a view, teaching, curriculum, assessment, and evaluations no longer appear as ‘factors’ to produce ‘outcomes’ but become meaningful aspects of the practice of educators to steer the educational process toward particular purposes


항상 지나친 조종은 의미 있는 교육을 문제적인 형태의 세뇌로 감소시킬 위험이 있다는 것을 명심한다.

always bearing in mind that too much steering runs the risk of reducing meaningful education to problematic forms of indoctrination.






. Aug-Sep 2020;32(4):449-456.
 doi: 10.1080/10401334.2020.1798240. Epub 2020 Aug 15.

Beyond the Medical Model: Thinking Differently about Medical Education and Medical Education Research

Affiliations 

Affiliations

  • 1Centre for Public Education and Pedagogy, Maynooth University, Co Kildare, Ireland.
  • 2Moray House School of Education and Sport, University of Edinburgh, Edinburgh, UK.
  • 3Department of General Practice, Erasmus Medical Centre, Rotterdam, The Netherlands.

Abstract

Issue: In medical education, teaching is currently viewed as an intervention that causes learning. The task of medical education research is seen as establishing which educational interventions produce the desired learning outcomes. This 'medical model' of education does not do justice to the dynamics of education as an open, semiotic, recursive system rather than a closed, causal system. Evidence: Empirical 'evidence' of 'what works' - that is, what is supposed to affect 'learning' - has become the norm for medical educational improvements, where generalized summary outcomes of research are often presented as must-follow guidelines for myriad future educational situations. Such investigations of educational processes tend to lack an explicit engagement with the purposes of medical education, which we suggest to understand in terms of qualification (the acquisition of knowledge, skills, and understanding), socialization (becoming a member of the professional group) and subjectification (becoming a thoughtful, independent, responsible professional). In addition, investigations of educational processes tend to rely on causal assumptions that are inadequate for capturing the dynamics of educational communication and interaction. Although we see an increasing acknowledgement of the context-dependency of teaching practices toward educational aims, the currently prevailing view in medical education and educational research limits understanding of what is actually going on when educators teach and students participate in medical education - a situation which seriously hinders advancements in the field. Implications: In this paper, we hope to inform discussion about the practice of medical education by proposing to view medical education in terms of three domains of purpose (professional qualification, professional socialization, and professional subjectification) and with full acknowledgement of the dynamics of educational interaction and communication. Such a view implies that curriculum design, pedagogy, assessment, and evaluation should be reoriented to include and integrate all three purposes in educational practice. It also means that medical education research findings cannot be applied in just any teaching context without carefully considering the value of the suggested courses of actions toward the particular educational aims and teaching setting. In addition, medical educational research would need to investigate all three purposes and recognize the openness, semiotic nature, and recursivity of education in offering implications for teaching practice.

Keywords: Medical education; education as open system; language of learning; medical education research; medical model.


다양한 학술통합연구: 왜 근거, 준거, 기준의 규칙이 중요한가 (Acad Med, 2015)

Varieties of Integrative Scholarship: Why Rules of Evidence, Criteria, and Standards Matter

William C. McGaghie, PhD



학계는 수십 년 동안 학술연구가 많은 형태를 띤다는 것을 인정해 왔다. 어니스트 보이어1은 1990년 단문집 '장학 재고: 교수의 우선순위'에서 장학금을 위한 활자를 제안했다. 보이어 유형학은 4가지 종류의 학문적 연구와 표현을 확인했다. 그것들은 

  • 발견 - 독창적인 연구의 발견; 

  • 통합 - 지적 종합을 수반하는 통합; 

  • 적용 - 실질적인 문제를 해결하기 위한 지식의 책임 있는 사용; 

  • 교육 - 연구산물을 다른 사람들에게 가르치고 교육하고 미래의 학자들을 유혹한다.

The academic community has acknowledged for decades that scholarship takes many forms. Ernest Boyer1 proposed a typology for scholarship in a 1990 monograph, Scholarship Reconsidered: Priorities of the Professoriate. The Boyer typology identified four varieties of scholarly work and expression. They are 

  • the scholarship of discovery or original research; 

  • integration, which involves intellectual synthesis; 

  • application, the responsible use of knowledge to address practical problems; and 

  • teaching, educating others about the products of scholarship and enticing future scholars.


이 글에서 나는 의료교육과 다른 보건직 교육에 있어서의 통합의 학술활동scholarship of integration을 다루고 증폭시킬 것이다.

In this article, I will address and amplify the scholarship of integration in medical education and education for other health professions.


방법의 복수성과 글쓰기는 실용적이고 인식론적인 이유에서 중요하다. 

  • 실용적인 이유로 우리는 의학교육이 어떻게 그리고 왜, 그 많은 형태로 작동하는지 알 필요가 있다. 

  • 인식론적 이유로 우리는 또한 우리의 지식 기반을 구체화하고 교육 실무를 알리는 증거와 증거 종합의 보완적 규칙에 대해 알 필요가 있다.

Plurality of methods and writing is important on practical and epistemological grounds. 

  • For practical reasons we need to know how and why medical education works in its many forms. 

  • For epistemic reasons we also need to know about complementary rules of evidence and evidence synthesis that embody our knowledge base and inform educational practice.


통합적 학술연구를 읽고 성찰해보면, [이러한 학문적 표현방식이 19세기 초의 오랜 역사를 가지고 있을 뿐만 아니라 서로 다른 증거, 기준, 품질 기준을 사용하는 여러 형태를 취할 수 있다는 것]을 보여준다.2

Reading and reflection about integrative scholarship reveal that this approach to academic expression not only has a long history dating from the early 19th century but also can take several forms that use different rules of evidence, criteria, and quality standards.2


학자들은 또한 하나의 연구만으로 확정적인 답을 얻을 수 없으며, 과학과 학술연구가 가지는 [진실에 대한 근사치]는 시간이 지남에 따라 누적되며, 근거의 무게와 질에 달려있다는 것을 인정해야 한다.8 과학적 발전은 이론 기반, 주제 기반, 지속적 및 누적적 검토를 포함하는 연구 프로그램에서 비롯된다.9

Scholars should also acknowledge that single publications are rarely definitive and that approximations to truth in science and scholarship rest on the weight and quality of evidence assembled and judged over time.8 Scientific advancement stems from research programs—which include integrative reviews—that are theory based, thematic, sustained, and cumulative.9


통합적 학술활동이란 무엇인가? 어니스트 보이어1은 통합적 학술활동이란 

"고립된 사실들에 의미를 부여하고, 그것들을 특정한 관점에 배치한다전문 분야를 연결하고, 전문 분야를 더 큰 맥락에 배치하며, 무언가를 드러내는revealing 방식으로 데이터를 조명하며, 비전문가를 교육에 필요한 경우도 종종 있다. 통합적 학술활동의 의미는, [해석을 위하여, 한데 모으기 위하여, 원저에서 새로운 통찰을 가져오기 위하여] 수행하는 진지하고 단련된 작업이다."

What is integrative scholarship? Ernest Boyer1 argues that integrative scholarship 

“give[s] meaning to isolated facts, putting them in perspective … making connections across the disciplines, placing the specialties in larger context, illuminating data in a revealing way, often educating nonspecialists, too…. What we mean is serious, disciplined work that seeks to interpret, draw together, and bring new insight to bear on original research.”


Harris Cooper는 다음과 같이 주장한다. "연구 합성은 경험적 연구에 초점을 맞추고, 과거의 연구를 요약하여 관련되거나 동일한 가설을 다루는 많은 개별적인 조사로부터 전반적인 결론을 이끌어내고자 한다. 연구 합성가의 목표는 관심대상들의 관계에 관한 지식의 현재 상태를 제시하고, 연구로 해결되지 않은 중요한 문제를 부각시키는 것이다." 쿠퍼는 또한 "연구 합성자들은 1차 연구자들에게 적용되는 것과 같은 엄격한 방법론적 기준을 충족시키기 위해 요구되어야 한다."고 말한다.

Harris Cooper asserts: “Research syntheses focus on empirical studies and seek to summarize past research by drawing overall conclusions from many separate investigations that address related or identical hypotheses. The research synthesist’s goal is to present the state of the knowledge concerning the relation(s) of interest and to highlight important issues that research has left unresolved.”10 Cooper also states that “research synthesists must be required to meet the same rigorous methodological standards that are applied to primary researchers.”10


통합형 또는 합성형 학술활동은 폭이 다양할 수 있다. 그것은 학문 분야 내에서 수행될 수 있고, 여러 학문에 걸쳐서도 수행될 수 있다.

Integrative or synthetic scholarship can vary in breadth. It can be conducted within academic disciplines or, after Boyer,1 across academic disciplines.


보건직 교육의 통합적 학술작업물을 발행하는 저널은 일반적으로 합법적인 합성 작업에 대한 다양하고 포괄적인 정책을 가지고 있다. 저널들은 저자에 대한 지침은 말하고 있다. 예를 들어 학술의학에서는 "일반 학술 논문… 학술 의학에 대한 폭넓은 관심사를 다루는 논문들… [어디서] 연구와 서술의 요소를 결합한 글로서, 연구가 충분히 견고하지 않거나 중심이 되어 완전한 연구 보고서를 구성하지 못하는 경우"를 구한다고 발표한다.15 비슷한 편집 정책 성명들이 다른 많은 잡지들에 의해 발표되었다.

Journals that publish integrative scholarship in health professions education typically have eclectic and inclusive policies about legitimate synthetic work. Journals’ instructions to authors are telling. Academic Medicine, for example, announces that it seeks “General scholarly articles … [that] cover topics of broad concern to academic medicine… [where] The article combines elements of research and description, where the research is not sufficiently robust or central enough to the article’s message to constitute a full-fledged research report.”15 Similar editorial policy statements have been expressed by many other journals


메시지는 분명하다. 많은 저널들이 중요한 문제를 해결하고 품질 기준에 부합하는 건강직업 교육의 통합적 학술물을 제시하는 원고를 환영하고 있다.

The message is clear. Many journals welcome manuscripts that present integrative scholarship in health professions education that addresses important issues and meets quality standards.


쿠퍼10과 쿠퍼와 코엔카25는 구조를 프레이밍하고 조직하는 연구 통합 과정의 7단계 접근법을 제안한다. 일곱 가지 단계는 다음과 같다.

Cooper10 and Cooper and Koenka25 propose a seven-step approach to frame the structure and organize the process of research integration. The seven steps are:


1. 문제를 공식화한다. 

2. 문헌을 검색한다. 

3. 연구로부터 정보를 수집한다. 

4. 연구의 품질을 평가한다. 

5. 연구의 결과를 분석하고 통합한다. 

6. 증거를 해석한다. 

7. 결과를 발표한다.

1. Formulate the problem; 

2. Search the literature; 

3. Gather information from studies; 

4. Evaluate the quality of studies; 

5. Analyze and integrate the outcomes of studies; 

6. Interpret the evidence; and 

7. Present the results.


7단계 접근법 10,25(5 × 7 = 35 cell)에서 연구 합성에 이르는 5가지 연구 검토 전통의 요약을 표 1에서 선행 주관자로 제시한다.

A summary of the five research review traditions crossed by the seven-step approach10,25 (5 × 7 = 35 cells) to research synthesis is presented as an advance organizer in Table 1.




다섯 가지 연구 검토 전통

Five Research Review Traditions


네러티브 Narrative


네러티브 리뷰는 학문 분야에 걸친 광범위하고 깊은 학문적 종합의 역사를 가지고 있다. 예로는 인문계, 행동과학 28개, 건강직업 교육 29개 등이 있다.30 최근까지 서술적 리뷰는 과학과 인문학을 아우르는 연구 통합에 대한 가장 보편적이고 영향력 있고 널리 인정된 접근 방식이었다.

Narrative reviews have a broad and deep history of scholarly synthesis across the academic disciplines. Examples include the humanities,28 behavioral sciences,29 and health professions education.30 Until recently, narrative reviews were the most common, influential, and widely endorsed approach to research integration across the sciences and humanities.


조작적으로, 서사를 수행하는 개별 작가 또는 학자 팀은 출판된 글의 영역을 "획득stake out"하고, 전문가 의견이나 판단에 기초하여 정성적으로 이멜의 31개 암묵적 3단계를 사용하여 증거를 취합한다. 이 단계에는 쿠퍼10과 쿠퍼, 코엔카25 7단계 모델이 포함된다.

Operationally, individual authors or scholarly teams who conduct narrative reviews “stake out” a domain of published writing and qualitatively, based on expert opinion or judgment, aggregate the evidence using Imel’s31 three tacit steps, which incorporate the Cooper10 and Cooper and Koenka25 seven-step model:


1. 통합적 학술작업을 제시할 원고의 경계, 내용 및 구조를 규정한다.

2. 증거의 의미에 대한 그럴듯한 주장을 만들기 위해 증거를 정성적으로 조립, 분석, 해석, 평가 및 종합한다.

3. 동료 청중에게 증거와 주장을 설득력 있게 통합한 보고서를 작성한다.

1. Define the boundaries, contents, and structure of a manuscript that presents integrative scholarship;

2. Qualitatively assemble, analyze, interpret, evaluate, and synthesize evidence to create plausible arguments about what the evidence means; and

3. Write a report that integrates evidence and argument in a convincing way to an audience of one’s peers.


내러티브 검토는 전형적으로 동일한 질적 준거와 기준을 사용하여 평가된다.32 교육연구의 검토(RER)33는 예를 들어 통합적, 이론적, 방법론적, 역사적 4가지 범주로 종합적 학술연구를 분류한다. 또한 RER33은 원고 검토자에게 저널에 게재할 원고를 평가할 때 8가지 기준과 기준을 사용하도록 지시한다.

Narrative reviews are typically judged using equally qualitative criteria and standards.32 To illustrate, the Review of Educational Research (RER)33 classifies synthetic scholarship in four categories: integrative, theoretical, methodological, and historical. RER33 also instructs manuscript reviewers to use eight standards and criteria when evaluating manuscripts for publication in the journal:


1. 문헌의 질 

2. 분석의 질 

3. 주제의 중요성 

4. 기사의 영향 

5. 현장의 선진화 

6. 스타일; 

7. 균형과 공정성 

8. 목적.

1. Quality of the literature; 

2. Quality of analysis; 

3. Significance of the topic; 

4. Impact of the article; 

5. Advancement of the field; 

6. Style; 

7. Balance and fairness; and 

8. Purpose.


8가지 RER 기준과 표준은 정교함이나 조작적 정의 없이 제시된다. 검토자는 경계와 의미를 "그들 스스로"해석해야 한다.31

The eight RER criteria and standards are given without elaboration or operational definition. Reviewers are “on their own” to interpret boundaries and meaning.31


Cooper10은 연구 통합에 대한 내러티브 접근법에 대해 매우 비판적이다. 쿠퍼는 

"전통적인 내러티브 방식으로 진행된 연구 합성은 많은 비판을 받아왔다. 전통적인 연구 합성에 반대하는 사람들은 이 방법과 그 결과적인 결론은 과정과 결과 모두에서 부정확하다고 제안했다. 특히 전통적인 내러티브 연구는 명확한 입증 기준standards of proof이 결여되어 있다. 이러한 합성의 독자와 사용자는 일련의 연구가 그 결론을 뒷받침하는지 여부를 결정하기 위해 어떤 표준의 증거를 사용했는지 모른다.34 전통적인 합성론자들이 사용하는 결합 법칙은 비록 그들이 추론을 인도하고 있는 것을 의식적으로 알고 있더라도 합성론자 자신 외에 다른 사람에게는 거의 알려져 있지 않다."10

Cooper10 is very critical of the narrative approach to research integration. Cooper asserts: 

“Research syntheses conducted in the traditional narrative manner have been much criticized. Opponents of the traditional research synthesis have suggested that this method—and its resulting conclusions—is imprecise in both process and outcome. In particular, traditional narrative research syntheses lack explicit standards of proof. Readers and users of these syntheses do not know what standard of evidence was used to decide whether a set of studies supported its conclusion.34 The combining rules used by traditional synthesists are rarely known to anyone but the synthesists themselves, if even they are consciously aware of what is guiding their inferences.”10


Cooper10은 또한 전통적인 [내러티브] 연구 합성에는 세 가지 다른 단점이 있다고 주장한다.

Cooper10 also argues that there are three other disadvantages to traditional [narrative] research synthesis:


    • 첫째, 전통적 연구 합성은 다음에 필요한 체계적인 기법이 거의 없다

⑴ 모든 관련 연구가 종합에 위치located하여 포함하는 것

⑵ 각 연구의 정보가 정확하게 수집되었는지 확인하는 것

“First, traditional research syntheses rarely involve systematic techniques to ensure that 

(a) all relevant research was located and included in the synthesis and 

(b) information from each study was gathered accurately.”


    • 둘째, 전통적인 서술형 합성은 개별 연구가 방법론적 품질의 허용 임계값을 충족하는지 여부를 결정하기 위해 사후 기준을 사용하는 경향이 있었다.

“Second, traditional narrative syntheses were prone to use post hoc criteria to decide whether individual studies met an acceptable threshold of methodological quality.”


"결국 전통적인 내러티브 합성은 본질적으로 연구 대상이 되는 관계의 전체적인 규모에 대한 진술을 이끌어내지 못한다."10

“Finally, traditional narrative syntheses, by their very nature, fail to result in statements regarding the overall magnitude of the relationship under investigation.”10


이러한 현실적이고 잠재적인 결함에도 불구하고, 내러티브 리뷰는 의학 및 보건 전문직 교육에서 통합적 학술적 문학에 중요한 기여를 하고 있으며, 지속적으로 그 역할을 하고 있다. 예를 들면 K가 지은 서술평론이다. 2004년 학술의학(Academic Medicine)에 발표된 안데르스 에릭슨(35)의 '의학과 관련 분야 전문가 성과 획득 및 유지'가 큰 영향을 미쳤다.

Despite these real and potential flaws, narrative reviews have been and continue to represent important contributions to the integrative scholarly literature in medical and health professions education. To illustrate, a narrative review authored by K. Anders Ericsson,35 “Deliberate practice and the acquisition and maintenance of expert performance in medicine and related domains,” published in Academic Medicine in 2004, has had a major impact.


체계적

Systematic


[호주] 국립보건의료연구위원회(NHMRC)는 체계적인 문헌 검토의 목적을 다음과 같이 밝히고 있다. 

"체계적인 문헌 검토의 목적은 특정 문제와 관련된 모든 가용한 연구 증거를 평가하고 해석하는 것이다. 이는 이전 작업이 설명되지만 체계적으로 식별되지 않고 품질에 대해 평가 및 종합되는 전통적인 검토와는 다르다."37 

The [Australian] National Health and Medical Research Council (NHMRC) states the aim of a systematic literature review: 

“The purpose of a systematic literature review is to evaluate and interpret all available research evidence relevant to a particular question…. This differs from a traditional review in which previous work is described but not systematically identified, assessed for quality and synthesized.”37 


NHMRC 설명은 알바네즈와 노르시니,38에 의해 증폭되었다. 체계적 검토는 

"검토 과정을 투명하게 하고 일반적으로 합의된 방법으로 증거의 규칙을 정의하기 위한 노력"이다. 미리 정해진 품질 기준에 대한 검토를 실시하는 것도 하나의 접근법이라고 말했다.

The NHMRC description is amplified by Albanese and Norcini,38 who assert that a systematic review 

“is an effort to make the review process transparent and to define the rules of evidence in generally agreed upon ways. It is also an approach that holds reviews to predetermined standards of quality.”


Lang39는 과학적 방법의 확장으로서 체계적 검토의 특성을 설명하고 그들의 행동에 대한 9단계 접근법을 제시한다. 랭의 9단계는 다음과 같다.

Lang39 describes the characteristics of systematic reviews as an extension of the scientific method and presents a nine- step approach for their conduct. Lang’s nine steps are:


1. 생물학적 또는 인간적 문제에 관심을 갖게 된다. 

2. 문제에 대해 알려진 내용을 학습한다. 

3. 문제에 대한 연구 질문을 작성한다. 

4. 질문에 대한 하나 이상의 가능한 답을 시험하기 위한 실험을 설계한다. 

5. 연구할 표본을 선택한다. 

6. 질문에 답변하는 데 필요한 데이터를 수집한다. 

7. 데이터를 분석하고 해석한다(아마도 통계적으로). 

8. 데이터에 기초하여 결론을 도출한다. 

9. 연구 결과를 발표한다.

1. Become interested in a biological or human problem; 

2. Learn what is known about the problem; 

3. Formulate a research question about the problem; 

4. Design an experiment to test one or more possible answers to the question; 

5. Select a sample to study; 

6. Collect the data needed to answer the question; 

7. Analyze and interpret the data, perhaps statistically; 

8. Derive conclusions on the basis of the data; and 

9. Publish the results of the study.


학술지의 전문 스태프들은 재현성과 연구 질문, 검색과 선택 과정, 분석, 해석의 네 가지 특징을 근거로 서술적 리뷰와 체계적 리뷰를 비교하는 비공식 자료를 만들었다.40 이러한 구분은 그림 1에 나타나 있다. 

      • 요컨대, 체계적 검토는 신중한 행동 계획을 따르고, 체계적이고, 지배되고, 그리고 (아마도) 정량적으로 된다

      • 이는 대개 [증거와 데이터 종합의 암묵적 규칙을 사용하는, 특이하고 질적인 절차에 기초하는] 내러티브 리뷰와 대비된다. 

Professional staff members for the journal Academic Medicine created an informal resource comparing narrative reviews and systematic reviews on grounds of four features: reproducibility and research question, search and selection process, analysis, and interpretation.40 These distinctions are shown in Figure 1. 

      • In short, a systematic review follows a careful plan of action, is organized, rule governed, and (perhaps) quantitative; 

      • in contrast with a narrative review, which is usually based on idiosyncratic, qualitative procedures that use tacit rules of evidence and data synthesis. 



3개의 공동 연구 그룹은 의료 및 보건 과학 교육자에게 관심에 대한 체계적인 검토를 후원하고 수행한다: 

Three collaborative research groups sponsor and conduct systematic reviews of interest to medical and health science educators: 

    • the Best Evidence Medical and Health Professional (BEME) Collaboration,41 

    • the Campbell Collaboration,42 and 

    • the Cochrane Collaboration.43


    • BEME Collaboration 체계적 검토는 의료 및 보건 직업에 대한 증거에 대한 교육을 개선하는 것을 목표로 한다. 

    • 캠벨 콜라보레이션의 체계적 리뷰는 연구 합성 대상으로 행동 과학, 공공 정책, 보건 서비스의 질문을 다룬다. 

    • Cochrane Collaboration은 건강 관리, 건강 정책, 질병 예방, 치료 및 재활에 대한 개입의 영향, 진단 테스트 정확도를 다룬다.

    • BEME Collaboration systematic reviews aim to improve evidence-informed education in medicine and the health professions. 

    • Campbell Collaboration systematic reviews address questions in the behavioral sciences, public policy, and health services as research synthesis targets. By contrast, 

    • Cochrane Collaboration systematic reviews address health care; health policy; effects of interventions for disease prevention, treatment, and rehabilitation; and diagnostic test accuracy.


BEME Collaboration, Campbell Collaboration, Cochrane Collaboration의 후원으로 수행되는 체계적인 리뷰는 엄격한 동료 검토를 거친다.

Systematic reviews performed under auspices of the BEME Collaboration, the Campbell Collaboration, and the Cochrane Collaboration undergo rigorous peer review


체계적 검토의 맥락에서 데이터 분석은 양적 또는 질적으로 이루어질 수 있다. 체계적 검토에서 정량적 데이터 분석을 메타분석이라고 하는데, 여기서 개별 연구의 데이터를 취합하여 효과 크기와 신뢰구간을 계산하고, 포레스트 플롯 등 확립된 규약에 따라 데이터 표시와 해석을 한다.48–50

Data analysis in the context of a systematic review can be either quantitative or qualitative. Quantitative data analysis in systematic reviews is called meta-analysis, where data from individual studies are aggregated, effect sizes and confidence intervals are calculated, and data presentation and interpretation are done according to established conventions such as forest plots.48–50


체계적 검토의 맥락에서 [질적 데이터 합성]은 선택된 연구의 특징들이 메타분석을 이용한 양적 합성을 배제하는 이질적인 연구 설계, 교육 개입, 결과 측정, 시간 프레임을 포함할 때 수행된다.51

Qualitative data synthesis in the context of a systematic review is performed when features of selected studies include heterogeneous research designs, educational interventions, outcome measures, and time frames that rule out quantitative synthesis using meta-analysis.51


체계적 검토를 위한 연구 보고 규약은 [통합적 연구 보고서의 요소와 그 표시 순서를 명시한 규칙]에 따른다. 랭과 세이크52는 의학 문헌에서 체계적인 검토 보고에 대한 기본적인 기대를 지적한다. Moher와 동료 53은 PRISMA 선언으로 알려진 "체계적인 검토와 메타 분석을 위해 선호되는 보고 항목"에 대한 상세한 설명을 제시한다.

Research reporting conventions for systematic reviews are governed by rules that specify the elements of an integrative research report and their order of presentation. Lang and Seic52 point out basic expectations for reporting a systematic review in the medical literature. Moher and colleagues53 present a detailed account of the “preferred reporting items for systematic reviews and meta-analyses,” known as the PRISMA Statement.


일부 비평가들은 방법론이 너무 구체적이고 엄격하기 때문에 체계적인 검토의 결과가 항상 신뢰할 수 있는 것은 아니라고 주장한다. 이들과 다른 학자들은 통합적 학술연구에 대한 체계적인 검토 접근방식은 탈맥락화acontextual 되어있다고 말한다. 즉, 그것은 원래의 연구가 수행된 조건을 설명하지 못한다따라서 데이터의 메타분석을 포함하거나 포함하지 않은 체계적인 검토는 [(원래 연구가 수행된 맥락과) 다른 설정과 환경에서] 교육 개입이 효과가 있을지(혹은 없을지)에 영향을 미치는 [복잡하고 변화무쌍한 조건으로부터 분리된 무균sterile 상태]로 간주된다

Some critics contend that results from systematic reviews are not always trustworthy because the methodology is too specific and rigid.57,58 These and other scholars argue that the systematic review approach to integrative scholarship is acontextual. It fails to account for the conditions under which the original research was performed. Thus, systematic reviews with or without meta-analysis of data are considered by some scholars to be sterile, detached from the complex, ever-changing conditions that affect the way educational interventions work (or do not work) in different settings and circumstances. 


셋째, 범위 지정, 넷째, 비판적 현실주의는 이 문제를 해결하고자 한다.

The third, scoping, and fourth, critical-realist, approaches to integrative scholarship aim to address this deficit.


범위 지정

Scoping


범위 지정scoping 연구는 통합적 학술연구 방법의 family에는 상대적으로 새로운 것이다. 범위 지정 연구의 목적은 연구 영역(범위, 한계 및 특징)에 포함된 주요 개념과 이용 가능한 증거의 주요 출처 및 유형을 매핑하는 것이다. 그 목적은 핵심 연구 문제를 다루는 현재 문헌의 범위에 대한 빠르고 서술적이며 기술적인 설명을 만드는 것이다. 범위 지정 연구에서 관련 문헌을 식별하는 데 사용되는 전략은 [폭넓은, 경계-설정boundary-setting 결과 달성]을 목표로 한다.59–61

Scoping studies are a relatively new addition to the family of integrative scholarship methods. The aim of a scoping study is to map the key concepts contained in a research domain—their breadth, limits, and features—and the primary sources and types of available evidence. The intent is to produce a quick, narrative, descriptive account of the scope of current literature addressing a key research question. The strategy used to identify relevant literature in a scoping study aims to achieve broad, boundary- setting results.59–61


Arcsey와 O'Malley62는 범위 지정 연구를 수행해야 하는 네 가지 이유를 기술한다: 

    • 구 활동의 범위, 다양성, 성격을 조사하기 위한 것, 

    • 완전한 체계적 검토full systematic review를 수행하는 것의 가치 결정, 

    • 연구 결과를 요약하고 보급하기 위한 것, 그리고 

    • 재 문헌에서 연구 격차를 식별하기 위한 것이다. 

Arksey and O’Malley62 state four reasons to perform a scoping study: 

    • to examine the extent, range, and nature of research activity; 

    • determine the value of undertaking a full systematic review; 

    • summarize and disseminate research findings; and 

    • identify research gaps in the current literature. 


범위 연구는 체계적인 검토와 같이 엄격한 방법론적 규칙(예: 특정 연구 설계, 측정 방법)에 의해 관리되지 않는다. 대신, "범위 지정 연구 방법은 [연구 설계와 상관없이 모든 관련 문헌을 식별]하는 요건에 의해 안내된다." 또한, "이 과정은 선형적이 아니라 상호작용적이어서 연구자들이 반사적으로 각 [점수 검토] 단계에 관여해야 하며, 필요한 경우 문헌이 포괄적으로 다루어지도록 하기 위한 단계를 반복해야 한다."62.

A scoping study is not governed by strict methodological rules (e.g., specific research design, measurement methods) like a systematic review. Instead, “the scoping study method is guided by a requirement to identify all relevant literature regardless of study design.” In addition, “The process is not linear but interactive, requiring researchers to engage with each [scoping review] stage in a reflexive way and, where necessary, repeat steps to ensure that the literature is covered in a comprehensive way.”62


Arcsey와 O'Malley62는 범위 지정 연구의 다섯 가지 필수 단계가 있다고 말한다.

Arksey and O’Malley62 state that there are five required stages of a scoping study:


1. 연구 질문을 확인한다. 

2. 관련 연구를 식별한다. 

3. 연구를 선택한다. 

4. 데이터를 도표로 작성한다. 

5. 결과를 취합, 요약, 보고한다.

1. Identify the research question; 

2. Identify relevant studies; 

3. Select studies; 

4. Chart the data; and 

5. Collate, summarize, and report results.


범위 지정 연구의 여섯 번째 선택적 단계는 통합 장학금에 기득권을 가진 이해관계자, 개인 및 그룹과 협의하여 그러한 작업의 가치와 영향에 대한 견해를 평가하는 것이다.

A sixth, optional stage in a scoping study is to consult with stakeholders, individuals, and groups who have a vested interest in the integrative scholarship, to assess their views about the value and impact of such work.


범위 지정 연구의 목표는 광범위하고 유연하다. 포괄적 목표는 연구 발표의 설계, 측정, 통계적 방법 또는 품질과 관계없이 잠재적으로 관련이 있는 다양한 연구를 식별하는 것이다. 역학 용어로는, [특이도가 높은 문헌 검색보다는 민감도가 높은 문헌 검색]을 실시하자는 취지다. 증거의 무게나 품질을 평가할 요건이 없고, 그 폭과 세부사항breadth and detail만 있을 뿐이다. 범위 연구 목적에 대한 개별 연구 연구의 목적적합성 또는 효용성은 일반 기준을 설정한 후 임시로 판단한다.

Scoping study goals are broad and flexible. The inclusive goal is to identify a wide variety of potentially relevant research studies without regard to design, measurement, statistical methods, or qualities of the research presentation. In epidemiological terms, the intent is to conduct a sensitive rather than a specific literature search. There is no requirement to assess the weight or quality of evidence, just its breadth and detail. The relevance or utility of individual research studies to the purpose of a scoping study is judged post hoc, after general criteria are set.


4단계(데이터 차트) 및 5단계(모으기, 요약 및 보고서 결과)는 범위 지정 연구에 특히 고유하다

Step four (chart the data) and step five (collate, summarize, and report results) are especially unique to scoping studies. 

    • 차트 작성은 검토 문제와 [관련된 문헌의 범위와 특징을 파악]하기 위해 전문가와 초기 검색 및 토론을 바탕으로 문헌 "맵"을 작성하는 것을 포함한다. "이 지도는 (지질 지도처럼) 여러 층으로 이루어져 있을 가능성이 높다. 왜냐하면, 과학과 이론적 지향이 다른 연구자들은 같은 현상을 다른 방법으로 연구했을 것으로 예상할 수 있기 때문이다."

    • 범위 보고서 작성, 5단계는 규칙이 없다. 대신 관련 문헌의 분량에 따라 원고의 구조, 내용, 길이가 결정된다. 범위 지정 연구 방법론에 대한 자세한 내용은 Levac과 동료들을 통해 확인할 수 있다.

    • Charting involves creating a literature “map” based on early searching and discussion with experts to identify the range and features of literature relevant to the review question. “The map is likely to be multi-layered (like a geological map), since researchers from different . . . sciences and with differing theoretical orientations can be expected to have studied the same phenomenon in different ways.”63 

    • Writing the scoping report, step five, is not rule governed. Instead, the structure, content, and length of the manuscript are determined by the volume of relevant literature.64 More details about scoping study methodology are available from Levac and colleagues.65


비판현실주의

Critical-realist


통합적 학문에 대한 비판적 현실주의 전통은 서술적, 체계적, 범위적 검토 방법이 혼합된 것이다. 비판적 현실주의 접근법은 [전문적인 판단과 엄격한 방법론]에 동시에 의존한다. Rycroft-Malone과 동료 66은 "현실주의 검토는 [개입이 작용하는 메커니즘을 이해하고 푸는 데 초점]을 맞추고 있으며, 따라서 개입이 어떻게 작용하는지에 대한 판단과는 달리 설명을 제공한다. 현실주의적 접근방식은 근본적으로 이론 개발과 정교함에 관련 문헌을 체계적이고 투명하게 합성하는 과정에서 [결과뿐만 아니라 맥락도 고려]한다." 더욱이 "현실주의적 접근법은 특히 복잡한 구현 개입에 대한 증거의 종합에 적합하다."

A critical-realist tradition for integrative scholarship is a hybrid of the narrative, systematic, and scoping review methods. The critical-realist approach relies simultaneously on both professional judgment and rigorous methodology. Rycroft-Malone and colleagues66 teach that “A realist review focuses on understanding and unpacking the mechanisms by which an intervention works (or fails to work), thereby providing an explanation, as opposed to a judgment about how it works. The realist approach is fundamentally concerned with theory development and refinement, accounting for context as well as outcomes in the process of systematically and transparently synthesizing relevant literature.” Moreover, “the realist approach is particularly suited to the synthesis of evidence about complex implementation interventions.”


비판적 현실주의 틀 안에서 수행되는 통합적 학술연구는 "개입은 이론(적)이다; 중재는 우리가 X를 이런 식으로 하면 결과를 가져올 것이다"라는 생각에 근거를 두고 있다. 또한, "실제론적 합성은 다른 상황적 구성 내에서 '무엇이 작용하는지'를 밝혀내는 것과 관련이 있기 때문에, 결과 모델은 결과에 초점을 맞추어야outcome focused 한다."66

Integrative scholarship performed within a critical-realist framework is grounded in the idea that “an intervention is a theory; because interventions are implemented on a hypothesis of if we do X in this way, then it will bring about an outcome.” In addition, “the resultant model must be outcome focused because a realist synthesis is concerned with uncovering ‘what works’ within differing contextual configurations.”66


비판적 현실주의 연구 합성을 수행하는 데 사용되는 방법은 계획적이고 단계적이며, 체계적 검토에 필요한 단계와 유사하지만 동일하지는 않다. 비판적 현실주의자 검토의 방법론적 절차는 4단계, 즉 Rycroft-Malone과 동료 66 및 Pawson.67에 의해 설명되는 보조 조치를 갖는 2단계와 같은 4단계와 관련이 있다.

The methods used to conduct a critical- realist research synthesis are planful and stepwise, similar but not identical to the steps needed for a systematic review. The methodological procedures for a critical- realist review involve four steps, two having subsidiary actions as articulated by Rycroft-Malone and colleagues66 and Pawson.67 The four steps are:


1. 검토의 범위 정의: 

• 질문을 식별한다. 

• 검토 목적을 명확히 한다. 

• 프로그램 이론을 찾고 명확하게 표현한다. 

1. Define the scope of the review: 

• identify the question, 

• clarify the review purpose(s), 

• find and articulate program theories; 


2. 증거를 찾고 평가한다. 

• 증거를 찾아라, 

• 시험 관련성; 

2. Search for and appraise the evidence: 

• search for evidence, 

• test relevance; 


3. 소견 추출 및 합성 

3. Extract and synthesize findings; and 


4. 서사를 전개하다.

4. Develop a narrative.


통합적 학술활동으로서, 비판적 현실주의 및 체계적 접근방식의 한 가지 중요한 차이점은 [비판적 현실주의 전통에서의 데이터 합성이 반복적이고 질적]이라는 점이다. "네 가지 차원에 관한 연구: 

    • 이론의 진실성integrity에 의문을 제기하고 

    • 경쟁하는 이론들 사이에서 판단을 내리고,

    • 동등한 환경에서 동일한 이론을 고려하거나, 

    • '공식적' 이론과 '실제' 실천을 비교하는 것

One key distinction between the critical- realist and systematic approaches to integrative scholarship is that data synthesis in the critical-realist tradition is iterative and qualitative, “focus[ing] on four dimensions: 

    • questioning the integrity of a theory, 

    • adjudicating between competing theories, 

    • considering the same theory in comparative settings, or 

    • comparing the ‘official’ theory with actual practice.”66 


비판적 현실주의 모드에서 정량적 데이터 분석은 통합적 학술연구의 특징이 아니다.

Quantitative data analysis is not a feature of integrative scholarship in the critical-realist mode.


이러한 생각들은 포슨과 동료들이 지지하는 "현실주의 검토" 전술tactic과 함께 문헌 합성에 대한 노만과 에바의 "비판적 검토" 접근법에 부합한다. Eva는 다음과 같이 말한다. 

"좋은 교육 연구 문헌 리뷰는 다양한 문헌의 중요한 종합을 제시하고, 잘 확립된 지식을 파악하며, 이해의 격차를 강조하고, 이해해야 할 부분에 대한 지침을 제공하는 것이다. 그 결과는 오래된 문제에 대한 새로운 관점을 제시해야 한다. 저자는 문학(그리고 그 안의 다양한 관점)을 공정하게 대표하려고 노력하는 도덕적 규범에 따른다는 생각을 해야 하지만, 절대적인 체계성을 가장할guise 필요는 없다." 

Pawson 등은 그 주장에 동의한다. 

"검토review 질문은 어떤 측면의 개입이 검토될 것인지 우선순위를 정할 수 있도록 주의 깊게 설명되어야 한다."

These ideas conform with Norman and Eva’s68 “critical review” approach to literature synthesis along with the “realist review” tactic espoused by Pawson and colleagues.57,67 Eva69 states: 

“A good educational research literature review … is one that presents a critical synthesis of a variety of literatures, identifies knowledge that is well established, highlights gaps in understanding, and provides some guidance regarding what remains to be understood. The result should give a new perspective of an old problem…. The author … should feel bound by a moral code to try to represent the literature (and the various perspectives therein) fairly, but need not adopt a guise of absolute systematicity.” 

Pawson et al57 agree with the assertion, 

“the review question must be carefully articulated so as to prioritise which aspects of which interventions will be examined.”


공개 피어 해설

Open peer commentary


통합적 학술연구의 수단으로서의 공개 동료 해설 형식은 보건직 교육에서 참신하다. 일반적인 접근방식은 저널 편집자(또는 편집위원)가 자극적이거나, 논란이 있거나, 학술 분야의 과학이나 연구분야를 선도하는 "표적 기사"를 요청하거나 위촉하는 것이다. 타겟 기사는 동료 검토, 아마도 수정을 거쳐 출판된다. 대상 기사는 그 방법, 내용 또는 결론을 승인, 반박, 증폭 또는 세분화할 수 있는 광범위한 공개 동료 논평(또한 비판적 검토)이 뒤따른다. 이어 대상 기사의 작성자는 반박, 요약 발언, 논평 등의 형태로 최종 발언권을 갖는다. 그 결과는 포화, 다양한 관점, 활발한 분열을 통한 통합적 학술물이다. 그것은 때로는 아이러니나 유머로 가득 찬 위대한 작업물에 기여한다.

The open peer commentary format as a means of integrative scholarship is novel in health professions education. The general approach is for a journal editor (or editorial board) to solicit or commission a “target article” that is provocative, controversial, or at the leading edge of science or scholarship in an academic field. The target article undergoes peer review, perhaps revision, and is published. The target article is followed by a wide-ranging series of open peer commentaries (also critically reviewed) that may endorse, refute, amplify, or refine its methods, substance, or conclusions. The author of the target article then has final say in the form of rebuttal, summary remarks, and comments. The result is integrative scholarship via saturation, diverse perspectives, and spirited disputation. It also contributes to great reading, sometimes spiked with irony or humor.


행동 및 뇌과학(BBS)은 다른 학술지(예: American Journal of Biothics, Sychical Bulletin)가 가끔 사용하지만 개방형 동료 논평 형식을 특징으로 가장 잘 알려진 학술지다.

Behavioral and Brain Sciences (BBS) is the scholarly journal best known for featuring the open peer commentary format, although other journals (e.g., American Journal of Bioethics, Psychological Bulletin) use it occasionally.


통합 장학금 심사

Judging Integrative Scholarship


통합 장학금 수행에 대한 다섯 가지 보완적 접근방식은 본 연구의 품질, 유용성 및 가치를 판단하는 데 사용되는 기준도 달라야 한다고 제안한다. 중점 평가 지침은 표 1의 행과 셀에 제시되어 있다.

The five complementary approaches to the conduct of integrative scholarship suggest that criteria used to judge the quality, utility, and value of this work should also vary. Focused evaluation guidelines are given in the rows and cells of Table 1.


Rows은 현대 학자들이 제안한 3개 항목에서 27개 항목으로 표현되는 통합 장학금에 대한 평가 기준과 보고 규약을 증류한 것이다. 이러한 평가 지침은 글래틱 등이 제안한 장학금 평가의 일반적 기준을 보완하지만 중복하지는 않는다.74: 명확한 목표, 적절한 준비, 적절한 방법, 중요한 결과, 효과적인 발표 및 성찰적 비평.

The rows10,25 are a distillate of evaluation criteria and reporting conventions for integrative scholarship expressed as lists ranging from 3 to 27 items proposed by contemporary scholars.31,33,39,48,53,62,66,72 These evaluation guidelines complement but do not duplicate the six generic criteria for evaluating scholarship proposed by Glassick et al74: 

  • clear goals, 

  • adequate preparation, 

  • appropriate methods, 

  • significant results, 

  • effective presentation, and 

  • reflective critique.


표 1에서 앞서 설명한 요약본은 통합적 학술물을 판단하는 것은 [체계적 검토나 비판적-현실주의 검토]의 경우처럼, 연구 종합에 대한 접근방식이 단계적이고, 규칙기반rule governed인 경우 비교적 간단하며 아마도 공식적일 수 있음을 시사한다. 이러한 검토를 위해 통합 장학금의 질과 효용성에 대한 판단은 체크리스트를 통해 원고가 선행 기준과 보고 기준을 충족하는지 여부를 판단할 수 있다. 예를 들어 PRISMA 체크리스트 또는 RAMESES의 비판적 현실주의자 합성을 위한 간행물 표준과 같은 것.

The summary advanced by Table 1 suggests that judging integrative scholarship is relatively straightforward, perhaps formulaic, when the approach to research synthesis is stepwise and rule governed, as is the case for systematic and critical-realist reviews. For these reviews, judgments about the quality and utility of integrative scholarship can be guided by checklists to gauge whether a manuscript fulfills a priori criteria and reporting standards such as the PRISMA checklist53 or the RAMESES (Realist and Meta- narrative Evidence Syntheses: Evolving Standards) publication standards for critical-realist syntheses.75


[서술형, 범위형, 개방형 동료 해설] 프레임워크를 사용하여 수행되는 통합형 학술연구의 질과 효용성에 대한 판단은 증거, 기준, 보고 표준의 규칙이 자주 불투명하기 때문에 더욱 어렵다. 평가자 또는 저널 심판은 이러한 작업을 평가할 때 전문가적 판단을 내릴 것으로 예상되며, 교육적 감식자 역할을 할 것으로 예상된다.76 이러한 상황에서 통합적 장학금에 대한 평가는 평가 대상 작업과 유사하게 특이하고 표준화되지 않을 가능성이 높다.

Judgments about the quality and utility of integrative scholarship performed using the narrative, scoping, and open peer commentary frameworks are more difficult to render because the rules of evidence, criteria, and reporting standards are frequently opaque. The evaluator or journal referee is expected to exercise expert judgment when evaluating such work, to act as an educational connoisseur.76 Evaluations of integrative scholarship under these circumstances will likely be idiosyncratic and unstandardized, similar to the work being judged.


의료 및 보건 전문직 교육의 통합적 학술연구는 고정된static "쿠키 커터" 사고방식을 사용하여 수행되어서는 안 되며, 그 퀄리티와 효용성에 대한 평가도 해서는 안 된다. 통합형 학술연구의 가치를 판단하는 것은 그 질과 효용을 평가하는 것과는 매우 다르다. 가치에 대한 판단은 개인적, 직업적, 국가적 우선 순위에 의해 좌우된다. 가치판단은 종종 암묵적이거나 묵시적이고tacit or occult, 거의 인정받지 못하더라도 항상 과학과 학문의 핵심에 있다. 학자들의 공동체로서 우리는 동료들을 초대하여 그들의 원고에 보고된 독창적이고 통합적인 장학금의 행위의 기초가 되는 가치를 표현하기를 원할 것이다.

Integrative scholarship in medical and health professions education must not be performed using a static, “cookie cutter” mentality, and neither should evaluations of its quality and utility. Judging the value of integrative scholarship is very different than evaluating its quality and utility. Judgments about value are governed by personal, professional, and national priorities. Value judgments, often tacit or occult, are always at the heart of science and scholarship even though they are rarely acknowledged. As a community of scholars we may wish to invite colleagues to express the values that underlie the conduct of original and integrative scholarship reported in their manuscripts.






. 2015 Mar;90(3):294-302.
 doi: 10.1097/ACM.0000000000000585.

Varieties of integrative scholarship: why rules of evidence, criteria, and standards matter

Affiliations 

Affiliation

  • 1Dr. McGaghie is director, Ralph P. Leischner Jr., MD Institute for Medical Education, vice chair, Department of Medical Education, and professor of medical education, Loyola University Chicago Stritch School of Medicine, Maywood, Illinois.

Abstract

Integrative scholarship involves the aggregation of data and evidence in a way that allows the research community to comprehend and value the connections and perspectives that unite isolated facts and research studies. Integrative scholarship summarizes data, enlightens and informs readers broadly, and sets the stage for subsequent research. This article describes five approaches to integrative scholarship--narrative, systematic, scoping, critical-realist, open peer commentary--and argues that each approach uses different methods and rules of evidence to combine data and report their meaning. Different forms of integrative scholarship use methods, criteria, and standards that are matched to the integrative approach and data being evaluated. There is no one best strategy to conduct or judge integrative scholarship. Researchers who perform integrative scholarship should openly express the values that underlie their work.


의학교육연구에서 복잡성 과학의 현 상태는? (Med Educ, 2019)

What is the state of complexity science in medical education research?

Sayra Cristancho,1,2,3 Emily Field1,4 & Lorelei Lingard1,3,5




도입 

INTRODUCTION


세상이 예전보다 복잡하다는 주장은 우리 포스트모던 사회에서 받아들여진 진실이 되었다. 예는 무궁무진하다. 

  • 조직의 리더십이 더 복잡함, 1–3 

  • 경제 무역은 더 복잡하고, 4–6 

  • 통신 기술은 더 복잡하다, 7,8 

  • 정부 정책은 더 복잡하다,9-11 

  • 사회관계는 더 복잡하고, 12,13 그리고 

  • 의료는 더 복잡하다.14-16 

The claim that the world is more complex than it used to be has become accepted truth in our postmodern society. The examples are endless: organisational leadership is more complex,1–3 economic trade is more complex,4–6 communication technology is more complex,7,8 government policy is more complex,9–11 social relations are more complex,12,13 and health care is more complex.14–16 


의학 교육에서 이는 [우리가 점점 더 복잡해지는 환자, 조직적, 문화적 힘의 맥락에서 유능한 전문 인력을 양성해야 하는 도전에 직면하고 있다]는 것을 의미한다.

In medical education, this means that we are faced with the challenge of developing capable professionals in the context of increasingly complex patient, organisational and cultural forces.


복잡성 과학은 시스템을 조사examine하는 방법으로 약 50년 전에 나타났다. 서로 다른 학문들이 복잡성에 대한 그들의 글에서 다른 진화의 단계에 있다. 비록 어떤 이들은 복잡성이 하나의 근원을 가지고 있는지 아닌지에 대한 문제(즉, 복잡성 대 단순성)에 대해 여전히 고심하고 있지만, 다른 이들은 복잡성의 다중성을 인식하고 수용했다. 우리 논문은 의학교육이 전자의 입장에서 후자의 입장으로 나아가는 것을 옹호할 것이다.

Complexity science emerged around five decades ago as a way to examine systems. Different disciplines are at different stages of evolution in their writings about complexity. Although some are still grappling with the question of whether complexity has a single origin or not (i.e. complexity versus simplicity), others have recognised and embraced its multiplicity. Our paper will advocate for medical education to move from the former stance to the latter.


우리 합성의 장을 마련하기 위해 우리는 다음과 같은 세 가지 학문적 개요에 대한 복잡성 과학 도면을 간략히 소개할 것이다. 

  • 멜라니 미첼의 학문에 걸친 복잡성 과학의 역사; 

  • 브라이언 카스텔라니(Brian Castellani)의 복잡성 과학의 진화에 대한 일시적 설명, 

  • 스티븐 맨슨의 복잡성 과학에 대한 많은 접근에 대한 개념화(Three main orientations)와 관련된 세 가지 주요 방향과 관련된 것이다.

To set the stage for our synthesis, we will briefly introduce complexity science drawing on three scholarly overviews: 

  • Melanie Mitchell’s history of complexity science across the disciplines; 

  • Brian Castellani’s temporal description of the evolution of complexity science, and 

  • Steven Manson’s conceptualisation of the many approaches to complexity science as pertaining to three main orientations.


미첼의 역사는 [복잡한 시스템을 지배하는 공통 원리에 대한 탐구]가 [1940년대 전통적인 환원주의적 접근법이 날씨 예측 불가능성, 살아있는 유기체의 적응성, 사회의 비선형적 행동과 같은 현상을 적절히 설명할 수 없게 되면서] 두드러지기 시작했다고 설명한다.두 명의 핵심 과학자가 이러한 시작을 알렸다. 수학자 노르베르트 비너와 생물학자 루드비히 폰 베르탈란피는 각각 사이버네틱스와 일반 시스템 이론의 학문을 발전시켰다. 이 두 가지 노력이 함께 현재 복잡성 과학으로 알려진 것의 뿌리를 형성했다.18

Mitchell’s history explains that the search for common principles governing complex systems began to take prominence in the 1940s when conventional, reductionist approaches were unable to adequately explain phenomena like the unpredictability of weather, the adaptive nature of living organisms and the non-linear behaviour of societies.17 Two key scientists marked these beginnings: the mathematician Norbert Wiener and the biologist Ludwig von Bertalanffy, who gave rise, respectively, to the disciplines of cybernetics and general systems theory. Together, these two efforts formed the roots of what is now known as complexity science.18


카스텔라니의 연대표는 이러한 뿌리에 기초하여 1940년부터 1950년대까지 복잡과학의 역사적 진화를 지도로 그리고 있다(그림 1).19 그의 지도는 복잡한 과학을 다양한 징계와 인식론적 배경의 학자들이 시너지 효과를 발휘하여 복잡한 시스템의 연구를 지도하는 이론과 개념, 방법의 진화하는 도구 키트를 만들어 내는 네트워크의 산물로 묘사하고 있다.

Castellani’s timeline builds on these roots to map the historical evolution of complexity science from 1940 to the 1950s to the present (Fig. 1).19 His map depicts complexity science as the product of a network of scholars from various disciplinary and epistemological backgrounds working synergistically to create an ever-evolving toolkit of theories, concepts and methods to guide the study of complex systems.



이러한 다양성을 고려해 볼 때, 다른 작가들은 복잡성 이론의 많은 용도에 대한 개요를 제공했다. 예를 들어 리처드슨 외 연구진 20,21은 복잡성에 대한 한 가지 사고방식은 각각 '단단한hard' 복잡성 과학, '부드러운soft' 복잡성 과학 및 그 사이의 어떤 것으로서 3개의 광범위한 사고방식에 관한 것이라고 제안했는데, 이를 '복잡성 사고'라고 한다.

Given this diversity, different authors have offered overviews of the many uses of complexity theory. For instance, Richardson et al.20,21 have suggested that one way of thinking about complexity is in terms of three broad schools of thought as, respectively, ‘hard’ complexity science, ‘soft’ complexity science and something in between, which they call ‘complexity thinking’.


본 논문의 경우, 의료 교육계의 학제간 노력에 귀중한 징계 기원에 대한 명시적인 주의를 제공하기 때문에 만슨의 프레임워크로부터 출발한다.22 만슨의 프레임워크는 [복잡성에 대한 어떤 특정한 정의도 원래 학문의 관점의 색깔에 바탕을 두게 된다]는 전제를 갖는다. 이와 같이, 그는 학문적 동기, 반복적인 정의 용어 및 인식론적 가정을 바탕으로 복잡성 과학 접근방식을 체계화한다,23.

For this paper, we draw on Manson’s framework as it offers explicit attention to disciplinary origins that will be valuable to the interdisciplinary endeavour of the medical education community.22 Manson’s framework is guided by the premise that any particular definition of complexity is coloured by the perspective of the original discipline. As such, he clusters complexity science approaches based on disciplinary motivations, recurring definitional terms and epistemological assumptions,23


Manson은 복잡성 과학에 대한 [세 가지 접근방식]을 개념화한다: 

  • 알고리즘(수학의 기원), 

  • 결정론적(물리학의 기원), 

  • 집합적(생물학의 기원).22 

세 가지 접근법 모두 시스템의 특성이 비저감적 방식으로 구성 요소를 참조하여 특성화하는 방법과 관련이 있다.

Manson conceptualises three approaches to complexity science: 

  • algorithmic (origins in mathematics); 

  • deterministic (origins in physics), and 

  • aggregate (origins in biology).22 

All three approaches are concerned with how the nature of a system may be characterised with reference to its constituent parts in a non-reductionist manner.


[알고리즘 복잡성]은 시스템의 행동을 재현할 수 있는 수학적, 계산적 문제를 해결하는 데 초점을 맞춘다. 알고리즘 복잡성은 정보를 처리하는 뇌의 용량과 같은 물리적 현상의 알고리즘적 표현을 만드는 데 유용하지만, 환경적, 기계적, 사회적 현상을 나타낼 때는 부족하다.

Algorithmic complexity focuses on solving mathematical and computational problems that can reproduce the behaviour of a system. Algorithmic complexity is useful for creating algorithmic representations of physical phenomena such as the capacity of the brain to process information, but it falls short when representing environmental, mechanical or social phenomena.


[결정론적 복잡성]환경적 또는 기계적 현상을 나타내기 위해 필요한 피드백, attractors, nesting 및 결정론적 방정식의 개념을 포함한다. 그 목표는 시스템의 정량화를 위해 방정식을 사용하여 시스템의 정체성 또는 역학을 예측하는 것이다. 따라서, 그것은 실증주의적 전통을 반영한다. 결정론적 복잡성은 작은 방정식의 몇 가지 핵심 변수들이 시스템을 설명할 수 있다는 생각에 의존한다. 예를 들어 로봇 수술의 경우 로봇의 역학을 예측하기 위해 위치, 힘 및 속도 변수가 필요하다.

Deterministic complexity incorporates the notions of feedback, attractors, nesting and deterministic equations that are necessary to represent environmental or mechanical phenomena. Its goal is to predict a system’s identity or dynamics by using equations to quantify the system; hence, it reflects a positivist tradition. Deterministic complexity relies on the idea that a few key variables in a small set of equations can describe the system. For example, in the case of robotic surgery, position, force and velocity variables are necessary to predict the robot’s dynamics.


사회현상을 결정론적 방정식을 통해서 보는 것은 (종종 인간의 행동의 예측 불가능성 때문에) 너무 단순화되기 때문에, [총체적 복잡성]은 보다 전체적인 표현을 제공하려고 시도한다. 이를 위해, [총체적 복잡성]은 또한 알고리즘 및 결정론적 복잡성과 마찬가지로 피드백과 비선형성에 의존하지만, 다음과 같은 다른 상호 관련 개념들을 추가한다. 

  • 엔티티 간의 관계 

  • 내부 구조 및 주변 환경 

  • 학습과 새로운 행동, 

  • 변화와 성장. 

As the characterising of social phenomena via deterministic equations is often too simplistic because of the unpredictability of human behaviour, aggregate complexity attempts to offer more holistic representations. To do this, aggregate complexity also relies on feedback and non-linearity as do algorithmic and deterministic complexities, but adds another set of interrelated concepts: 

relationships between entities; 

internal structure and surrounding environment; 

learning and emerging behaviour, and 

change and growth. 


총체적 복잡성은 [다양한 요소의 상호작용에 의해 시스템이 생성되는 방법]에 더 관심이 있고 변수 측정에는 관심이 더 적은 편이다. 이러한 목적을 위해, 종합적 복잡성은 부품들 간의 상호작용에서 비롯되는 결과를 적응시키고 학습하기 위한 시스템의 행동을 이해하고 설명하려고 한다. 따라서, 그것은 [구성주의적 전통]을 반영한다.

Aggregate complexity is more interested in how systems are created by interactions of the various elements and less in measuring variables. To this end, aggregate complexity seeks to understand and describe a system’s behaviours to adapt and learn that result from interactions among parts; hence, it reflects a constructivist tradition.


[총체적 복잡성]은 임상 팀과 같은 시스템을 연구하는데 적절할 것이며, 이는 [개별 구성원]과 [그들의 관계]에 의해 크게 추진된다. 예를 들어, 팀 구성원 개개인은 자신의 역할, 업무 일정, 병원 계층 내의 위치, 환자들과의 상호 작용에 의해 정의된 관계를 가지고 있다. 총체적 복잡성에서, 특히 중요한 한 가지 특징은 [자기 조직]이다. 시스템의 요소들이 시스템 전체의 구조와 행동을 더 잘 조정하여 업무를 더 잘 수행할 수 있도록 하는 방식으로 그들의 관계를 변화시킨다.

Aggregate complexity would be appropriate for studying systems like clinical teams, which are driven to a great extent by the individual members and their relationships. For example, individual team members have relationships defined by their roles, their work schedules, their place within the hospital hierarchy and their interactions with patients, to name a few. In aggregate complexity, one particularly important feature is self-organisation, in which elements of a system change their relationships in ways that enable the system as a whole to adapt its structure and behaviour to better accomplish its work.


복잡성에 대한 세 가지 방향성을 종합하면, 만손에 의해 기술된 바와 같이, 배타적인 방법이 아닌 보완적인 방법으로 복잡성 사상을 사용할 수 있는 기회를 제시한다. Manson의 방향은 복잡한 시스템을 이해하려면 접근법과 관점 사이의 삼각측정이 필요하다는 것을 암시하는 인식론적 관점의 범위를 수용한다.

Taken together, the three orientations to complexity, as described by Manson,22 present an opportunity for using complexity ideas in a complementary rather than an exclusive way. Manson’s orientations accommodate a range of epistemological perspectives which suggest that understanding complex systems requires triangulation among approaches and viewpoints.


'복잡성'은 의학 교육에서 '신(神) 용어'로 빠르게 자리 잡고 있다(그림 2). 이 논문은 의학 교육이 학문적 연구에서 어떻게 복잡한 생각을 가져왔는지 탐구하고자 한다. 우리는 복잡성 원리의 사용 패턴을 설명하고, 우리 분야에서 '복잡한' 현상에 대한 학술적 대화를 진전시키는 능력에 대해 그러한 패턴의 결과를 고려하는 것을 목표로 한다.

‘Complexity’ is fast becoming a ‘god term’ in medical education (Fig. 2). This paper seeks to explore how medical education has taken up complexity ideas in scholarly research. We aim to describe the patterns of use of complexity principles and to consider the consequences of those patterns for our ability to advance scholarly conversations about ‘complex’ phenomena in our field.



문헌을 찾아서

IN SEARCH OF THE LITERATURE


우리의 문헌 조사에는 두 가지 단계가 포함되어 있었다. 1단계에서는 보건과학과 의학교육 문헌 모두에서 14개의 검토 및 의견서를 사용하여 이러한 분야의 복잡성 과학의 외관을 지도화했다. 2단계에서는 의학 교육 연구에서 복잡성 과학의 현재 이론적 방향과 적용을 식별하기 위해 추가 문헌을 통합한다.

Our search of the literature involved two phases. In Phase 1, we used 14 review and opinion papers in both the health sciences and medical education literatures to map the appearance of complexity science in these fields. In Phase 2, we synthesised additional literature to identify the current theoretical orientations and applications of complexity science in medical education research.


우리는 만슨의 프레임워크22와 다음과 같은 질문을 사용하여 우리의 합성을 이끌었다.

We used Manson’s framework22 and the following questions to guide our synthesis:


  • 1 저자들은 복잡성을 어떻게 활용하고 있는가? 그들의 이론적 성향은 어떠한가?

  • 2 다른 저자들의 개념화와 복잡성 과학의 사용 사이에 어떤 긴장감이나 유사성이 있는가?

  • 3 저자들은 복잡성 과학의 용도를 찾기 위해 주로 누구의 작품을 인용하는가?

1 How are the authors using complexity? What are their theoretical orientations?

2 What are the tensions or similarities between different authors’ conceptualisations and uses of complexity science?

3 Whose work do the authors primarily cite to locate their use of complexity science?



보건과학과 의료교육에서 복잡성 과학이 등장한 것은 언제인가?

WHEN DID COMPLEXITY SCIENCE EMERGE IN THE HEALTH SCIENCES AND MEDICAL EDUCATION?


2001년에, BMJ는 의료 연구에 복잡성 이론을 도입하는 것을 명시적으로 목적으로 하는 특별호를 발행했다. 이 문제의 첫 번째 기사에서는 [모호한 경계, 적응, 비선형성, 예측 불가능성, 유치자 및 자기 조직]을 포함한 [복잡한 시스템을 이해하기 위한 원칙]을 간략히 설명하였다.24 특별호의 다른 기사에서는 이러한 원칙을 사용하여 임상실무, 조직적 리더십 및 교육에서 오랫동안 유지되어 온 가정에 도전하였다. 

  • 예를 들어 임상 실습에서 복잡성 이론은 질병이 단일 생리학적 시스템의 실패라는 생각에서 멀어져 질병은 여러 시스템 내부와 시스템 사이의 동적 상호작용에서 발생한다는 생각을 향한 이동을 뒷받침했다.

  • 리더십에서, 복잡성 이론은 조직을 고립된 부분들의 집합으로 생각하는 것에서 그 부분들 사이의 관계에 대한 생각으로 바꾸게 했다.

  • 교육에서 복잡성 이론은 정적 영역의 역량 강화에서 지식이 끊임없이 변화하는 영역에서 능력이나 적응을 위한 교육으로 초점을 전환하기 위해 사용되었다.

In 2001, The BMJ published a special issue with the explicit purpose of introducing complexity theory to health care research. The first article in the issue outlined the principles for understanding complex systems, including fuzzy boundaries, adaptation, non-linearity, unpredictability, attractors and self- organisation, among others.24 Other articles in the special issue used these principles to challenge long- held assumptions in clinical practice, organisational leadership and education. 

  • In clinical practice, for instance, complexity theory supported a move away from the idea that illness is a failure of a single physiological system, towards the idea that illness arises from dynamic interactions within and between multiple systems.25 

  • In leadership, complexity theory prompted a shift away from thinking of an organisation as a set of isolated parts to thinking in terms of relationships among those parts.

  • 26 In education, complexity theory was used to shift the focus from enhancing competence in static domains to educating for capability or adaptation in domains in which knowledge is everchanging.27


이번 BMJ 특집호에서는 21세기 의료 환경이 의료교육에 미치는 영향과 의사의 직업적 정체성에 대한 심도 있는 분석을 촉발했다.

  • 예를 들어, 급성 치료에서 만성 치료로 의료 관행이 변화함에 따라 병원 밖에서 더 많은 치료를 제공할 필요성이 생겨났다. 이 새로운 치료 모델은 의사가 새로운 전문적 가치(자율성/권위성/전문지식에서 상호의존성으로의 전환으로 표현됨)와 새로운 기대(의료 전문가의 가치에서 공공 전달자, 지도자, 관리자, 옹호자, 교육자, 연구자, 모두 동시에 경력 시작부터 수용하도록 요구한다.

  • 이러한 새로운 기대에 대응하여, 교수 초점의 변화도 일어났다. 여기서 '바이오메디컬 과학'의 전경은 '의료 교육'의 전경에 자리를 내주었고, 그 결과 인문학이 의료 커리큘럼에 포함되었다.

This special issue of The BMJ precipitated in-depth analyses of the influence of the complex 21st century health care environment on medical education and the professional identity of physicians.28–30 

  • For instance, the changes in medical practice from acute to chronic care have created the need to provide more care outside the hospital.31,32 This new care model requires physicians to embrace new professional values (represented by a shift from autonomy/authority/ expertise to interdependency)33 and new expectations (from that of a medical expert to those of a public communicator, leader, manager, advocate, educator, researcher, all at the same time and from the start of a career).34

  •  In response to these new expectations, a change in teaching focus also occurred, whereby the foregrounding of ‘biomedical science’ gave way to the foregrounding of ‘competency-based education’, which resulted in the inclusion of humanities in medical curricula.


2010년대 초, 의료 교육 연구에 복잡성에 관한 언어가 나타나기 시작한다.

In the early 2010s, complexity language begins to appear in medical education research.


의료 교육 연구는 복잡성 과학을 어떻게 사용하는가?

HOW DOES MEDICAL EDUCATION RESEARCH USE COMPLEXITY SCIENCE?


분석하는 동안 의료 교육 연구에서 복잡성 이론의 사용에서 네 가지 패턴을 확인했다. 

  • 째, 복잡성 원리는 다양한 방법으로 설명된다

  • 둘째, 복잡성에 대한 다중 접근방식이 단일 논문에서 결합하여 사용된다

  • 셋째로, 과학이 사용하는 복잡성의 유형은 암묵적으로 방치되는 경향이 있다. 

  • 째, 사용되는 복잡성 방향은 일차 소스 인용보다는 이차 소스 인용문을 사용하는 것이 훨씬 일반적이다.

During our analysis, we identified four patterns in the use of complexity theories in medical education research. 

Firstly, complexity principles are described in a variety of ways. 

Secondly, multiple approaches to complexity are used in combination in single papers. 

Thirdly, the type of complexity science used tends to be left implicit. 

Fourthly, the complexity orientation used is much more commonly located using secondary source citation rather than primary source citation.


우리의 분석은 의료 교육 연구에서 복잡성 아이디어가 설명되어 온 다양한 방법을 보여준다. 일부 출판물은 그것의 기본 원칙이나 개념을 전혀 언급하지 않고 복잡성 과학을 유발한다. 예를 들어, 한 연구는 주치의의 역할에 대한 사고방식으로 복잡성 과학을 제시했지만, 역할에 적용될 수 있는 복잡성의 구체적인 원리에 대한 자세한 설명은 제공하지 않았다.44

Our analysis shows a variety of ways in which complexity ideas have been described in medical education research. Some publications invoke complexity science without making any mention of its basic principles or concepts. For instance, one study offered complexity science as a way of thinking about the role of the attending physician preceptor, but provided no elaboration of the specific principles of complexity that might apply to the role.44


다른 출판물들은 원리에 대하여 구어적colloquial 설명을 사용하면서 복잡성 과학을 묘사했지만, 그것들을 라벨로 표시하지는 않았다. 예를 들어 리더십에 대한 연구에서는 자기 조직화, 출현 및 피드백에 대한 개념이 예시를 통해 효과적으로 설명되었지만, 이러한 개념을 이론적 뿌리에 고정시키기 위한 명시적인 라벨링은 제공되지 않았다.45

Other publications described complexity science by using colloquial explanations of its principles, but not labelling them. For instance, in a study on leadership, notions of self-organisation, emergence and feedback were effectively illustrated through exemplars, but no explicit labelling was provided to anchor these notions to their theoretical roots.45


다른 경우에 복잡성 원칙은 맥락을 제공하기 위하여 라벨을 붙였지만 정의는 제공되지 않았다. 예를 들어, 시뮬레이션 교육을 알리기 위한 복잡성 이론의 사용에 대한 해설에는 관련 복잡성 원리의 목록이 포함되었지만 정의를 제공함으로써 자세히 설명하지는 않았다.39

In other instances, complexity principles were labelled to provide context but no definitions were provided. For instance, a commentary on the use of complexity theory to inform simulation education included a list of the relevant complexity principles but did not elaborate by providing definitions.39


마지막으로, 일부 간행물은 어떤 복잡성 원리를 선택하고 그 정의를 사용하여 현상을 설명했지만, 더 큰 복잡성 원리는 언급하지 않았다. 예를 들어, 한 논문에서는, 보건의료에서 리더십이 제정되는 방법의 역학관계를 설명하기 위해 등장 원리가 전초적으로 제시되었지만, 자기 조직화와 같은 다른 잠재적으로 관련이 있는 원칙은 언급되지 않았다.

Finally, some publications chose some complexity principles and used their definitions to illustrate a phenomenon, but did not mention the larger constellation of complexity principles. For instance, in one paper, the principle of emergence was foregrounded to describe the dynamics of how leadership is enacted in health care,46 but other potentially relevant principles such as self-organisation were not mentioned.


비록 우리는 만손의 프레임워크의 도움으로 많은 논문의 복잡성 방향을 유추할 수 있었지만, 이것들은 대부분 암묵적이었고 종종 방향성의 조합 패턴을 반영했다. 많은 출판물은 하나 이상의 이론적 방향을 암시하는 키워드나 언어를 사용했지만, 그 방향에 명시적으로 라벨을 붙이지 않았다.

Although we were able to infer many papers’ complexity orientations with the assistance of Manson’s framework,22 these were mostly implicit and often reflected a pattern of combination of orientations. Many publications used keywords or language suggestive of one or more theoretical orientations, but did not explicitly label that orientation.


다른 출판물들은 특정한 목적을 명시하지 않고 [복수의 오리엔테이션]을 반영하는 참고문헌을 인용했다. 예를 들어, 검토 논문은 임상적 맥락의 개념을 문제화하기 위해 서로 다른 방향의 주요 출처를 인용했다.48

Other publications cited references reflective of multiple orientations without explicitly indicating their particular purpose. For instance, a review paper cited primary sources from different orientations to problematise the notion of clinical context.48


우리는 또한 복잡한 과학을 사용하는 의학 교육 논문에서 인용의 두 가지 특징에 주목했다. 첫째로, 2차 출처는 1차 출처보다 더 일반적으로 인용되었다. 데이터 집합의 몇몇 논문 41,43,49–51은 복잡성의 정의에 대한 지원으로 2001 The BMJ series24 및 2011년 의학 교육 토론과 같은 독창적인 개념을 요약하고 개작한 논문을 인용했다. 2000년 이전부터 소수의 논문만이 1차 출처를 사용했다는 사실은 1차 출처와의 불충분한 관계를 시사한다. 둘째로, 인용문은 저자들이 복잡성 과학을 사용하는 방식에 항상 적절하거나 정확한 것은 아니었다.

We also noted two features of citation in medical education papers using complexity science. Firstly, secondary sources were cited more commonly than primary sources. Several papers41,43,49–51 in our dataset cited papers that summarised and adapted original concepts, such as the 2001 The BMJ series24 and the 2011 Medical Education debate,52,53 as support for their definitions of complexity. The fact that only a few papers used primary sources from before 200048,50,54 suggests insufficient engagement with primary sources. Secondly, citations were not always appropriate or accurate for the ways in which the authors were using complexity science.


이 사용의 의미는 무엇인가?

WHAT ARE THE IMPLICATIONS OF THIS USE?


우리는 네 가지 패턴을 개별적으로 설명했지만, 그것들이 서로 얽히고 상호 지지될 수 있다고 주장할 것이다. 복잡성 과학에 대한 그들의 접근방법에 대해 명시적인 저자는 거의 없으며, 이것은 부분적으로 왜 의료 교육 연구자들이 그것을 취하는 방식에 그러한 변화가 있는지 설명할 수 있다. 더욱이, 이러한 암묵성implicitness은 인식론적 일관성이 저자나 독자에게 즉각적으로 드러나지 않고 서로 다른 접근법을 결합할 수 있다는 것을 의미한다. 더욱이, 2차 원천 인용의 우위는 복잡성 지향 간의 구분을 더욱 모호하게 하며, 암묵적, 때로는 내부적으로 일관되지 않는 접근방식을 결합하여 허용한다.

We have described the four patterns individually, but we would argue that they may be entangled and mutually supporting. Few authors are explicit about their approach to complexity science, which may in part explain why there is such variation in the ways medical education researchers are taking it up. Furthermore, this implicitness means that different approaches can be combined without epistemological incoherence becoming immediately apparent to authors or readers. Moreover, the predominance of secondary source citation further obscures distinctions between complexity orientations and allows the implicit, and sometimes internally inconsistent, combining of approaches to persist.


그 자체로 다양성이 반드시 문제가 되는 것은 아니다. 우리가 서론에서 설명했듯이, 17 카스텔라니19와 맨슨, 22개의 복잡성 과학은 다중이다. 여러 학문에서 생겨났고, 그 지속적인 진화는 교차 훈련 수정에 의해 형성되기 때문에 그것의 기원을 식별하는 것은 간단하지 않다. 따라서 우리는 의학교육학자들이 일치시키는 특정한 복잡성 과학 접근법이나 혈통에 따라 복잡성 과학의 다양한 응용을 기대할 수 있을 것이다.

Variety in and of itself is not necessarily problematic. As we explained in the introduction, drawing on Mitchell,17 Castellani19 and Manson,22 complexity science is multiple. It is not straightforward to identify its origins because it emerged from multiple disciplines and its continued evolution is shaped by cross-discipline fertilisation. Therefore, we would expect to see a variety of applications of complexity science depending on the particular complexity science approach or lineage that medical education scholars align with.


그러나 무의식적인 다양성은 문제가 있다. 본 표본의 의학교육 논문이 복잡성 과학을 한 가지 방법으로 사용하는 명백한 선택을 거의 인정하지 않았다는 사실은 다음과 같은 질문을 던진다. 

우리 분야의 학자들은 복잡성 과학에 대해서 [특정한 학문적 기원에서 파생되어, 다른 은유에 의존하고 뚜렷한 목적을 가지고 있는] 여러 가지 합법적인 지향이 있다는 것을 이해하고 있는가

However, unconscious variety is problematic. That the medical education papers in our sample rarely acknowledged an explicit choice to use complexity science in one way versus another begs the question: 

Do scholars in our field understand that there are multiple legitimate orientations to complexity science, deriving from particular disciplinary origins, drawing on different metaphors and serving distinct purposes?


복잡성 과학이 복합적이라는 의식의 부재는 우리 분야를 연달은 문제적 결과로 만든다. 

  • 첫째로, 우리는 복잡성 과학이 특이하다고 가정할 수 있다: 즉, 그것을 할 수 있는 방법은 오직 하나뿐이다. 

  • 둘째로, 복잡성 과학이 단수적이라는 가정은 우리가 우리의 방식을 '올바른' 방법으로 인식하게 하고 다른 접근법을 부당한 것으로 무시하게 할 수 있다

  • 셋째로, 부당성illegitimacy에 대한 이러한 인식은 우리의 복잡성 과학에서 영감을 받은 연구에 대해 서로 생산적인 대화를 할 수 있는 우리의 능력을 제한할 수 있다.

An absence of conscious appreciation that complexity science is multiple sets our field up for a cascade of problematic consequences. 

  • Firstly, we may assume that complexity science is singular: that is, there is only one way to do it. 

  • Secondly, the assumption that complexity science is singular may cause us to perceive our way as the ‘right’ way and to disregard other approaches as illegitimate. 

  • Thirdly, this perception of illegitimacy may limit our ability to enter into productive dialogue with one another about our complexity science-inspired research.


보건과학과 의학교육의 최근 두 토론이 그 예다. 각각의 토론은 복잡성 과학의 부당한 사용에 대한 비난에 초점을 맞췄다.

Two recent debates in the health sciences and medical education are illustrative. Each debate centred on an accusation of the illegitimate use of complexity science.


[건강과학 논쟁]에서, 팰리는 '건강관리 문헌에서 일반적으로 복잡성이 해석되는 방법은 복잡성 이론의 모든 요점을 놓치고 있다'고 주장하면서, 건강 연구자들에 의한 복잡성 과학의 '전유appropriation'를 비난했다.56 페일리는 '수학적 개념을 심리학화psychologising'하거나 '자기조직화를 다른 것으로 재해석하는' 유혹에 빠진 사람들을 바로잡을 '과격한 수정'을 요구했다. 

In the health sciences debate, Paley decried the ‘appropriation’ of complexity science by health researchers, claiming that ‘the way in which complexity is usually interpreted in the health care literature misses the whole point of complexity theory’.56 Paley called for ‘a radical amendment’ that would correct those who ‘succumb to temptation[s]’ such as ‘psychologising mathematical concepts’ and ‘reinterpret[ing] “self- organisation” [to] make it mean something else’.56


[의학 교육 논쟁]에서 노르만52는 의료 교육 현상을 묘사하기 위해 '복잡성'과 '카오스'라는 용어를 사용하는 것에 반대했다. 그는 '정확히 하는 것이 반드시 필요하다'고 주장하면서 '카오스라는 단어는 어떻게든 우리 주변의 세계에서 우리가 관찰하는 복잡성에 대한 설명을 제공해 준다는 것을 상상하는 것은 호소력이 있지만 (교육에서의 발생을 설명하는 은유로서 우리가 그것을 사용한다면) 물리적 이론으로서의 '카오스'는 매우 구체적인 조건들을 가지고 있다.' 라고 경고했다. 

In the medical education debate, Norman52 objected to the use of the terms ‘complexity’ and ‘chaos’ to describe medical education phenomena. Asserting that ‘it is imperative to get it right’, he cautioned that ‘although it is appealing to envision that chaos somehow affords an explanation for the complexities we observe in the world around us (particularly if we use it as a metaphor by which to explain occurrences in education), chaos as a physical theory has some very specific conditions’.52


Paley56과 Norman52 둘 다 복잡한 과학을 사용하는 학자들이 자신의 용어를 신중하게 정의해야 할 필요성에 주목했다. 또한, 그들은 복잡성 과학을 단수라고 보기 때문에 - Paley는 수학적 과학으로, Norman은 물리 과학으로 - 두 저자는 그러한 용어를 사용하는 단 하나의 올바른 방법을 주장하였다.

Both Paley56 and Norman52 drew attention to the need for scholars using complexity science to define their terms carefully. Further, because they viewed complexity science as singular – for Paley a mathematical science and for Norman a physical science – both authors asserted a single correct way to use those terms.


복잡한 과학을 불법적으로 사용했다는 이러한 비난에 대해 그린할그 외 연구진 57명과 레게르53은 용어의 정밀성이 중요하다는 데 동의했다. 그러나 그들은 또한 복잡성 과학 개념을 보건 서비스와 교육 환경에서 현상을 설명하기 위해 적용할 수 있고 적용되어야 한다고 주장했다.

Responding to these accusations that they had used complexity science illegitimately, Greenhalgh et al.57 and Regehr53 both agreed that precision of terms is important. However, they also insisted that complexity science concepts can and should be adapted to explain phenomena in health services and education settings.


노먼에 대한 대응에서, 52 Regehr는 '설명이란 간단해야 한다거나 의미가 있을 수 없다는 생각을 당연시하는 이분법적 방식'에 도전하는 것으로 보이는 [의학 교육에서 복잡성 과학의 인식론적 입장]이 가치 있다고 주장했다.53 그러나, 그는 또한 의료교육이 복잡하다는 걸 보여주기 위한 시도에서 '유추analogies를 지나치게 밀어붙이는 것은 위험이 있다'고 인정했다. 

In his response to Norman,52 Regehr maintained that the epistemological stance of complexity science is valuable in medical education for challenging ‘a dichotomy that appears to take for granted the idea that a description must be simple or it cannot be meaningful’.53 However, he also acknowledged that ‘there is danger in pushing analogies too far’53 in an attempt to show that medical education counts as complex.


두 토론 모두 이 토론에 익숙하지 않은 추가적인 뉘앙스를 포함하고 있다. 우리는 주로 두 가지 점을 설명하기 위해 그것들을 사용한다. 

  • 첫째로, 토론에 임하는 사람들이 [복잡성 과학이 단수인지 다중인지]라는 근본적인 전제에 대해서 동의하지 않을 때, 학문적 토론이 생산적이 되기는 어렵다(즉, 그 분야에 대한 새로운 통찰력을 도출하는 것). 이 근본적인 전제에서 합의 없이, 그리고 사실, 이 의견의 불일치가 문제의 일부로서 명백하게 제시되지 않는 한, 이러한 논쟁들은 극명하게 반대적인 어조를 띠며, 그 누구도 그 어떤 것에도 대해 납득시킬 수 있는 것은 분명하지 않다. 

  • 째로, 복잡성이 복합적이라는 것을 받아들이면, 용어의 정확한 사용은 덜 필요하기는커녕 오히려 더 필요하다.

Both debates contain additional nuances not germane to this discussion. We use them primarily to illustrate two points. 

  • Firstly, it is difficult for a scholarly debate to be productive (i.e. to result in new insights for the field) when those in the debate disagree on a fundamental premise: whether complexity science is singular or multiple. Without agreement on this fundamental premise – and in fact, without the disagreement being explicitly tabled as part of the problem– these debates take on a starkly oppositional tone and it is not clear that anyone manages to convince anyone else of anything. 

  • Secondly, if we accept that complexity is multiple (and we align with Mitchell,17 Castellani,18,19 Manson23 and others in taking this position), the precise use of terms is more, rather than less, necessary.


Kenneth Burke가 지적했듯이, '모든 보는 방법은 보지 않는 방법이다'.58 따라서, 복잡성 과학은 의학 교육 연구원들에게 많은 강력한 시각 방법을 제공한다; 그 중 하나를 선택할 때, 우리는 연구 중인 현상의 어떤 측면에 주의를 돌리고 다른 사람들로부터 주의를 돌린다. Manson과 같은 개념적 프레임워크의 가치는 [우리가 어떤 복잡성 오리엔테이션의 관점에서 어떤 교육 문제를 접근하고 있는지] 볼 수 있도록 이 과정을 가시화하는데 도움을 줄 수 있다는 것이다.

As Kenneth Burke pointed out, ‘every way of seeing is a way of not seeing’.58 Hence, complexity science offers medical education researchers many powerful ways of seeing; in choosing among them, we direct attention to some aspects of the phenomenon under study and deflect attention fromothers. The value of conceptual frameworks such as that of Manson22 is that they can help make visible this process, allowing us to see which education problems we are approaching from which complexity orientations.


우리는 의학교육 연구자들이 복잡성 과학으로부터 어떤 개념과 도구를 끌어내고 있는지, 왜 그러한 도구들이 그것들에 공명하는지, 그리고 그들이 성취한 통찰력에 대한 선택들의 함의에 대해 생각해보도록 장려할 것이다. 인용문과 키워드에 대한 우리의 분석은 우리의 표본에 있는 대부분의 논문들이 Manson의 총체적인 방향을 반영하였다는 것을 추론할 수 있게 해주었지만, 22 우리는 이 방향이 목적적이었는지 알 수 없으며, 또한 그것이 항상 바람직하다고 주장할 수도 없다. 복잡성에 대한 총체적인 접근방식은 사회현상에 영향을 주며, 확실히 많은 교육관행은 매우 사회적이다. 그러나 모든 것이 그렇지는 않다

  • 복잡성에 대한 알고리즘 접근방식은 실험실의 인지 연구와 관련이 있을 수 있으며, 

  • 복잡성에 대한 결정론적 접근방식은 특정 모의 훈련 개입을 검사하는 강력한 렌즈를 나타낼 수 있다.

We would encourage medical education researchers to think about which concepts and tools they are drawing from complexity science, why those tools resonate with them, and the implications of their choices for the insights they achieve. Although our analysis of citations and keywords allowed us to infer that most papers in our sample reflected Manson’s aggregate orientation,22 we cannot know whether this orientation was purposeful and nor would we assert that it is necessarily always preferable. Aggregate approaches to complexity lend themselves to social phenomena, and certainly many education practices are intensely social. However, not all of them are: 

  • algorithmic approaches to complexity may be relevant for studies of cognition in the laboratory, and 

  • deterministic approaches to complexity may represent powerful lenses through which to examine certain simulated training interventions.


우리는 의료교육에서 복잡성 과학의 이론적 가져오기를 현장에서 '방법론적 수입methodological importing'를 지원하기 위해 Varpio 등이 제공한 전략을 사용하여 개선할 것을 권고한다.60 그들은 [방법론의 개념과 도구가 방법론을 개발한 분야에서 방법론을 주로 알 수 없는 분야로 이전될 때] 방법론적 수입이 발생하는 것으로 기술하였다.

We recommend that the theoretical importing of complexity science in medical education could be improved using the strategies offered by Varpio et al. to support ‘methodological importing’ in the field.60 They described methodological importing as occurring when a methodology’s concepts and tools are transferred from a field in which the methodology was developed to a field in which the methodology is largely unknown.60 


그러한 수입은 도전적인 문제를 새롭고 다각적인 방법으로 탐구하는 강력한 학문적 접근법이다. 그러나, 수입의 위험은 원래 접근법의 기초적인 조건을 누락할 수 있다는 것이다. 이러한 위험에 대처하기 위해, 우리는 연구자들이 주요 출처와 관계를 맺고 개념이나 용어 사이의 긴장을 인정하려는 의식적인 노력을 포함해야 하는 상당한 [정당화 작업]에 참여해야 한다는 Varpio 외 연구원의 권고를 반영할 것이다.

Such importing is a powerful scholarly approach to exploring challenging problems in new and multifaceted ways. However, a risk of importing is that the foundational conditions of the original approach may be left behind.60 To counteract this risk, we would echo Varpio et al.’s60 recommendation that researchers engage in considerable justification work, which, we would argue, should include a conscious effort to engage with primary sources and to acknowledge tensions among concepts or terms.



35 Kuper A, D’Eon M. Rethinking the basis of medical knowledge. Med Educ 2011;


36 Norcini JJ, Banda SS. Increasing the quality and capacity of education: the challenge for the 21st century. Med Educ 2011;


43 Jorm C, Roberts C. Using complexity theory to guide medical school evaluations. Acad Med 2018; 93 (3):399–405.








. 2019 Jan;53(1):95-104.
 doi: 10.1111/medu.13651. Epub 2018 Oct 10.

What is the state of complexity science in medical education research?

Affiliations 

Affiliations

  • 1Centre for Education Research and Innovation, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.
  • 2Department of Surgery, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.
  • 3Faculty of Education, University of Western Ontario, London, Ontario, Canada.
  • 4Department of Women's Studies and Feminist Research, Faculty of Arts and Humanities, University of Western Ontario, London, Ontario, Canada.
  • 5Department of Medicine, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.

Abstract

Context: 'Complexity' is fast becoming a 'god term' in medical education, but little is known about how scholars in the field apply complexity science to the exploration of education phenomena. Complexity science presents both opportunities and challenges to those wishing to adopt its approaches in their research, and debates about its application in the field have emerged. However, these debates have tended towards a reductive characterisation of complexity versus simplicity. We argue that a more productive discussion centres on the multiplicity of complexity orientations, with their diverse disciplinary roots, concepts and terminologies. We discuss this multiplicity and use it to explore how medical education researchers have taken up complexity science in prominent journals in the field.

Methods: We synthesised the health sciences and medical education literature based on 46 papers published in the last 18 years (2000-2017) to describe the patterns of use of complexity science in medical education and to consider the consequences of those patterns for our ability to advance scholarly conversations about 'complex' phenomena in our field.

Results: We identified four patterns in the use of complexity science in medical education research. Firstly, complexity science is described in a variety of ways. Secondly, multiple approaches to complexity are used in combination in single papers. Thirdly, the type of complexity science used tends to be left implicit. Fourthly, the complexity orientation used is much more commonly located using secondary source citation rather than primary source citation.

Conclusions: The presence of these four patterns begs the question: Do medical education scholars understand that there are multiple legitimate orientations to complexity science, deriving from distinct disciplinary origins, drawing on different metaphors and serving distinct purposes? If we do not understand this, a cascade of potential consequences awaits. We may assume that complexity science is singular in that there is only one way to do it. This assumption may cause us to perceive our way as the 'right' way and to disregard other approaches as illegitimate. However, this perception of illegitimacy may limit our ability to enter into productive dialogue about our complexity science-inspired research.

+ Recent posts