어떻게 현상학이 다른 사람의 경험으로부터 배울 수 있도록 돕는가 (Perspect Med Educ, 2019)

How phenomenology can help us learn from the experiences of others

Brian E. Neubauer1,2 · Catherine T.Witkop3 · Lara Varpio1



도입 Introduction


인간은, 다른 사람의 경험으로부터 배울 수 있는 능력을 가지고 있다는 점에서 독특하며, 동시에 그렇게 하는 것을 명백히 꺼리는 것으로 유명하다.—더글라스 애덤스

Human beings, who are almost unique in having the ability to learn from the experience of others, are also remarkable for their apparent disinclination to do so.—Douglas Adams


인간은 다른 사람들의 경험으로부터 배울 수 있는 몇 안 되는 동물들 중 하나라는 사실에도 불구하고, 우리는 종종 그렇게 하기를 싫어한다.

Despite the fact that humans are one of few animals who can learn from the experiences of others, we are often loath to do so.


학자들이 다른 사람들의 경험으로부터 배우는 것은 필수적이다. 사실, 그것은 연구의 기본적인 전제이다. 연구는 정보를 발견하거나 주체에 대한 새로운 이해를 얻기 위해 대상(즉, 개인, 집단, 사회 또는 객체)에 대한 상세한 연구를 포함한다 [1]. 그러한 상세한 연구는 종종 우리가 특정한 현상에 대한 새로운 통찰력을 얻을 수 있도록 다른 사람들의 경험을 이해하도록 요구한다. 보건 직업 교육 학자들은 다른 사람들의 경험으로부터 배울 필요성에 대해 잘 알고 있다.

it is essential for scholars to learn from the experiences of others. In fact, it is a foundational premise of research. Research involves the detailed study of a subject (i. e., an individual, groups of individuals, societies, or objects) to discover information or to achieve a new understanding of the subject [1]. Such detailed study often requires understanding the experiences of others so that we can glean new insights about a particular phenomenon. Scholars in health professions education (HPE) are savvy to the need to learn from the experiences of others.


이러한 노력을 종종 억제curtail하는 것은 방법론의 부족이다. 다른 말로 하자면, HPE 연구원들은 다른 사람들의 경험으로부터 배우는 방법을 알아야 한다.

What often curtails these efforts is a lack of methodology. In other words: HPE researchers need to know how to learn from the experiences of others.


현상학은 이 연구를 뒷받침할 수 있는 독특한 위치에 있는 질적 연구 접근법이다. 그러나, HPE 연구에 참여하기 위한 접근법으로서, 현상학은 강한 추종자를 가지고 있지 않다. 현상학을 진정으로 이해하려면 그것을 뒷받침하는 철학에 대한 감상을 발전시켜야 한다. 그 철학들은 인간 경험의 의미를 이론화한다. 다시 말해, 현상학 연구에 참여하는 것은 학자가 인간의 경험에 대한 해석의 철학적 계류방식mooring에 익숙해지도록 요구한다.

Phenomenology is a qualitative research approach that is uniquely positioned to support this inquiry. However, as an approach for engaging in HPE research, phenomenology does not have a strong following. It is easy to see why: To truly understand phenomenology requires developing an appreciation for the philosophies that underpin it. Those philosophies theorize the meaning of human experience. In other words, engaging in phenomenological research requires the scholar to become familiar with the philosophical moorings of our interpretations of human experience.


현상학이 대답할 수 있는 질문들과 이런 종류의 연구가 제공할 수 있는 통찰력은 HPE에게 근본적인 중요성을 가집니다: 

  • 수치심의 경험과 의학 학습자들에게 그러한 경험이 미치는 영향은 무엇입니까? 

  • 공감하는 임상의[3]가 된다는 것은 무엇을 의미합니까? 

  • 고위험 시험에서 낙제했을 때의 의료 학습자의 경험은 무엇입니까 [4]?

The questions that phenomenology can answer, and the insights this kind of research can provide, are of foundational importance to HPE: 

  • What is the experience of shame and the impact of that experience for medical learners [2]? 

  • What does it mean to be an empathetic clinician [3]? 

  • What is the medical learner’s experience of failure on high stakes exams [4]?


현상학이란 무엇인가?

What is phenomenology?


간단히 말해서, 현상학은 [현상을 경험한 사람들의 관점에서 그것을 탐구함으로써 현상의 본질을 설명하고자 하는 연구에 대한 접근법]으로 정의될 수 있다[6]. 현상학의 목표는 이 경험의 의미를 경험하는 것과 경험하는 방법 두 가지 측면에서 설명하는 것입니다 [6]. 인간 경험의 어떤 것과 방법을 생각하는 다른 방법에 뿌리를 둔 다양한 종류의 현상학이 있다. 다른 말로 하자면, 현상학의 각 접근은 서로 다른 철학에 뿌리를 두고 있다.

In simple terms, phenomenology can be defined as an approach to research that seeks to describe the essence of a phenomenon by exploring it fromthe perspective of those who have experienced it [6]. The goal of phenomenology is to describe the meaning of this experience—both in terms of what was experienced and how it was experienced [6]. There are different kinds of phenomenology, each rooted in different ways of conceiving of the what and how of human experience. In other words, each approach of phenomenology is rooted in a different school of philosophy.


이 원고에서, 우리는 현상학에 대한 초월적 접근과 헤르메네틱한(해석적) 접근을 강조하지만, 더 넓은 현상학적 지형이 존재한다. 예를 들어, 1997년에 출판된 현상학 백과사전은 7가지 다른 유형의 현상학에 대한 기사를 특집으로 다루고 있습니다 [7]. 초월적/그녀의 본질적 분열을 연결하는 더 현대적인 전통도 개발되어 왔다. 이러한 전통 중 몇 가지는 표 1[8-10]에 자세히 설명되어 있습니다.

In this manuscript, we highlight the transcendental and the hermeneutic approaches to phenomenology, but a broader phenomenological landscape exists. For instance, the Encyclopedia of Phenomenology, published in 1997, features articles on seven different types of phenomenology [7]. More contemporary traditions have also been developed that bridge the transcendental/hermeneutic divide. Several of these traditions are detailed in Tab. 1 [8–10].




현상학에 대한 이러한 접근법들 중 하나를 이해하기 위해서, 대부분의 접근법들이 현상학의 연구목적에 대한 유사한 정의를 가지고 있다는 것을 기억하는 것이 유용하다. 현상학은 보통 다음에 대한 연구이다.

  • 우리의 경험에서 나타나는 현상, 

  • 우리가 현상을 인지하고 이해하는 방법, 

  • 우리의 주관적인 경험에 있는 의미적 현상 [11]. 

To understand any of these approaches to phenomenology, it is useful to remember that most approaches hold a similar definition of phenomenology’s object of study. Phenomenology is commonly described as the study 

  • of phenomena as they manifest in our experience, 

  • of the way we perceive and understand phenomena, and 

  • of the meaning phenomena have in our subjective experience [11]. 


좀 더 간단하게 말하자면, 현상학은 개인이 살아 겪는 세상의 경험에 대한 연구입니다 [12]. 경험이 주관적으로 살아있는 것을 조사함으로써, 새로운 의미와 감상이 우리가 그 경험을 이해하는 방법을 알리거나 방향을 바꾸도록 개발될 수 있습니다 [13].

More simply stated, phenomenology is the study of an individual’s lived experience of the world [12]. By examining an experience as it is subjectively lived, new meanings and appreciations can be developed to inform, or even re-orient, how we understand that experience [13].


초월현상학

Transcendental phenomenology


현상학은 수세기에 걸쳐 진화한 철학적 전통에서 기원하지만, 대부분의 역사가들은 에드먼드 후셀이 20세기 초에 현상학을 정의했다고 믿는다.

Phenomenology originates in philosophical traditions that evolved over centuries; however, most historians credit Edmund Husserl for defining phenomenology in the early 20th century [14].


철학에 대한 Husserl의 접근은 그의 작품 본문이 '순수 현상론'에 대한 그의 관심에 종지부를 찍거나 철학과 과학의 보편적인 기초를 찾기 위해 노력하면서 객관적 경험과 주관적 경험을 동등하게 높이려고 노력했다. Husserl은 외부 현실에 대한 객관적인 관찰이라는 실증주의에 절대적인 초점을 두기를 거부하고, 대신 [개인의 의식에 의해 인식되는 현상]들이 과학적 연구의 대상이 되어야 한다고 주장했다. 그러므로, Husserl은 어떤 가정도 현상의 연구를 알려주지 말아야 한다고 주장했다. 어떤 철학적이거나 과학적인 이론, 연역적인 논리 절차, 그리고 어떤 다른 경험적 과학이나 심리학적 추측도 그 연구에 정보를 주지inform 말아야 한다. 대신에, 초점은 개인의 직관에 직접 주어지는 것에 맞춰져야 합니다 [16].

Husserl’s approach to philosophy sought to equally value both objective and subjective experiences, with his body of work ‘culminating in his interest in “pure phenomenology” or working to find a universal foundation of philosophy and science [13].’ Husserl rejected positivism’s absolute focus on objective observations of external reality, and instead argued that phenomena as perceived by the individual’s consciousness should be the object of scientific study. Thus, Husserl contended that no assumptions should inform phenomenology’s inquiry; no philosophical or scientific theory, no deductive logic procedures, and no other empirical science or psychological speculations should inform the inquiry. Instead, the focus should be on what is given directly to an individual’s intuition [16].


스타티가 최근에 주장했듯이, 현상학에 대한 이러한 태도는 '과거에 알려지지 않았던 현실의 차원을 발견한 자연 과학자의 태도'[17]와 비슷하다. 이러한 초점의 전환은 연구자가 '사물의 본질과 의미를 발견하기 위해 자신에게 되돌아갈 것'을 요구한다. Husserl이 주장했듯이, '결국 모든 진짜 그리고 특히 모든 과학적 지식은 내면적 증거에 달려 있다.' 내면적 증거, 즉 의식에 나타나는 것이 현상을 연구해야 하는 부분이다. 이것이 Husserl에게 의미하는 것은 [주관적이고 객관적인 지식은 밀접하게 연관되어 있다는 것]이다. 현상의 실체를 이해하는 것은 현상의 실체를 사람이 살아가는 그대로 이해하는 것이다. 이 살아있는 경험은 Husserl에게 아직 발견되지 않은 존재의 차원입니다 [17].

As Staiti recently argued, this attitude towards phenomenology is akin to that of ‘a natural scientist who has just discovered a previously unknown dimension of reality [17].’ This shift in focus requires the researcher to return ‘to the self to discover the nature and meaning of things [18].’ As Husserl asserted: ‘Ultimately, all genuine and, in particular, all scientific knowledge, rests on inner evidence [19].’ Inner evidence—that is, what appears in consciousness—is where a phenomenon is to be studied. What this means for Husserl is that subjective and objective knowledge are intimately intertwined. To understand the reality of a phenomenon is to understand the phenomenon as it is lived by a person. This lived experience is, for Husserl, a dimension of being that had yet to be discovered [17].


Husserl에게 현상학은 인식론적 태도에 뿌리를 두고 있었다; 그에게 있어 현상학적 조사의 중요한 질문은 '개인이 현상에 대해 알고 있거나 의식하는 것이 무엇인가?'였다. Husserl의 현상학 개념에서, 어떤 경험적 현상도 연구의 대상이 될 수 있으며, 따라서 분석을 단순한 감각 지각(즉, 내가 보고 듣고 만지는 것)을 넘어 사상, 기억, 상상 또는 감정의 경험으로 밀어넣을 수 있다[21].

For Husserl, phenomenology was rooted in an epistemological attitude; for him, the critical question of a phenomenological investigation was ‘What is it for an individual to know or to be conscious of a phenomenon [20]?’ In Husserl’s conception of phenomenology, any experienced phenomenon could be the object of study thereby pushing analysis beyond mere sensory perception (i. e. what I see, hear, touch) to experiences of thought, memory, imagination, or emotion [21].


Husserl은 [현상의 살아있는 경험]은 [현상을 경험한 개인들이 흔히 인식하는 특징]을 가지고 있다고 주장했다. 일반적으로 인식되는 이러한 [특징 또는 보편적 본질]은 [일반화할 수 있는 설명]을 개발하기 위해 식별될 수 있다. Husserl에 따르면 현상의 본질essence은 그 현상의 본질true nature을 나타낸다고 한다. 그렇다면 Husserl의 현상학에 참여하는 연구자가 직면하는 과제는 다음과 같습니다.

Husserl contended that a lived experience of a phenomenon had features that were commonly perceived by individuals who had experienced the phenomenon. These commonly perceived features—or universal essences—can be identified to develop a generalizable description. The essences of a phenomenon, according to Husserl, represented the true nature of that phenomenon. The challenge facing the researcher engaging in Husserl’s phenomenology, then, is:


사물을 그 자체로 묘사하고, 그 앞에 놓인 것을 의식 속으로 들어가 직관과 자기 성찰의 관점에서 그 의미와 본질로 이해되도록 합니다. 그 과정은 [실제로 존재하는 것]과 [가능한 의미의 이점으로부터 상상되는 것]의 혼합을 포함한다. 그러므로, 실제와 이상 사이의 통일성을 만드는 것이다. [18].

To describe things in themselves, to permit what is before one to enter consciousness and be understood in its meanings and essences in the light of intuition and self-reflection. The process involves a blending of what is really present with what is imagined as present from the vantage point of possible meanings; thus, a unity of the real and the ideal [18].


즉, 과제는 [그 현상의 보편적인 본질을 강조하는 현상]에 대한 [한 개인의 살아있는 경험] 연구에 참여하는 것입니다 [22]. 이를 위해서는 연구자가 현상에 대한 참가자의 경험에 초점을 맞추고 현상의 본질을 파악하기 위해 자신의 태도, 신념 및 가정을 중단해야 한다. 철학과 과학에 대한 Husserl의 큰 공헌 중 하나는 그가 개발한 방법인데, 이것은 연구자들이 '자연스러운 태도뿐만 아니라 우리가 인간 정신이라고 부르는 것에 대한 순진한naive 이해를 중단하고suspende, 새로운 연구 분야로서 초월적 주관성의 영역을 공개'할 수 있게 해준다.

In other words, the challenge is to engage in the study of a person’s lived experience of a phenomenon that highlights the universal essences of that phenomenon [22]. This requires the researcher to suspend his/her own attitudes, beliefs, and suppositions in order to focus on the participants’ experience of the phenomenon and identify the essences of the phenomenon. One of Husserl’s great contributions to philosophy and science is the method he developed that enables researchers ‘to suspend the natural attitude as well as the naïve understanding of what we call the human mind and to disclose the realm of transcendental subjectivity as a new field of inquiry [17].’


Husserl's의 초월적 현상학(때로는 서술적 접근법이라고도 함)에서, 연구자의 목표는 [초월적 주관성]을 달성하는 것이다. 즉, '연구자가 조회에 미치는 영향을 지속적으로 평가하고 편견과 선입견을 중화시켜 연구 대상에 영향을 미치지 않는 상태이다.[22]

In Husserl’s’ transcendental phenomenology (also sometimes referred to as the descriptive approach), the researcher’s goal is to achieve transcendental subjectivity—a state wherein ‘the impact of the researcher on the inquiry is constantly assessed and biases and preconceptions neutralized, so that they do not influence the object of study [22].’


연구자는 분리되어 떨어져 있어야 하며, [참가자가 제공한 설명]을 해석하는데 자신의 주관을 개입하지 않아야 한다. 이 살아있는 경험의 차원은 [초월적 I]의 상태를 달성할 수 있는 연구자가 가장 잘 접근한다. 즉, 객관적 연구자가 [실제 경험의 사실에 대한 참가자의 설명]에서 벗어나, [의식 자체를 파악할 수 있는 현상의 보편적인 본질]로 이동하는 상태]이다 [23].

The researcher is to stand apart, and not allow his/her subjectivity to inform the descriptions offered by the participants. This lived dimension of experience is best approached by the researcher who can achieve the state of the transcendental I—a state wherein the objective researcher moves from the participants’ descriptions of facts of the lived experience, to universal essences of the phenomenon at which point consciousness itself could be grasped [23].


초월적 I의 상태에서, 연구자들은 '당연한 것으로 간주되는 것 또는 상식적인 것들을 포함하여, 개념화에 대한 분류에 의존하지 않는다'는 현상에 대한 참가자들의 경험에 사전성찰적으로prereflectively 접근할 수 있다. 초월적 I은 어떤 정의, 기대, 가정 또는 가설도 연구에 가져오지 않는다; 대신에, 이 상태에서는, 연구자는 현상의 본질에 대한 이해를 발전시키기 위해 참가자들의 경험을 이용하는 빈 석판인 [타블라 라사]의 위치를 가정한다.

In the state of the transcendental I, the researcher is able to access the participants’ experience of the phenomenon prereflectively—that is ‘without resorting to categorization on conceptualization, and quite often includes what is taken for granted or those things that are common sense [13].’ The transcendental I brings no definitions, expectations, assumption or hypotheses to the study; instead, in this state, the researcher assumes the position of a tabula rasa, a blank slate, that uses participants’ experiences to develop an understanding of the essence of a phenomenon.


이 상태는 일련의 환원을 통해 달성됩니다. 

This state is achieved via a series of reductions. 


  • 초월적 단계라고 불리는 첫 번째 환원은 괄호치기bracketing 과정이라고도 불리는, 에포체(epoche)를 통해 일상 생활의 자연스러운 태도에서 초월을 요구한다. 이것은 연구자들이 관심 현상에 대한 이전의 이해, 과거의 지식 및 가정들을 수학 방정식에서처럼 제쳐놓거나 분류하는 과정이다. 이전부터 없어져야 할 이해는 과학적 이론, 지식 또는 설명, 참여자의 주장의 진실 또는 거짓, 그리고 연구자의 개인적인 견해와 경험을 포함한 광범위한 출처를 포함한다. 

The first reduction, referred to as the transcendental stage,requires transcendence from the natural attitude of everyday life through epoche, also called the process of bracketing. This is the process through which the researchers set aside—or bracket off as one would in a mathematical equation—previous understandings, past knowledge, and assumptions about the phenomenon of interest. The previous understandings that must be set aside include a wide range of sources including: scientific theories, knowledge, or explanation; truth or falsity of claims made by participants; and personal views and experiences of the researcher [24].


  • 두 번째 단계, 초월적-현상학적 환원에서, 각 참가자의 경험은 개별적으로 고려되며, 현상의 의미와 본질에 대한 완전한 설명이 구성된다 [18].

In the second phase, transcendental-phenomenological reduction, each participant’s experience is considered individually and a complete description of the phenomenon’s meanings and essences is constructed [18].


  • 다음은 상상적 변화를 통한 환원으로, 모든 참가자의 의식적 경험에 대한 설명이 자유 변화 과정을 통한 통합적 통합으로 증류된다[25]. 이 과정은 직관에 의존하며, 현상의 본질에 도달하기 위해 현상의 다양한 변형을 상상해야 한다 [25]. 이러한 본질은 현상에 대한 모든 지식의 기초가 된다.

Next is reduction via imaginative variation wherein all the participants’ descriptions of conscious experience are distilled to a unified synthesis of essences through the process of free variation [25]. This process relies on intuition and requires imagining multiple variations of the phenomenon in order to arrive at the essences of the phenomenon [25]. These essences become the foundation for all knowledge about the phenomenon.


일반적으로 사용되는 한 가지 초월적 현상학적 방법은 심리학자인 Clark Moustakas의 방법이며, 다른 접근법에는 Collaizi [26], Giorgi [27] 및 Polkinghorne [28]의 연구가 포함된다. 사용된 접근법에 관계없이, 초월적 현상학에 엄격하게 참여하기 위해, 연구자들은 연구자의 개별 주관성이 데이터 분석과 해석에 치우치지 않도록 분류 작업에 주의를 기울여야 한다.

One commonly used transcendental phenomenological method is that of psychologist Clark Moustakas, and other approaches include the works of: Colaizzi [26], Giorgi [27], and Polkinghorne [28]. Regardless of the approach used, to engage rigorously in transcendental phenomenology, the researcher must be vigilant in his/her bracketing work so that the researcher’s individual subjectivity does not bias data analysis and interpretations.


이것은 연구자 자신의 해석, 인식, 범주 등이 감소 과정에 영향을 미치지 않는 [초월적 I]의 상태에 도달하는 도전이다. 현대 철학자들이 계속해서 후셀의 괄호치기 개념과 씨름하고 있다는 것을 주목하는 것은 중요하다. 괄호치기가 성공적으로 달성되면, 연구자는 연구자의 물리적 신체를 포함하여, 세계와 그 내용 전체를 제쳐놓습니다 [17].

This is the challenge of reaching the state of the transcendental I where the researcher’s own interpretations, perceptions, categories, etc. do not influence the processes of reduction. It is important to note that modern philosophers continue to wrestle with Husserl’s notions of bracketing. If bracketing is successfully achieved, the researcher sets aside the world and the entirety of its content—including the researcher’s physical body [17].


[물리적 현실에 대한 의존과 기반을 중단하는 것]은 초월적 자아를 찾는 것과 같은 방법으로 인간의 경험을 버리는 유일한 방법이다.

Suspending reliance on and foundations in physical reality is the only way to abandon our human experiences in such a way as to find the transcendent I.


연구자들은 이 목표를 달성하기 위해 다른 정성적 연구 방법에서 practice를 빌릴 수 있다. 예를 들어, 여러 명의 연구자가 [30] 환원을 삼각 측량하여 적절한 괄호치기가 유지되었는지 확인하도록 연구를 설계할 수 있습니다. 또는, 확인된 본질이 참가자의 경험과 일치하는지 확인하기 위해 [31] 멤버체킹을 통한 데이터 [18]의 유효성 검사가 연구에 포함될 수 있다.

Researchers might borrow [29] practices from other qualitative research methods to achieve this goal. For instance, a study could be designed to have multiple researchers triangulate [30] their reductions to confirm appropriate bracketing was maintained. Alternatively, a study could involve validation of data [18]via member checking [31] to ensure that the identified essences resonated with the participants’ experiences.


헤르메네틱 현상학

Hermeneutic phenomenology


해석적 현상학으로도 알려진 헤르메네틱 현상학은 마틴 하이데거의 연구에서 비롯된다. 하이데거는 신학 분야에서 경력을 쌓기 시작했지만, 그 후 철학 학생으로 학계로 옮겨갔다. 하이데거의 철학적인 연구는 후셀의 연구와 일치하면서 시작되었지만, 그는 후에 후셀의 초월적 현상론의 몇 가지 중요한 측면에 도전했다.

Hermeneutic phenomenology, also known as interpretive phenomenology, originates from the work of Martin Heidegger. Heidegger began his career in theology, but then moved into academia as a student of philosophy. While Heidegger’s philosophical inquiry began in alignment with Husserl’s work, he later challenged several key aspects of Husserl’s transcendental phenomenology.


그의 전임자와의 근본적인 결별이 현상학적인 조사의 초점이었다. Husserl이 지식의 본질(즉, 인식론적 초점)에 관심이 있었던 반면, Heideger는 존재와 시간의 본질(즉, 존재론적 초점)에 관심이 있었다 [21]. 인간의 경험과 그것이 어떻게 사는가에 초점을 맞추면서, 그녀의 해석적 현상학이 다른 점이다. 후셀은 '세상에 참여하고, 인지하고, 기억하고, 생각하는 행위'와 현상의 지식자knower로서의 인간에 초점을 맞춘다.

A foundational break from his predecessor was the focus of phenomenological inquiry. While Husserl was interested in the nature of knowledge (i. e., an epistemological focus), Heidegger was interested in the nature of being and temporality (i. e., an ontological focus) [21]. With this focus on human experience and how it is lived, hermeneutic phenomenology moves away from Husserl’s focus on ‘acts of attending, perceiving, recalling and thinking about the world [13]’ and on human beings as knowers of phenomenon.


이와는 대조적으로 하이데거는 [세계의 배우actors in the world로서 인간]에 관심이 있어서, 개인과 그의 삶의 세계 사이의 관계에 초점을 맞추고 있다하이데거의 용어, 생활세계lifeworld는 '개인의 현실'은 그들이 살고 있는 세계에 의해 변함없이 영향을 받는다는 생각을 언급했습니다. 이러한 지향을 고려할 때, 개인은 (끊임없이, 명시적으로, 그리고/또는 의식적으로 그러한 이해를 인식하지 않더라도), 항상 이미 세계 내에서 자신에 대한 이해를 가지고 있는 것으로 이해됩니다 [17].

In contrast, Heidegger is interested in human beings as actors in the world and so focuses on the relationship between an individual and his/her lifeworld. Heidegger’s term lifeworld referred to the idea that ‘individuals’ realities are invariably influenced by the world in which they live [22].’ Given this orientation, individuals are understood as always already having an understanding of themselves within the world, even if they are not constantly, explicitly and/or consciously aware of that understanding [17].


하이데거에게 있어, 현상에 대한 개인의 의식적인 경험은, [세계와 분리되지도 않고 개인의 역사와도 분리되지도 않는다]. 대신, 의식은 개인의 역사와 그/그녀가 자란 문화를 포함하여 역사적으로 살아온 경험의 형태입니다 [22].

For Heidegger, an individual’s conscious experience of a phenomenon is not separate from the world, nor from the individual’s personal history. Consciousness is, instead, a formation of historically lived experiences including a person’s individual history and the culture in which he/she was raised [22].


개인은 자신의 삶의 세계에서 벗어날 수 없다. 인간은 자신의 배경에 대한 이해를 언급하지 않고는 현상을 경험할 수 없다. 따라서, 해석적 현상학은 '표면적 인식 아래에 가려진 인간 경험의 더 깊은 층을 이해하고, 그 또는 그 혹은 그녀가 그것을 사전-성찰적으로 경험하면서 그 세계가 어떻게 이 경험에 영향을 미치는지 이해'하려고 한다. 헤르메네틱 현상학은 개인의 내러티브를 연구하여, 그 개인들이 일상 생활과 생활 세계에서 경험하는 것을 이해한다.

An individual cannot step out of his/her lifeworld. Humans cannot experience a phenomenon without referring back to his/her background understandings. Hermeneutic phenomenology, then, seeks ‘to understand the deeper layers of human experience that lay obscured beneath surface awareness and how the individual’s lifeworld, or the world as he or she pre-reflectively experiences it, influences this experience [35].’ Hermeneutic phenomenology studies individuals’ narratives to understand what those individuals experience in their daily lives, in their lifeworlds.


그러나 헤르메네틱한 전통은 서술적인 이해를 넘어서고 있다. 해석적 현상학은 해석에 뿌리를 두고 있다. 즉, 개인의 인생 세계를 통해 [경험과 현상을 해석하는 것]이다.

But the hermeneutic tradition pushes beyond a descriptive understanding. Hermeneutic phenomenology is rooted in interpretation—interpreting experiences and phenomena via the individual’s lifeworld.


헤르메네틱스는 문헌을 다른 언어로 번역해야 할 필요성과 원본(예: 성경)에 대한 접근이 문제가 있었던 곳에서 개발된 이론으로, 텍스트의 해석을 참조한다 [36].

Hermeneutics refers to the interpretation of texts, to theories developed from the need to translate literature from different languages and where access to the original text (e. g., the Bible) was problematic [36].


만약 모든 인간의 경험이 개인의 인생세계에 영향을 받고informed, 모든 경험이 그 배경을 통해 해석되어야 한다면, 해석적 현상학은 현상에 대한 설명을 넘어서, 현상에 대한 해석으로 이어져야 합니다. 연구자들은 개인의 배경이 미치는 영향을 알아야 하고, 그들이 존재의 경험에 미치는 영향에 대해 설명해야 한다.

If all human experience is informed by the individual’s lifeworld, and if all experiences must be interpreted through that background, hermeneutic phenomenology must go beyond description of the phenomenon, to the interpretation of the phenomenon. The researcher must be aware of the influence of the individual’s background and account for the influences they exert on the individual’s experience of being.


이는 개인의 주관적 경험(사회, 문화 및 정치적 맥락과 불가분의 관계에 있음)이 사전에 결정된다는 것을 의미하지는 않는다. 하이데거는 개인이 자유를 찾아왔다고 주장했다. 위치 자유는 '개인은 자유롭게 선택할 수 있지만, 그들의 자유는 절대적이지 않다; 그것은 그들의 일상 생활의 특정한 조건에 의해 제한된다. [22]’

This is not to say that the individual’s subjective experience—which is inextricably linked with social, cultural, and political contexts—is pre-determined. Heidegger argued that individuals have situated freedom. Situated freedom is a concept that asserts that ‘individuals are free to make choices, but their freedom is not absolute; it is circumscribed by the specific conditions of their daily lives [22].’


해석적 현상학은 개인의 경험이 그의 인생세계를 통해 해석되기 때문에, 세계 속 개인의 존재의 의미를 연구한다. 그리고 이러한 의미와 해석이 개인의 선택에 어떻게 영향을 미치는지를 연구한다. 이러한 초점은 존재에 대한 참가자의 이해의 기본 구조와, 그 이해가 개인이 내린 결정을 어떻게 형성했는지를 조명하기 위해, 연구 참여자가 제공한 내러티브를 해석하도록 요구한다 [37].

Hermeneutic phenomenology studies the meanings of an individual’s being in the world, as their experience is interpreted through his/her lifeworld, and how these meanings and interpretations influence the choices that the individual makes [13]. This focus requires the hermeneutic phenomenologist to interpret the narratives provided by research participants in relation to their individual contexts in order to illuminate the fundamental structures of participants’ understanding of being and how that shaped the decisions made by the individual [37].


그녀의 해석적 현상학을 구별하는 또 다른 중요한 측면은 연구에서 [연구자의 역할]이다.

Another key aspect that distinguishes hermeneutic phenomenology is the role of the researcher in the inquiry.


연구자의 주관적인 관점을 배제하는 대신, 해석적 현상학은 연구 주제와 마찬가지로 연구자가 자신의 삶의 세계를 제거할 수 없다는 것을 인정한다. 대신에, 연구원의 과거의 경험과 지식은 그 연구의 귀중한 지침이다. 연구자의 교육 및 지식 기반은 연구할 가치가 있는 현상이나 경험을 고려하도록 이끈다. 연구에서, 데이터에 대해 편파적이지 않은 접근법을 취하도록 요구하는 것은 해석적 현상학의 철학적 뿌리와 일치하지 않는다. 대신, 이 전통에서 일하는 연구자들은 그들의 선입견을 공개적으로 인정하고 그들의 주관성이 분석 과정의 일부인 방법에 대해 성찰해야 합니다 [16].

Instead of bracketing off the researcher’s subjective perspective, hermeneutic phenomenology recognizes that the researcher, like the research subject, cannot be rid of his/her lifeworld. Instead, the researcher’s past experiences and knowledge are valuable guides to the inquiry. It is the researcher’s education and knowledge base that lead him/her to consider a phenomenon or experience worthy of investigation. To ask the research to take an unbiased approach to the data is inconsistent with hermeneutic phenomenology’s philosophical roots. Instead, researchers working from this tradition should openly acknowledge their preconceptions, and reflect on how their subjectivity is part of the analysis process [16].


해석적 현상학의 해석 작업은 하나의 규칙 결합 분석 기법에 얽매이지 않는다. 대신, 그것은 다중 분석 활동의 상호작용을 포함하는 해석 과정이다 [35].

The interpretive work of hermeneutic phenomenology is not bound to a single set of rule-bound analytical techniques; instead, it is an interpretive process involving the interplay of multiple analysis activities [35].


    • 우리의 관심을 살아있는 경험으로 향하게 하는 흥미로운 현상을 발견하는 것으로부터 시작합니다. 

    • 그런 다음 연구팀의 구성원들은 경험이 [(개념화되기 보다는) 살아있는 lived rather than conceptualized 그대로의 경험을 조사하고, 그 현상에 대한 참가자의 경험을 특징짓는 필수적인 [현상적] 주제들을 성찰하는 동시에 자신의 경험도 성찰한다. 

    • 연구자들은 자신의 성찰 내용을 글로 포착한 다음 성찰하고 다시 작성하며, 지속적이고 반복적인 주기를 만들어 점점 더 강력하고 미묘한 분석을 개발한다. 

    • 분석 내내, 연구자들은 연구 중인 현상에 대한 강한 지향을 유지하고(즉, 주의를 산만하게 하지 않음) 부품과 전체 사이의 상호작용에 주의를 기울여야 한다. 

    • 헤르메네틱 서클이라고도 하는 이 마지막 단계는 데이터(부품)가 현상(전체)의 진화하는 이해에 어떻게 기여하는지와 각 요소가 다른 것의 의미를 어떻게 향상시키는지를 신중하게 고려하는 관행을 강조한다[35].

Starts with identifying an interesting phenomenon that directs our attention towards lived experience. 

Members of the research team then investigate experience as it is lived, rather than as it is conceptualized, and reflect on the essential [phenomenological] themes that characterize the participant’s experience with the phenomenon, simultaneously reflecting on their own experiences. 

Researchers capture their reflections in writing and then reflect and write again, creating continuous, iterative cycles to develop increasingly robust and nuanced analyses. 

Throughout the analysis, researchers must maintain a strong orientation to the phenomenon under study (i. e., avoid distractions) and attend to the interactions between the parts and the whole. 

This last step, also described as the hermeneutic circle, emphasizes the practice of deliberately considering how the data (the parts) contribute to the evolving understanding of the phenomena (the whole) and how each enhances the meaning of the other [35].


현상학에 대한 헤르메네틱 접근법에서, 이론은 집중적인 조사, 연구 참여자에 대한 의사 결정, 그리고 연구 질문이 제기될 수 있는 방법에 도움이 될 수 있습니다 [22]. 이론들은 또한 연구의 결과를 이해하는데 도움을 주기 위해 사용될 수 있다. 그녀의 음소 현상학과의 연관성이 널리 존경받는 한 학자는 Max van Manen [38]이다. Van Manen은 hermenetic 현상학이 '해석적 현상한 그 자체를 방법론적 스키마나 해석적 절차 집합으로 기만적으로 환원하지 않도록 한다[39].'고 인정한다. 대신에, 이런 종류의 현상학은 연구자가 해석적 현상학적 사고, 읽기, 쓰기의 프로젝트를 이해하기 위해, 이 전통의 철학을 깊이 읽도록 요구한다.

In the hermeneutic approach to phenomenology, theories can help to focus inquiry, to make decisions about research participants, and the way research questions can be addressed [22]. Theories can also be used to help understand the findings of the study. One scholar whose engagement with hermeneutic phenomenology is widely respected is Max van Manen [38]. Van Manen acknowledges that hermeneutic phenomenology ‘does not let itself be deceptively reduced to a methodical schema or an interpretative set of procedures [39].’ Instead, this kind of phenomenology requires the researcher to read deeply into the philosophies of this tradition to grasp the project of hermeneutic phenomenological thinking, reading, and writing.



결론 

Conclusion


아마도 가장 비판적으로, HPE 학자들은 선택된 방법론의 원리와 그것을 뒷받침하는 철학적 뿌리와 일치하는 연구 과정을 구성해야 한다. 이 정렬은 연구 엄격성과 신뢰성을 확립하기 위한 초석입니다.

Perhaps most critically, HPE scholars must construct research processes that align with the tenets of the methodology chosen and the philosophical roots that underlie it. This alignment is the cornerstone for establishing research rigour and trustworthiness.


검증 활동 또는 필수 프로세스의 특정 체크리스트를 따르는 것은 특정 현상학적 연구의 품질과 엄격함을 높일 수 없다. 대신에, 연구 질문, 패러다임 및 선택된 방법론 사이의 충실도를 유지하는 것 외에도, 강력한 현상학적 연구는 읽기, 반성적 쓰기, 다시 읽기 및 다시 쓰기를 통해 데이터에 대한 깊은 관여를 포함한다.

Following a specific checklist of verification activities or mandatory processes cannot buoy the quality and rigour of a particular phenomenological study. Instead, beyond maintaining fidelity between research question, paradigm, and selected methodology, robust phenomenological research involves deep engagement with the data via reading, reflective writing, re-reading and re-writing.


  • [초월적 현상학]에 대한 무스타카스의 접근법에서는 연구자는 데이터를 읽고, 데이터를 의미 단위로 축소하고, 축소된 데이터를 다시 분석하여 주제 클러스터링에 참여하고, 데이터를 비교하고, 설명을 쓰는 등의 작업을 수행합니다. 지속적인 데이터 처리 및 성찰적 문서 작성 과정에서 연구자가 살아 있는 경험의 본질을 설명할 수 있을 때까지 요약한다.

In Moustakas’s approach to transcendental phenomenology, the researcher reads the data, reduces the data to meaning units, re-reads those reductions to then engage in thematic clustering, compares the data, writes descriptions, and so on in an ongoing process of continually engaging with the data and writing reflections and summaries until the researcher can describe the essence of the lived experience [18].


  • [해석적 현상학]에서, 학자들은 연구자가 데이터를 읽고, 애매한 이해를 형성하고, 반사적 글쓰기에 관여한 다음, 수정된 이해로 본문과 다시 결합하는 헤르메네틱 서클에 관여하는 것을 설명한다[40]. 읽기와 쓰기의 주기, 본문 전체와 부분들에 주의를 기울이는 주기들에서, 해석적 연구자는 살아 있는 경험에 대한 이해를 형성한다.

In hermeneutic phenomenology, scholars describe engaging in a hermeneutic circle wherein the researcher reads the data, constructs a vague understanding, engages in reflective writing, then re-engages with the text with revised understandings [40]. In cycles of reading and writing, of attending to the whole of the text and the parts, the hermeneutic researcher constructs an understanding of the lived experience.


두 가지 전통 모두 읽기, 쓰기, 다시 읽기 및 다시 쓰기를 통한 데이터와의 긴밀한 결합이 기본입니다.

In both traditions, deep engagement with the data via reading, writing, re-reading and re-writing is foundational.


현상학적 데이터의 읽기 및 쓰기에 대한 참여 깊이에 대한 주의는 엄격함에 필요한 조건이다.

attention to the depth of engagement in reading and writing of the phenomenological data is a necessary condition for rigour.





Review
 
. 2019 Apr;8(2):90-97.
 doi: 10.1007/s40037-019-0509-2.

How phenomenology can help us learn from the experiences of others

Affiliations 

Affiliations

  • 1Department of Medicine, Uniformed Services University, Bethesda, MD, USA. brian.e.neubauer.mil@mail.mil.
  • 2General Internal Medicine Service, Walter Reed National Military Medical Center, Bethesda, MD, USA. brian.e.neubauer.mil@mail.mil.
  • 3Department of Preventative Medicine and Biostatistics, Uniformed Services Medical Center, Bethesda, MD, USA.
  • 4Department of Medicine, Uniformed Services University, Bethesda, MD, USA.
Free PMC article

Abstract

Introduction: As a research methodology, phenomenology is uniquely positioned to help health professions education (HPE) scholars learn from the experiences of others. Phenomenology is a form of qualitative research that focuses on the study of an individual's lived experiences within the world. Although it is a powerful approach for inquiry, the nature of this methodology is often intimidating to HPE researchers. This article aims to explain phenomenology by reviewing the key philosophical and methodological differences between two of the major approaches to phenomenology: transcendental and hermeneutic. Understanding the ontological and epistemological assumptions underpinning these approaches is essential for successfully conducting phenomenological research.

Purpose: This review provides an introduction to phenomenology and demonstrates how it can be applied to HPE research. We illustrate the two main sub-types of phenomenology and detail their ontological, epistemological, and methodological differences.

Conclusions: Phenomenology is a powerful research strategy that is well suited for exploring challenging problems in HPE. By building a better understanding of the nature of phenomenology and working to ensure proper alignment between the specific research question and the researcher's underlying philosophy, we hope to encourage HPE scholars to consider its utility when addressing their research questions.

Keywords: Hermeneutic phenomenology; Qualitative; Transcendental phenomenology.


교육 설계연구: 생산적 학술활동을 계획하고, 수행하고, 강화하는 것(Med Educ, 2020)

Educational design research: Portraying, conducting, and enhancing productive scholarship

Susan McKenney1 | Thomas C. Reeves2



1 | 소개

1 | INTRODUCTION


인간은 [해결하려는 문제의 본질을 완전히 이해하기 전에 해결책으로 뛰어드는 공통된 경향]을 가지고 있으며, 이는 Morozov에 의해 '해결책주의solutionism'으로 묘사된 관행을 입증한다. 1 교육도 (그러한 행동의 희생물이 되는 유일한 분야는 아니지만) 수십 년 동안 예외는 아니었다. 예를 들어, 1922년 에디슨은 영화가 교과서를 대체할 것이라고 약속했다. 2 증강현실과 다른 기술들이 의학 교육의 미래로 제시됨에 따라 오늘날에도 유사한 예측이 계속 이루어지고 있다. 비평가들이 교육에서 기술적 해결책에 대한 대부분의 연구가 '별로 큰 차이는 없다'고 밝혔음에도 불구하고, 이러한 경향은 지속되고 있다. 아마도 이것은 경험에 대한 낙천주의의 승리를 나타내거나, 아니면 단순히 순진무구함일 수도 있다.

Humans have a common tendency to jump to solutions prior to fully understanding the nature of the problem they are trying to solve, thus demonstrating a practice described as ‘solutionism’ by Morozov.1 Education is not the only field to fall prey to such behaviour, but it has seen its fair share of examples over the course of many decades. For instance, in 1922 Edison promised that films would replace textbooks.2 Similar predictions continue to be made today as augmented reality and other technologies are put forward as the future of medical education.3 Despite the fact that critics have revealed that the majority of studies on technological solutions in education yield ‘no significant difference,'4 the tendency persists. Perhaps this represents the triumph of optimism over experience, or perhaps it is simply naïveté.


[새로운 지식을 발견하기 위한 기초연구]와 [실제적인 문제를 해결하기 위한 응용연구] 사이에 종종 구별이 이루어졌지만, 이 단순한 이분법은 연구가 실제로 어떻게 수행되는지 또는 대부분의 학자들에 의해 추구되는 [다중적 목표]를 적절하게 나타내지 못한다. 의료 교육 분야에서 일하는 사람들을 포함한 교육 연구자들은 종종 [그들의 목적이 서술적, 예측적, 해석적 또는 개발이나 행동을 참조할 수 있다는 점에서] 다양한 목표를 가지고 있다.4 개발 목표와 함께 이론에 기여하는 데 관심이 있는 연구자들에게 교육 설계 연구(EDR)는 매력적인 옵션이 될 수 있다.6

A distinction has often been made between basic research to discover new knowledge and applied research to solve practical problems, but this simplistic dichotomy does not adequately represent either how research is actually conducted or the multiple goals pursued by most scholars.5 Education researchers, including those working in the field of medical education, often have a range of different goals in that their purposes may be descriptive, predictive, interpretivist, or refer to development or action.4 For researchers interested in contributing to theory alongside development goals, educational design research (EDR) may be a compelling option.6


2 | EDR을 묘사하는 것

2 | PORTRAYING EDR


교육 설계 연구실용적이고 복잡한 교육 문제에 대한 해결책의 반복적 개발도 경험적 조사의 맥락을 제공하는 연구의 한 장르로 정의될 수 있는데, 이것은 다른 사람들의 작업에 정보를 줄 수 있는 이론적 이해를 산출한다.'7

‘Educational design research can be defined as a genre of research in which the iterative development of solutions to practical and complex educational problems also provides the context for empirical investigation, which yields theoretical understanding that can inform the work of others.’7


EDR에 적합한 문제를 식별하려면 [조사 가치가 있고 EDR 프로세스를 통해 해결할 수 있는 실제 과제]를 찾아야 한다. 특정 문제는 실무자, 연구원 또는 문헌 연구를 통해 확인할 수 있다.7 예를 들어, 의학 교육의 심각한 문제는 미래의 의사가 패혈증을 예방하기 위한 일관된 습관을 개발하도록 돕는 것을 말한다.8 소독 프로토콜은 잘 알려져 있지만, 왜 제대로 지켜지지 않는지 이해하고, 이 문제를 근절할 수 있는 추가적인 해결책을 개발하기 위한 연구가 필요하다.10

Identifying problems amenable to EDR involves finding real-world challenges that are worthy of investigation and capable of being solved through the EDR process. Specific problems may be identified by practitioners, by researchers, or through the study of literature.7 For example, a serious problem in medical education refers to helping future physicians develop consistent habits to prevent sepsis.8 Although antisepsis protocols are well known, research is needed to understand why they are insufficiently adhered to, and to develop additional solutions that can eradicate this problem.10


명백하게 심각한 문제가 제기되었을 때, 그것이 정말로 정당하고, 연구 가능하고 연구 가치가 있는지 확인하기 위해 문헌과 실제 모두에서 검증이 필요하다

  • 정당성: 이론적 관점에서, 만약 그렇게 하는 것이 현존하는 문헌의 명백한 차이를 해결할 수 있다면, 그 문제는 연구할 가치가 있다.

  • 연구가능성: 현존하는 방법이 노력을 보증할 수 있을 정도여서, 충분히 잘 연구될 수 있는 경우(연구 가능)

  • 연구가치: 이 작업이 특이적 우려와 반대로 광범위한 보유자와 관련된 이론 개발 또는 과학적 이해에 기여할 것인지 여부(연구 가치)

When even an obvious serious problem is raised, verification in both literature and practice is necessary to ascertain if it is, indeed, legitimate, researchable and research-worthy. 

  • From the theoretical perspective, the problem is worth studying if doing so would address a clear gap in the existing literature (legitimate), 

  • if existing methods will allow it to be studied well enough to warrant the effort (researchable), and 

  • if the work will contribute to theory development or scientific understanding related to a widely held, as opposed to idiosyncratic, concern (research-worthy).7


다음은 총 해부학 클래스에 있는 예제입니다.

Here is an example situated in a gross anatomy class:


• 문제: 시신 기증자는 제한적이며, 인체 해부학을 가르치기 위한 기존의 시뮬레이션은 충분한 충실도가 결여되어 있다(문제의 실질적인 측면). 현재 시뮬레이션 문헌은 포유류 해부학을 위한 고품질 시뮬레이션을 개발하는 방법에 대한 지침이 불충분하다(문제의 과학적 측면).

• Problem: corpse donors are limited and existing simulations for teaching human anatomy lack sufficient fidelity (the practical side of the problem). The current simulation literature provides insufficient guidance on how to develop high-quality simulations for mammalian anatomy (the scientific side of the problem).


• 실제적인 목적: 학생들이 실제 해부를 수행하지 않고도 과정 목표를 달성할 수 있는 고품질의 인간 해부 시뮬레이션을 개발하는 것.

• Practical aim: to develop a high-quality human dissection simulation that allows students to meet course goals without conducting actual dissection.


• 과학적 목적: 포유류 및 특히 인간을 위한 고품질 시뮬레이션의 특성을 이해하고 기술하는 것

• Scientific aim: to understand and describe the characteristics of high-quality simulations for mammals in general and humans in particular.


[[현실 세계의 과제를 해결함으로써 이론과 실제에 기여]하는 것을 명시적으로 추구하지 않는 연구]는 분명 큰 가치가 있을 수 있지만, EDR을 구성하지는 않는다.

Research that does not explicitly seek to contribute to both theory and practice by addressing real-world challenges can certainly be of great value, but it does not constitute EDR.



2.1 | 이론적이고 실제적인 시너지: 간략하고 포괄적인 검토

2.1 | Theoretical and practical synergies: a brief, non-comprehensive review


이론과 실제 작업을 연결하는 과학을 연결한다는 개념은 심리학자들에 의해 한 세기 이상 주장되어 왔다. 

  • 1930년대와 1940년대에, 이 방향의 주요한 진보는 Lewin과 동료들에 의해 [실행 연구]를 통해 이루어졌는데, 이 연구는 집단의 결정에 따르는 문제에 대한 논의를 통한 가설 생성과 테스트가 중심이었다. 

  • 1960년대와 1970년대에는 사회과학 분야에서 [(참여형) 행동 연구]가 번창했고, 실무자 연구가 등장했으며, 교육의 문제와 필요를 직접적으로 해결하기 위한 교육 연구의 요구는 증가했다. 

  • 무엇보다도, 이것은 1980년대 '행동 과학action science'과 1990년대에 널리 추진력을 얻은 '사용에 영감을 받은 기초 연구'의 발판을 마련했다. 

The notion of a linking science connecting theoretical and practical work has been advocated by psychologists for over a century.11,12 

  • In the 1930s and 1940s, major advancements in this direction were made by Lewin and colleagues, through action research, in which hypothesis generation and testing through the discussion of problems followed by group decisions were central.13 

  • In the 1960s and 1970s, (participatory) action research flourished in the social sciences, practitioner inquiry emerged, and calls for educational research to directly address the problems and needs of education increased.14 

  • Amongst other things, this set the stage for the rise of ‘action science’ in the 1980s15 and the notion of ‘use-inspired basic research,' which gained widespread momentum in the 1990s5. 


그 무렵, 교육 설계 및 커리큘럼 개발 분야의 연구원들은 교육 제품, 프로그램, 프로세스 및 정책의 강력한 설계를 안내하기 위해 보다 [신뢰할 수 있는 처방적prescriptive 이해]의 필요성을 강조하기 시작했다. 동시에, 교육 심리학 분야의 연구원들은 이론이 학습의 설계에 어떻게 영향을 미치는지와 그 반대의 경우에 어떻게 영향을 미치는지 주장하며, [학습이 실제로 일어나는 상황에 연구가 위치할situated 것]을 요구하며, [학습 현상을 이해하기 위한 실험실 상황의 단점을 언급]하는 획기적인 논문을 발표했다.9, 20

Around that time, researchers in the fields of instruction design and curriculum development began to stress the need for more reliable, prescriptive understanding to guide the robust design of educational products, programmes, processes and policies.16-18 At the same time, researchers in the field of education psychology published landmark papers arguing for how theory informs the design of learning and vice versa, calling for research to be situated in the contexts in which that learning actually takes place, and citing the shortcomings of laboratory settings for understanding learning phenomena.19, 20


교육 전반에 걸쳐, 그러한 견해는 파스퇴르의 사분면: 기초 과학 및 기술 혁신 출판에 탄력을 받았다.5 스톡스는 이번 세미나 연구에서 우유의 부패와 광견병 치료와 같은 현실 세계의 문제를 해결하는 맥락에서 근본적인 지식을 찾았던 프랑스의 화학자이자 미생물학자 루이스 파스퇴르와 같은 연구를 더 많이 해야 한다고 주장한다. 이 전통에서, EDR은 생태학적으로 타당하고 다른 사람들의 작업에 inform해주는 과학적 이해를 산출하고자, [현실의 기존 문제 해결]과 [탐구 과정의 구조화]에 관심이 있다.

Across disciplinary lines, such views gained momentum upon the publication of Pasteur’s Quadrant: Basic Science and Technological Innovation.5 In this seminal work, Stokes argues for more research like that of the French chemist and microbiologist Louis Pasteur, who sought fundamental knowledge within the context of solving real-world problems such as the spoilage of milk and treatment for rabies. In this tradition, EDR is concerned with the solving of existing problems in practice and with the structuring of the inquiry process so that it yields scientific understanding that is ecologically valid and informs the work of others.


2.2 | 접근법 제품군

2.2 | A family of approaches


우리는 'EDR'이라는 용어를 [이론적 이해의 개발] 및 [실제 개입의 설계 및 구현]이라는 이중 목표를 위해 노력하는 일군의 접근법을 설명는 용어로 사용한다.21 다음의 용어를 포함한다

  • design-based research, 

  • design-based implementation research, 

  • development research, 

  • design experiments, 

  • formative research, 

  • participatory design research, 

  • realist evaluation, 

  • the Medical Research Council (MRC) framework for evaluating complex interventions, 

  • action research and improvement science.

다양한 이름들은 동의어가 아니며, 일부 작가들은 이 가족의 특정한 구성원들이 다른 사람들과 어떻게 다른지 광범위하게 묘사했다.22

We use the term 'EDR' to describe a family of approaches that strive towards the dual goals of developing theoretical understanding and also designing and implementing interventions in practice.21 This family of approaches may, but does not always, include design-based research, design-based implementation research, development research, design experiments, formative research, participatory design research, realist evaluation, the Medical Research Council (MRC) framework for evaluating complex interventions, action research and improvement science. The various names are not synonymous, and some authors have extensively described how specific members of this family differ from others.22


표 1은 EDR을 다른 형태의 조사와 차별화시키는 각 접근방식의 목표와 특징을 요약한다. 즉, 실제 문제에 대한 해결책의 (반복적) 개발을 통한 이론적 이해의 추구이다.

Table 1 summarises the goals and characteristics of each approach in light of that which sets EDR apart from other forms of inquiry: the pursuit of theoretical understanding through the (iterative) development of solutions to problems in practice.


2.3 | 의료 교육에서 EDR의 예

2.3 | Examples of EDR in medical education


다른 연구와 마찬가지로, EDR은 데이터 수집과 분석을 통해 기존의 이론적 지식을 확장한다.23-25 그러나 많은 다른 종류의 연구와 달리, EDR 프로세스는 [해결하려는 문제에 대한 해결책의 (종종 주기적) 개발]에 embed되어 있다.23-25

Like other research, EDR extends existing theoretical knowledge through data collection and analysis.23-25 However, unlike many other kinds of research, the EDR process is embedded in the (often cyclic) development of a solution to the problem being tackled.23-25


• Hege 등 26은 가상 환자를 특징으로 하는 [임상 추론 도구 개발]에 embed된 연구를 설명한다. 심리학적 이론, 환자 중심, 교수 및 평가, 학습자 중심 및 맥락을 기반으로 소프트웨어 설계를 위한 프레임워크를 개발한 후 가상 환자 시스템과 함께 사용할 소프트웨어 도구가 개발되었다. 특히 임상 추론 기술 획득을 지원하고 이 복잡한 프로세스의 모든 단계를 평가합니다. 저자 26은 소프트웨어의 주요 구성 요소, 사용적합성 시험 결과 및 시험 연구를 설명하고 추가 개발 방향을 제시한다.

• Hege et al26 describe the research embedded in the development of a clinical reasoning tool featuring virtual patients. After a framework for software design had been developed based on psychological theories, patient-centredness, teaching and assessment, learner-centredness and context, a software tool was developed to be used with virtual patient systems. It specifically supports clinical reasoning skills acquisition and assesses all steps of this complex process. The authors26 describe the main components of the software, results of usability tests and a pilot study, and indicate directions for further development.


• Duitsman 외 연구진 27은 [임상 역량 위원회의 기능을 개선]하기 위한 주기적 접근방식을 설명한다. 이 프로젝트에서는, 이론적인 원칙을 문헌에서 추출하여 대학 아동 병원의 거주자 성과에 초점을 맞춘 임상 역량 회의를 재구성하였다. 그 회의는 평가되었고 거주자의 성과를 널리 알리는 데 유용하다고 간주되었다. 주어진 설계 원칙과 권고사항은 다른 (연구에 대한) 레지던트 프로그램에 유용하며, 다른 상황에 맞게 조정할 수 있다.

• Duitsman et al27 describe their cyclic approach to improving the functioning of a clinical competency committee. In this project, theoretical principles were distilled from the literature to (re-) shape clinical competency meetings focused on resident performance in a university children’s hospital. The meetings were evaluated and deemed useful for obtaining a broad indication of resident performance. The design principles and recommendations given are useful for other (research on) residency programmes, and can be adjusted to different contexts.


• Bararends 등 28은 [학부 작업 치료 학생 사이의 증거 기반 의사결정 능력을 육성]하기 위해 EDR을 수행했다. 그들의 보고서는 인지 도제 및 위치 학습의 원칙에 기초하는 교육 및 학습 시나리오의 기초가 되는 교육 원리를 생성하고 시험하기 위해 수행된 혼합 방법 연구를 설명한다. 그 개입은 잘 받아들여졌고 저자들은 학생들이 증거 기반 의사결정에 필요한 자기 효과, 인지 능력 및 비판적 사고 능력을 개발하는 데 도움이 될 수 있는 후속 연구와 개발을 위한 권고안을 제시한다.

• Baarends et al28 conducted EDR to foster evidence-based decision-making capacity amongst undergraduate occupational therapy students. Their report describes a mixed-methods study undertaken to generate and pilot test the pedagogic principles underlying a teaching and learning scenario based on principles of cognitive apprenticeship and situated learning. The intervention was well received and the authors28 make recommendations for subsequent research and development that can help students develop the self-efficacy, cognitive skills and critical thinking skills required for evidence-based decision making.



2.4 | 주요 특징

2.4 | Key characteristics


실용적이고 과학적인 목표의 동시 추구는 이 과정의 핵심이며, 다섯 가지 필수적인 특징으로 특징지어질 수 있다

  • 교육 설계 연구는 이론적으로 지반 설계에 사용할 뿐만 아니라 설계와 개발 작업이 광범위한 과학적 이해에 기여하기 위해 수행되기 때문에 '이론지향적'이다. 

  • 그것은 특정한 교육 환경에서 생산적인 변화를 일으키기 위해 수행되기 때문에 '개입주의적'이다. 

  • 연구자와 실무자를 포함한 다원적 파트너십의 전문지식을 필요로 하지만 다른 분야(예: 주제 전문가, 소프트웨어 프로그래머 및 촉진자)의 전문지식을 요구하기 때문에 '협력적'이다. 

  • 그것은 그것의 제품이 참가자의 전문지식, 문헌, 특히 현장 시험에 의해 형성되기 때문에 '반응기반적'이다. 

  • 마지막으로, 그것은 일반적으로 설계, 개발, 시험 및 개정의 여러 사이클을 통해 진화하기 때문에 '반복적'이다.

The simultaneous pursuit of practical and scientific goals is central to the process, which can be characterised by five essential features. 

  • Educational design research is 'theorectically oriented' not only because it uses theory to ground design, but also because the design and development work is undertaken to contribute to broader scientific understanding. 

  • It is 'interventionist' because it is undertaken to engender productive change in a particular education context. 

  • It is 'collaborative' because it requires the expertise of multidisciplinary partnerships, including researchers and practitioners, but also often others (eg, subject matter specialists, software programmers and facilitators). 

  • It is 'responsively grounded' because its products are shaped by participant expertise, the literature and, especially, field testing. 

  • Finally, it is 'iterative' because it generally evolves through multiple cycles of design, development, testing and revision.


표 1 개입 개발을 통해 이론적이고 실용적인 결과를 본질적으로 산출하는 방법(회색 셀)과 사용 방법에 따라 이론적이고 실제적인 결과를 산출할 수 있는 방법(백색 셀)을 포함하여 실용적이고 과학적인 시너지를 추구하는 접근법 제품군

TABLE 1 Family of approaches seeking practical and scientific synergies, including those that inherently yield theoretical and practical outcomes through intervention development (grey cells), and those that may yield theoretical and practical outcomes, depending on how they are used (white cells)


전반적인 EDR 연구 기간이 일반적으로 월이 아닌 [년 단위]로 측정된다는 것은 놀랄 일이 아니다.

no surprise that the overall duration of EDR studies is typically measured in years, rather than months.


교육 설계 연구는 방법론이 아니다. 이것은 [ERD이 따라야 할 방법론적 기준이 다른 종류의 연구의 기준과 다르지 않다는 것]을 명확히 하기 때문에 언급하는 것이 중요하다. 따라서 EDR 이니셔티브의 방법론적 엄격성은 정성적, 정량적 또는 혼합적 방법 연구의 기존 기준(예: 신뢰성, 유효성, 신뢰성, 이전 가능성, 신뢰성, 신뢰성, 신뢰성, 확인성)을 사용하여 판단되어야 한다. 또한, EDR은 설계, 사회학 및 교육 분야의 기존 관행을 활용하여 참여와 참여를 형성한다.

Educational design research is not a methodology. This is important to mention because it clarifies that the methodological standards to which it should be held are no different from those of other kinds of research. The methodological rigour of EDR initiatives should therefore be judged using existing criteria for qualitative, quantitative or mixed-methods studies (eg, reliability, validity, credibility, transferability, dependability, confirmability). Further, EDR leverages existing practices from the fields of design, sociology and education to shape participation and engagement.




3 | EDR 수행

3 | CONDUCTING EDR


3.1 | 프로세스 모델링

3.1 | Modelling the process


그림 1에 표시된 EDR의 일반 모델. 

a generic model for EDR, shown in Figure 1. 



첫째, 그림 1의 네모은 세 개의 핵심 단계를 나타내며, 그 사이의 화살표는 이 과정이 반복적이고 유연하다는 것을 나타냅니다.

First, the squares in Figure 1 denote three core phases, and the arrows between them indicate that the process is both iterative and flexible.


  • '분석 및 탐구' 단계 동안, 다룰 문제에 대한 더 나은 이해를 형성하기 위해 실무자와의 협업을 모색한다. 이 단계 동안의 연구는 일반적으로 문제, 맥락 또는 이해관계자에 관한 이론적 이해에 기여한다.

During the 'analysis and exploration' phase, collaboration with practitioners is sought in order to shape a better understanding of the problem to be addressed. Research during this phase is typically informed by and contributes to theoretical understanding concerning the problem, context or stakeholders.


  • '설계와 시공' 동안, 문제가 어떻게 처리될 수 있는지에 대한 아이디어는 다소 크고 모호하게 시작해서, 점차 개선, 가지치기, 조작화 경향이 있다. 비록 이 단계는 본질적으로 [경험적 작업을 포함하지는 않으며], 그것의 특징과 근본적인 행동 이론을 포함하여, (일종의) 개입에 대한 [이론적 이해]에 의존하고 기여한다.

During 'design and construction,' ideas about how the problem might be addressed tend to start off as rather large and vague, and gradually become refined, pruned and operationalised. Although this phase does not inherently involve empirical work, it does rely on and contribute to theoretical understanding about the (kind of) intervention, including its characteristics and underlying theory of action.


  • '평가 및 성찰' 동안, 설계 아이디어와 프로토타입 솔루션은 경험적으로 조사되며, (이론적으로) 개입 기능이 작동하는지, 어떻게 그리고 왜 작동하는지 이해하는 것을 목표로 그 결과를 성찰한다. 이 단계에서 연구는 (종류의) 개입이나 그것이 초래하는 반응에 대한 이론적 이해에 의해 형성되고 기여한다.

During 'evaluation and reflection,' design ideas and prototype solutions are empirically investigated, and the findings are reflected upon, with the aim of refining (theoretical) understanding about if, how and why intervention features work. During this phase, research is shaped by and contributes to theoretical understanding about the (kind of) intervention or the responses it engenders.


모든 단계에서 합리적이고 창의적인 사고방식이 혼합되어 생산적입니다.

Across all phases, a blend of rational and creative mindsets is productive.


둘째, 이론과 실제에 대한 [이중 초점]은 각각 실용적, 과학적 산출물을 나타내는 직사각형을 통해 명백하게 이루어진다. EDR로 인한 실질적인 솔루션은 다음이 있다.

  • 교육용 제품(예: 다중 사용자 가상 학습 게임)

  • 프로세스(예: 뒤집힌 교실에서 의대생 학습을 비계하기 위한 전략)

  • 프로그램(예: 의료 교사가 보다 효과적인 질문 전략을 개발하는 데 도움이 되는 일련의 워크샵)

  • 정책(예: 인턴의 현장 멘토링을 위한 최소 일대일 시간 지정)

Second, the dual focus on theory and practice is made explicit through the rectangles, which represent the practical and scientific outputs, respectively. The practical solutions resulting from EDR can be 

  • educational products (eg, a multi-user virtual learning game), 

  • processes (eg, a strategy for scaffolding medical student learning in a flipped classroom), 

  • programmes (eg, a series of workshops intended to help medical teachers develop more effective questioning strategies), or 

  • policies (eg, the designation of a minimum amount of one-to-one time for on-site mentoring of interns).


[EDR에서 얻어진 이론적 이해]는 교육현상을 기술, 설명, 예측 또는 조작하는데 사용될 수 있다. 앞에서 언급한 바와 같이, 설계 연구에 대한 이론적 이해는 개입의 설계를 뒷받침하고, 과학적 연구를 체계화하며, 개입의 경험적 시험을 통해 생성된 결과에 의해 진전된다.

The theoretical understanding resulting from EDR can be used to describe, explain, predict or manipulate education phenomena. As noted previously, the theoretical understanding in design research underpins the design of the intervention, frames the scientific inquiry, and is advanced by findings generated through the empirical testing of the intervention.


마지막으로, 모델은 구현과 확산을 나타내는 사다리꼴을 통해 실제 사용에 주의를 기울인다는 것을 보여줍니다. 이것은 연습과의 상호작용이 [사후 사고afterthought]가 아닌 [프로세스의 시작부터 존재]하며, 시간이 지남에 따라 증가한다는 것을 보여준다. 양방향 화살표는 실제에서 일어나는 일이 궁극적인 결과뿐만 아니라 진행 중인 핵심 프로세스에 영향을 미치며 그 반대의 경우도 영향을 미친다는 것을 나타낸다.

Finally, the model demonstrates that attention to practical use through the trapezoid, which represents implementation and spread. It shows that interaction with practice is present from the start of the process, not as an afterthought, and increases over time. The bi-directional arrows indicate that what happens in practice influences the ongoing core processes, as well as the ultimate outputs, and vice versa.


3.2 | 모든 단계에 걸친 하나의 예

3.2 | One example spanning all phases


이 모델이 어떻게 살아나는지를 설명하기 위해, 우리는 세계보건기구(WHO)가 경험한 문제를 다룬 이전에 발표된 4년 PhD 연구에 대해 간략하게 설명한다. 즉, 세계보건기구는 운송, 보관 및 유통 중 적절한 온도 범위 내에 유지해야 하는 백신 및 기타 의약품의 취급에 적용되는 '콜드 체인'에 대한 확장 가능한 고품질 교육 프로그램이 부족했다. 

To illustrate how this model comes to life, we briefly describe a previously published 4-year PhD study, 32 which addressed a problem experienced by the World Health Organization (WHO). Namely, the WHO lacked a scalable, high-quality training programme on the ‘cold chain’ that applies to the handling of vaccines and other pharmaceutical products that must be kept within the appropriate temperature range during shipping, storage and distribution.


  • 분석 및 탐색 중, Byster32는 관련 학습 접근법, WHO e-러닝 프로그램의 최신 기술을 이해하기 위한 현장 기반 조사 및 기존 콜드 체인 훈련 프로그램의 참여자 관찰에 대한 문헌 검토를 실시했다.

During analysis and exploration, Vesper32 conducted a literature review on relevant learning approaches, field-based investigation to understand the state of the art of WHO e-learning programmes, and participant observation of the existing cold chain training programme.


  • 설계와 시공 중에, Byster는 문헌과 경험적 시험(즉, 평가와 반영의 결과)을 기반으로 복수의 훈련 프로그램 프로토타입을 개발하고 수정했다.32

During design and construction, Vesper developed and revised multiple training programme prototypes on the basis of the literature and empirical testing (ie, the outcomes of evaluation and reflection).32


  • 평가와 성찰 과정에서, E-러닝 전문가의 전문가 평가, 콘텐츠 전문가의 위험 분석, 대상 사용자와의 성숙한 시제품의 현장 테스트 등 다양한 프로토타입을 조사하기 위해 다양한 전략을 사용했다.

During evaluation and reflection, Vesper32 used diverse strategies to investigate the various prototypes, including expert appraisal by e-learning specialists, risk analysis by content experts, and field testing of a mature prototype with target users.


첫 번째 분석 활동에서 마지막 버전의 과정에 이르기까지, 구현에 대한 관심이 집중되었고 실무자와의 긴밀한 상호작용을 통해 확산되었다. 이후 WHO의 다른 온라인 학습 환경의 설계에 적용된 실질적인 결과물(e-러닝 과정 및 기본 설계 프레임워크) 외에도, 과학적 산출물은 각각 분석, 탐사, 설계 및 시공, 평가 및 반영 단계에서의 조사에 기초하여 5개의 저널 기사의 형태로 볼 수 있다.

From the very first analysis activities through to a final version of the course, attention was given to implementation and spread through close interaction with practitioners. In addition to the practical output (the e-learning course and underlying design framework), which has subsequently been applied to the design of other online learning environments at the WHO,33 the scientific output is visible in the form of five journal articles, based on the investigation during analysis and exploration,34 design and construction,35 and evaluation and reflection36-38 phases, respectively. 


Figure 2



3.3 | 다양한 단계의 기여를 강조하는 여러 가지 예

3.3 | Multiple examples highlighting contributions from different phases


여기에서 의료 교육 분야에서 수행되는 다양한 EDR을 설명하기 위해 서로 다른 연구 보고서 39-41이 사용된다. 각각의 문제에 대해, 해결된 문제, 개발된 개입, 생성된 지식 및 사용된 방법이 표 2에 요약되어 있다.

Here, different research reports39-41 are used to illustrate the variety of EDR conducted within the field of medical education. For each one, the problem addressed, the intervention developed, the knowledge created and the methods used are summarised in Table 2.



[분석 및 탐색 단계의 결과]는 사회경제적으로 불리한 배경에서 청소년을 대상으로 한 건강 식자율을 위한 방과 후 프로그램인 HackHealth를 만들고, 구현하고, 개정하기 위해, [설계 연구에서 정량적이고 질적인 방법]을 사용한 Subramaniam et al의 연구에서 매우 잘 나타난다. 이 특별 하위 연구는 다양한 건강 관련 정보 활동을 완료할 때 직면하는 과제에 대한 심층 분석 및 탐색을 위해 초기 문헌 기반 프로토타입의 구현이 어떻게 컨텍스트를 제공했는지를 보여준다. 연구 결과는 Hack Health 프로그램을 개선하는 것 이상으로 확장되며, 이 인구와 협력하고, 그들의 건강 식자율 기술을 평가 및 개선하고, 그들의 요구에 부합하는 지침을 설계하는 데 중요한 의미를 갖는다.

Results from the analysis and exploration phase are highly visible in the article by Subramaniam et al,39 who used quantitative and qualitative methods in their design research to create, implement and revise HackHealth, an after-school programme for health literacy that was targeted at adolescents from socioeconomically disadvantaged backgrounds. This particular sub-study demonstrates how the implementation of the initial, literature-based prototype provided the context for deeper analysis and exploration of the challenges encountered when completing various health-related information activities. The findings extend beyond improving the HackHealth programme and hold important implications for working with this population, assessing and improving their health literacy skills, and designing instruction that stands to meet their needs.


[설계와 시공 단계]는 [일반 실습 학생들을 위한 5가지 학습 모듈을 구축하는 과정]에서 그들이 취한 단계와 특히 그들의 근본적인 추론을 설명하는 반데트리 등의 작업의 핵심이다. 이 작업은 노인을 돌보거나 신체적으로 정의되지 않은 증상을 가진 환자를 다루는 것과 같은 진짜 복잡한 작업을 통해 교육자가 임상 추론, 의사소통 및 건강 증진과 같은 통합 능력의 개발을 어떻게 다룰 수 있는지를 보여준다. 모듈 설명은 전체 작업 학습의 원칙과 4C/ID(4-구성 요소/지시적 설계) 모델을 적용할 수 있는 방법을 설명하고 또한 교육 혁신 과정의 과제와 함정에 주목하여 유사한 과제를 해결하고자 하는 다른 사람들에게 지침을 제공한다.

The design and construction phase is central in the work of Vandewaetere et al,40 who describe the steps they took, and especially their underlying reasoning, in the course of building five learning modules for general practice students. Through authentic complex tasks such as caring for elderly people or handling patients with physically undefined symptoms, this work demonstrates how educators can address the development of integrated competencies, such as clinical reasoning, communication and health promotion. The module descriptions illustrate how principles of whole-task learning and the 4C/ID (four-component/instructional design) model can be applied, as well as also noting challenges and pitfalls in the educational innovation process, and thus offers guidance to others wishing to tackle similar challenges.


[평가와 성찰 과정]과 연구 결과는 [수의과 학생들을 위한 이론 기반 평가 프로그램의 실행]을 조사한 41세의 복 외 연구진들의 연구에서 전경화되었다. 그들의 프로그램은 학생들이 직장에서 피드백을 찾고 축적하고 배울 수 있도록 동기를 부여하고 지원함으로써 학습과 평가를 통합한다. 그들은 학생과 임상 감독자의 경험을 탐구하기 위해 양적, 질적 방법을 사용했다. 그들의 연구결과는 유사한 이니셔티브의 개발뿐만 아니라 그들의 프로그램에 대한 개정에도 영향을 미친다. 예를 들어, 동료 피드백, 사회적 상호 작용 및 외부 지침은 이 (종류의) 프로그램에서 중요한 요소인 반면, 포트폴리오 심판과 의도하지 않은 학생 인식(즉 형성적 평가조차 총괄적이라는)에 필요한 훈련 수준은 정면으로 대처해야 할 과제를 구성한다.

The evaluation and reflection processes and findings are foregrounded in the work of Bok et al,41 who investigated the implementation of a theory-based assessment programme for veterinary medicine students. Their programme integrates learning and assessment by motivating and supporting students to seek, accumulate and learn from feedback in the workplace. They used quantitative and qualitative methods to explore the experiences of students and clinical supervisors. Their findings hold implications for revisions to their programme, as well as the development of similar initiatives. For example, peer feedback, social interaction and external guidance are crucial elements in this (kind of) programme, whereas the level of training required for portfolio judges and unintended student perceptions (namely, that even formative assessments are still summative) constitute challenges to be tackled head on.


4 | EDR 강화 

4 | ENHANCING EDR


4.1 | 도전과 한계

4.1 | Challenges and limitations


다른 사람들 중 필립스와 돌은 [실용적인 혁신과 이론 구축을 동시에 추구하는 것은 매우 야심적이고 어렵다]고 경고했다. 이는 부분적으로 설계 연구를 추구하는 연구자들이 실제 교육 문제의 복잡한 변이와 직접 씨름하기 위해 실무자들과 손을 맞잡고 작업한다는 사실에서 비롯된다. 복잡성은 증가하지만, 이러한 협업은 모든 관련자를 위한 전문 개발 목표인 EDR의 세 번째 목표를 달성할 수 있습니다.

Phillips and Dolle,42 amongst others, have cautioned that the simultaneous pursuit of practical innovation and theory building is extremely ambitious and difficult. This partially stems from the fact that researchers pursuing design research work hand-in-hand with practitioners to grapple directly with the complex variation of realworld education problems. Although it increases complexity, this collaboration can lead to the accomplishment of a third goal of EDR, that of professional development for all those involved.


EDR을 수행할 때 일반적으로 네 가지 유형의 도전에 직면합니다.

Four types of challenges are commonly encountered when conducting EDR,


[개념적 도전]은 EDR이 무엇인지(또는 그렇지 않음)와 추구되는 목표의 종류를 이해하는 것과 관련이 있다. [방법론적 관점]에서 EDR은 프로젝트의 라이프사이클 전체에 걸쳐 질문 유형의 다양성을 고려할 때, 연구자들이 다양한 방법에서 다방면의 기술을 보유해야 하기 때문에 도전적이다. EDR 연구의 프로세스와 [결과를 전달]하는 것은 어려울 수 있다. 왜냐하면 이러한 연구는 일반적으로 크고 복잡하며, 비-이해관계자들에게 그들의 가치가 항상 명확하게 표현되는 것은 아니기 때문이다. 네 번째 과제는 종종 조직 정책 및 이해관계자 역학과 같은 설계(실행)에서 비롯되는 [정치적 차원]과 관련이 있다. 표 3

Conceptual challenges relate to understanding what EDR is (or is not) and the kinds of goals being pursued. From a methodological standpoint, EDR is challenging because, given the variety in the types of questions asked throughout a project’s lifecycle, it requires that researchers possess well-rounded skills in a variety of methods. Communicating the processes and outcomes of EDR studies can be challenging because these studies are typically large and complex, and because their value to non-stakeholders is not always articulated. A fourth set of challenges relates to political dimensions, often stemming from (implementing) the design, such as organisational policies and stakeholder dynamics. Table 3


EDR을 고려하는 사람들에게는 정보에 입각한 선택을 하는 것이 중요하다. 

  • 째로, EDR은 (적어도) 연구자와 실무자 사이의 긴밀한 협력을 요구한다.43 이것이 실현 가능하지 않거나 바람직하지 않을 때 EDR은 실행 가능한 옵션이 되지 않는다. 

  • 둘째, EDR은 이론, 혁신 및 실제를 연결한다.44 이들 중 하나 이상의 개발이 높은 우선순위가 아닐 때, EDR은 유용하지 않을 가능성이 있다. 

  • 셋째, 실무에서 생산적인 변화를 창출하는 데 중점을 두기 때문에 EDR은 상당한 시간이 필요하다.45 가용 시간이 몇 개월 또는 몇 년이 아닌 몇 주 단위로 측정된다면 EDR은 실현 가능하지 않을 가능성이 높다.

For those considering EDR, it is important to make informed choices. First, EDR requires close collaboration between (at least) researchers and practitioners.43 When this is not feasible or desirable, EDR ceases to be a viable option. Second, EDR connects theory, innovation and practice.44 When the development of one or more of these is not of high priority, EDR is not likely to be useful. Third, because it centres on creating productive change in practice, EDR requires substantial amounts of time.45 If the time available is measured in weeks (rather than months or years), EDR is not likely to be feasible.


마지막으로, EDR이 제대로 수행하기가 상당히 쉽고 잘 수행하기가 상당히 어렵다는 점을 감안할 때, EDR의 네 번째 제한은 접근법 자체와 더 적은 관련이 있으며, EDR을 수행하는 사람들의 능력capacity과 더 많은 관련이 있다. 다른 아이디어와 마찬가지로 EDR의 가치는 그 정의가 아니라 실현에 있다. '디자인 연구는 [혁신성, 증거에 대한 대응성, 기초 과학과의 연결성, 그리고 지속적인 개선에 대한 헌신]이라는 특성을 가진 실천공동체 내에서 이루어진다.' 46.

Finally, given that EDR is fairly easy to do poorly and quite difficult to do well, a fourth limitation of EDR has less to do with the approach per se and more to do with the capacity of those conducting it. As with other ideas, the value of EDR lies not in its definition but in its realisation. ‘Design research is constituted within communities of practice that have certain characteristics of innovativeness, responsiveness to evidence, connectivity to basic science, and dedication to continual improvement.’46


이러한 궤도에서 연구자들은 디자이너와 컨설턴트의 역할도 완수해야 하며, 이는 매우 도전적인 노력이 될 것입니다. McKenney와 Brand-Gruwel47은 설계 연구의 각 하위 프로세스(분석과 탐구, 설계와 시공, 평가와 반영, 구현과 확산)에 비추어 이 세 가지 역할을 검토했다.

In these trajectories, researchers must also fulfil the roles of designers and consultants, rendering this a highly challenging endeavour. McKenney and Brand-Gruwel47 examined these three roles in light of each sub-process of design research (analysis and exploration; design and construction; evaluation and reflection; implementation and spread).


표 3 공통 과제 및 이를 완화하는 방법

TABLE 3 Common challenges and ways to mitigate them



그들은 각각의 역할을 제정하는 데 필요한 [가지 기본 역량]을 명확히 하고, 그것을 발전시키기 위한 지침을 제공한다. 그들은 예를 들어 

  • '공감'이 공유되지 않은 목표를 탐구하거나 다른 환경에서 인센티브, 동기 및 보상 구조에 노출되기 위해 필요하다는 점에 주목한다. 

  • '조정'은 연구 프레임워크, 데이터 수집, 솔루션 설계, 구현, 인프라 문제 및 이해관계자 소유에 동시에 참여할 수 있도록 지원합니다. 

  • 창의적이고 분석적인 '유연성'은 지침의 목표와 일치하는 방식으로 사용 가능한 인적 및 물질적 자원의 최적화를 지원합니다. 

  • 마지막으로 '사회적 역량'은 각 역할을 수행하는 데 필요한 상호작용 전략의 강력한 레퍼토리를 가리킨다. 따라서 EDR을 수행하는 것은 분명히 복잡한 작업이다.

They articulate four foundational competencies that are required to enact each role, and offer guidelines for developing them. 

  • They note that 'empathy' is needed, for example, to explore (un)shared goals or become exposed to the incentives, motives and reward structures in different settings. 

  • 'Orchestration' helps to simultaneously attend to research framing, data collection, solution design, implementation, infrastructure woes and stakeholder ownership. 

  • Creative and analytical 'flexibility' supports the optimisation of the human and material resources available in ways that remain aligned with the goals of the instruction. 

  • Finally, 'social competence' refers to a robust repertoire of the interaction strategies needed to fulfil each role. Thus, conducting EDR is clearly a complex task.


4.2 | 결론

4.2 | CONCLUSIONS


교육 디자인 연구는 물론 만병통치약이 아니다. 그러나, 그것은 교육적 개입이나 해결책이 잉태되기 전에 문제의 본질을 분명히 하는 그것의 높아진 관심 때문에 해결책주의에 은유적인 제동을 걸었다. 우리는 의학 교육이 이론적인 목표와 개발 목표 모두를 시너지 효과적으로 추구함으로써 가장 잘 해결될 수 있는 많은 도전에 직면해 있다고 믿는다. 예를 들어 Chen과 Reeves48이 주장하는 바와 같이 이 접근 방식은 다음과 같은 용도로 사용될 수 있습니다.

Educational design research is of course no panacea. However, it does put the metaphorical brakes on solutionism because of its heightened attention to clarifying the nature of the problem before an educational intervention or solution is conceived. We believe that medical education faces many challenges that might be best addressed by synergistically pursuing both theoretical and development goals. For example, as Chen and Reeves48 argue, this approach could be used to:


• 점점 더 유동적인 의료 팀에서 효과적으로 일할 수 있는 역량 개발 

• develop capacities to work effectively in increasingly fluid health care teams; 


• 환자 및 기타 의료 전문가와 문화적으로 유능하게 의사소통할 수 있는 기술을 배양한다. 

• cultivate skills to communicate in a culturally competent manner with patients and other health care professionals; 


• 기계 학습 알고리즘과 로봇에 점점 더 심화되고 있는 세계에서 의료 전문가들이 실습할 수 있도록 준비한다. 

• prepare health care professionals for practice in a world that is increasingly infused with machine learning algorithms and robots; 


• 역량 기반 교육을 촉진하기 위한 평가 프로토콜 및 피드백 관행을 개선합니다. 

• improve assessment protocols and feedback practices to promote competency-based education, and 


• 의료 전문가의 임상 추론 능력 향상

• enhance health care professionals’ clinical reasoning skills.


이 공동체가 설계 연구를 공유하기 전에 접근법의 유창성이 아직 개발되지 않은 경우(더 많이), 설계 연구에 더 익숙한 자매 분야의 연구원들과의 협력(예: 학습 과학, 교육 설계 또는 교육 기술)은 탐구할 가치가 있을 수 있다. 그렇게 함으로써, 해결책을 개발하기 전에 다룰 가치가 있는 문제들에 대한 서술적이고 설명적인 이해를 보장하는 데 세심한 주의를 기울이는 것을 우선시하는 같은 사고방식을 가진 학자들을 찾는 것이 중요해 보인다.

If fluency with the approach has yet to be developed before this community shares its design studies (more), then collaboration with researchers in sister fields, who are more accustomed to design research (eg, those in the learning sciences, instructional design or educational technology) may be worth exploring. In so doing, it seems crucial to seek out like-minded scholars who prioritise the giving of careful attention to ensuring descriptive and explanatory understanding of problems worth tackling before developing solutions.







. 2020 Jun 21.
 doi: 10.1111/medu.14280. Online ahead of print.

Educational design research: Portraying, conducting, and enhancing productive scholarship

Affiliations 

Affiliations

  • 1Department of Teacher Development (ELAN), Faculty of Behavioural, Management and Social Sciences, University of Twente, Enschede, the Netherlands.
  • 2Department of Career and Information Studies, College of Education, University of Georgia, Athens, Georgia, USA.

Abstract

Context: Solutionism is the all-too-common human propensity to jump to a solution before adequately understanding the nature of a problem. Solutionism has long been prevalent in efforts to improve education at all levels, including medical education.

Thesis: Educational design research (EDR) is a genre of research that features the gaining of in-depth understanding of a problem before any prototype solution is designed and tested. It is different from other forms of scientific inquiry because it is committed to the simultaneous development of both theoretical insights and practical solutions, together with stakeholders. This approach is powerful for theory building because it privileges ecologically valid studies that embrace the complexity of investigating learning in authentic (as opposed to laboratory) settings. When conducted well, both the research process and its outcomes generate valuable contributions to practice.

Preview: This article constitutes an expository essay on EDR, comprised of three movements. First, the approach is defined, its origins are presented, and its characteristics are described. Second, a generic model for conducting EDR is offered, and illustrated with examples from the field of medical education. Third, pathways towards advancing this form of inquiry are discussed, including ways to address inherent challenges and limitations, as well as recommendations for the medical education community. Although EDR is no panacea, this article illustrates how it can serve medical education research in a wide variety of geographic and disciplinary contexts.

시험을 위한 블루프린트 제작 가이드(AMEE Guide No. 125) (Med Teach, 2019)

A practical guide to test blueprinting (AMEE Guide No. 125) (Med Teach, 2019)

Mark R. Raymonda and Joseph P. Grandeb



도입 Introduction


과정과 평가가 목표와 일치하도록 하기 위해 진정 중요한 학습 결과를 균형 있게 다루려면 잘 숙고한 계획에 따라 평가를 개발하는 것이 중요하다. 여기에서는 시험의 계획에 대한 체계적인 접근 방식, 즉 학생들이 각 평가에서 무엇을 알고 시연할 수 있는지를 문서화하는 접근 방식을 설명합니다. 이러한 계획 문서는 테스트 계획, 사양 표 및 테스트 사양이라고도 하지만 일반적으로 테스트 Blueprint라고 합니다.

To ensure that course and assessments are consistent with objectives address truly important learning outcomes in a balanced manner, it is important that assessments be developed according to a well thought-out plan. This article describes a systematic approach to planning tests—an approach that documents what students should know and be able to demonstrate on each assessment. These planning documents are typically called test blueprints, although they also are known as test plans, tables of specifications, and test specifications.


테스트 Blueprint는 테스트의 주요 속성을 설명합니다. 시험 청사진은 다룰 내용을 명시해야 하지만, 많은 청사진은 또한 각 내용 영역에 할당된 강조의 양, 평가 작업의 인지적 요구, 평가 형식 및 기타 중요한 특징과 같은 속성을 설명한다(Millman and Greene 1989; Raymond 2016).

A test blueprint describes the key properties of a test. While any test blueprint should specify 

  • the content to be covered, many blueprints also describe properties such as 

  • the amount of emphasis allocated to each content area, 

  • the cognitive demand of the assessment tasks, 

  • the assessment format, and 

  • other important features (Millman and Greene 1989; Raymond 2016).


테스트 Blueprint의 기반

Foundations of a test blueprint


학습 성과와 학생 역량에 대한 주장

Learning outcomes and claims about student competence


테스트 청사진은 대부분의 강사가 [이미 시행하고 있는 학습 성과와 과정 목표를 자연스럽게 확장한 것]입니다.

A test blueprint is a natural extension of the learning outcomes and course objectives that most instructors already have in place.


우리는 학습 성과를 [학생들이 과정을 이수할 때 갖춰야 하는 지식과 기술을 설명하는 광범위한 서술]로 정의한다(Harden 2002). 행동 목표(또는 교육 목표)는 학생들이 알고 할 수 있는 것을 자세히 설명하는 진술이다.

We define learning outcomes as broad statements that describe the knowledge and skills that students should possess upon completing a course (Harden 2002). Behavioral objectives (or instructional objectives) are statements that describe in detail what students are expected to know and be able to do.


    • 학습 성과는 학생들이 기대하는 지식과 기술을 나타내며, 

    • 행동 목표는 그 목표를 달성하기 위한 로드맵 역할을 한다. 

    • 평가 목표라는 용어를 사용하여 특별히 평가를 목표로 하는 학습 결과 또는 행동 목표를 설명합니다.

    • Learning outcomes indicate the knowledge and skills that are expected of students, while 

    • behavioral objectives serve as a road map for getting there. 

    • We use the term assessment objectives to describe those learning outcomes or behavioral objectives that are specifically targeted for assessment.


평가의 일차적인 목표는 강사가 학생들이 알고 할 수 있는 것에 대해 주장이나 추론을 할 수 있도록 하는 것이다. 테스트는 그러한 주장을 뒷받침할 증거를 얻을 수 있는 기회를 창출한다(Mislevy and Riconscente 2006). 학생이 "심혈관 시스템의 주요 상태를 진단하기 위한 지식과 기술을 마스터했다"는 주장을 뒷받침하기 위해, 강사는 관심 있는 행동을 유도하기 위한 평가 과제를 식별하고, 학생들이 그러한 행동을 증명할 기회를 제공해야 한다. 증거 중심 설계는 교수들이 학생 능력에 대한 주장을 뒷받침할 증거를 제공하는 평가 과제를 선택하도록 요구한다.

A primary goal of assessment is to allow an instructor to make a claim or inference about what students know and are able to do. A test creates the opportunity to obtain evidence to support such claims (Mislevy and Riconscente 2006). To back up the claim that a student has “mastered the knowledge and skills to diagnose major conditions of the cardiovascular system”, an instructor needs to identify assessment tasks to elicit the behaviors of interest, and then provide the opportunity for the student to demonstrate those behaviors. Evidence-centered design requires that faculty choose assessment tasks that provide the evidence to support the claims to be made about student competence.


학생들이 [각 장기 시스템에 영향을 미치는 가장 일반적인 질병을 진단할 수 있도록 보장한다]라는 전체적인 목표가 있는 과정을 고려해보자. 그림 1은 학습 결과와 심혈관 시스템에 특정한 몇 가지 목표를 나타냅니다. 학습 결과, "심혈관 질환에 대한 진단 테스트 결과에 대한 적응증 인식 및 해석"은 상당히 광범위하다. 결과를 성공적으로 입증할 수 있는 것은 지식과 기술의 상당한 네트워크를 필요로 한다. 그림 1의 8가지 행동 목표는 학습 결과에 대한 숙달성을 입증하는 데 필요한 행동의 표본일 뿐입니다. 이러한 행동 목표는 수업을 guide하기 위한 것이지만, 평가에 정보를 제공하는 방법도 쉽게 알 수 있습니다. 각 목표를 "학생이 할 수 있을 것"과 같은 조항과 함께 선행함으로써 이러한 진술은 학생에 대한 주장을 뒷받침하는 평가 목표로 바뀔 수 있습니다. 행동 목표는 개발하기가 지루하지만, 그 특수성specificity은 평가 과제의 개발을 단순화할 수 있다.

Consider a course that has an overall goal of ensuring that students can diagnose the most common diseases affecting each organ system. Figure 1 identifies a learning outcome and several objectives specific to the cardiovascular system. The learning outcome, “Recognize indications for and interpret results of diagnostic tests for cardiovascular disease” is fairly broad; being able to successfully demonstrate that outcome requires a substantial network of knowledge and skills. The eight behavioral objectives in Figure 1 are just a sample of the behaviors required to demonstrate mastery of that learning outcome. Although these behavioral objectives are intended to guide instruction, it is easy to see how they also can inform assessment. By preceding each objective with a clause like “The student will be able to…” these statements can be transformed into assessment objectives that support claims to be made about students. Although behavioral objectives are tedious to develop, their specificity can simplify the development of assessment tasks.



지식의 종류와 수준

Types and levels of knowledge


이러한 서로 다른 유형의 학습은 다른 교육 및 평가 방법을 필요로 한다는 것은 오래 전부터 인식되어 왔다. 밀러의 피라미드는 학습의 유형을 조직하는 데 인기 있는 틀 중 하나이다. 그림 2에 표시된 바와 같이,

It has long been recognized that these different types of learning require different methods of instruction and assessment. Miller’s(1990) pyramid is one popular framework for organizing types of learning. As depicted in Figure 2,


그림 2의 중심 부분은 원래의 피라미드를 묘사하는 반면, 왼쪽의 텍스트는 두 가지 샘플 행동 목표와 그것들이 계층에서 어디에 속하는지 나열한다.

The central portion of Figure 2 depicts the original pyramid, while the text on the left lists two sample behavioral objectives and where they fall in the hierarchy.



Bloom's (1956) 분류법은 평가에 유용한 또 다른 모형입니. 그것은 행동을 인지, 정서, 그리고 정신 운동 영역이라고 불리는 세 가지 범주로 분류한다. 그림 1의 지시 목표를 이 세 가지 도메인 중 하나 이상으로 분류할 수 있는 방법을 알 수 있다. 예를 들어, 목표 7 "대동맥 협착을 청취하기 위해 청진기를 최적의 위치에 배치"를 하려면 청진기를 배치할 위치(인지적)를 결정하고 환자에게 배치 및 권한(정서적)을 요청한 다음 청진기를 배치해야 합니다(정신운동적).

Bloom’s(1956) taxonomy is another model that is useful for assessment. It classifies behaviors into three categories referred to as the cognitive, affective, and psychomotor domains (Anderson and Krathwohl 2001). One can see how the instructional objectives in Figure 1 can be classified into one or more of these three domains. For example, objective 7, “Place stethoscope in optimal location to listen for aortic stenosis”, requires deciding where to place the stethoscope (cognitive), explaining its placement to the patient and asking permission (affective), and then positioning the stethoscope (psychomotor).


인지 영역은 교수와 평가에서 가장 많은 관심을 받았다. 그것은 지식, 이해, 응용, 분석, 합성, 평가의 여섯 단계로 구성되며, 각각의 수준은 앞의 것보다 더 많은 인지적 투자를 필요로 한다. 행동 목적의 수준은 평가에 영향을 미친다. 

The cognitive domain has received the most attention in teaching and assessment. It consists of six levels: knowledge, comprehension, application, analysis, synthesis, and evaluation, with each level requiring a greater cognitive investment than the one preceding it. The level of a behavioral objective has implications for assessment.


예를 들어, 객관식 질문(MCQ)은 지식과 이해를 평가하는 데 효과적이지만, 종합 및 평가에는 효용이 제한적이고, 정신 운동 및 정서 영역의 많은 기술을 평가하는 데는 효과적이지 않다.

For example, while multiple-choice questions (MCQs) are effective for assessing knowledge and comprehension, they have limited utility for assessing synthesis and evaluation, and are ineffective for assessing many skills in the psychomotor and affective domains.


효과적인 테스트 청사진에 대한 4단계

Four stages to an effective test blueprint


그림 3과 아래 텍스트는 테스트 청사진을 개발하기 위한 네 가지 단계를 설명합니다.

Figure 3 and the text below describe four stages for developing a test blueprint.



주요 지식 및 기술 영역 식별

Identify the major knowledge and skill domains


이 첫 번째 단계는 [평가할 광범위한 역량 영역]을 식별하는 것을 포함한다. 그들은 학생들의 행동에 대해 제기되는 높은 수준의 주장에 대응해야 한다. 이 과제에 접근하는 한 가지 방법은 "만약 내가 내 과정을 몇 개 내지 몇 개 단위로 분할한다면, 라벨은 무엇이 될 것인가?"라고 묻는 것이다. 만약 그 의도가 학생들의 면역학 지식에 대한 주장을 하는 것이라면, 프레임워크는 면역학의 영역을 정의하는 주요 내용 범주를 포함해야 한다. 만약 그 의도가 학생의 환자와 상호작용하는 능력에 대한 주장을 하는 것이라면, 그 프레임워크는 주요한 유형의 의사소통 기술을 포함할 것이다. 이러한 문서는 과정 개요, 학습 결과, 강의 노트, 교과서 및 기타 교육 자료에서 찾을 수 있습니다. 또한, 커리큘럼 조사직무 분석 보고서는 의료 교육에서 커리큘럼 설계와 평가에 중요한 기술을 식별했다.

This first stage involves identifying the broad competency domains to be assessed. They should correspond to the high-level claims to be made about student behaviors. One way to approach this task is to ask, “If I were to partition my course into a few to several units, what would the labels be?” If the intent is to make claims about students’ knowledge of immunology, then the framework should include major content categories that define the domain of immunology. If the intent is to make claims about a student’s ability to interact with patients, then the framework will include major types of communication skills. Such documentation can be found in course outlines, learning outcomes, lecture notes, textbooks, and other instructional materials. In addition, curriculum surveys and job analysis reports have identified the skills that are important for curriculum design and assessment in medical education


테스트 Blueprint는 일반적으로 구성된 목록, 개요 또는 테이블 형식으로 만들어진다. 시험 청사진의 조직 체계는 중요한데, 그 범주는 claim과 종종 학생들에게 제공되는 피드백을 병행하기 때문이다. 다음에 설명된 바와 같이 테스트 청사진은 테스트할 내용 또는 평가 작업에 필요한 행동 프로세스에 따라 구성할 수 있습니다(Millman 및 Greene 1989; Raymond 2016).

Test blueprints typically are cast in the form of an organized list, outline, or table. A test blueprint’s organizational framework is important because the categories often parallel the claims to be made and the feedback provided to students. As described next, test blueprints can be organized according to the content to be tested or around the behavioral processes required of the assessment tasks (Millman and Greene 1989; Raymond 2016).


[내용 지향적인 청사진]은 테스트를 다루는 주제 또는 주제 측면에서 설명합니다. 그들은 보통 전통적인 학문분야에 따라 시험 자료를 구분했다. 예를 들어 의과대학 임상의 학년을 포함하는 종합적인 시험에는 생리학, 약리학, 생물통계학 등과 같은 범주가 포함될 수 있다.

Content-oriented blueprints describe tests in terms of the topics or subject matter covered. They usually slice up the test material according to traditional academic disciplines. For example, a comprehensive test covering a preclinical year of medical school might include categories such as physiology, pharmacology, biostatistics, and so on.


[프로세스 지향 테스트 청사진]은 학생들이 보여줄 수 있는 절차적 기술을 기술하고 있다. 많은 프로세스 지향 테스트 청사진에는 블룸의 분류학 인지 영역의 기술이 포함되어 있습니다. 예를 들어, Miller의 피라미드는 통계 시험의 70%가 알고 있는 수준의 과제를 포함하며, 30%는 학생들이 방법을 보여주도록 요구할 것이라고 결정하는 데 사용될 수 있다. 프로세스 지향 프레임워크는 특히 절차적 기술과 정서적 영역에 중점을 두는 임상 교육에 유용하다.

Process-oriented test blueprints delineate the procedural skills students are expected to demonstrate. Many process-oriented test blueprints include skills from the cognitive domain of Bloom’s taxonomy. Miller’s pyramid can be used to decide, for example, that 70% of a statistics test will include tasks at the knows and knows how levels, while 30% will require students to show how. Process-oriented frameworks are particularly useful for clinical training where the emphasis is on procedural skills and the affective domain.


앞의 텍스트는 테스트 Blueprint가 내용 중심 또는 프로세스 중심 윤곽선임을 나타냅니다. 실제로 많은 Blueprint에서 이 두 차원을 [프로세스-컨텐츠 매트릭스]라는 단일 프레임워크에 통합합니다.

The preceding text suggests that test blueprints are either content-oriented or process-oriented outlines. In fact, many blueprints integrate these two dimensions into a single framework called the content-by-process matrix.


그림 4와 같은 프로세스별 콘텐츠 매트릭스는 테스트 설계를 위한 상당한 유연성을 제공하며 커리큘럼 전반에 걸쳐 사용할 수 있습니다. 이 설계의 일반적인 변화는 행 또는 열을 블룸의 분류법(예: 지식, 응용 프로그램, 분석)의 인지 수준으로 바꾸는 것입니다.

A content-by-process matrix like that in Figure 4 offers considerable flexibility for test design and can be used across the curriculum. A common variation of this design is to replace either the rows or columns with the cognitive levels from Bloom’s taxonomy (e.g. knowledge, application, analysis).



평가 목표 설명

Delineate the assessment objectives


이전 단계의 결과는 주요 내용과 프로세스의 범주 목록입니다. 이 두 번째 단계에서는 자세한 내용을 설명서에 소개합니다. 테스트 청사진은 구체적, 저추론적low-inference 행동을 나열하여 학생들이 기대하는 바를 설명해야 한다(Mookerjee et al. 2013). [저추론 행동]은 학생이 평가가 의도한 행동을 보여주었는지 객관적으로 판단하기에 충분히 관찰가능해야 한다. 경우에 따라 필수 세부 정보가 과정 목표의 일부로 이미 존재합니다. 무커지 외 연구진(2013)이 개발한 임상 기술 평가 청사진은 의대 기존 임상 기술 커리큘럼의 이정표에 의존했다.

The outcome of the previous stage is a list of the major content and/or process categories; this second stage introduces detail to the documentation. Test blueprints should describe what is expected of students by listing specific, low-inference behaviors (Mookherjee et al. 2013). Low-inference behaviors are sufficiently observable to objectively determine whether the student demonstrated the behaviors of interest. Sometimes the required detail will already exist as part of the course objectives. A blueprint for clinical skills assessment developed by Mookherjee et al. (2013) relied on milestones from the medical school’s existing clinical skills curriculum.


이정표와 학습 성과와 같은 상세한 문서를 쉽게 이용할 수 없는 경우, 평가 목표를 작성할 필요가 있을 수 있다. 잘 작성된 평가 목표는 그림 1의 행동 목표와 유사합니다. 그들은 숙달될 내용과 학생이 보여줄 지식이나 기술의 유형을 명시한다. 또 다른 접근 방식은 매트릭스 Blueprint에 의존하여 평가 목표를 지정하는 것입니다. 그림 5는 심혈관 의학에 대한 점원 시험을 위한 프로세스별 내용 청사진의 골격을 보여줍니다.

If detailed documents such as milestones and learning outcomes are not readily available, then it may be necessary to write the assessment objectives. Well-written assessment objectives are similar to the behavioral objectives in Figure 1. They specify the content to be mastered and the type of knowledge or skill that the student is expected to demonstrate. Another approach is to rely on a matrix blueprint to specify the assessment objectives. Figure 5 presents the skeleton of a content-by-process blueprint for a clerkship exam on cardiovascular medicine.


그림 5에는 논평할 가치가 있는 다른 특징들이 포함되어 있다. 

    • 첫째, 심근경색증에 따른 세부사항을 수준별로 기록합니다. 이상적으로는 각 등급의 심장 질환이 적절한 특정 조건을 포함하는 것이 좋다. 

    • 둘째, 오른쪽 열과 아래쪽 행의 값은 각 범주에 할당된 질문 수를 나타냅니다. 다양한 질문이 있으면 Blueprint를 구현할 때 유연성을 제공합니다. 

    • 셋째, 이 예제는 매우 일반적인 행렬의 각 셀에 대한 평가 항목 수를 지정합니다. 그러나 그림에서 알 수 있듯이 셀은 다른 방법으로도 사용될 수 있습니다(예: 과정 목표와 연결됨). 

    • 마지막으로, 세분화 수준을 고려하는 것이 중요합니다. 평가 작업을 더 쉽게 만들고 균형 잡힌 테스트를 조립할 수 있다는 이점 때문에 너무 세부적이고 몇 시간을 들여 테스트 청사진을 개발할 수 있습니다. 세부 사항이 너무 적어서 시험에 집중하지 못할 수도 있고, 학생들은 무엇을 예상해야 할지 모를 것이다. 대부분의 저자들은 테스트 청사진(예: Coderre 등)의 특수성을 높이려고 합니다. 2009; Fives and DiDonato-Barnes 2013, Mookherjee et al. 2013)

Figure 5 includes other features worthy of comment. 

    • First, note the level of detail under cardiomyopathies. Ideally, each class of cardiac disorders would include specific conditions as appropriate. 

    • Second, the values in the right column and the bottom row indicate the number of questions allocated to each category. Having a range of questions provides some flexibility when implementing the blueprint. 

    • Third, this particular example specifies the number of test items for each cell of the matrix, which is quite common. However, as the Figure indicates, the cells can be used in other ways as well (e.g. linked to course objectives). 

    • Finally, the level of granularity is important to consider. Too much detail and one can spend hours developing the test blueprint, with the benefit that it will be easier to produce assessment tasks and to assemble a balanced test. Too little detail and the test may be unfocused, and students will not know what to expect. Most authors lean toward greater specificity in test blueprints (e.g. Coderre et al. 2009; Fives and DiDonato-Barnes 2013; Mookherjee et al. 2013).



평가 형식 결정

Decide on the assessment format


평가 형식을 선택하는 것은 평가 방법과 학생들이 알고 할 수 있는 것에 대한 주장을 일치시키는 문제이다. 평가 방법은 세 가지 일반적인 등급으로 분류된다: 서면 평가, 시뮬레이션, 작업장 기반 평가.

Choosing an assessment format is a matter of matching the method of assessment with the claims to be made about what students know and can do. Assessment methods fall into three general classes: written assessments, simulations, and workplace-based assessment.


테스트 청사진 개발과 가장 관련이 있는 두 가지 유형의 타당성 증거는 콘텐츠 타당성 및 응답 프로세스입니다(Tavakol 및 Dennick 2017). 테스트 청사진이 컨텐츠 관련 증거의 주요 출처 역할을 한다는 것은 널리 알려져 있습니다(Kane 2016; Raymond 2016). 그 이유는 신중하게 개발된 테스트 청사진을 통해 평가 내용이 지침 중 다루는 내용과 일치하도록 보장할 수 있기 때문입니다(Notar 등). 2004; McLaughlin et al., 2005; Fives and DiDonato Barnes 2013).

The two types of validity evidence most relevant to the development of test blueprints are content validity and response process (Tavakol and Dennick 2017). It is widely recognized that a test blueprint serves as a primary source of content-related evidence (Kane 2016; Raymond 2016). This is because a thoughtfully developed test blueprint can help ensure that the assessment aligns with content covered during instruction (Notar et al. 2004; McLaughlin et al. 2005; Fives and DiDonatoBarnes 2013).


응답 프로세스 타당성은 [평가 과제에 의해 도출된 인지적, 정신 운동적, 그리고 정서적 프로세스가 학생들의 행동에 대해 제기되는 주장에 의해 암시되는 과정과 유사한 정도]를 의미한다. 예를 들어, MCQ는 "학생이 신체 검사와 흉부 X선을 해석하여 흉부 중심화의 필요성을 결정할 수 있다"는 주장을 뒷받침할 수 있다. 그러나 학생이 실제로 흉부 중심화를 수행할 수 있다는 주장을 뒷받침하려면 매우 영리한 MCQ가 필요할 것이다. 이 후자의 목표는 실제 또는 모의 실험 환자와 상호작용하는 학생의 직접 관찰을 포함하는 형식을 필요로 한다.

Response process validity refers to the extent to which the cognitive, psychomotor, and affective processes elicited by the assessment tasks are similar to the processes implied by the claims to be made about student behaviors. For example, an MCQ could support the claim that “the student is able to interpret physical examination and chest X-ray to determine the need for thoracentesis”. However, it would take a very clever MCQ to support the claim that a student can actually perform thoracentesis. This latter objective would require a format involving direct observation of the student interacting with a real or simulated patient.


또한 신뢰도는 평가 형식의 선택에 영향을 미치며, MCQ는 일반적으로 시뮬레이션이나 작업장 기반 평가보다 더 신뢰할 수 있는 점수를 산출한다. 비용, 물류 및 기타 실제적인 제약조건이 평가 형식의 선택에 가장 큰 영향을 미칠 것이다. 멀티 스테이션 시뮬레이션은 타당도를 향상시킬 수 있지만 직원 지원이나 물리적 공간 측면에서 의대 용량을 초과할 수 있다.

Reliability also will influence the choice of an assessment format, with MCQs generally producing more reliable scores than simulations or workplacebased assessments. Cost, logistics, and other practical constraints will most certainly influence the choice of an assessment format. Multi-station simulations may enhance validity but may exceed a medical school’s capacity in terms of staff support or physical space.


의심할 여지 없이, 의학 교육의 평가 환경은 지난 수십 년 동안 진화해 왔다. 임상 시뮬레이션과 작업장 기반 평가가 점점 더 보편화되고 있는 반면, 서면 평가는 그것이 가장 효과적인 영역만으로 제한되고 있다. 테스트 청사진을 필기 테스트와 연결하는 것이 일반적이지만, 시뮬레이션 및 작업 공간 기반 평가에도 역할이 있습니다. 실제로, 시험 청사진은 교육과정이 임상적 환경의 특이점에 의존하는 임상실습과 전공의에게 훨씬 더 중요할 수 있다.

Without question, the assessment landscape in medical education has evolved over the past few decades. Clinical simulations and workplace-based assessments are becoming more common, while written assessments are being limited to those domains for which they are most effective. Although it is common to associate test blueprints with written tests, they also have a role in simulations and workplace-based assessments. Indeed, test blueprints can be even more important for clerkships and residencies where the curriculum is dependent on the idiosyncrasies of the clinical setting.


OSCE와 같은 구조화된 임상 시뮬레이션은 시험 내용을 통제할 수 있는 직장 기반 평가보다 더 큰 기회를 제공한다. OSCE가 관련성이 있고 서로 다른 학생 코호트 간에 균형을 유지할 수 있도록 테스트 청사진은 학생 성과에 가장 영향을 미칠 수 있는 사례 특성을 명시해야 한다. 이론적으로, OSCE 청사진은 환자 나이, 성별, 의료 조건 및 환자 관리 유형과 같은 여러 요소로 구성될 수 있다. 이는 다차원 매트릭스로 수백 개의 셀을 생성한다. 실제로, 간단한 테이블로도 충분할 수 있다. 그림 6은 OSCE의 청사진을 보여줍니다. 이 Blueprint는 단일 테스트 양식에 대한 환자 및 의사 작업을 설명합니다. 추가 테스트 양식으로 일반화하려면 각 열에 대한 추가 내용 제약 조건을 문서화하는 것이 바람직합니다.

Structured clinical simulations, such as OSCEs, afford greater opportunity than workplace-based assessments to control test content. To ensure that OSCEs are relevant and remain balanced across different student cohorts, test blueprints should specify those case characteristics most likely to affect student performance. In theory, an OSCE blueprint could consist of multiple factors, such as patient age, gender, medical condition, and type of patient management; this would produce hundreds of cells in a multidimensional matrix. In practice, a simple table may suffice. Figure 6 illustrates a blueprint for an OSCE. This blueprint describes the cases and physician tasks for a single test form. To generalize to additional test forms, it would be desirable to document additional content constraints for each column.



범주 가중치 지정

Specify the category weights


테스트 시간은 제한되어 있습니다. 실질적인 문제로서, 내용 가중치 또는 범주 가중치를 사용하여 다른 평가 목표에 시간과 공간을 할당할 필요가 있다. 

    • 서면 평가의 경우, 가중치는 각 범주의 [시험 항목 수] 또는 백분율에 해당한다. 

    • 시뮬레이션과 작업장 평가의 경우 가중치는 [시험 시간]으로 환산할 가능성이 더 높다. 

Testing time is limited. As a practical matter, it is necessary to allocate time and space to the different assessment objectives through the use of content weights or category weights. 

    • For written assessments, the weights correspond to the number or percent of test items for each category. 

    • For simulations and workplace assessments, the weights more likely translate to the amount of testing time. 


범주 가중치를 할당할 때 한 가지 어려움은 일반적으로 [평가 목표 수가 사용 가능한 시험 시간을 초과한다는 것]이다. 도메인 샘플링 모델은 이 과제를 설명한다. 모든 테스트가 관심 있는 더 큰 지식 및 기술 영역의 행동 샘플을 나타낸다는 원칙에 기초한다(Tavakol 및 Dennick 2017).

One challenge when assigning category weights is that the the number of assessment objectives usually outweighs available testing time. The domain sampling model speaks to this challenge; it is based on the principle that any test represents a sample of behaviors from the larger knowledge and skill domains of interest (Tavakol and Dennick 2017).


범주 가중치는 도메인 내에서 주제의 중요성을 반영한다(Millman과 Greene 1989). 중요성은 주제에 전념하는 교육 시간, 그것이 실제로 얼마나 자주 적용되는지, 또는 후속 학습을 위한 주제의 중요성에 해당될 수 있다. 범주 가중치는 다양한 의료 조건과 절차의 발병률을 보고하는 국가 데이터에서 도출할 수 있다(Boulet et al. 2003, Baker et al. 2017). 또는 교수진, 거주자 또는 학생과 같은 동료들을 조사하여 주제 중요성을 결정할 수 있다.

Category weights reflect the importance of the topics within a domain (Millman and Greene 1989). Importance might correspond to the instructional time devoted to a topic; how often it is applied in practice; or the criticality of a topic for subsequent learning. Category weights can be derived from national data reporting the incidence of various medical conditions and procedures (Boulet et al. 2003; Baker et al. 2017). Alternatively, one can survey colleagues such as faculty, residents, or students to determine topic importance.


가중치 도출에 대한 이러한 엄격한 경험적 접근방식은 훌륭하지만 덜 까다로운 방법은 또한 강의실 시험에 적합하다. 효과적인 두 가지 전략은 하향식 및 상향식 방법(Raymond 2016)이며, 두 가지 방법 모두 단일 강사에 의해 적용되거나 동료 및 상급advanced 의대생을 포함하여 적용할 수 있다. 

    • 하향식 방법에는 Blueprint의 각 주요 범주에 백분율을 할당하여 백분율 합계가 100%가 되도록 합니다. 바람직한 경우, 하위 범주에 대해서도 유사한 방식으로 가중치를 얻을 수 있다. 

    • 향식 방법에는 백분율이 아닌 항목 수를 지정해야 하며, 그 수는 먼저 하위 범주 또는 특정 목적의 [낮은 수준(예: 하위 범주)에서 할당]되어야 합니다. 상향식 접근법의 한 가지 과제는 총 항목 수가 실현 가능한 최대 시험 길이를 초과할 수 있다는 것이다. 따라서 초기 가중치에 대한 일부 조정이 종종 필요하다.

Although these rigorous empirical approaches to deriving weights are admirable, less demanding methods also are suitable for classroom tests. Two effective strategies are the top-down and the bottom-up methods (Raymond 2016), both of which can be applied by a single instructor, or by including colleagues and advanced medical students. 

    • The top-down method involves the assignment of percentages to each major category in the blueprint such that the percentages sum to 100%. Weights can be obtained in a similar fashion for subcategories, if desirable. 

    • The bottom-up method requires specifying numbers of items, rather than percentages; and that numbers first be assigned at a lower level of the test blueprint (e.g. at the subcategory or specific objective). One challenge with the bottom-up approach is that the total number of items may exceed the maximum feasible test length; consequently, some adjustment to the initial weights is often necessary.


요약 및 결론 설명

Summary and concluding comments


테스트 청사진은 테스트 내용이 커리큘럼과 일치하는지 확인합니다(Notar 등). 2004); 이것은 타당도의 중요한 측면이다(Tavakol 및 Dennick 2017). 테스트 청사진은 특정 테스트의 점수가 더 큰 관심 영역(Kane 2016)으로 일반화되도록 지원함으로써 다른 방식으로 내용 타당화를 지원합니다. 또한 테스트 Blueprint는 응답 프로세스의 타당도를 평가하기 위한 프레임워크를 제공합니다.

Test blueprints assure that the content of a test aligns with the curriculum(Notar et al. 2004); this is a critical aspect of validity (Tavakol and Dennick 2017). Test blueprints support content validation in other ways, by helping to ensure that scores on a specific test generalize to the larger domain of interest (Kane 2016). Test blueprints also provide a framework for evaluating the validity of response processes.


이 문서는 강사가 학생들에게 어떤 가치를 부여하고 기대하는지를 나타내며 학습 가이드로 사용할 수 있습니다. 학생들과 청사진을 공유하는 것에는 장단점이 있지만, 연구는 이러한 관행을 뒷받침한다(McLaughlin et al. 2005; Patil et al. 2015).

They indicate what instructors value and expect of their students, and can be used as a study guide. Although there are pros and cons to sharing blueprint with students, studies support this practice (McLaughlin et al. 2005; Patil et al. 2015).


  • Blueprint에 포함된 내용 범주와 역량 영역은 학생들에게 피드백의 기초를 제공한다.

The content categories and competency domains included on test blueprints provide the basis for feedback to students.


  • Blueprint는 평가 관련 자료의 개발을 촉진한다. 예를 들어, 시험 청사진을 시뮬레이션 및 작업장 기반 평가를 위한 채점 루빅과 피드백 보고서로 변환하는 것이 간단하다(Mookerjee et al. 2013).

They facilitate the development of assessment-related materials. For example, it is straightforward to transform a test blueprint into scoring rubrics and feedback reports for simulations and workplace-based assessments (Mookherjee et al. 2013).


  • Blueprint는 부서별 문항작성 작성 및 검토 작업을 구성하는 데 필수적입니다. 문항 쓰기 과제를 간결하게 전달하기 때문이다 

Test blueprints are essential for organizing departmental item-writing and review efforts because they succinctly communicate item-writing assignments.


  • Blueprint는 시험 자료를 관리하기 위한 메타데이터를 제공한다. 일단 시험 청사진에 따라 시험 항목이 코드화되면, 더 큰 항목 풀에서 그것들을 회수하고 다른 목적을 위해 시험 형태로 조립하는 것이 간단하다.

They provide metadata for managing test materials. Once test items have been coded according to a test blueprint, it is straightforward to retrieve them from a larger pool of items and to assemble them into test forms for different purposes.


  • Blueprint는 교육의 질 향상에 기여한다. 학생 피드백에 사용된 범주는 또한 교수진에게 교육적 효과의 척도를 제공한다. 시험 청사진은 계획, 지침 및 평가 사이의 연관성을 명확히 하며, 이는 교수진의 자기반성을 고무시킬 수 있다(McLaughlin et al. 2005).

Test blueprints contribute to educational quality improvement. The categories used for student feedback also provide faculty with measures of instructional effectiveness. Test blueprints clarify the connections between planning, instruction, and assessment, which can inspire faculty self-reflection (McLaughlin et al. 2005).






. 2019 Aug;41(8):854-861.
 doi: 10.1080/0142159X.2019.1595556. Epub 2019 Apr 24.

A practical guide to test blueprinting

Affiliations 

Affiliations

  • 1National Board of Medical Examiners , Philadelphia , PA , USA.
  • 2Mayo Clinic College of Medicine and Science , Rochester , MN , USA.

Abstract

A test blueprint describes the key elements of a test, including the content to be covered, the amount of emphasis allocated to each content area, and other important features. This article offers practical guidelines for developing test blueprints. We first discuss the role of learning outcomes and behavioral objectives in test blueprinting, and then describe a four-stage process for creating test blueprints. The steps include identifying the major knowledge and skill domains (i.e. competencies); delineating the specific assessment objectives; determining the method of assessment to address those objectives; and establishing the amount of emphasis to allocate to each knowledge or skill domain. The article refers to and provides examples of numerous test blueprints for a wide variety of knowledge and skill domains. We conclude by discussing the role of test blueprinting in test score validation, and by summarizing some of the other ways that test blueprints support instruction and assessment.


종합에서 해석까지: 어떻게 평가자가 역량기반포트폴리오의 복잡한 데이터를 판단하는가(Adv in Health Sci Educ, 2017)

From aggregation to interpretation: how assessors judge complex data in a competency-based portfolio

Andrea Oudkerk Pool1 • Marjan J. B. Govaerts1 • Debbie A. D. C. Jaarsma2 • Erik W. Driessen1





서론 Introduction


역량 기반 평가의 증가로 포트폴리오가 평가 시스템의 핵심 요소로 인식되고 있습니다. 형식과 내용이 다를 수 있지만, 일반적으로는 포트폴리오는 수행된 작업에 대한 보고, 동료 및 교수진으로부터 받은 피드백, 진행 상황, 역량 향상 방법에 대한 목표 및 계획을 모두 포함하고 있습니다(Driessen et al. 2007).

With the rise of competency-based assessment, portfolios are increasingly seen as the linchpin of assessment systems. Although their format and content may differ, generally they all contain reporting on work done, feedback received from peers and faculty, progress made, and goals and plans on how to further improve competence (Driessen et al. 2007).


세계적으로 여러 의과대학은 학생의 성취도 평가에 포트폴리오가 핵심인 역량 기반 평가 시스템을 구현했다(Dannefer와 Henson 2007; Davis et al. 2001; Driessen 2016; Smith et al. 2003). 이러한 포트폴리오 기반 평가 시스템에서 학생들의 역량 수준에 관한 결정은 일반적으로 전문가의 판단에 의존한다. 전문 심사관은 포트폴리오에서 관련 증거를 선택, 해석 및 통합할 수 있으며, 결과적으로 학생의 역량에 대한 타당한 결정을 내릴 수 있다고 가정한다.

Worldwide, multiple medical schools have implemented competency-based assessment systems in which the portfolio is key to the assessment of students’ achievements (Dannefer and Henson 2007; Davis et al. 2001; Driessen 2016; Smith et al. 2003). In these portfolio-based assessment systems, decisions regarding the students’ level of competence typically rely on expert judgment. It is assumed that expert judges are able to select, interpret, and integrate relevant evidence in the portfolio, and consequently make a valid decision about a student’s competence.


더욱이 최근 훈련 중 평가에 관한 연구는 [교수진이 미래의 임상의에서 중요한 자질로 보는 것]과 [역량 기반 평가에서 정의된 역할] 사이의 불일치를 보여주었다(Ginsburg et al. 2011; Resenting et al. 2016; Rosenbluth et al. 2014). 학생들의 임상 역량 수준을 평가하도록 요청받았을 때, 교수진은 레지던트에 따라 특정 측면에 다양한 중요도를 부여했다. 즉, 뛰어난 학생의 단점은 무시될 수 있는 반면 약한 학생들의 강한 속성은 간과할 수 있었다(긴스버그 외. 2010). 게다가, 평가자에게 중요한 일부 구조는 고려할 역량조차 아니었다. 예를 들어, 평가자는 학생이 감독관에게 어떤 영향을 미치는지에 큰 중요성을 부여했습니다('직원에 미치는 영향').

Moreover, recent studies on in-training evaluations revealed a discrepancy between what faculty see as important qualities in a future clinician, and the roles defined within competency-based assessment (Ginsburg et al. 2011; Renting et al. 2016; Rosenbluth et al. 2014). When asked to assess students’ level of clinical competence, faculty assigned varying degrees of importance to certain aspects depending on the resident: shortcomings of exceptional students could be discounted while strong attributes of weaker students were overlooked (Ginsburg et al. 2010). Besides, some constructs that were of importance in the considerations of assessors were not even competencies at all. For example, assessors attached great importance to how the student affected the supervisor (coined ‘impact on staff’).


효과적인 교육에 대한 [공통된 비전]을 가지고 있고 많은 [동일한 증거]를 인용하는 평가자도 [상당히 다른 '이야기' 또는 수행에 대한 해석적인 요약]을 개발할 수 있다(슈츠와 모스 2004).

even assessors who hold a shared vision of effective teaching and who cite much the same evidence can, nonetheless, develop significantly different ‘stories’ or interpretive summaries of performance (Schutz and Moss 2004).


방법론 Methodology


세팅 Setting


이 연구는 네덜란드 마스트리히트 대학의 의학 석사 프로그램에서 정해졌다. MiM 커리큘럼은 의학 학사 이후 3년 동안 계속됩니다. 그것은 임상실습, 연구 프로젝트, 그리고 일렉티브로 구성되어 있다. 커리큘럼은 CanMEDs 프레임워크를 중요한 평가 프레임워크로 사용하여 역량 기반 교육과 평가의 원칙에 따라 설계되었다(Frank와 Danoff 2007). 역량 기반 평가는 학생들이 각 역량 영역에서 학습 및 개발 증거를 수집하고 반성하는 웹 기반 포트폴리오 시스템에 의해 지원된다(Moonen-van Loon et al., 2013). 모든 학생들에게는 자신의 평가와 성찰, 학습 목표 설정 등을 지도함으로써 학생의 역량 개발을 감시하는 멘토가 배정된다. 멘토와 학생은 1년에 3~4번 만나며, 그 동안 멘토는 역량 개발 및 포트폴리오에 대해 학생들과 논의합니다.

The research was set in the Master’s in Medicine (MiM) programof Maastricht University, the Netherlands. The MiM curriculum spans a 3-year period following the bachelor’s in Medicine. It consists of clerkships, a research project, and electives. The curriculum has been designed according to the principles of competency-based education and assessment, using the CanMEDS framework as overarching assessment framework (Frank and Danoff 2007). Competency-based assessment is supported by a web-based portfolio system in which students collect and reflect on evidence of their learning and development in each of the competency domains (Moonen-van Loon et al. 2013). Every student is assigned a mentor who monitors the student’s competency development by guiding the student in his or her self-assessments and reflections, and in setting learning goals. Mentor and student meet three to four times per year, during which the mentor discusses the competency development and portfolio with the student.


참여자 Participants


우리는 의도적으로 최대 변동 샘플링(Patton 1990)을 사용하여 18명의 멘토-평가자를 선택했습니다. 평가자의 의료 배경의 변화를 극대화하기 위해 다양한 의료 전문 분야(가족 의료 및 외과 및 비외과 전문 분야)에서 

We purposefully selected 18 mentor-assessors using maximum variation sampling (Patton 1990). To maximize variation in assessors’ medical backgrounds, we selected assessors from different medical specialties (Family Medicine and surgical as well as non-surgical specialties).


학생 포트폴리오 Student portfolio


본 연구의 목적을 위해, 연구팀은 (심리학자, 두 명의 교육학자, 그리고 한 명의 수의사로 구성된) 3개의 서로 다른 학생 프로필을 대표하는 3개의 모의 포트폴리오를 개발했으며, 각각은 다양한 수준의 역량 성취도를 반영했다. 이전 연구에서 평가자가 비의료 전문가 역량을 평가하는 데 어려움이 있다는 것을 보여주었기 때문에, 학생 프로파일에서 우리는 [의료 전문가 역량]과 [다른 역량]을 구별하기로 결정했다(Whitehead et al. 2015).

For the purpose of this study, the research team (consisting of a psychologist, two educationalists and a veterinarian) developed three mock portfolios representing three different student profiles, each reflecting varying levels of competency achievement. In our student profiles we chose to make a distinction between de medical expert competency and other competencies because previous research has shown that assessors have difficulty assessing the non-medical expert competencies (Whitehead et al. 2015).


    • 포트폴리오 (A) 의료 전문가 영역에서는 주로 긍정적인 피드백, 관리자와 의사소통 영역에서는 비판적 피드백과 긍정적인 피드백, 

    • 포트폴리오 (B) 의료 전문가 분야에서 비판적인 긍정적인 피드백, 그러나 다른 역량에 대한 긍정적인 피드백, 그리고 

    • 포트폴리오(C)는 모든 도메인에서 주로 긍정적인 피드백입니다.

    • portfolio (A) predominantly positive feedback in the medical expert domain, but both critical and positive feedback in the domains of manager and communicator; 

    • portfolio (B) both critical and positive feedback in the domain of medical expert, but predominantly positive feedback on the other competencies; and 

    • portfolio (C) predominantly positive feedback in all domains.


포트폴리오에는 학생의 자체 평가, 작업장 기반 평가(mini-CEX, DOPS, 현장 노트, 다중 소스 피드백), 진행 시험 결과, CV 등을 포함한 [18주 기간의 임상 로테이션] 동안 수집된 학생의 역량에 대한 증거가 포함되어 있었다. 각 포트폴리오에는 서술적 피드백, 역량 등급 및 자격(즉, 불충분, 충분 및 양호)과 개별 CanMED 역량과 관련된 테스트 결과가 포함되었습니다. 그림 1은 본 연구에 사용된 온라인 포트폴리오 환경의 인쇄 화면을 제공합니다.

The portfolios contained evidence on a student’s competencies collected during a single 18-week clinical rotation, including student’s self-assessments, workplace-based assessments (mini-CEXs, DOPSs, field notes, multi-source feedback), progress test results, and a curriculum vitae. Each portfolio comprised narrative feedback, competency ratings and qualifications (i.e., insufficient, sufficient, and good) as well as test results pertaining to each of the individual CanMEDS competencies. Figure 1 provides a print screen of the online portfolio environment used for this study.



윤리 Ethical approval


자료 수집과 분석 Data collection and analysis


24명의 멘토 평가자를 이메일로 초대하여 참여 전에 동의를 받았습니다. 18명의 평가자들이 우리의 초대에 응했다. 각 평가자는 세 가지 포트폴리오 버전 중 하나를 제시받았고, 따라서 각 포트폴리오 버전은 여섯 명의 평가자에 의해 평가되었다.

We invited 24 mentor–assessors via e-mail to participate and obtained their consent prior to participation. Eighteen assessors responded to our invitation. Each assessor was presented one of the three portfolio versions, each portfolio version was therefore assessed by six assessors.


평가자들은 이 내용을 주의 깊게 읽고 '부족하다', '충분하다', 또는 '좋다'고 평가함으로써 학생의 전반적인 직업적 역량에 대한 전체적인 판단을 내리도록 지시받았다.

Assessors were instructed to carefully read it and provide a holistic judgment of the student’s overall professional competence by rating it as ‘insufficient,’ ‘sufficient,’ or ‘good.’


포트폴리오 평가 중 평가자의 인지 처리를 포착하기 위해, 우리는 think-aloud 방식(Van Someren et al., 1994)을 사용했는데, 이는 우리가 평가자들에게 포트폴리오를 읽고 평가하는 동안 모든 생각, 아이디어 및 결정을 언어화하도록 지시했다는 것을 의미한다. 만약 그들이 몇 초 이상 침묵한다면, 우리는 그들에게 그들의 생각을 계속 말하라고 상기시켰다.

To capture assessors’ cognitive processing during portfolio evaluation, we employed the think-aloud method (Van Someren et al. 1994), which means that we instructed assessors to verbalize all their thoughts, ideas, and decisions while reading and evaluating the portfolio. If they fell silent for more than a few seconds, we reminded them to keep verbalizing their thoughts.


결과 Results


평가자의 정보 처리과정: 3단계 순환적 프로세스 

Assessors’ information processing: a 3-phase cyclical process


정보 처리에서 모든 평가자는 각각 정보를 [획득, 조직, 통합]하는 유사한 순환 패턴을 따랐다. 

    • 첫 번째 단계에서 평가자는 가장 중요하고 신뢰할 수 있는 근거 중 판단의 근거가 되는 것으로 간주되는 정보를 선택하였다. 

    • 이 정보를 검토한 후, 그들은 그것이 학생들의 [역량의 여러 측면aspects]에 대한 [정보에 근거한 판단]에 기여하는지 여부와 그 방법을 정의했다. 

    • 평가자들은 그 후에 다양한 증거의 출처를 따져보고 학생의 능력에 대한 예비판단을 결정했다.

In processing information, all assessors followed a similar cyclical pattern of acquiring, organizing, and integrating information, respectively. 

    • During the first phase, assessors selected the information they considered the most important and credible pieces of evidence upon which to base their judgment. 

    • After reviewing this information, they defined if and how it contributed to an informed judgment about aspects of student’s competence. 

    • Assessors subsequently weighed the various sources of evidence and decided on a (preliminary) judgment of the student’s competence.


첫 번째 라운드가 끝나자, 평가자는 나머지 포트폴리오 증거를 검토하여 추가 확인 또는 확인되지 않은 데이터를 찾아 정보 획득 단계를 반복했고, 이는 다시 정보의 조직과 통합에 영향을 미쳤다. 이 반복적인 과정은 평가자가 학생의 능력에 대한 판단을 내릴 수 있을 만큼 충분한 정보를 얻었다고 느낄 때까지 평가자가 새로운 포트폴리오 증거를 검토할 때마다 반복되었다. 여러 출처의 다른 증거들을 비교함으로써, 평가자들은 점차적으로 학생의 역량 패턴을 인식하게 되었다.

Upon conclusion of the first round, assessors reviewed the remaining portfolio evidence to look for additional confirming or disconfirming data thereby repeating the information acquisition phase which, in turn, influenced the organization and integration of information. This iterative process was repeated every time the assessor reviewed new portfolio evidence, until assessors felt they had obtained enough information to make a judgment about the student’s competence. By comparing different pieces of evidence from multiple sources, assessors gradually came to recognize patterns in the student’s competence.


더욱이 중요한 발견은 다음과 같은 명백한 증거에 직면했을 때조차 [평가자가 초기 판단을 고수하는 경향]이 있다는 것이다. 비록 그들의 최종 판단이 그들의 예비판단에 비해 더 정교하고 세밀했지만, 그들은 그들의 초기판단과 실질적으로 다르지 않았다. 학생 프로파일 간의 차이는 학생의 능력에 대한 평가 과정이나 평가자의 전반적인 판단에 영향을 미치지 않는 것으로 보였다. 대부분의 평가자들은 학생들의 능력이 충분하다고 평가했다.

A salient finding, moreover, was that assessors were inclined to stick to their initial judgments even when confronted with seemingly disconfirming evidence: Although their final judgments were, indeed, more elaborate and detailed compared to their preliminary judgments, they were not substantially different from their initial judgments. Differences between student profiles did not seem to affect the judgment process or assessors’ overall judgment of the student’s competence: Most assessors rated the students’ competence as sufficient.


학생 평가에 대한 평가자의 독특한 접근 방식

Assessors’ idiosyncratic approaches to the student evaluation


어떤 평가자는 최종 판단을 내리기 전에 전체 포트폴리오를 읽지만, 다른 평가자는 주로 자신의 판단에 inform하기 위해 학생의 자체 평가 또는 직장 기반 평가 데이터에 의존했고, 대체로 추가적인 포트폴리오 증거를 무시했다.

While some assessors read the entire portfolio before providing their final judgment, others mainly relied on either the student’s self-evaluation or workplace-based assessment data to inform their judgment, largely ignoring additional portfolio evidence.


다음 단락에서는 이 세 가지 평가자 간 차이에 대해 좀 더 자세히 논의한다.

The following paragraphs will discuss each of these three inter-assessor differences in more detail.


평가자가 신뢰할 수 있는 포트폴리오 증거라고 믿었던 것의 차이

Differences in what assessors believed to be credible portfolio evidence


첫째, 평가자는 자신의 판단에 inform하기 위해 주로 서술적 피드백에 의존한다는 점을 주목해야 한다. 이는 다른 사람이 제공하는 개선사항에 대한 구체적인 제안뿐만 아니라 학생의 발전, 강점 및 약점에 대한 의미 있고 상세한 정보를 제공했기 때문이다. 성적과 자격은 단지 서술에 근거한 인상을 확인하는 데 사용되었다.

First it should be noted that assessors mainly relied on narrative feedback to inform their judgment, because this provided meaningful and detailed information about the student’s development, strengths and weaknesses, as well as specific suggestions for improvement as provided by others. Grades and qualifications were merely used to confirm impressions based on narratives.


이러한 공통성에도 불구하고, 평가자들은 [어떤 종류의 서술적 증거가 학생의 능력에 대한 가장 가치 있고 신뢰할 수 있는 정보를 제공하는지]에 대해서는 다양한 신념을 가지고 있었다.

Despite this commonality, assessors had varying assessment beliefs about what kind of narrative evidence gave the most valuable and credible information about the student’s competence.


예를 들어 평가자들은 평가를 시작하기 위해 서술적 증거의 여러 부분들을 선택하였다. 일부 평가자들은 직장 기반 평가에 대한 서술적 코멘트가 학생들의 능력에 대한 가장 확실한 증거를 생성한다고 믿고 있다. 그러나, 다른 이들은 학생들의 자기 평가와 성찰적인 글을 읽기 시작했는데, 이는 그들이 결과적으로 학생들의 주장이 정당한지 확인하기 위해 읽은 중요한 피드백 논평과 평가 양식에 대한 언급을 포함할 것이라고 가정했기 때문이다.

Assessors, for instance, chose different pieces of narrative evidence to start their evaluation: some selected narrative comments on workplace-based assessments, believing that these would generate the most authentic evidence of students’ abilities; Other, however, started reading the student’s self-evaluations and reflective writings as they assumed these would contain reference to salient feedback comments and assessment forms which they consequently read to check if the student’s claims were justifiable.


출처는 또한 증거의 신빙성을 결정하는 데 있어 중요한 것으로 보였다. 일부 평가자는 주로 의사로부터의 피드백에 의존했다. 왜냐하면 그들은 그들이 학생 역량에 대한 정확하고 의미 있는 피드백을 제공할 가능성이 가장 높기 때문이다. 반면, 다른 평가자는 동료 학생 및 간호사의 피드백을 선호했다. 다른 평가자는 학생들과 더 가깝게 일했고, 따라서 직접 관찰할 수 있는 더 많은 기회를 가졌을 것이다. 

The source also appeared to matter in deciding on the credibility of evidence: Some assessors mainly relied on feedback from physicians because they perceived them as content experts most likely to provide accurate and meaningful feedback on student competence; Others, in contrast, preferred feedback from fellow students and nurses who, they presumed, had worked more closely with students and therefore had more opportunities to directly observe them.


소스 선호도의 평가자 간 차이도 [평가자의 기준 프레임]과 [학생-감독관 관계에 미칠 영향]에서 비롯되었다. 예를 들어, 복수 평가자는 [학생이 서로 다른 시점에 동일한 사람으로부터 피드백을 받았을 때] 학생의 진도가 더 안정적으로 설정될 수 있다는 믿음을 표현했다.

Between-assessor differences in source preferences also stemmed from assessors’ frames of reference and the presumed impact of student-supervisor relationships. for instance, multiple assessors expressed their belief that student’s progress could be established more reliably when the student had received feedback from the same person at different points in time,


동시에, 다른 평가자는 여러 평가자의 입력input을 가치 있게 평가했으며, 이는 1인 피드백에 비해 더 신뢰할 수 있고 더 유용한 것으로 추정했다. 선호도를 설명할 때, 몇몇 평가자는 선택 편향에 대한 인식(즉, 학생들이 피드백을 제공하기 위해 의도적으로 더 관대한 평가자를 선택)과 충돌을 피하기 위해 부정적인 의견을 적기를 꺼리는 피드백 제공자를 유발했다.

At the same time, other assessors did value the input from multiple assessors, which they estimated to be more reliable and more informative compared to single-person feedback. In explaining their preferences, several assessors invoked perceptions of selection bias (i.e., students purposively selecting more lenient assessors to provide feedback) and feedback providers’ reluctance to write down negative comments so as to avoid conflicts:


마지막으로, 포트폴리오의 평가 데이터는 또한 감독의 퀄리티애 대한 다양한 인상을 유도했다. 예를 들어, 감독자가 상세한 서면 피드백을 제공하지 못했을 때, 여러 평가자는 감독자가 필수 코멘트를 적었으며 구두로 보다 정교한 피드백을 제공했다고 가정했다. 그러나 다른 사람들은 그 학생이 관찰되지 않았다고 믿었고 따라서 감독관 평가의 신뢰성에 의문을 제기했습니다.

Finally, the assessment data in the portfolio also induced different impressions about the quality of supervision. When a supervisor, for instance, failed to provide detailed written feedback, several assessors assumed that the supervisor had probably written down the essential comments and had provided more elaborate feedback verbally. Others, however, believed that the student had gone unobserved and therefore questioned the credibility of the supervisors’ assessments.


무엇이 '역량'을 구성하는지에 대한 해석의 차이

Differences in interpretations of what constitutes ‘competence’


무엇이 역량을 구성하는지에 대한 이러한 가변적 해석의 결과로, 평가자들은 판단을 내리기 위해 학생에 대해 무엇을 알아야 하는지에 대해 다르게 생각했다. 흥미롭게도, 이러한 소위 '성과 이론'은 공식적인 평가 기준에서 벗어나는 경향이 있었다.

As a result of these variable interpretations of what constitutes competence, assessors thought differently about what they needed to know about the student to be able to form a judgment. Interestingly, these so-called ‘performance theories’ tended to deviate from the formal assessment criteria.


한 평가자 그룹은 학생들의 역량을 [그들이 자신의 학습 과정에 적극적으로 참여하고 역량 향상을 위한 피드백을 효과적으로 사용하는 정도]로 정의했다. 좀 더 구체적으로, 그들은 [학습과 평가에 대한 적극적인 참여]를 좋은 학생의 핵심적 자질이라고 생각했다. 따라서, 성장을 확립하기 위해, 그들은 종종 포트폴리오 증거를 시간 순으로 읽어서 임상 로테이션 초기에 잘 진행되지 않았던 측면이 시간이 지남에 따라 개선되었는지 여부를 점검한다. 비슷하게, 그들은 학생이 개선이 필요한 모든 측면을 추적했는지 확인하기 위해 작업영역 기반 평가와 피드백을 선별했다. 그들은 또한 학생들이 학습 목표와 약속에 대해 후속 조치를 취하는 것이 필수적이라고 생각했기 때문에 학생들의 자기 평가와 학습 목표를 포함했다. 이 평가자 그룹에 따르면, [학생이 시간이 지남에 따라 충분히 향상되고 적극적으로 개선하려고 노력했다는 충분한 증거]가 있는 한, 학생의 역량이 반드시 표준에 달해야 하는 것은 아니다.

One group of assessors defined students’ competence in terms of the extent to which they actively engaged in their own learning process and effectively used feedback for competence improvement. More specifically, they considered active engagement in learning and assessment a key quality of a good student. Hence, to establish growth, they often read the portfolio evidence in chronological order to check if aspects that did not go well in the beginning of the clinical rotation had improved over time. In the same fashion, they screened the workplace-based assessments and feedback to verify whether the student had followed-up on all the aspects that needed to improve. In their perusal, they also included the student’s self-assessment and learning goals as they felt that it was vital to know if students did follow up on learning goals and appointments. According to this group of assessors, the student’s competence did not necessarily have to be up to standard as long as there was enough evidence that the student had sufficiently improved over time and actively tried to improve:


다른 평가자들은 [스스로의 역량을 성찰하는 능력]에 의해 학생들의 능력 수준을 측정했다. 결과적으로, 그들은 학생이 하나 이상의 영역에서 자신의 역량을 인식하지 못하는 경우라면 절대 안 된다는 점을 고려하여 학생의 자기반성을 검토하는 것으로 시작했다.

Other assessors measured students’ level of competence by their ability to reflect on their own competencies. Consequently, they started by reviewing the student’s self-reflections, considering it a no–no when a student was not aware of his or her competence in one or more areas:


'역량'에 대한 평가자의 해석 사이에 발견된 최종 차이는 포트폴리오의 다양한 CanMED 역량 영역에 가중치를 부여하고 평가하는 방식에 반영되었다. 포트폴리오 버전에 관계없이 대부분의 평가자는 구체적으로 '의료 전문가', '관리자' 및 '의사소통가' 역량을 대상으로 하여 나머지 역량을 검사했지만, 어떤 평가자들은 모든 범위의 역량에 초점을 맞추려고 했다. 후자와 같은 방식은 잘 정의되지 않은 역량(예: 건강 옹호자 또는 학자)에 대한 귀중한 피드백을 수집하는 것이 학생들에게 상당히 어려운 과제이기 때문에 학생 간에 차별화를 가능하게 했다. 따라서, '잘 정의되지 않는 역량'에 대한 과제를 수행할 수 있고, 이러한 증거를 성찰하는 학생들은 평균 이상이며 학습에 열심인 것으로 간주되었습니다.

A final distinction we found between assessors’ interpretations of ‘competence’ was reflected in the way they weighted and valued the various CanMEDS competency domains in the portfolio. While most assessors, regardless of portfolio version, specifically targeted ‘medical expert’, ‘manager’, and ‘communicator’ competencies and scanned the remaining competencies, others sought to bring into focus the full range of competencies. This latter tactic allowed them to differentiate between students, as collecting valuable feedback on the less well defined competencies (e.g., health advocate or scholar) is quite a challenge for students. Hence, students who were able to do so and reflected on this evidence were considered to be above average and eager to learn:


평가자가 포트폴리오 증거를 해석하는 방법의 차이

Differences in how assessors construed the portfolio evidence


전체 판단 과정 동안 평가자는 포트폴리오에 포함된 [증거에 자신의 의미를 부여]하여 학생의 능력과 태도에 대한 서로 다른 추론을 유도했다. 좀 더 구체적으로 말하면, 동일한 정보 부분에 기초하여 평가자들은 다른 결론을 도출했다. 예를 들어 학생들의 역량 및 성취에 대한 책임에 관한 것이다. 특정 학생의 직장 기반 평가에 대한 '불충분함insufficient' 등급에 대하여, [한 평가자가 지식의 부족으로 해석]한 반면, [다른 평가자는 그것을 불안정insecurity]으로 돌렸다. 반대로, 일부에서는 평가자와 감독자의 경험에서, 서면 평가는 일반적으로 평가를 후하게 하는 측면에 있다는 것을 배웠기 때문에, 장기간에 걸쳐 '충분함sufficient' 등급을 받은 학생은 '저조한 수행능력'을 가진 것으로 해석되었다.

Throughout the entire judgment process assessors lent their own meanings to the evidence included in the portfolio, leading to different inferences about the student’s competence and attitude. More specifically, based on the same pieces of information assessors drew different conclusions, for instance about students’ responsibility for their competence and achievement: An insufficient rating on a workplace-based assessment of a specific student, was construed by one assessor as the result of a lack of knowledge, while another attributed it to insecurity. Conversely, sufficient ratings over a prolonged period of time were construed as underperformance by some, since they had learned from experience as an assessor and supervisor that written assessments were generally on the positive side be as supervisors eschew failing a student:


그리고 나서 나는 그 '부족함'이라는 판단을 내리는 것이 얼마나 어려운 일인지 깨닫는다. 평가자는 학생에 대한 영향력을 누그러뜨리려는 경향이 있고, 그래서 1점이나 2점을 주는 것은 매우 어려우므로, 보통 3을 준다. 그리고 그것이 내가 누군가가 3점밖에 얻지 못할 때 조심하는 이유이다. 사실, 그 세 가지는 3점 대신 1점부터 3점까지를 의미할 수 있기 때문입니다. (평가자 12)

And then I realize how hard it is to deliver that emphatic ‘insufficient.’ You are inclined to soften the blow for that person and then it is very difficult to give a one1 or a two, so you give a three. And that is why I am cautious when someone only scores threes. Really, because those threes could also be taken to mean a score of one to three, instead of a three. (Assessor 12)


그러나 다른 평가자들은 학생에 대한 약간의 배경 정보가 없이는 포트폴리오의 평가 피드백에 대한 정확한 해석을 할 수 없다고 느꼈다. 이 평가자들은 또한 학생들의 과외 활동, 관심사, 취미에도 관심이 있었다. 학생의 배경에 대해 좀 더 알기 위한 노력으로 일부 평가자는 실제로 학생의 CV를 읽으면서 포트폴리오 검토를 시작했습니다.

Yet other assessors felt they could not make an accurate interpretation of the assessment feedback in the portfolio without having some background information about the student. These assessors were also interested in the student’s extracurricular activities, interests, and hobbies. In an effort to know more about the student’s background, some assessors actually commenced their portfolio review by reading the student’s curriculum vitae:


위에 명명된 성과 데이터의 다른 해석은 학생의 수행능력에 대한 다양한 추론을 초래했고 역량 프레임워크의 특정 요소에 대해서도 서로 동등하지만, 서로 다른 판단으로 이어졌다.

The above-named different interpretations of performance data led to varying inferences about a student’s performance and to equally dissimilar judgments about specific components in the competency framework.


예를 들어, 포트폴리오 A를 읽을 때, 평가자 1은 '의료 전문가' 역할에 큰 중요성을 부여했고, 따라서 구체적으로 이 역량에 대한 모든 포트폴리오 증거를 찾아보았다. 결과적으로, 이 평가자는 이 역량에 대한 가장 신뢰할 수 있는 정보는 의사로부터 얻었으며 직장 기반 평가에서 찾을 수 있다고 믿었다. 결국, 평가자는 학생이 의료 전문가 영역에서 능력이 부족하기 때문에 학생의 역량이 문제가 된다고 추론했다.

When reading portfolio A, for instance, assessor 1 attached great importance to the ‘medical expert’ role and therefore specifically looked for all portfolio evidence about this competency. Consequently, this assessor believed that the most reliable information about this competence came from doctors and could be found in the workplace-based assessments. In the end, the assessor inferred that the student’s competence was problematic since the student lacked competence in the medical expert domain.


그러나 동일한 포트폴리오를 읽은 평가자 2는 학생의 발전progress 상황을 파악하는 데 더 관심이 있었습니다. 이 평가자는 다중 소스 피드백의 코멘트를 읽음으로써 자신이 그렇게 할 수 있을 것이라고 믿었는데, 이 피드백은 장기간에 걸쳐 학생의 능력에 대한 여러 사람의 의견을 포함하기 때문이다. 학생이 의료 전문가 역량에 주의를 기울여야 한다는 점은 인정했지만, 평가자는 학생이 임상 교대 중에 상당히 개선되었기 때문에 우려를 갖지 않았다.

Assessor 2, however, who read the same portfolio, was more interested in determining the student’s progress. This assessor believed that by reading the comments in the multisource feedback he would be able to do so, because this feedback contained opinions of multiple people about the student’s competence over a longer period of time. Although acknowledging that the student should pay attention to the medical expert competency, the assessor was not concerned because the student had improved considerably during the clinical rotation.


고찰 Discussion


우리의 연구 결과는 평가자의 정보 처리는 정보의 획득, 구성 및 통합의 반복적인 단계에 의해 특징지어진다는 것을 시사한다. 평가자 인식에 대한 이전 연구에서도 유사한 단계가 발견되었습니다(Gauthier et al. 2016). 비록 모든 평가자들이 그들의 신뢰도 판단, 수행 이론 및 추론의 차이에서 증명되었듯이, 평가자들은 각자의 고유한 접근법을 가지고 있었지만, 그들은 결국 동일한 전반적인 판단에 도달했다. 이 결과는 Gingerich 등의 연구(2014년)와 일치한다. 평가자는 판단에 대해 다른 원인 설명을 제공했지만, 유사한 판단을 내리고 있었다.

Our findings suggest that assessors’ information processing is characterized by iterative phases of acquiring, organizing and integrating information. Previous research on rater cognition has found similar phases (Gauthier et al. 2016). Although all assessors had their unique approaches, as evidenced by differences in their credibility judgments, performance theories, and inferences, they eventually reached the same overall judgments. This finding is consistent with research by Gingerich et al. (2014) : While raters provided differentcausal explanations for their judgment, subgroups of raters were making similar judgments.


우리는 또한 평가자의 증거 선택과 이 증거가 그들의 판단에 영향을 미치는 정도는 포트폴리오 증거의 신뢰성에 대한 믿음에 의해 강하게 지배된다는 것을 발견했다.

We also found that assessors’ selection of evidence and the extent to which they let this evidence influence their judgment were strongly governed by their beliefs about the credibility of the portfolio evidence.


피드백에 직면했을 때, 학생들은 [자신의 성장에 inform하는 데 어떤 정보를 사용할지 결정]하기 위해 피드백의 신뢰성을 판단했습니다. 평가자와 마찬가지로, (학생에게도) 피드백의 출처는 신뢰도 판단에 중요한 역할을 했다. 예를 들어, 학생들이 개인의 임상적 역량을 존중할 때, 그들은 피드백을 더 쉽게 받아들일 것이다.

When confronted with feedback, students judged the credibility of this feedback in order to decide which information they would use to inform their development. As with the assessors, the source of feedback played an important role in their credibility judgment. When students, for example, respected the individual for his or her clinical competence, they would more readily accept the feedback.


Watling 외 연구진(2012)과 현재의 연구는 모두 정보의 신뢰성을 평가할 수 있으려면 피드백 소스를 아는 것이 필수적이라는 것을 입증한다.

both research by Watling et al. (2012) and the present research demonstrate that it is vital to know the feedback source in order to be able to assess the information’s credibility.


우리의 연구 결과는 또한 평가자들이 [정보에 입각한 결정]을 내리기 위해 [학생에 대해 알아야 할 것에 대한 믿음]을 가이드하는 [서로 다른 수행 이론]을 가지고 있다는 것을 보여주었다. 이전 연구를 확인하면서, 본 연구의 평가자들은 포트폴리오 구조를 제공하는 역량 프레임워크의 외부적인 측면(예: 학생 진행 및 자기반성과 같은)에 근거하여 판단했습니다.

Our findings also revealed that assessors held different performance theories which guided their beliefs about what they needed to know about a student to be able to make a well-informed decision. Confirming previous research , the assessors in our study also based their judgments on aspects (such as student progress and self-reflections) that were external to the competency framework providing the portfolio structure.


직접적인 관찰에 기초한 판단은 본질적으로 자동적 의사결정 과정을 포함한다. 사람 분류와 관련된 자동 의사결정 프로세스는 변환 오류와 역량 간의 차이를 평가할 수 없는 평가자로 이어질 수 있다는 것이 입증되었다(Kolars et al. 2003; Macrae and Bodenhausen 2000). 또한 자동 의사 결정에는 최적의 솔루션은 아니지만, 만족스러운 솔루션을 찾는 프로세스를 가속화하기 위해 사용되는, [경험적 접근 기술]의 사용이 포함된다. 유사한 의사결정 문제가 종종 더 일찍 직면하는 경우, 의사결정자들은 쉽게 의사결정에 도달하기 위해 쉽게 이용할 수 있는 전략을 사용하는 경향이 있다(Tversky와 Kaneman 1975). 

Judgments based on direct observations inherently involve automatic decision-making processes. It has been demonstrated that automatic decision-making processes involving the categorization of people could lead to conversion errors and assessors’ inability to differentiate between competencies (Kolars et al. 2003; Macrae and Bodenhausen 2000). Furthermore, automatic decision-making involves the use of heuristic techniques used to speed up the process of finding a satisfactory, though possibly not optimal, solution. If similar decision-making problems have often been faced earlier, decision makers tend to use readily available strategies to arrive at a decision more easily (Tversky and Kahneman 1975). 


우리의 연구에서, 휴리스틱 사용을 포함한 다양한 자동적 과정들이 평가자들의 의사 결정에도 중요한 역할을 하는 것처럼 보였다. 예를 들어 평가자는 자동으로 특정 피드백 소스를 선호한다. 또한 그들의 추론은 이전의 경험에 의해 형성되었다. 평가자는 유사한 학생에 대한 이전의 경험에 기초하여 포트폴리오 증거에 인과적 설명을 자동으로 할당했다. 비록 이러한 자동적 의사결정 과정이 판단 과정에 영향을 주었고, 평가자의 평가 이면에 있는 추론의 차이를 야기시켰지만, 평가자들은 학생들의 역량을 평가하는 데 아무런 어려움을 겪지 않았다더욱이, 그들의 최종적인 전반적인 평가는, 자동적인 의사결정 과정에서의 차이에도 불구하고, 조화를 이루었다.

In our study, various automatic processes including use of heuristics seemed to play a role in assessors’ decision-making as well. Assessors, for example, automatically favoured particular feedback sources. Furthermore, their inferences were shaped by previous experiences: Assessors automatically assigned causal explanations to portfolio evidence based on earlier experiences with similar students. Although these automatic decision-making processes influenced the judgment process and caused differences in assessors’ reasoning behind their evaluations, assessors experienced no difficulty assessing the students’ competence. What’s more, their final overall assessments were in harmony, despite the differences caused by automatic decision-making processes.


본 연구는 포트폴리오의 자기 평가 및 반성적 작성을 포함한 다양한 유형의 작업장 기반 평가 및 성과 평가 옆에 평가자에게 의미 있고 중요한 정보를 추가한다고 제안합니다. 분명히, 자기 평가와 성찰적 글은 평가자에게 직장 기반 평가에서 추론할 수 없는 정보를 제공한다. 우리 연구의 또 다른 중요한 기여는 평가자는 [학생의 배경에 대한 보다 일반적인 정보를 얻고 해석함으로써] 평가를 맥락화할 필요가 있다고 느낀다는 점이다.

our study suggests that, next to various types of workplace-based assessments and performance evaluations, including self-assessments and reflective writing in the portfolio adds information that is meaningful and important to assessors. Apparently, self-assessments and reflective writings provide assessors with information that cannot be inferred from workplace-based assessments. Another important contribution of our study is the observation that assessors feel need to contextualize the assessment by obtaining and interpreting more general information about the student’s background.


한계 Limitations


다음으로, think-aloud 절차는 다양한 사고 과정이 자동적이거나 너무 빨리 일어나 언어화할 시간이 없기 때문에 언어화할 수 없다는 한계가 있다(2003년 헌장). 비록 참가자들의 언어화가 일관되고 완벽해 보이지만, 우리가 모든 사고 과정을 포착하지 못했을 수도 있다는 점을 고려해야 한다. 더욱이, think-aloud를 사용하는 것은 참가자가 실제 사고과정을 보고하기 보다는 연구자를 만족시키기 위해 설명을 작성할 위험이 있다. 그러나, 우리는 think-aloud 절차 외에도, 참가자들에게 왜 그들이 특별한 결정을 내렸는지에 대한 질문을 받는 반구조적인 인터뷰도 실시했습니다. 또한, 참가자의 의사결정의 중요한 공통적인 측면이 포착됨을 나타내는 12명의 참가자 후에 이론적 포화에 도달했다.

Next, the think-aloud procedure inherently harbours a limitation in that various thought processes cannot be verbalized because they are either automatic or happen so quickly that there is no time to verbalize them (Charters 2003). Although the participants’ verbalizations seem coherent and complete, it should be taken into account that we might have not captured all thought processes. Furthermore, using think-aloud procedures has the risk of participants creating explanations to satisfy the researcher rather than reporting their actual thought processes. However, in addition to the think-aloud procedure, we also conducted semi-structured interviews in which participants were asked about the reasons why they made particular decisions. Also, theoretical saturation was reached after 12 participants indicating that important common aspects of participants’ decision-making are captured.


실질적 함의 Practical implications


이 연구는 학생들의 역량에 대해서 평가자가 자신의 판단을 설명하는 것이 중요함을 재차 강조한다. 평가자의 설명explanation 에서 확인된 차이는, (역량에 대한) 의사결정이 개별적으로 이루어지는 것이 아니라, 그룹 토론에서 비롯되어야 한다는 것을 시사한다. 복수 평가자가 학생의 역량에 대해 동일한 일반적인 판단에 도달할 수 있지만, [개별 역량에 대한 판단]과 [전체적인 판단 이면에 있는 추론]에 있어 다르다.

This study reiterates the importance of assessors explaining their judgments about students’ competence. Differences between assessors’ explanations suggest that decisions should not be made individually, but should result fromgroup discussions. Although multiple assessors may reach the same general judgment about a student’s competence, they do differ in their judgments of individual competencies and the reasoning behind their overall judgments.


또한, [다른 평가자의 판단 정책을 논의하는 것]은 평가자가 [자신의 평가 방법이 보편적으로 공유되지 않는다는 사실]을 인식하게 할 것이다. 그것은 그들이 역량과 포트폴리오 해석의 다른 관점에 익숙해지도록 도울 것이다. 이를 통해 평가자는 자신의 평가 프로세스에 다른 평가자의 평가 관행을 통합하고 역량 평가를 위한 '공유된 정신 모델'을 구축할 수 있다.

Also, discussing judgment policies of other assessors will make assessors aware of the fact that their method of assessment is not universally shared. It will help them to become acquainted with other views of competence and portfolio interpretation. This enables assessors to incorporate assessment practices of other assessors into their own assessment process, and to build ‘shared mental models’ for competence assessment.


우리의 연구 결과는 평가자 교육에 시사하는 바가 있음을 시사한다. 평가자 훈련은 자신의 신념, 수행 이론 및 추론에 대한 평가자의 인식을 높이는 데 초점을 맞춰야 한다. 만약 그들이 그들 자신의 의사 결정 과정에 대한 더 많은 통찰력을 얻고 다른 평가자들의 의견을 알게 된다면, 그들의 의사 결정은 개선될 수 있다. 또한, 훈련은 Hauer 등(2016)이 설명한 의사결정 과정에 대한 그룹 구성원 구성 및 그룹 프로세스의 영향에 초점을 맞춰야 한다.

Our findings suggest implications for assessor training. Assessor training should focus on raising assessors’ awareness of their own beliefs, performance theories, and inferences. If they gain more insight into their own decision-making process and get acquainted with those of other assessors their decision making may improve. Furthermore, training should focus on the effect of group member composition and group processes on the decision making processes as described by Hauer et al. (2016).


더욱이, 평가자는 포트폴리오 증거의 선택과 사용에 대해 서로 다른 접근방식을 가지므로, 포트폴리오가 포트폴리오 증거를 통해 선택selection과 항해navigation를 촉진하는 방식으로 설계되는 것이 중요하다. 캡션도 중요하다. 왜냐하면 역량 피드백이 학생에게 제공된 컨텍스트를 요약하기 때문이다(Van Tartwijk and Driessen 2009). 맥락은 평가자가 증거를 해석하고 판단하기 위해 증거를 사용할지 여부와 방법을 결정하는 데 도움이 된다.

Furthermore, since assessors have different approaches to the selection and use of portfolio evidence, it is important that portfolios be designed in such a way that they facilitate the selection of and navigation through the portfolio evidence. Captions are important as well, for they summarize the context in which the competency feedback was provided to the student (Van Tartwijk and Driessen 2009), helping assessors interpret the evidence and decide if and how they want to use it for their judgment.


결론 Conclusion


평가자는 포트폴리오 증거만으로 판단을 내릴 수 있었다. 비록 그들은 같은 전반적인 판단에 도달했지만, 그들은 증거를 처리하는 방식과 그들의 판단 이면에 있는 추론에 있어서 차이를 보였다. 평가자의 다른 평가 신념, 수행 이론 및 일치된 행동을 하는 추론에서 차이가 발생한다. 이러한 결과는 포트폴리오가 그들의 판단을 철저히 입증해야 하는 복수의 평가자에 의해 판단되어야 한다는 개념을 뒷받침한다. 또한 평가자는 자신의 의사 결정 과정과 그룹 결정에 영향을 미치는 요인에 대한 통찰력을 제공하는 교육을 받아야 한다.

Assessors were able to form a judgment based on the portfolio evidence alone. Although they reached the same overall judgments, they differed in the way they processed the evidence and in the reasoning behind their judgments. Differences sprung from assessors’ divergent assessment beliefs, performance theories, and inferences acting in concert. These findings support the notion that portfolios should be judged by multiple assessors who should, moreover, thoroughly substantiate their judgments. Also, assessors should receive training that provides insight into factors influencing their own decision making process and group decisions.






. 2018 May;23(2):275-287.
 doi: 10.1007/s10459-017-9793-y. Epub 2017 Oct 14.

From aggregation to interpretation: how assessors judge complex data in a competency-based portfolio

Affiliations 

Affiliations

  • 1Department of Educational Development and Research, Maastricht University, Universiteitssingel 60, 6229 ER, Maastricht, The Netherlands. a.oudkerkpool@maastrichtuniversity.nl.
  • 2Department of Educational Development and Research, Maastricht University, Universiteitssingel 60, 6229 ER, Maastricht, The Netherlands.
  • 3Center for Education Development and Research in Health Professions (CEDAR), Faculty of Medical Sciences, University Medical Center Groningen, University of Groningen, Groningen, The Netherlands.
Free PMC article

Abstract

While portfolios are increasingly used to assess competence, the validity of such portfolio-based assessments has hitherto remained unconfirmed. The purpose of the present research is therefore to further our understanding of how assessors form judgments when interpreting the complex data included in a competency-based portfolio. Eighteen assessors appraised one of three competency-based mock portfolios while thinking aloud, before taking part in semi-structured interviews. A thematic analysis of the think-aloud protocols and interviews revealed that assessors reached judgments through a 3-phase cyclical cognitive process of acquiring, organizing, and integrating evidence. Upon conclusion of the first cycle, assessors reviewed the remaining portfolio evidence to look for confirming or disconfirming evidence. Assessors were inclined to stick to their initial judgments even when confronted with seemingly disconfirming evidence. Although assessors reached similar final (pass-fail) judgments of students' professional competence, they differed in their information-processing approaches and the reasoning behind their judgments. Differences sprung from assessors' divergent assessment beliefs, performance theories, and inferences about the student. Assessment beliefs refer to assessors' opinions about what kind of evidence gives the most valuable and trustworthy information about the student's competence, whereas assessors' performance theories concern their conceptualizations of what constitutes professional competence and competent performance. Even when using the same pieces of information, assessors furthermore differed with respect to inferences about the student as a person as well as a (future) professional. Our findings support the notion that assessors' reasoning in judgment and decision-making varies and is guided by their mental models of performance assessment, potentially impacting feedback and the credibility of decisions. Our findings also lend further credence to the assertion that portfolios should be judged by multiple assessors who should, moreover, thoroughly substantiate their judgments. Finally, it is suggested that portfolios be designed in such a way that they facilitate the selection of and navigation through the portfolio evidence.

Keywords: Assessment; Competency-based medical education; Information processing; Portfolio; Rater cognition; Think-aloud method; Undergraduate medical education.


내러티브 코멘트의 숨은 가치: 질적 자료의 양적 신뢰도 분석(Acad Med, 2017)

The Hidden Value of Narrative Comments for Assessment: A Quantitative Reliability Analysis of Qualitative Data

Shiphra Ginsburg, MD, MEd, PhD, Cees P.M. van der Vleuten, PhD, and Kevin W. Eva, PhD


전공의가 미리 결정된 마일스톤을 확실히 충족시키려면, (2) 타당한 판단과 의사결정을 뒷받침하기 위해 연습생별로 훨씬 더 많은 정보를 수집할 필요가 있다.3,4 이를 위해, 질적이고 주관적인 데이터5와 다수의 저부담 출처의 데이터를 aggregate하는 것의 가치가 점차 높아지고 있다.6 이러한 변화에 발맞춰 평가의 형식과 다양성이 확대되고 있지만, 전문직은 여전히 숫자 및 서술형 데이터를 포함하는 로테이션 종료시점 평가 양식(여기서 교육 내 평가 보고서 또는 ITER라고 함)에 크게 의존하고 있다. 이러한 형식의 문헌(및 사용)은 대부분 전적으로 숫자 데이터에 기초하지만 서술에는 큰 가치가 있을 수 있다.7–9

To ensure that residents meet predetermined milestones,2 it is necessary to collect much more information on each trainee to support valid judgment and decision making.3,4 To this end, increasing value is being placed on qualitative and subjective data5 and on the need to aggregate data from multiple, low-stakes sources.6 The format and variety of evaluations is expanding in step with these changes, but the profession generally still relies heavily on end-of- rotation assessment forms (herein called in-training evaluation reports, or ITERs) that contain numeric and narrative data. Most of the literature (and use) of forms of this type is based entirely on the numeric data, yet there may be great value in the narratives.7–9


평가 코멘트를 이용해 학습자나 실무자를 평가하는 효용성과 타당성에 대한 연구가 일부 진행돼 엇갈린 결과가 나오고 있다. 예를 들어, 몇몇 연구에서는 코멘트가 할당된 점수와 대체로 일치한다는 것을 밝혀냈으며, 수천 개의 코멘트(예: 의사 revalidation, 또는 레지던시12)를 읽는 것은 문제를 해결할 가치가 없을 수 있음을 시사했다. 반면에, 비협조적인nonconcordance 영역은 점수에서 달리 파악되지 않은 약점을 나타낼 수 있다. 따라서 흔히 "실패 실패failure to fail"로 표현되는 문제를 극복하는 데 도움이 되고, 그리고 코멘트는 학습자들에게 개선 방법에 대한 더 많은 지침을 제공한다.16,17 어떠한 방식으로 [추가적인 정보 획득]과 [(정보 획득의) 실현가능성을 유지하는 것] 사이의 형을 맞출 것인가가 공식적인 훈련 환경뿐만 아니라 훈련과 연습의 연속에서 보건 전문가들이 다루어야 할 중요한 과제다.

Some research has been conducted on the utility and feasibility of using assessment comments to evaluate learners or practitioners, yielding mixed results. For example, several studies have found that comments are usually concordant with scores assigned, suggesting that reading thousands of comments (e.g., for physician revalidation11 or residency12) may not be worth the trouble. On the other hand, areas of nonconcordance can illustrate weaknesses not otherwise picked up by the scores,7,13 thereby helping to overcome the well-described phenomenon of “failure to fail,”14,15 and comments provide learners with more guidance regarding how to improve.16,17 Determining how to balance these competing issues of gaining additional information and maintaining feasibility is an important challenge for the health professions to address, not only in formal training environments but across the continuum of training and practice.


따라서, 신뢰성이 높게 관찰되는 것은, [(모든 평가 프로세스에서 가용한 데이터의 양이 늘어남에 따라서 일반적으로 신뢰도가 높아진다고 볼 수 있기에) 누적된 코멘트의 양]과 [특정 훈련 프로그램 내에서 평가 문화에 대한 교수진의 인식]과 관련이 있을 수 있다. 

The high reliability observed, therefore, may be related to the volume of comments amassed (given that reliability can generally be expected to increase with the amount of data available in any assessment process) and to the faculty’s awareness of the culture of assessment within the particular training program studied.


이 연구의 전반적인 목표는 평가에서 서술적 데이터의 사용에 관한 타당성 주장validity argument에 기여하는 것이었다. 현재 타당도 모델에서, 신뢰성은 타당도의 중요한 측면으로 간주되며, 주어진 모집단의 특정 목적에 평가 점수가 적합한지 여부에 대한 논쟁을 형성하는 데 도움이 된다. 20,21 본 연구는 다양한 양의 논평이 주어진 거주자가 순위를 매길 수 있는 신뢰성에 초점을 맞춘다.그들의 연기에 도전하다

The overall goal of this study was to contribute to the validity argument regarding the use of narrative data in assessment. Under current models of validity, reliability is considered to be an important aspect of validity, helpful for building an argument regarding whether or not assessment scores are fit for a given purpose with a given population.20,21 Our study focuses on the reliability with which residents can be rank-ordered given variable amounts of commentary about their performance.


방법 Method


세팅 Setting


각 전공의는 1개월의 임상 순환이 끝날 때마다 1개의 ITER를 받으며, 이 중 93% 이상이 서면 의견을 포함하고 있다. 우리의 ITER에는 18개의 항목이 포함되어 있는데, 각 항목은 1에서 5까지의 척도로 평가되고, 그 다음에 전체 등급과 의견을 입력할 수 있는 단일 자유 텍스트 상자가 뒤따른다. 교수들에게 보내는 지침서는 다음과 같다: "일반적인 능력, 동기부여, 그리고 컨설턴트 기술을 포함하여, 이 로테이션 동안 연습생의 발전에 대한 일반적인 인상을 제공하라. 강점과 개선이 필요한 분야를 강조해 달라."

Each resident receives one ITER at the end of each one-month clinical rotation, over 93% of which contain written comments. Our ITERs contain 18 items, each rated on a scale from 1 to 5 followed by an overall rating and a single free-text box in which to enter comments. The instructions to faculty state: “Provide a general impression of the trainee’s development during this rotation, including general competence, motivation, and consultant skills. Please emphasize strengths and areas that require improvement.”


1년 동안 [코멘트가 담긴 ITER 8개 이상]을 받은 레지던트를 포함했는데, 이 중 3개는 처음 4개월간의 교육에서 나와야 했다. 우리는 ITER의 이 숫자에 걸쳐 집계된 ITER 점수의 허용 가능한 신뢰도를 보여주는 연구에 기초하여 8을 선택했다.7,22,23 우리는 다음과 같은 의견 집합을 만들 수 있도록 이러한 기준을 만족하는 각 코호트에서 무작위로 48명의 레지던트를 선택했다. 전공의 1인당 4회씩 포함시켜 4세트에 걸쳐 4명의 참가자가 순위를 매길 수 있도록 했으며, 이는 192건의 문서에 해당하며, 각각의 문서는 특정 전공의에 대한 1년 치 의견을 담고 있다. 이전의 연구를 바탕으로, 7 우리는 [교수는 16명의 전공의의 의견을 합리적인 시간 내에 읽고 순위를 매길 수 있다]고 판단하여, 12 세트의 16명의 전공의 코멘트를 정리했다.

We included residents who had received 8 or more ITERs containing comments over the course of one year, 3 of which had to come from the first 4 months of training. We chose 8 based on studies showing acceptable reliability of ITER scores aggregated across this number of ITERs.7,22,23 We randomly selected 48 residents from each cohort who met these criteria so that we could create sets of comments as follows. Each resident was included 4 times, so that they appeared in 4 different sets and could be ranked by 4 different participants; this resulted in 192 documents, with each document containing a year’s worth of comments from a given resident. On the basis of previous research,7 we determined that faculty could read and rank-order comments from 16 residents in a reasonable time frame; thus, 12 sets of 16 residents’ comments were compiled.



참여자 Participants


연구 설계는 그림 1에 나와 있다. 각 동의하는 교수진에게 다음과 같은 두 가지 데이터 세트가 포함된 패키지가 발송되었다. 한 세트는 두 코호트 중 한 곳에 있는 15~16명의 전공의에 대한 연간 전체 코멘트를 포함했고, 다른 세트는 다른 코호트와 다른 15~16명의 전공의에 대한 올해 첫 3개의 코멘트 상자를 포함했다.

The study design is shown in Figure 1. Each consenting faculty member was sent a package containing two sets of data: One set contained the entire year’s worth of comments for 15 to 16 residents in one of the two cohorts; the other set contained the first three comment boxes of the year from 15 to 16 different residents from the other cohort.



프로토콜 Protocol


훈련된 연구 보조원(RA)이 각 참가자와 스카이프를 통해 대면 회의를 진행했다. 참가자들에게 15~16개의 문서를 모두 읽고 사전 연구 중에 도출된 범주로 분류하도록 했다(

    • A = 우수, 우수, 모범, 

    • B = 견고, 안전, 약간의 미세한 조정이 필요할 수 있음, 

    • C = 경계선, 맨 최소, 교정 가능, 

    • D = 안전하지 않음, 다중 결손).24 

그 후 각 부문별로 주민 순위를 매겨 최종 순위 1~15/16이 나왔다.

A trained research assistant (RA) conducted a face-to-face meeting over Skype with each participant. Beginning with the set of full-year comments, participants were asked to read all 15 to 16 documents and sort them into categories derived during prior research (

    • A = outstanding, excellent, exemplary; 

    • B = solid, safe, may need some fine tuning; 

    • C = borderline, bare minimum, remediable; 

    • D = unsafe, unacceptable, multiple deficits).24 

Afterwards, they were asked to rank-order the residents within each category, resulting in a final ranking of 1 to 15/16.


이 과제를 수행한 후, 그들은 의사결정 과정을 탐색하기 위해 RA에 의해 인터뷰되었다. 이어 두 번째 서류 세트를 이용해 과제를 반복했는데, 여기에는 레지던트들이 올해 처음 3차례 평가한 것과 다른 주민들의 의견이 담겨 있었다. 전체 연도 및 부분 연도 작업에 필요한 시간은 각각 RA가 기록한 약 45분과 15~20분~20분이었다.

After this task, they were interviewed by the RA to explore their decision-making process. They then repeated the task using a second set of documents, which contained a different set of residents’ comments from the residents’ first three assessments of the year. Time required for the full-year and part-year tasks was approximately 45 and 15–20 minutes, respectively, as recorded by the RA.


분석 Analysis


ITER 코멘트를 바탕으로 판단 생성의 효과를 분석하기 위해 24명의 교수진 참가자 모두의 순위 데이터를 엑셀에 입력하여 정확성을 검증했다. [레지던트 내 랭커가 중첩된 일반화 이론]을 사용하여 레지던트 순위의 신뢰성을 평가하였다. G_string은 스터디 설계가 불균형할 때 분석을 가능하게 하기 때문에 사용되었다(대부분의 PGY-1에는 랭커가 4개 있었지만, 일부는 한 레지던트의 데이터를 실수로 잘못 부호화하여 3개가 있었고, 두 개의 패키지가 각각 한 레지던트에 대한 코멘트가 누락되었기 때문에 사용).

To analyze the effectiveness of generating judgments based on ITER comments, rank-order data from all 24 faculty participants were entered into Excel and verified for accuracy. We assessed the reliability of resident rankings using generalizability theory, with ranker nested within resident. G_string was used because it enables analysis when the study design is unbalanced (while most PGY-1s had four rankers, some had three because of inadvertent miscoding of one resident’s data and because two packages were each missing comments for one resident).


결과 Results


2011년 코호트 출신 주민 48명은 평균 3.97명의 교직원이 순위를 매겼고, 2010년 코호트 출신 주민 46명은 평균 3.94명의 교직원이 순위를 매겼다.

The 48 residents from the 2011 cohort were rank-ordered by an average of 3.97 faculty, and the 46 residents from the 2010 cohort were rank-ordered by an average of 3.94 faculty.


교수 랭커 수가 증가하는 것이 순위의 신뢰성에 미치는 영향을 요약한 의사결정 연구는 표 1에 설명되어 있다.

A decision study outlining the influence of increasing the number of faculty rankers on the reliability of the rankings is illustrated in Table 1.



[처음 세 가지 평가에 근거한 순위] 및 [전체 연도에 근거한 순위] 간의 스피어맨 상관 관계는 각 코호트에 대해 계산되었으며, 각각 r = 0.66과 0.63으로 확인되었으며, 둘 다 P < 0.01로 유의했다. 이러한 상관관계는 ITER 점수 자체에 대해 계산된 유사한 집합과 비교할 수 있는데, 이 집합은 각각 r = 0.76과 0.63으로 확인되었으며, 다시 P < 0.01로 유의미하다.

Spearman correlations between rankings based on the first three assessments and based on the full year were calculated for each cohort and were found to be r = 0.66 and 0.63, respectively, both significant with P < .01. These correlations are comparable to a similar set calculated on the ITER scores themselves, which were found to be r = 0.76 and 0.63, respectively, again both significant with P < .01.


고찰 Discussion


우리의 연구 결과는 서술적 코멘트만을 가지고 레지던트를 평가하는 수단으로 사용하는 것이 매우 신뢰할 수 있다는 것을 보여준다. 이러한 높은 신뢰성은 그해 처음 3개의 코멘트가 포함된 ITER만 고려했을 때에도 유지되었다(표 1 참조). 연구된 두 코호트에서, 거주자 순위 변동의 85% - 91%는 4명의 랭커에 걸친 평균 순위를 고려할 때 레지던트(즉, 측정에서 "시그널")에게 귀속되었다. 또한, 최초 3개 ITER로부터 얻은 레지던트 순위는 데이터의 전체 연도를 기준으로 한 순위와 높은 상관관계가 있었다.

Our findings reveal that using narrative comments alone as a means of assessing residents can be extremely reliable. This high reliability was maintained even when we considered only the first three comment-containing ITERs of the year (see Table 1). In both cohorts studied, 85% to 91% of the variance in resident ranking was attributable to the resident (i.e., the “signal” in the measurement) when the average ranking across four rankers was considered. Further, residents’ rankings from the first three ITERs were highly correlated with their rankings based on the full year of data


표 1은 또한 3회 로테이션에 근거하여, 2명의 교수진가 레지던트의 순위를 매기는 경우에도 0.75 - 0.80의 신뢰성을 달성할 수 있음을 보여준다. 이러한 수치는 고부담 평가에서 수용할 수 있는 범위 내에 있다. 이는 [두 명의 교수가 연초에 레지던트의 평가 의견을 읽도록 하는 간단한 개입]조차도 매우 유익한 방법이 될 수 있으며 이른 시기에 추가 교육 지원이 필요한 레지던트를 식별할 수 있을 것이라고 제안한다.17

Table 1 also illustrates that a reliability of 0.75 to 0.80 can be achieved with only two faculty members ranking residents based on three rotations’ worth of comments. Such numbers are within the range of acceptability for even high-stakes assessments,25 suggesting that a simple intervention—having two faculty read residents’ evaluation comments early in the year—can be a very fruitful enterprise and may enable the identification of residents requiring additional educational supports at an early time point.17


본 연구의 독특한 특징은 이전 연구와 달리 교수진 참여자들이 우리의 교육 프로그램에 포함되어 있지 않으며external to program, IM 평가에서 경험이 있지만 ITER 코멘트를 평가하는 훈련을 받지 않았다는 것이다. 이전의 연구에서는 ITER가 평가되고 있는 레지던트와 동일한 프로그램에 속해있는 교직원이 "행간 읽기"에 능통하여, [모호하고 특수성이 결여된 것으로 보일 수 있는 평가 의견]도 해독해내는 것으로 밝혀졌다.18,26 외부의, 교육받지 않은 교수조차 행간 읽기 능력이 있는 것으로 보인다는 사실은 IM 교수진이 거주자에 대한 내러티브를 쓰고 이해하는 방법에 어느 정도의 보편성이 있다는 것을 쉽게 암시한다. 이는 적어도 단일 국가 내에서 IM의 PGY-1에 대해 어떤 성능을 보여야 하는지에 대한 교수진의 공통된 이해가 있음을 시사한다.

Unlike previous work, a unique feature of this study is that the faculty participants were external to our training program and were not trained in assessing ITER comments, although they were experienced in IM assessment. Previous research found that faculty belonging to the same program as the residents whose ITERs were being assessed were adept at “reading between the lines” to decode assessment comments that could often appear to be vague and lacking in specificity.18,26 The fact that external, untrained faculty appear capable of reading between the lines just as readily implies that there is a degree of universality to how IM faculty write and understand narratives about their residents. This further suggests that there is a shared understanding on the part of faculty of what performance should look like for PGY-1s in IM, at least within a single country.


우리의 발견은 다른 맥락에서 복제가 필요하지만, 우리의 코멘트가 수집이 쉬웠고, 상당히 간략하며, 어텐딩의 부분에 대한 특별한 교육이 포함되지 않았다는 현실은 수많은 잠재적인 응용 프로그램을 쉽게 상상할 수 있게 한다.

our findings would require replication in different contexts, but the reality that our comments were easily collected, fairly brief, and involved no special training on the part of the attendings makes it easy to envision numerous potential applications.


우리의 연구 결과를 해석할 때 몇 가지 한계를 명심해야 한다. 비록 코멘트의 범위와 성격에 관한 특정 평가 문화를 가질 수 있지만 하나의 대형 IM 프로그램으로부터 모든 평가 코멘트가 나왔고, 우리의 참여자들은 ITER에 2년 정도의 경험이 필요했기 때문에 다른 프로그램에서 우리의 작업의 복제 가능성은 제한적일 수 있다. 이러한 잠재력은 주어진 프로그램에서 다수의 레지던트 평가 코멘트를 읽으면 독자들이 해당 프로그램 내에서 "일반적인" 언어 사용이 무엇인지 알 수 있고 그에 따라 순위를 조정할 수 있다는 점에서 우리의 참여자들이 "행 사이를 읽을" 수 있게 한 메커니즘에 대한 대체 설명을 증가시킨다. 우리는 이 설명의 가능성이 낮다고 생각한다. 왜냐하면 주치의 사이의 작문 방식과 내용에서 현저한 차이가 "일반적인" 언어 사용의 개념에 반대한다고 주장하기 때문이다.26

Several limitations should be kept in mind when interpreting our findings. The replicability of our work in other programs may be limited as all of our assessment comments came from a single, albeit large IM program that might have a specific culture of assessment regarding the extent and nature of comments and because our participants were required to have two years’ worth of experience with ITERs. This potential raises an alternative explanation of the mechanisms that enabled our participants to “read between the lines” in that perhaps reading multiple resident assessment comments from a given program can allow readers to learn what “typical” language use is within that program, thereby allowing them to calibrate their rankings accordingly. We think this explanation is less likely, as the marked differences in writing style and content noted between attending physicians argue against the notion of “typical” language use.26


결론 Conclusions


서술형 코멘트를 의료교육에서 일상적 평가의 일부로 편입하는 것은 이미 이뤄졌어야만 한다30 우리의 연구는 [소수의 내러티브 보고서가 수집된 후, 이를 전공의의 변별력있게 평가하는 방법으로 신뢰성 있게 사용될 수 있다는 것]을 입증함으로써 내러티브21의 유용성에 대한 타당성 증거를 증가시키고 있다.

The incorporation of narrative comments as a routine part of assessment in medical education is overdue.30 Our study adds to the growing validity evidence for the utility of narratives21 by demonstrating that they can be reliably used as a way to discriminate between residents after a small number of reports are collected.


중요한 것은, 이러한 발견이 증가하는 문헌 7,21,32에 ITER가 내과IM에서 평가에 대해 "무용하다"는 일반적인 의견을 불식시키는 데 도움이 되어야 하며, 이것은 풍부하고 의미 있는 코멘트를 작성하는 것의 중요성을 더욱 강화시킬 수 있을 것이다.

Importantly, these findings add to a growing literature7,21,32 that should help to dispel the common opinion that ITERs are “useless” for assessment in IM, which might further reinforce the importance of writing rich and meaningful comments.








. 2017 Nov;92(11):1617-1621.
 doi: 10.1097/ACM.0000000000001669.

The Hidden Value of Narrative Comments for Assessment: A Quantitative Reliability Analysis of Qualitative Data

Affiliations 

Affiliation

  • 1S. Ginsburg is professor, Department of Medicine, and scientist, Wilson Centre for Research in Education, Faculty of Medicine, University of Toronto, Toronto, Ontario, Canada. C.P.M. van der Vleuten is professor of education, Department of Educational Development and Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands. K.W. Eva is associate director and senior scientist, Centre for Health Education Scholarship, and professor and director of educational research and scholarship, Faculty of Medicine, University of British Columbia, Vancouver, British Columbia, Canada.

Abstract

Purpose: In-training evaluation reports (ITERs) are ubiquitous in internal medicine (IM) residency. Written comments can provide a rich data source, yet are often overlooked. This study determined the reliability of using variable amounts of commentary to discriminate between residents.

Method: ITER comments from two cohorts of PGY-1s in IM at the University of Toronto (graduating 2010 and 2011; n = 46-48) were put into sets containing 15 to 16 residents. Parallel sets were created: one with comments from the full year and one with comments from only the first three assessments. Each set was rank-ordered by four internists external to the program between April 2014 and May 2015 (n = 24). Generalizability analyses and a decision study were performed.

Results: For the full year of comments, reliability coefficients averaged across four rankers were G = 0.85 and G = 0.91 for the two cohorts. For a single ranker, G = 0.60 and G = 0.73. Using only the first three assessments, reliabilities remained high at G = 0.66 and G = 0.60 for a single ranker. In a decision study, if two internists ranked the first three assessments, reliability would be G = 0.80 and G = 0.75 for the two cohorts.

Conclusions: Using written comments to discriminate between residents can be extremely reliable even after only several reports are collected. This suggests a way to identify residents early on who may require attention. These findings contribute evidence to support the validity argument for using qualitative data for assessment.


운전 연습 또는 운전 시험? 피드백을 평가와 구분하기 위한 비유(Perspect Med Educ, 2020)

Driving lesson or driving test? A metaphor to help faculty separate feedback from assessment

Paul L. P. Brand · A. Debbie C. Jaarsma · Cees P. M. van der Vleuten





임상 교육에 대한 피드백: 중요하지만 아직 덜 사용됨

Feedback in clinical education: important, but still underused


피드백은 임상 의학에서 직장 기반 학습을 지원하는 핵심 도구다[1–3]. 의료교육의 모든 단계에서 학습자가 환자와의 만남에서 경험적 학습 기회를 최대한 활용할 수 있도록 돕는다 [4, 5].

Feedback is a key tool to support workplace-based learning in clinical medicine [1–3]. It helps learners at all stages of medical education to make the most of the experiential learning opportunities in encounters with patients [4, 5].


상자 1 주행 테스트 은유—첫 번째 저자의 개인적 설명

Box 1 The driving test metaphor—a personal account of the first author


운전 면허시험이 있던 날, 수년 전, 나는 꽤 긴장하고 있었다. 단호하지만 친근한 운전 강사의 연이은 레슨을 받고 나니 시험에 필요한 모든 기동을 할 수 있다는 자신감이 생겼다. 그러나 나의 운전면허시험은 대학도시에서 러시아워에 예정되어 있었는데, 그 많은 자전거 운전자들이 모든 교통신호를 무시하고 눈에 보이는 신호를 무시하고 시내 자동차와 트럭 교통의 복잡성을 가중시켰다. 주행 테스트 도중 다른 도로 이용자들의 불규칙한 행동에 대응해 두 차례에 걸쳐 급브레이크를 밟아야 했다. 45분 동안 운전과 주차/회전 절차를 거친 후, 심사관은 내가 시험에 합격했다고 말했고, 그것은 분명히 나를 기쁘고 자랑스럽게 만들었다. 그러나 그는 아슬아슬한 상황이었다고 덧붙였다. "두 번 째, 나는 거의 비상 브레이크를 밟을 뻔 했다"고 그는 말했다. "그리고 내가 그렇게 해야 했다면, 너는 시험에 떨어졌을 것이라는 것을 알고 있다." 물론, 난 고개를 끄덕였어. 이어 "내가 너라면 운전 강습을 좀 더 받아 번잡한 교차로에 대한 너의 접근법을 연구하겠다. 교통이 혼잡할 때 속도와 안전 사이의 균형을 더 잘 맞춰라." 나는 잠시 혼란스러웠다. 여기서 나한테 무슨 말을 하려던 걸까? 내 운전이 충분하지 않았던가? 그가 정말 그렇게 생각했다면, 그는 나를 실망시켰어야 했다. 하지만 그는 그러지 않았다. 나는 확실히 하기 위해 다시 확인했고 그는 내가 시험에 합격했다는 것을 확인했다. 그래서 나는 "오늘 내 운전이 시험에 합격할 수 있을 만큼 좋다면 충고를 잘 지키면서 어디든 붙이면 되겠다"고 생각했다. 며칠 뒤 운전면허를 챙기고 면허를 받은 운전자로 독립적 연습을 시작했는데, 시간이 지날수록 연습과 노출이 늘어나면서 점점 좋아진 것 같다(생각한다. 몇 년 후에야 나는 무슨 일이 일어났는지 깨달았다. 심사관은 평가와 피드백을 혼동했다. 결과적으로, 그의 피드백은 효과가 없었다.

On the day of my driving test, many years ago, I was feeling pretty nervous. After a series of lessons by a firm but friendly driving instructor, I was confident I could do all the manoeuvres required for the exam. My driving test, however, was scheduled during rush hour in a university city, with its masses of cyclists ignoring every traffic light and sign in sight, adding to the complexity of inner-city car and truck traffic. During the driving test, I had to brake suddenly on two occasions in response to other road users’ erratic behaviour. After the required 45min of driving and parking/turning procedures, the examiner told me I had passed the test, which—obviously—made me happy and proud. He added, however, that it had been a close call. “Twice, I almost hit the emergency brake”, he said. “And you know that if I had had to do that, you would have failed the test”. Sure, I nodded, I know that. Then, he added, “If I were you, I’d take some more driving lessons to work on your approach to busy intersections. Strike a better balance between speed and safety in busy traffic”. I was confused for a moment. What did he mean to tell me here? Was my driving not good enough? If he really thought that, he should have failed me. But he didn’t. I double-checked to be sure and he confirmed that I had passed the test. So I thought, “If my driving today was good enough to pass the test, you can keep your advice and stick it, well, anywhere”. I collected my driving licence a few days later, started independent practice as a licensed driver, and got better and better over time (I think), with increasing practice and exposure. Only many years later did I realise what had happened. The examiner had confused assessment and feedback. As a result, his feedback was ineffective.


유용성과 최적의 피드백 제공에 대한 이해의 진보에도 불구하고, 의료 학습자들은 임상 배치 중에 제한된 양의 피드백을 계속 경험하고, 너무 일반적이거나 범위가 제한되어 도움이 되지 않는 피드백을 받고, 피드백 역량이 부족한 교수를 자주 겪는다 [1, 5, 8, 1].2, 13] 최근의 관찰에 따르면 역량 기반 의료 교육은 학습자의 성장을 지원하기 위한 피드백과 프로그램의 핵심 역량 획득을 평가하는 데 필요한 공식적인 평가 절차 사이에 긴장을 조성한다[13, 14]. 학습자들은 임상 기술의 직접 관찰과 같은 학습 활동을, 미래에 대한 유의미한 결과를 가져오는 고부담 평가[14–17]로 인식하여, 직접적인 관찰[18–20]과 관련된 피드백 기회를 회피하고, 따라서 잠재적으로 매우 유용한 피드백을 잃는 경향이 있다. 또한 인식된 시간 제약으로 인해 감독관은 관련 임상 기술을 수행하는 데 있어 학습자의 직접적인 관찰을 피하거나 회피하게 되며 [21], 이는 레지던트의 피드백-탐색 행동을 더욱 손상시킨다[18–20].

Despite these advancements in our understanding of the usefulness and the optimal provision of feedback, medical learners continue to experience a limited amount of feedback during their clinical placements, receive feedback that is too general or limited in scope to be helpful, and engage with faculty deficient in feedback competencies [1, 5, 8, 12, 13]. Recent observations suggest that competency-based medical education creates tension between feedback intended to support a learner’s growth and the formal assessment procedures needed to assess the acquisition of the core competencies of the programme [13, 14]. Learners tend to perceive learning activities like direct observation of clinical skills as high-stakes evaluations with significant consequences for their future [14–17], prompting them to avoid feedback opportunities associated with direct observations [18–20], and hence missing out on the potentially very useful feedback associated with it. In addition, perceived time constraints prompt supervisors to avoid or opt out of directly observing their learners in performing relevant clinical skills [21], which further compromises the resident feedback-seeking behaviour [18–20].


일견 이것은 학습자들의 행동의 문제로 보인다. 따라서, 학습자를 대상으로 피드백을 추구하는 행동을 설명하고 수정하려고 시도함으로써 이 문제를 해결하려고 시도하는 것이 유혹적일 것이다 [22]. 그러나, 우리는 감독자와 학습자가 각각의 상호 작용의 목적을 명확하게 상호 이해하도록 하는 것이 임상 감독자의 책임이라고 주장한다.

At first sight, this appears to be a problemof learners’ behaviour. Thus, it would be tempting to try and tackle this problem by targeting the learners, by addressing and trying to modify their feedback-seeking behaviour [22]. however, we argue that it is the clinical supervisors’ responsibility to ensure that supervisors and learners achieve a clear mutual understanding of the purpose of each of their interactions.


고득점 평가 시 심사원의 책임

Responsibility of examiners in high-stakes assessments


운전자로서 후보자의 능력을 평가하는 운전 심사관의 업무(상자 1)는 중요한 책임이다.

The driving examiner’s task of assessing a candidate’s competence as a driver (Box 1)is an important responsibility:


운전면허 시험이나 의사면허 시험과 같은 시험은 앞서 일어났던 학습에 대한 고부담 총괄 평가다. 중등학교나 대학 교육 시스템과 마찬가지로 의료 교육 문화는 총괄 평가 패러다임에 의해 지배되고 있다[28, 29]. 이는 총괄 평가가 학습을 주도한다는 전제 하에 구축된다[25, 30]. 감독관들은 안전하지 않은 학습자들이 의사 자격을 갖추지 못하도록 막아야 할 강한 책임을 느낀다.

Exams like a driving test or a licensing exam are high-stakes summative assessments of the learning that has taken place earlier. Like the secondary school and university education systems, the medical education culture is dominated by the primacy of the summative assessment paradigm [28, 29], which builds on the premise that (summative) assessment drives learning [25, 30]. Supervisors feel a strong responsibility to prevent unsafe learners qualifying as licensed doctors.


감독관과 학습자가 평가와 피드백을 혼동하면 어떻게 되는가?

What happens if supervisors and learners mix up assessment and feedback?


첫 번째 저자의 경험은 감독관(그리고 그 결과 학습자)이 피드백과 종합 평가를 혼동하면 어떤 일이 일어나는지 보여준다. 운전 시험과 같이 고부담 시험에서는 대부분의 학습자가 피드백을 수용하지 않는다[9, 31, 32]. 그들은 시험 모드에 있다: 그들이 원하는 것은 시험에 합격하고 그들이 잘했다는 긍정적인 피드백을 받는 것이다.

The first author’s experience illustrates what happens if supervisors (and, as a consequence, their learners) mix up feedback and summative assessment. At a high-stakes exam like the driving test, most learners are not receptive to feedback [9, 31, 32]. They are in exam mode: all they want to do is pass the test and receive the positive feedback that they did a good job.


직장에 기초한 평가를 미래에 심각한 결과를 초래할 가능성이 있는 고부담 시험으로 인식하는 거주자는 자신과 관련된 피드백을 무시하거나 폐기하는 경향이 있다[16, 33]. 그들은 긍정적인 피드백만을 추구하는 "게임"을 한다[13, 31, 34].

Residents who perceive workplace-based assessments as high-stakes exams with potentially serious consequences for their future tend to ignore or discard the feedback associated with them [16, 33]. They “play the game” of seeking only positive feedback (i.e. only ask for feedback on a task or procedure they think they did well) [13, 31, 34].


전공의들은 역량있는 이미지를 보여주기 위해 이것과 다른 인상 관리 전략을 사용한다[13, 25, 35]. 그들은 임상 기술에 대한 직접관찰을 능력의 "교과서적" 예를 증명할 것으로 기대되는 "수행능력의 무대staging a performance"로 본다[13, 15]. 이러한 모든 것들이, [WBA]를 많은 학습자가 하는, 고부담 시험으로 보게 되어, 학습자를 피드백에 비-수용적으로 만든다는 것을 보여준다. 시험 모드에서는 그냥 공연하고, 멋있게 보이고, 시험에 합격하고 싶어. 첫 번째 작가가 운전면허 시험에서 했던 것처럼 말이다.

Residents employ this and other impression management strategies to portray an image of competence [13, 25, 35]. They view direct observations of clinical skills as “staging a performance” in which they are expected to demonstrate a “textbook” example of competence [13, 15]. All these observations showthat viewing a workplace-based assessment as a test, as a high-stakes exam, which many learners do, renders the learner unreceptive to feedback. In exam mode, we just want to perform, look good, and pass the test. Like the first author did at his driving test.


만약 우리가 운전 수업처럼 직장에 기반을 둔 학습에서 피드백을 접근한다면 어떨까?

What if we approached feedback in workplacebased learning like a driving lesson?


반대로, 사람들은 운전 수업 중에 피드백에 매우 수용적인 경향이 있다. 다른 코칭 관계에서와 마찬가지로, 운전 교습 중 실패는 학습의 촉매제로 채택된다[36]. 운전 교습 중 대부분의 응시자들은 운전 강사의 피드백을 듣고 싶어하는데, 이는 운전 실력을 향상시키는 데 도움이 되기 때문이다. 그들은 학습 모드에 있다.

Conversely, people tend to be very receptive to feedback during driving lessons. Like in other coaching relationships, failures during driving lessons are embraced as catalysts for learning [36]. During driving lessons, most candidates are eager to hear their driving instructor’s feedback, because it helps them to improve their driving skills. They are in learning mode.


학습 모드에 있는 것은 사람들이 주어진 피드백을 자신의 성과를 향상시키고, 발전시키고, 성장시키는 데 도움을 준다[37]. 임상 기술 향상을 목표로 하는 반복적인 코칭으로 프레임을 씌운 피드백은 피드백의 수용과 그에 따른 행동을 촉진한다[36, 38]. 피드백을 대화로 설계하면 학습자가 자신의 장단점을 소유할 수 있는 기회를 얻을 수 있다[8].

Being in learning mode helps people to use the feedback given to improve their performance, develop and grow[37]. Feedback framed as repeated coaching over time aimed at improving clinical skills promotes the acceptance of feedback and acting upon it [36, 38]. Designing feedback as a dialogue gives learners the opportunity to take ownership of their strengths and weaknesses [8].


은유의 유용성

Usefulness of the metaphor

운전 시험의 아름다움—운전 수업 은유법은 그것의 인식 정도에 있다. 우리의 교수진 개발 세션 경험에서, 드라이빙 레슨 은유법 운전교사는 학습자가 시험 모드일 때 피드백을 받아들이기 어려운 점, 학습 모드에 있을 때 피드백에 대한 학습자의 수용성을 높이는데 도움을 준다. 간단한 은유는 의사를 혼란스럽게 하고 성가시게 할 수 있는 복잡한 교육 용어에 의존할 필요 없이 시험과 학습 모드(또는 수행과 학습 목표 지향 사이의)의 주요 차이를 보여준다[40].

The beauty of the driving test—driving lesson metaphor lies in its degree of recognition. In our experience in faculty development sessions, the driving test—driving lesson metaphor helps clinical teachers to appreciate the learners’ difficulty in accepting feedback when they are in exam mode, and the learners’ receptivity to feedback when they are in learning mode. The simple metaphor illustrates the key difference between exam and learning mode (or between performance and learning goal orientation) without having to resort to complex educational jargon that may confuse and irritate physicians [40].


감독자(운전 강사와 같은)가 학습자가 자신을 신뢰할 수 있도록 지원하는 데 성공한다면, 이는 학습자의 피드백을 수용하고 학습하려는 의지를 증가시킬 것이다 [9, 13, 37, 41].

If a supervisor (like a driving instructor) succeeds in supporting the learner to trust him(or her), this will increase the learner’s willingness to accept the feedback and learn [9, 13, 37, 41].


프로그램 평가의 이중 역할

The dual role of programmatic assessment


직장 기반 학습에서 어떤 하나의 시험도 역량을 온전히 신뢰할 수 있는 수준으로 평가하지 못한다는 점에 착안하여, 각 개별 평가의 한계를 완화하는 [다양한 평가 방법의 의도적인 프로그램]을 설명하기 위해 "프로그램적 평가"라는 용어를 만들었다[42]. 이 모델은 교육 연구[29]에서 광범위한 지원을 받았으나, 역량 기반 의료 교육 실무에서의 구현은 여전히 도전적이다[13, 14, 30]. 핵심 난이도는 학습과 의사결정 기능 모두를 제공하는 프로그램적 평가의 이중 역할을 계속한다[29].

Appreciating that there is no single reliable test to assess competence in workplace-based learning, the term “programmatic assessment” was coined to describe a deliberate programme of different assessment methods, which alleviates the limitations of each individual assessment [42]. Although this model has received widespread support in educational research [29], its implementation in competency-based medical education practice remains challenging [13, 14, 30]. A key difficulty remains the dual role of programmatic assessment, serving both learning and decision-making functions [29].


대부분의 임상 감독자는 그러한 전반적인 역량 판단에 복수의 출처와 감독자의 정보가 필요하다는 것을 깨닫는다[43]. 그들은 학생이나 거주자와 마주치는 각각의 감독이 단지 스냅숏 인상에 불과하며, 이는 학습자의 전반적인 역량을 반드시 반영하는 것은 아니라는 것을 이해한다[29]. 그러나, 총괄 평가 패러다임이 의학 교육 연속 전반에 걸쳐 만연해 있기 때문에, [공식적인 평가]가 [학습자의 성장을 촉진하기 위한 피드백]을 오염시키는 것을 제거하기가 어렵다[13].

Most clinical supervisors realise that such an overall judgement of competence requires information from multiple sources and supervisors [43]. They understand that each supervision encounter with a student or resident is just a snapshot impression, which does not necessarily reflect the learner’s overall competence [29]. However, the pervading primacy of the summative assessment paradigm throughout the medical education continuum makes it difficult to remove formal assessment contamination from feedback aimed at promoting the learner’s growth [13].


드라이빙 레슨-드라이브 테스트 은유법은 임상 감독자들이 프로그램적 평가의 이중 기능을 더 이해할 수 있도록 한다. 각 주행 강습은 주행 능력 향상을 위해 응시자를 코칭하는 데 사용되지만, 주행 강사가 응시자가 주행 테스트에 등록할 준비가 된 시점을 결정한다. 이때 운전교사는 후보자가 충분히 유능한 운전사라는 자신감을 표출한다.

The driving lesson—driving test metaphor makes the dual function of programmatic assessment more understandable to clinical supervisors. Although each driving lesson is used to coach candidates towards increasing driving competence, the driving instructor decides the moment at which the candidate is ready to enrol for the driving test. At that point in time, the driving instructor expresses the confidence that the candidate is a sufficiently competent driver.



은유의 한계

Limitations of the metaphor


운전 수업의 한계—운전 시험 은유법을 고려해야 한다. 첫째, [국가]와 [프로그램]은 의사 또는 의료 전문가로서의 역량에 대한 고부담 총괄 평가에 대한 접근방식이 다르다. 어떤 사람들은 프로그램이나 커리큘럼이 끝날 때 정식 면허시험을 적용하여 지식과 임상 기술을 모두 평가하는데, 이는 운전 이론과 실습 시험과 쉽게 비교될 수 있다. 네덜란드와 같은 다른 나라들은 프로그램 감독이나 감독팀의 전반적인 판단을 역량의 최종적인 요약 평가로 사용한다. 비록 이것이 운전 시험과 직접적인 비교는 되지 않지만, 운전 시험인 운전 수업 은유는 감독관과 주민들이 평가와 피드백을 혼동하는 경향이 있다는 것과 왜 이것이 바람직하지 않은지를 깨닫는데 도움을 준다.

The limitations of the driving lesson—driving test metaphor need to be taken into account. First, countries and programmes differ in their approach to high-stakes summative assessment of competence as a doctor or medical specialist. Some apply formal licensing exams at the end of a programme or curriculum, assessing both knowledge and clinical skills, which are easily comparable to driving theory and practice tests. Others, like the Netherlands, use the overall judgement of the programme director or supervisory team as the final high-stakes summative assessment of competence. Although this is less directly comparable to a driving test, it is our experience in faculty development sessions that the driving test—driving lesson metaphor helps supervisors and residents to realise that they tend to mix up assessment and feedback, and why this is undesirable.


둘째, 많은 역량 기반 의료 교육 커리큘럼에서 학습(피드백, 저평가)과 학습(고득점) 평가에서 동일한 감독관이 역할을 하는 반면, 운전교사와 시험관의 역할은 대부분의 국가에서 엄격히 분리되어 있다. 또한 오늘날 대부분의 임상 교수 부서에서 의대생과 거주자의 코칭에 관여하는 많은 수의 임상 감독자와 비교했을 때, 모든 운전 강사는 거의 항상 동일한 운전 강사에 의해 주어진다[45]. 이는 거주자와 감독자 간의 상호 신뢰 관계가 있는 것을 더욱 중요하게 만들고 [9, 41], 임상 역량에 대한 전반적인 판단은 감독자 그룹 전체에 의해 이루어진다[43, 46].

Second, in many competency-based medical education curricula, the same supervisors play a role both in assessment for learning (feedback, lowstakes) and assessment of learning (high stakes), whilst the roles of driving instructor and examiner are strictly separated in most countries. In addition, all driving lessons are almost always given by the same driving instructor, as compared to the large number of clinical supervisors involved in the coaching of medical students and residents in most clinical teaching departments today [45]. This makes it even more important for there to be a relationship of mutual trust between resident and supervisors [9, 41], and that the overall judgement of clinical competence is made by the entire group of supervisors [43, 46].


셋째, [형성적 피드백과 총과적 평가 만남이 명확히 구분되는] 프로그램적 평가 시스템은 동일한 구별을 적용하는 시스템 요소에 의해 뒷받침되어야 한다. 여기에는 프로그램 평가 프로그램의 목표와 구조에 대한 명확한 제도적 또는 부서의 비전이 포함된다. 

  • 피드백 및 평가의 오염을 방지하는 양식 사용(예: 감독자가 전반적인 등급 또는 글로벌 역량 등급을 제공할 필요가 없는 피드백 양식) 

  • 그리고 [고부담 평가를 위해 사용되는 구성 요소](예: 최소 절차 수와 필수 지식 시험 결과)를 훈련 의사로서 [학습자의 성장을 지원하기 위한 구성 요소]와 명확하게 구분하는 포트폴리오.

Thirdly, a system of programmatic assessment, in which formative feedback and summative assessment encounters are clearly separated, should be supported by system factors applying the same distinction. These include a clear institutional or departmental vision on the goals and structure of the programmatic assessment programme [11, 44], 

  • the use of forms avoiding contamination of feedback and assessment (e.g. a feedback form that does not require the supervisor to provide an overall grade or global rating of competence) [47], and 

  • a portfolio which clearly separates those components which are being used for high-stakes assessments (e.g. having fulfilled a minimum number of procedures and the results of mandatory knowledge tests) from those intended to support the learner’s growth as a doctor in training [48, 49].


은유를 사용하여 교수진 개발에서 프로그램적 평가를 촉진

Using the metaphor to promote programmatic assessment in faculty development


표1 Tab. 1.


본 논문에서 제시된 주장은 그러한 교수진 개발 이니셔티브가 공식적인 고위직 평가[27]로부터 피드백을 분리하는 것의 중요성에 대한 논의를 포함하고, 임상 감독의 지침 원칙으로서 판단보다는 코칭을 촉진해야 한다는 개념을 뒷받침한다[36, 44].

The arguments laid out in this paper support the notion that such faculty development initiatives should include a discussion of the importance of separating feedback from formal high-stakes assessment [27], and promote coaching, rather than judgement, as the guiding principle of clinical supervision[36, 44].


학습자는 합격/불합격 평가에 대한 결정은 [감독자 그룹] 내에서 이루어지며, 포트폴리오에 기록된 평가 양식에만 기초하지 않는다는 것을 알아야 한다[13, 32]. [피드백을 캡처하고 포트폴리오에 저장되는 양식]은 피드백 목적을 반영하도록 의도적으로 설계되어야 하며, 총괄적 등급과 전체적인 역량 평가가 없어야 한다. 또한 학습자의 성과나 역량 성장에 대한 감독자 팀 간의 우려는 초기 단계에서 학습자와 논의될 것이기 때문에, 학습자들은 그러한 고부담 수준의 판단은 결코 갑자기 등장하는 일이 없다고 안심시켜야 한다[9, 28]. 모든 감독자는 효과적인 피드백 대화를 위한 방법에 대해 교육을 받아야 하며, 이러한 대화에서 신뢰와 상호 참여의 중요성을 강조해야 한다[7, 8, 53, 54].

Learners should be made aware that the decision on pass/ fail assessments will be made within the group of supervisors, and is not based solely on the assessment forms recorded in the portfolio [13, 32]. Forms capturing feedback and stored in portfolios should be purposely designed to reflect their feedback purpose, and be devoid of summative grades and overall competence assessments. Learners should also be reassured that such high-stakes judgements can never come as a surprise, because any concern among the team of supervisors about the learner’s performance or growth in competence will be discussed with the learner at an early stage [9, 28]. All supervisors should be trained in methods for effective feedback conversations, highlighting the importance of trust and mutual engagement in these conversations [7, 8, 53, 54].







. 2020 Sep 9.
 doi: 10.1007/s40037-020-00617-w. Online ahead of print.

Driving lesson or driving test? : A metaphor to help faculty separate feedback from assessment

Affiliations 

Affiliations

  • 1Department of Medical Education and Faculty Development, Isala Hospital, Isala Academy, Zwolle, The Netherlands. p.l.p.brand@isala.nl.
  • 2Lifelong Learning, Education and Assessment Research Network (LEARN), University Medical Centre Groningen, Groningen, The Netherlands. p.l.p.brand@isala.nl.
  • 3Lifelong Learning, Education and Assessment Research Network (LEARN), University Medical Centre Groningen, Groningen, The Netherlands.
  • 4Centre for Educational Development and Research (CEDAR), University Medical Centre Groningen, Groningen, The Netherlands.
  • 5Department of Educational Development and Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, The Netherlands.

Abstract

Although there is consensus in the medical education world that feedback is an important and effective tool to support experiential workplace-based learning, learners tend to avoid the feedback associated with direct observation because they perceive it as a high-stakes evaluation with significant consequences for their future. The perceived dominance of the summative assessment paradigm throughout medical education reduces learners' willingness to seek feedback, and encourages supervisors to mix up feedback with provision of 'objective' grades or pass/fail marks. This eye-opener article argues that the provision and reception of effective feedback by clinical supervisors and their learners is dependent on both parties' awareness of the important distinction between feedback used in coaching towards growth and development (assessment for learning) and reaching a high-stakes judgement on the learner's competence and fitness for practice (assessment of learning). Using driving lessons and the driving test as a metaphor for feedback and assessment helps supervisors and learners to understand this crucial difference and to act upon it. It is the supervisor's responsibility to ensure that supervisor and learner achieve a clear mutual understanding of the purpose of each interaction (i.e. feedback or assessment). To allow supervisors to use the driving lesson-driving test metaphor for this purpose in their interactions with learners, it should be included in faculty development initiatives, along with a discussion of the key importance of separating feedback from assessment, to promote a feedback culture of growth and support programmatic assessment of competence.

Keywords: Assessment; Feedback; Programmatic assessment.


평가에서 인간판단의 공정성: 해석적 문헌 고찰과 개념 프레임워크(Adv Health Sci Educ Theory Pract, 2020)

Fairness in human judgement in assessment: a hermeneutic literature review and conceptual framework

Nyoli Valentine1 · Steven Durning2 · Ernst Michael Shanahan1 · Lambert Schuwirth1





도입 Introduction


공정성은 건강직종 평가의 기본적인 자질이며 일반적으로 학생의 권리로 받아들여진다(Robinson 2002). 전통적으로 객관성은 평가의 공정성을 보장하기 위한 지배적인 방법으로 여겨져 왔으며, 평가의 구성 타당성과 신뢰성에 초점을 맞춘 20세기 보건 전문직 교육 연구 개발의 상당부분을 대상으로 한다(Valentine and Schuwirth 2019; Van der Vleuten et al. 1991; Cate and Regehr 2019). 지난 몇 십 년 동안, 학습에 대한 진화하는 생각, 사회적 이상 이동, 그리고 높은 이해도 시험의 한계에 대한 이해는 우리 분야 내에서 많은 변화를 가져왔다. 역량 기반 교육은 많은 국가에서 의료 교육에 대한 지배적인 접근 방식이 되었다. (10 Cate 2017). 이를 통해 임상의의 역할은 [이전에 강조되지 않았던 특징]과 [투입input보다는 결과에 대해 인증된 학습자]를 포함하도록 재정의되었다(10 Cate and Billett 2014). 역량은 학습자가 독립적으로 완료하도록 위임된 전문적인 과업으로 정의되었다(10 Cate and Schele 2007). 임상 역량의 평가는 서면 평가에서 다시 작업장의 실제 맥락으로 이동했고, 개별 평가에서는 평가 프로그램을 위한 길을 열었다(Daupine 1995; Van Der Vleuten and Schuwirth 2005; Valentine and Schuwirth 2019). 

Fairness is a fundamental quality of health professions assessment and is commonly accepted as a student’s right (Robinson 2002). Traditionally, objectivity has been seen as the predominant way to ensure fairness in assessment and for much of the twentieth century health professions education research and development focussed on construct validity and reliability in assessment (Valentine and Schuwirth 2019; van der Vleuten et al. 1991; ten Cate and Regehr 2019). Over the last few decades, evolving ideas about learning, shifting social ideals and understandings of the limitations of high stakes tests led to many changes within our field. Competency-based education became the dominant approach to medical education in many countries (ten Cate 2017). With this, the role of the clinician has been redefined to include features previously not been emphasised, and learners certified on outcome rather than input (ten Cate and Billett 2014). Competencies have been defined into professional tasks which a learner is entrusted to complete independently (ten Cate and Scheele 2007). Assessment of clinical competence moved from written assessments back into the authentic context of the workplace, and individual assessments made way for programmes of assessment (Dauphinee 1995; van der Vleuten and Schuwirth 2005; Valentine and Schuwirth 2019). 


이러한 변화에도 불구하고, 객관적 접근방식은 평가에서 지배적인 담론으로 남아있으며, 많은 사람들이 객관성을 평가를 평가해야 하는 'gold standard'로 보고 있다(Valentine and Schuwirth 2019; Van der Vleuten et al. 1991; Govaerts and van der Vleuten 2013; 10 Cate and Regehrer 2019). 심리측정적 모델은 측정과 양적 관점에서 공정성을 정의하려고 노력해왔다. 인간의 판단을 활용하고 진정한 성과를 평가하기 위해 고안된 작업장 기반 평가는 정량적 프레임워크를 사용하여 평가되었으며, 따라서 타당성과 신뢰성 기준을 충족하지 못한다는 비판을 받았다(Govaerts and van der Vleuten 2013). 이러한 객관적 관점에 기반하여, 많은 사람들은 인간의 판단을 너무 과실하고 주관적인 것으로 간주하여 고부담 평가에 사용할 수 없다고 본다(Valentine and Schuwirth 2019). 그러나 전통적인 정신측정학 접근법에만 배타적으로 초점을 두게 되면 복잡한 직장 환경에서 역량, 성과 및 평가의 주요 이슈를 놓칠 수 있다(Govaerts and van der Vleuten 2013; Govaerts et al. 2007). 이는 학문적 환경에서 역량을 획득하기에 충분하지 않다고 생각되어 왔다(Boud 1990).

Despite these changes, objective approaches have remained a dominant discourse in assessment, with many seeing objectivity as the ‘gold standard’ to which assessments should be judged (Valentine and Schuwirth 2019; van der Vleuten et al. 1991; Govaerts and van der Vleuten 2013; ten Cate and Regehr 2019). Psychometric models have sought to define fairness from a measurement and quantitative perspective. Workplace based assessments, which utilise human judgement and are designed to assess authentic performance, have been judged using a quantitative framework and therefore criticised for not meeting validity and reliability criteria (Govaerts and van der Vleuten 2013). Using this objective perspective, human judgement is seen by many as too fallible and subjective to be used in high stakes assessment (Valentine and Schuwirth 2019). However an exclusive focus on traditional psychometric approaches can disregard key issues of competence, performance and assessment in complex workplace settings (Govaerts and van der Vleuten 2013; Govaerts et al. 2007), has been thought not be sufficient to capture competence in an academic setting (Boud 1990).


문헌을 통해, 많은 저자들은 객관성에 대한 이러한 지속적인 초점을 의문을 제기하여, [평가에서 주관적인 인간의 판단]을 [심리측정적으로 교정될 '문제']가 아니라 [성과에 대한 정당한 인식]으로 수용하고자 하는 욕구를 표현하였다(Jones 1999; Rotthoff 2018; Hodges 2013; Cate and Regehr 2019; Bacon et). 2015년, Govaerts and van der Vleuten 2013, Schuwirth and van der Vleeuten 2006, Gingerich et al. 2014, Gipps and Stobart 2009). 가장 최근인 2020년에 오타와 컨센서스 성명보고서는 특별히 평가 프로그램에서 '전문가 판단을 재임명re-instate'(Boursicot 2020)하도록 요구했다.

Throughout the literature, many authors have questioned this continued sole focus on objectivity, expressing a desire to better embrace subjective human judgement in assessment not as a ‘problem’ to be corrected psychometrically but as legitimate perceptions of performance (Jones 1999; Rotthoff 2018; Hodges 2013; ten Cate and Regehr 2019; Bacon et al. 2015; Govaerts and van der Vleuten 2013; Schuwirth and van der Vleuten 2006; Gingerich et al. 2014; Gipps and Stobart 2009). Most recently, in 2020, the Ottawa consensus statement report for performance in assessment specifically called for assessment programs to ‘re-instate expert judgement’ (Boursicot 2020).


한 걸음 물러서서 평가에서 공정성의 근본적인 기본 가치에 초점을 맞추기 위해 관점을 바꾸는 것은 전통적인 객관적 접근법을 다시 설정하고, 평가에서 주관적인 인간 판단의 적절성을 판단하는 더 적절한 방법을 제공하는 데 도움이 될 수 있다. 평가에서 ['객관적'인 인간의 판단]이 아니라, 평가에서 ['공정fair'한 인간의 판단]이 무엇인지 살펴보는 것으로 초점을 바꾸는 것은 많은 다른 관점을 수용하도록 하며, 평가에서 인간의 판단의 정당화를 허용한다. 그러나 이를 위해서는 건강직업 평가에서 무엇이 인간의 판단을 공정하게 만드는가라는 질문을 다룰 필요가 있다. 이것은 모호하지 않게 '정답'한 단 하나의 대답이 있는 솔직한 질문이 아니다. 건강직종 평가는 복잡하고 예측할 수 없는 상황별 건강관리와 교육 환경에 내재되어 있다; 그것은 환자, 기관, 감독자 및 학습자를 포함한다; 그리고 때로는 인간의 판단과 공정성 모두에 여러 가지 그리고 때로는 모순되는 면이 있다.

Taking a step back and changing perspectives to focus on the fundamental underlying value of fairness in assessment may help re-set the traditional objective approach and provide a more appropriate way to determine the appropriateness of subjective human judgements made in assessment. Changing focus to look at what is ‘fair’ human judgement in assessment, rather than what is ‘objective’ human judgement in assessment allows for the embracing of many different perspectives, and allows for the legitimising of human judgement in assessment. However, to do this requires addressing the question: what makes human judgements fair in health professions assessment? This is not a straightforward question with a single unambiguously ‘correct’ answer. Health professions assessment is embedded in complex, unpredictable, contextual health care and education environments; it involves patients, institutions, supervisors and learners; and there are multiple, and at times conflicting, facets to both human judgement and fairness.


단순한 정의 없이 다차원적이고 복잡한 구조에 직면했을 때, 공유된 언어와 이해가 도움이 될 수 있다. 하이페츠 외 연구진(Heifetz et al.)은 "같은 의미를 지닌 동일한 단어를 사용하기 시작하면, 이슈에 대한 유의미한 차이점을 고심하면서도 더 효과적으로 의사소통하고 오해를 최소화하며 같은 페이지에 있다는 느낌을 얻게 된다"고 지적했다. 2009년). 본 문헌 검토의 목적은 의료 전문직 평가에서 인간 판단의 공정성과 관련된 요소, 정의 및 핵심 질문에 대한 학문적 지식 종합과 이해를 도출하는 데 있었으며, 공정한 인간 판단에 대한 아이디어를 명시적으로 제시하려고 시도했다.

When faced with a multi-dimensional, complex construct without a simple definition, a shared language and understanding can be helpful. Heifetz noted “When people begin to use the same words with the same meaning, they communicate more effectively, minimize misunderstandings, and gain the sense of being on the same page, even while grappling with significant differences on the issues” (Heifetz et al. 2009). The aim of this literature review was to produce a scholarly knowledge synthesis and understanding of the factors, definitions and key questions associated with fairness in human judgement in health professions assessment, attempting to make ideas about fair human judgement explicit.


이러한 복잡한 구조, 범주 및 결과 개념적 프레임워크를 추가로 관리하는데 도움을 주기 위해, 추가적인 연구를 알리고, 공정한 인간 판단에 대한 커뮤니케이션과 토론을 강화하며, 평가 프로그램의 전문가 판단의 재제시에 도움을 주기 위해 개발되었다.

To further help manage this complex construct, categories and a resulting conceptual framework was developed, with a view to informing further research, enhancing communication and discussions about fair human judgement and provide assistance in the re-instatement of expert judgement in assessment programs.


방법 Methods

설계 Design


이 리뷰의 목적을 달성하기 위해, 우리는 해석적hermeneutic 문학 리뷰를 실시했다. 인간의 판단의 공정성을 이해하려면 서로 다른 분야와 관점의 증거를 검토하고 취합하며, 고유한 맥락과 복잡성을 고려하고, 많은 다른 이해당사자들에 대한 함의를 검토해야 한다. 놀랄 것도 없이, 이 문헌은 방대하고, 이질적이며, 무작위적으로 통제된 실험에서 나온 일치된 답변이 없다. 헤르메뉴틱 접근법은 선형 프레임워크가 아닌 주기적 프레임워크로 사용하며 해석적 이해를 생성하는 과정과 관련이 있다. 논문은 문헌에서 나온 다른 논문의 맥락에서 해석되며, 새로운 논문이 읽힐 때마다 이해에 영향을 받는다(Boell and Ccez-Kecmanovic 2010). 체계적 검토 방법론을 통해 합성할 수 없는 이질적 문헌으로부터 통찰력을 창출하는 가치가 있고 그렇지 않으면 결론에 도달하지 않는 결과를 산출할 수 있기 때문에 헤르메뉴틱 리뷰의 인기가 높아지고 있다(Greenhalgh and Shaw 2017).

To achieve the aim of this review, we undertook a hermeneutic literature review. Understanding fairness in human judgement requires reviewing and compiling evidence from different disciplines and perspectives, considering unique contexts and complexity, and reviewing implications for many different stakeholders. Not surprisingly, this literature is vast, heterogeneous and without consensus answers from randomised controlled trials. A hermeneutic approach uses as cyclical rather than linear framework, and is concerned with the process of creating interpretive understanding. Papers are interpreted in the context of other papers from the literature and understanding is influenced by each new paper read (Boell and Cecez-Kecmanovic 2010). The popularity of a hermeneutic review is increasing as it has value in generating insights from heterogenous literatures which cannot be synthesised through systematic review methodology, and would otherwise produce inconclusive findings (Greenhalgh and Shaw 2017).


검토에는 두 가지 주요한 연속적인 순환 과정이 있었다. 즉, 그림 1(Boell and Cecez-Kecmanovic 2014)에서 입증된 주장을 전개하기 위해 입수한 기사의 검색 및 획득과 분석과 해석이다. 검토 내내 기존 문헌을 의미 있게 종합하고 비평하기 위해 해석적 접근법을 사용했다(Boell and Ccez-Kecmanovic 2014). 이러한 접근방식과 일관되게, 우리의 문헌 검색은 엄격했지만 유연하고 반복적이었으며, 아이디어가 지도화, 분류, 비판적으로 평가되고 증거의 성격이 더욱 명백해짐에 따라, 연구 질문의 추가적인 정교화가 이루어졌다(Boell과 Cecz-Kecmanovic 2010).

There were two main continuous cyclical processes in the review: the search and acquisition of articles and the analysis and interpretation of the articles obtained to develop an argument as demonstrated in Fig. 1 (Boell and Cecez-Kecmanovic 2014). Throughout the review an interpretive approach was used to meaningfully synthesize and critique the existing literature (Boell and Cecez-Kecmanovic 2014). Consistent with this approach, our literature search was rigorous but flexible and iterative, and as ideas were mapped, classified and critically assessed and the nature of the evidence became more apparent, there was further refinement of the research question (Boell and Cecez-Kecmanovic 2010).


그림 1 문헌 검토를 위한 프레임워크로서의 헤르메뉴틱 서클 (Boell and Ccez-Kecmanovic 2014)

Fig. 1 The hermeneutic circle as a framework for the literature review (Boell and Cecez-Kecmanovic 2014)


리뷰의 초점

Focus of the review

그림 1에서 서술한 단계들을 헤르메뉴틱 리뷰의 모범 사례로 따라, 우리의 문학 리뷰는 초기 아이디어에서 시작되었다. 이것들이 우리의 초기 질문들을 형성했다:

Following the steps outlined in Fig. 1 as best practice for a hermeneutic review, our literature review started with initial ideas. These formed our initial questions:



검토 단계 Stages of the review

1단계: 증거 검색 및 획득 

Stage 1: search and acquisition of evidence

2019년 7월 NV는 그림 2에 요약된 검색 전략으로 시작했다. 

In July 2019 NV began with the search strategy outlined in Fig. 2. 





2단계: 데이터 추출, 분석 및 해석

Stage 2: Data extraction, analysis and interpretation


3단계: 개념 모델 개발

Stage 3: Development of a conceptual model

문헌 검토 과정에서, 건강 전문직 평가에서 인간 판단의 공정성에 대한 정의의 개념적 모델이 문헌 검토를 기반으로 개발되었다(그림 3). 

During the literature review process, a conceptual model of the definition of fairness in human judgement in health professions assessment was developed based on the literature review (Fig. 3). 


결과 Results

우리의 모든 질문에 대한 '숙성' 과정은 90개의 논문이 포함된 후에 이루어졌다. 이것들은 표 1에 요약되어 있다. 

The process ‘saturation’ on all our questions was reached after the inclusion of 90 papers. These are summarised in Table 1. 




개요: 평가 시 인간 판단의 공정성

Overview: fairness in human judgement in assessment

공정성은 복수의 정의를 가진 복잡한 구인이다(Tierney 2012). 평가 문헌 내에서는 "편향과 차별이 없고 모든 학생에게 적합성 규칙과 표준을 요구하는 판단의 질"(Harden et al. 2015) 또는 "시험에서 측정하고자 의도한 구인을 보여주는demonstrate 것에 대하여, 모든 응시자에게 동등한 기회를 주도록 시험이나 평가 과정 내 편향이 부재한 것"등과 같이 공정성을 단순화하려는 시도가 있었다. (American Research Association et al. 1999) 또는 "기술적 정신측정학 용어가 아님"(Tierney 2012)에 대한 그들의 입장을 입증한다. 그러나 공정성은 또한 공정성, 일관성, 균형, 유용성 및 윤리적으로 실현 가능한 것과 같은 광범위한 평가 관련 품질과 연관되어 있다. 이러한 폭breath는 평가의 공정성이 다면적이며, 이분법적으로 결정되거나 단순한 정의(Tierney 2012)로 축소될 수 있는 것이 아님을 보여준다.

Fairness is a complex construct with multiple definitions (Tierney 2012). Within the assessment literature, there have been attempts to simplify fairness to “the quality of making judgements that are free from bias and discrimination and requires conformity rules and standards for all students” (Harden et al. 2015), or “absence of bias within the test or assessment processes that give all candidates an equal opportunity to demonstrate their standing on the construct the test is intended to measure” (American Research Association et al. 1999) or as “not a technical psychometric term” (Tierney 2012). However, fairness has also been associated with a wide range of assessment related qualities such as equitable, consistent, balanced, useful and ethically feasible. This breath demonstrates that fairness in assessment is multifaceted and not something which can be reduced to a number, determined dichotomously or a simple definition (Tierney 2012).


인간 판단의 공정성의 특성을 이해하는 데 도움을 주기 위해, 문헌 검토의 결과로부터 개념적 프레임워크(그림 3)를 도출했다. 공정한 인간 판단의 복잡한 구조는 

  • 공정한 인간 판단의 특성(해외, 경계, 전문성, 민첩성 및 증거)

에 의해 개념화되며, 이는 실제 구성요소로 인간 판단의 공정성을 변환하는 데 있어서, 

  • 개개인의 수준에서 실제 구성요소로 지원되고 번역되는 가치(확실성, 목적에 적합성, 투명성 및 방어성)와 

  • 시스템 수준에서 도움이 되는 절차 및 환경(일반적인 공정성, 문서화, 다중 기회, 복수의 평가자, 타당성 증거)

To assist in understanding the characteristics of fairness in human judgement, a conceptual framework was derived (Fig. 3) from the results of the literature review. The complex construct of fair human judgement could be conceptualised through 

  • values (credibility, fit for purpose, transparency and defensibility) 

which are supported and translated into practical components 

  • at an individual level by characteristics of fair human judgement (narrative, boundaries, expertise, agility and evidence) and 

  • at a systems level by procedures and environments (procedural fairness, documentation, multiple opportunities, multiple assessors, validity evidence) which help translate fairness in human judgement from concepts into practical components.



평가에서 공정한 인간 판단의 가치

Values of fair human judgement in assessment

문헌 검토에서 평가에서 공정한 인간 판단의 네 가지 가치, 즉 신뢰도, 목적에 대한 적합성, 방어성 및 투명성을 확인했다. 이 값들은 모두 겹쳐서 서로 관련된다. 때로는 값이 상충하는 것처럼 보여서 관리해야 할 긴장을 고조시킨다. 이것들은 아래에 더 자세히 설명되어 있다.

The literature review identified four values of fair human judgement in assessment: credibility, fitness for purpose, defensibility and transparency. These values all overlap and relate to each other. At times the values appear to be conflicting, raising tensions which need to be managed. These are described in more detail below.


신뢰도 Credibility

[믿을 만하다고 여겨지는 인간]의 판단은 공정하다고 보여진다. 학습자들에게는 특히 불확실한 시기에는, 공정성이나 정의감이 [결정의 신뢰성]에 열쇠가 된다(Van den Bos and Medema 2000; Lind and Van den Bos 2002). 신뢰성에 대한 명확한 정의는 없지만, 정의 전반에 걸친 중요한 관점이 신뢰성believability, 그리고 조사 결과의 '진실성'에 대한 자신감 또는 신뢰감(Govaerts and van der Vleuten 2013)으로 나타나고 있다

Human judgements which are seen as credible, are seen as fair. For learners, a sense of fairness or justice is key to the credibility of the decision, especially in times of uncertainty (Van den Bos and Miedema 2000; Lind and Van den Bos 2002). There is no clear definition of credibility however an overarching view across definitions appears to believability (Hilligoss and Young Rich 2008), and confidence or trustability in the ‘truthfulness’ of the findings (Govaerts and van der Vleuten 2013).


신뢰도 평가는 이분법적이지도 않고, 단 한 번에 일어나는 것도 아니다. 오히려, 정보 구상의 종단적 과정 전반에 걸쳐 이루어진 고려사항이다(Rieh와 Hilligoss 2008). 신빙성은 판단 자체뿐만 아니라 판단 당사자와도 관련이 있다(Chory 2007). [판단 그 자체의 신뢰성]과 그 [판단의 발단이 되는 사람] 사이의 상호작용이 된다(Chory 2007). [과거의 경험]은 신뢰도 판단에 영향을 미친다. 예를 들어, 학습자가 출처의 신뢰성에 의문을 제기하는 경우, 해당 출처의 모든 정보는 해당 시점(Rieh 및 Hilligoss 2008)에서 "두 번째 추측"된다.

Credibility assessment is a not dichotomous, nor does it occur at just one point in time. Rather, it is a consideration made throughout the longitudinal process of information seeking (Rieh and Hilligoss 2008). Credibility is related not only to the judgement itself but also to the person making the judgement (Chory 2007). It is an interplay between the credibility of the judgement itself and the person from whom it originates (Chory 2007). Past experience impacts credibility judgements. For example, if a learner questions the credibility of the source, all information from that source is “second guessed” from that point forward (Rieh and Hilligoss 2008).


[대인관계 또는 상호작용적 공정성]은 신뢰성과 공정성의 중요한 구성요소다(Rodabaugh 1996; Patterson et al. 2011). 대부분의 학습자들은 그들의 선생님을 존경하고 또한 존경받는 대우를 받기를 원했다(Rodabaugh 1996). 의료 교육에서 여러 연구의 주요 주제는 학습자의 신뢰성 판단에 있어 평가자 참여의 중요성이다. 연구에 따르면 학습자는 [평가자의 명백한 열정, 헌신, 가르치는 동기, 신뢰, 존중 및 호감]과 관련하여 학습자에 대한 분명한 느낌에 대해 신뢰성 있게 판단한다(Telio et al. 2016; Watling et al. 2008; Ginsburg et al. 2017a). [장기간의 관찰, 긍정적인 학습 문화, 증거를 수집할 다수의 기회]는 이러한 신뢰성 판단의 발달을 지원한다(Watling et al. 2008; Watling 2014).

Interpersonal or interactional fairness, is an important component of credibility and fairness (Rodabaugh 1996; Patterson et al. 2011). Most learners respect their teachers and wanted to be treated with respect also (Rodabaugh 1996). A dominant theme of several studies in medical education is the importance of assessor engagement in learner’s credibility judgements. Studies have noted learners make credibility judgements regarding the assessors’ apparent enthusiasm, dedication and motivation for teaching, and their apparent feelings towards the learner in regards to trust, respect and fondness (Telio et al. 2016; Watling et al. 2008; Ginsburg et al. 2017a). Prolonged observation, a positive learning culture, and multiple opportunities for evidence support development of this credibility judgement (Watling et al. 2008; Watling 2014).


방어성 Defensibility

평가에서 판단 결정은 [학습자가 종종 주장claims의 기초를 형성하는 공정성의 개념으로 법적 보상을 요구할 수 있기 때문에] (법적으로) 방어할 수 있어야 한다(Colbert et al. 2017). 법적 용어로 판단judgement이란 어떤 증거를 가지고 또는 정당한 이유로 한 주장이다(reid 1850). 의료교육과 같이 복잡하고 불확실한 환경의 판단은 참 또는 거짓으로 분류하기 어렵고 확실성보다는 [신뢰성 또는 수용성]에 더 의존한다(Upshur and Colak 2003; Groarke 2019). 의학 교육 내에서는 평가가 어떻든 항상 불확실성이 있을 것이다. 어떤 평가 방법도 연습생이 모든 상황에서 의사라는 기대를 충족시킬 수 있다는 결정적인 증거는 결코 아니다. [절차적 공정성, 문서화, 전문성 및 경계]와 같은 개별적 특성과 시스템 절차는 판단의 방어성을 구축한다.

Judgement decisions in assessment need to be (legally) defendable as learners may seek legal redress with the concept of fairness often forming the basis of claims (Colbert et al. 2017). In legal terms, a judgement is an assertion made with some evidence or for good reason (Reid 1850). Judgements in complex, uncertain environments such as medical education are difficult to categorise as true or false and rest more on plausibility, or acceptability rather than certainty (Upshur and Colak 2003; Groarke 2019). Within medical education, no matter the assessment, there will always be uncertainty. No assessment method is ever conclusive proof that a trainee will be able to fulfil the expectations of being a doctor in all circumstances. Individual characteristics and system procedures such as procedural fairness, documentation, expertise and boundaries build the defensibility of judgements.


목적 적합성

Fitness for purpose

많은 저자들은 공정성이 사회적 구인이라고 주장해왔다(Stobart 2005; Ståhl et al. 2019; Wolf 1978; Eva 2015; Gipps and Stobart 2009). 지프스 외 연구진은 평가가 기술적 특성(Gipps 및 Stobart 2009; Stobart 2005)과 함께, 그것이 운영되는 사회문화적 맥락을 고려해야만 완전히 이해할 수 있는 [사회적으로 내재된 활동]이라고 주장한다. 의학 교육은 다양한 임상적 맥락에서 이루어지며, 진정한authentic 건강 관리 실천이라는 예측 불가능한 과제에 참여함으로써 생성되고 고유한 물리적, 사회적, 조직적 맥락에 의해 형성된다(Govaerts and van der Vleuten 2013). 

Many authors have argued that fairness is a social construct (Stobart 2005; Ståhl et al. 2019; Wolf 1978; Eva 2015; Gipps and Stobart 2009). Gipps et al. argue that assessment is a socially embedded activity that can only be fully understood by taking account of the social and cultural contexts within which it operates, alongside the technical characteristics (Gipps and Stobart 2009; Stobart 2005). Medical education occurs in diverse, clinical contexts, with learning produced by engagement in unpredictable tasks of authentic health care practice and shaped by unique physical, social and organisational contexts (Govaerts and van der Vleuten 2013). 


따라서 판단에서 무엇이 공정하고 신뢰할 수 있는지는 임상적 만남의 맥락과 환경 및 문화에 의해 결정되어야 하며, (다른) 증거의 존재만으로 결정되지 않아야 한다. 미국의 법률 시스템 내에서 처벌, 행정 편의 또는 자원의 예산 제약/이용 가능성과 같이 의도가 부적절할 경우 전문적 판단을 무시한다(Stefan 1993).

Therefore, what is fair and credible in a judgement must be determined by the context of the clinical encounter, and the environment and culture, not just by the existence of other evidence (Upshur and Colak 2003). Within the US legal system there is general consensus if the intent is inappropriate, such as punishment, administrative convenience, or budgetary constraints/availability of resources then the professional judgement is disregarded (Stefan 1993).


또한 공정한 판단 결정은 [의료전문가의 업무]와 [환자의 요구]와도 관련이 있어야 한다. 연구는 학습자들이 무엇보다도 임상적 관련성이 있다는 평가를 인지했다는 점에 주목했다(더필드와 스펜서 2002; 비니 외 2017). 맥락에 의존하고 목적에 맞는 공정한 판단은 총체적이다. 환자들은 측정 가능한 단위로 깔끔하게 분해되지 않으며 건강 전문가의 작업 또한 그렇지 않다. 통합 또는 전체론적 역량은 선별적으로 접근 가능한 증거를 옹호하며, 이는 역량이 추론되는 직장 및 환자 상황의 맥락에 민감하다(Beckett 2008).

Fair judgement decisions also need to relate to the work of a health care professional and the needs of the patient. Studies have noted that learners perceived assessment that, among other things, had clinical relevance was fair (Duffield and Spencer 2002; Viney et al. 2017). Context dependent and fit for purpose fair judgements are holistic. Patients are not neatly broken down into measurable units and neither can the work of a health professional. Integrated or holistic competence advocates a selective accessibly of evidence, which is sensitive the to the context of the workplace and patient situation, from which competence is inferred (Beckett 2008).


투명성 Transparency

문헌 전체에 걸쳐, 학습자와 공유된 이해를 구축하기 위해 개방성을 입증하는 공정한 평가를 강조한다(Dijksterhuis et al. 2009; Colbert et al. 2017; Van der Vleuten et al. 2015; Hays et al. 2015; Schuwirth et al. 2002), 일부 저자들은 투명성이 불공정한 평가에 대한 최선의 방어라고 주장한다(Gipps and Stobart 2009). 여기에는 [어떤 판단을 내릴 것인지, 누가 판단을 내릴 것인지, 판단의 목적, 기준 및 결과에 대한 명시적 의사소통]이 포함된다(Tierney 2012). 투명성을 개선하기 위한 의사소통 개입이 전체 공정성에 대한 candidate의 인식을 개선할 수 있다는 연구 결과가 나왔다(Patterson et al. 2011). 투명성은 판단 과정의 가치와 편견을 공개하고 이에 대한 영향에 대해 토론할 기회를 제공한다(Gipps와 Stobart 2009).

Throughout the literature, there is an emphasis on fair assessments demonstrating openness to build a shared understanding with learners (Dijksterhuis et al. 2009; Colbert et al. 2017; van der Vleuten et al. 2015; Hays et al. 2015; Schuwirth et al. 2002), with some authors arguing transparency is the best defence against unfair assessment (Gipps and Stobart 2009). This includes explicit communication about what judgements will be made, who will make them, the purpose, criteria, and results of the judgement decisions (Tierney 2012). Research has demonstrated communication interventions to improve transparency can improve candidate perceptions of overall fairness (Patterson et al. 2011). Transparency brings out into the open the values and biases of the judgement process and provides an opportunity for debate about the influences on this (Gipps and Stobart 2009).


투명성에는 수행능력 향상과 피드백에 초점을 맞춘 서술도 포함된다(Rodabaugh 1996; Colbert et al. 2017). 한 연구는 의대생을 대상으로 한 조사에서 '더 많은 피드백'이 공정성에 대한 일반적인 반응이라고 지적했다. 몇몇 의견제출자들은 적절한 피드백이 없다면, 미래에 계속해서 같은 실수를 저지를 수 있으며, 이는 불공평한 것으로 간주된다고 언급하였다(더필드와 스펜서 2002). 피드백을 제공하는 성과에 대한 고품질의 적절한 판단은 판단 결정의 신뢰성, 투명성 및 공정성을 구축한다(Tavares and Eva 2013; Govaerts and Van der Vleuten 2013).

Transparency also includes a narrative which focuses on performance improvement and feedback (Rodabaugh 1996; Colbert et al. 2017). One study noted ‘more feedback’ as a common response in a survey of medical students about fairness. Several respondents noted that without adequate feedback, they could continue to make the same mistakes in the future, and this was considered unfair (Duffield and Spencer 2002). High quality, appropriate judgements about a performance which provide feedback build the credibility, transparency and thus fairness of a judgement decisions (Tavares and Eva 2013; Govaerts and van der Vleuten 2013).


그러나 가치로서의 투명성은 공정성의 다른 가치와 상충될 수 있다(Tierney 2012). 예를 들어, 투명성은 학습자에게 프레임워크와 기대치에 대한 이해를 제공하지만, 이것은 더 신뢰할 수 있고 목적에 적합하며 방어할 수 있는 개별화된 [맥락적 평가의 기회를 제한]할 수 있다. 투명성은 컨텍스트-독립성을 목표로 하는 체크리스트, 루브릭 및 판단 보조 도구로 이어질 수 있기 때문이다

However, transparency as a value can conflict with other values of fairness (Tierney 2012). For example, transparency provides learners with a framework and an understanding of expectations, but this can restrict opportunities for individualised, contextual assessment which is more credible, fit for purpose and defensible. Transparency can lead to checklists, rubrics and judgement aids which aim to be context independent. 


와틀링(2014년)은 사전 결정된 평가 양식을 주목했는데, 평가자가 관찰되지 않거나 임상 상황의 맥락에서 광범위한 역량에 대해 판단하도록 강요받으면 평가자와 프로세스에 대한 학습자의 신뢰도가 떨어지고, 의미 없는 상투적인 산더미에서 잠재적으로 [신뢰할 수 있는 결정]을 숨길hide 수 있다. 게다가, 분명하게 표현할 수 없는 판단을 내릴 때 작용하는 많은 개별화된, 암묵적인 가치관과 개인적 특성이 있다. 투명성이 신뢰도, 방어성 및 인간 판단의 공정성에 [합목적적인 공생] 속에서 이뤄질 수 있도록 하기 위해서는 그림 3과 같이 전문가의 능력, 경계, 서술성, 평가자의 민첩성 등 많은 특성이 필요하다.

Watling (2014) noted predetermined assessment forms, where assessors are forced to make judgements on a wide range of competencies not observed or in context of the clinical situation can diminishes the learners’ trust in the assessor and process, and hides potentially credible decisions in a mountain of meaningless platitudes. Furthermore, there are many individualised, tacit values and personal characteristics which come into play when making judgements which cannot be explicitly expressed. To ensure transparency can occur in symbiosis with credibility, defensibility and fit for purpose in fairness in human judgement, many characteristics such as expert abilities, boundaries, narrative and agility of assessors are needed as demonstrated in Fig. 3.


개인 차원의 평가에서 인간 판단의 공정성을 창출하기 위해 필요한 것은 무엇인가?

What is needed to create fairness in human judgement in assessment at an individual level?

판단 결정이 평가에서 인간 판단의 공정성의 가치에 내재된 경우, 이러한 결정은 내러티브, 증거, 경계, 전문지식 및 민첩성을 포함한 개별적 수준의 구성요소에 의해 뒷받침되어야 할 것이다.

If judgement decisions are embedded in the values of fairness in human judgement in assessment, then these will need to be supported by components at an individual level, including narrative, evidence, boundaries, expertise and agility.


내러티브 Narratives

내러티브는 인간의 판단에 투명성, 신뢰성, 방어성, 맥락, 경계 및 관점을 제공한다. 내러티브는 의도적으로 수행능력의 맥락 특이적 측면을 잡아내기 때문에, 학습자가 어떠한 방식과 이유와 방법으로 평가받았는지를 정의할 수 있게 된다. 이로서, 비선형적non-linear 평가를 캡처할 수 있으며, 의미 구성을 허용하고 성찰을 장려하여, 평가의 방어성을 개선하고 판정이 목적에 적합하도록 보장할 수 있다.

Narratives provide transparency, credibility, defensibility, context, boundaries and perspective to human judgement. It intentionally captures context-specific aspects of performance (Govaerts and van der Vleuten 2013; Bacon et al. 2017; Ginsburg et al. 2015), allows for capturing of non-linear assessment by defining how, why and in what way a learner has been judged, allows for the construction of meaning and encourages reflection (Greenhalgh and Hurwitz 1999a, b) which can improve defensibility and ensure the judgements remain fit for purpose.


일부 저자들은 전문가의 주관적 내러티브 논평은 '총괄적 평가에서 신뢰할 수 있는 의사결정을 하는데 필수적'이며, 따라서 판단의 신뢰도에 필수불가결하다고 제안한다. 평가자가 자신의 생각을 명확히 표현할 수 있도록 허용하는 것은 평가가 평가자의 사고를 가리는 [수치적 점수에 의존할 때 발생하는 환원주의]보다 더 신뢰할 수 있고 방어할 수 있다(Govaerts and van der Vleuten 2013; McCready 2007). 평가에 서술적 내러티브를 사용하는 것은 위험 학습자를 조기에 식별하는 것으로 나타났다(Cohen et al. 1993; Durning et al. 2010; Ginsburg et al.2017b; Ginsburg et al. 2013). 내러티브는 또한 평가자들을 보다 전체적인 판단으로 이끌며(Bacon et al. 2017), [학습자들이 공정한 판단에 필요하다고 보는] 피드백을 허용한다(Rodabaugh 1996; Colbert et al. 2017; Duffield and Spencer 2002; Govaerts and van der Vleuten 2013; Tavares와 Eva 2013; Watling et al. 2008). 더욱이, return-to-work 문헌에서, 판단의 공정성에 대한 인식은 적어도 부분적으로 관련 전문가의 의사소통 능력에 의존했다(Sthl et al. 2019).

Some authors propose that expert subjective narrative comments are ‘indispensable for trustworthy decision making in summative assessments’, and thus credibility of judgements (Ginsburg et al. 2015; Marjan Govaerts and van der Vleuten 2013). Allowing assessors to articulate their thinking, may be more credible and defensible than reductionism which occurs when assessments rely on numerical scores which mask assessors’ thinking (Govaerts and van der Vleuten 2013; McCready 2007). The use of descriptive narratives in assessment has been shown to identify at-risk learners earlier (Cohen et al. 1993; Durning et al. 2010; Ginsburg et al. 2017b; Ginsburg et al. 2013) and contributes to predicting future performance or need for remediation (Cohen et al. 1993). Narratives also lead assessors to more holistic judgements (Bacon et al. 2017) and allow for feedback which learners see as essential for a fair judgement (Rodabaugh 1996; Colbert et al. 2017; Duffield and Spencer 2002; Govaerts and van der Vleuten 2013; Tavares and Eva 2013; Watling et al. 2008). Furthermore, within the return-to-work literature, perceptions of the fairness of the judgements was at least partly dependent on the communication skills of the professionals involved (Ståhl et al. 2019).


내러티브는 또한 [그룹 의사결정을 용이하게 하고, 평가자가 가정을 명확히 하고, 견해의 확정을 논하고, 다른 사람의 관찰로부터 배울 수 있도록 함]으로써 [시스템 수준]에서 방어성을 더한다(Bacon et al. 2017). 어떤 사람이 자신의 결정에 대한 이유를 명확하게 설명하기 위해 내러티브를 사용해야 할 때, 그들은 그들이 목적에 적합하도록 확실히 하기 위해 의사 결정에 더 집중하게 된다. (Daniels and Sabin 1997).

Narratives also add to defensibility at a systems level by facilitating group decision making, allowing assessors to articulate assumptions, discuss disconfirming views and learn from the observations of others (Bacon et al. 2017). When a person is required to use narratives to articulate the reasons for their decisions they become more focused in their decision making ensuring they remain fit for purpose (Daniels and Sabin 1997).


평가자의 언어는 모호하고 간접적일 수 있으며, 교직원과 학습자가 자신의 코멘트에 의해 의도된 평가자의 의도를 추측하도록 요구하는 경우('숨겨진 코드'를 찾음) 이 코드를 해석하는 데 있어 교직원과 학습자들 사이에 놀라운 일관성이 있다(Ginsburg et al. 2015, 2016, 2017a). 그러나, 체면 유지를 위한 '헷징'을 포함한 여러 요소들로 인해, 내러티브는 종종 학습자가 얼마나 열심히 일하느냐에 초점을 맞추는데, 이는 학습자가 노력의 이러한 인식을 공정하다고 보는 경우가 많지만, 성과 판단에 도움이 되지 않을 수 있다. 게다가, 일부 평가자들은 부정적인 메시지를 효과적으로 전달하기 위한 훈련과 내러티브가 부족하다고 느낀다. (Cleland et al. 2008) 

Whilst assessors’ language may be vague and indirect, requiring faculty and learners to guess what assessors intended by their comments (finding a ‘hidden code’) there is surprising consistency amongst faculty and learners in interpreting this code (Ginsburg et al. 2015, 2016, 2017a). However, due to multiple factors, including ‘hedging’ to save face, narrative often focuses on how hard a learner works which can be unhelpful in judging performance (Ginsburg et al. 2016, 2017a), although learners often see this recognition of effort as fair (Rodabaugh 1996). Furthermore, some assessors feel they lack the training and narrative to give negative messages effectively (Cleland et al. 2008). 


이러한 한계를 극복하기 위해 많은 사람들은 평가자에게 판단을 요청할 때 임상 실무에 적합한 서술법을 사용할 것을 요구하였다(Kogan et al. 2014; Crossley and Jolly 2012). 평가 척도를 임상적 독립성 또는 위임 구성에 맞춰 조정하면 점수 신뢰도와 평가자 차별성이 개선되는 것으로 나타났다(Crossley and Jolly 2012; Weller et al. 2014). 이것은 또한 임상적 증거가 [판단의 내러티브]의 기초가 될 수 있도록 하여 신뢰성을 향상시킨다 (Watling et al. 2012). 더욱이, (이러한) 판단은 평가 척도보다 고품질 임상 치료에 집중되기 때문에, 환자들에게도 더 공평하다(Kogan et al. 2014).

To overcome these limitations, many have called for narratives which fit clinical practice to be used when asking assessors to make judgement (Kogan et al. 2014; Crossley and Jolly 2012). Aligning rating scales to the construct of clinical independence or entrustment has been shown to improve score reliability and assessor discrimination (Crossley and Jolly 2012; Weller et al. 2014). This also allows for clinical evidence to be form the basis of the narrative of the judgement which improves credibility (Watling et al. 2012). Furthermore, it also is fairer to patients, as the judgements are focused on high quality clinical care rather than rating scales (Kogan et al. 2014).


근거 Evidence

근거는 판단을 뒷받침하는 수단으로 제공되며(Upshur와 Colak 2003), 타당성 논쟁을 일으키는데 필수적이다(Govaerts and van der Vleuten 2013). 근거가 없으면 판단이 아니라 추측이다(Downie and Macnaughton 2009). 근거 그 자체는 종종 주관적이다. 각 맥락에서 적용할 수 있는 증거를 판단하는 보편적 표준은 없으며, 따라서 필요한 근거의 유형은 그에 따라 달라질 것이다(Upshur와 Colak 2003). 또한 고부담 평가에서 [데이터 수집 단계와 수집된 증거]가 실제 판단 자체보다 더 자주 어려운 것임이 입증되었다(Southgate et al. 2001).

Evidence is offered as a means of supporting judgements (Upshur and Colak 2003), and is essential for creating a validity argument (Govaerts and van der Vleuten 2013). Without evidence, it is not a judgement but a guess (Downie and Macnaughton 2009). Evidence itself is often subjective. There is no universal standard to adjudicate evidence that can be applied in each context, and the type of evidence needed will therefore vary accordingly (Upshur and Colak 2003). It has also been demonstrated that in high stakes assessment, the data gathering phase and evidence collected is more often challenged than actual judgement itself (Southgate et al. 2001).


Watling 외 연구진(2012)은 [환자의 임상 결과 및 환자로부터의 피드백]과 같이, 학습자는 [의사의 실제 작업에 내재된 판단에 관한 근거]를  본질적으로 신뢰할 수 있는 것으로 보았다. 평가자로부터 [직접 관찰을 받음]으로서 판단 결정을 받는 것은 평가의 공정성에 대한 신뢰도와 인식에 기본적이며, 이러한 공정성에 대한 인식은 관찰이 장기간에 걸쳐 이루어질 경우 더욱 강화된다(Duffield 및 Spencer 2002; Bul).잠금 등 2019). 다양한 임상 환경에서 복수의 증거 출처를 갖는 것(삼각측량), 증거의 지속적인 수집 및 삼자 회의(피어 디브리핑 및 멤버 체크)와 같은 시스템 절차도 증거의 공정성에 대한 인식을 개선하기 위해 보인다(Webb et al. 2003; Bacon et al. 2017; Watling et al. 2013a).

Watling et al. (2012) noted evidence for judgements that were embedded into the actual work of a doctor, such as patient clinical outcomes and feedback from patients was seen by learners as being intrinsically credible. Having the opportunity to be directly observed by the assessor making judgement decisions is fundamental to the trustworthiness and perception of fairness of the assessment (Watling and Ginsburg 2019; Watling et al. 2013a; Watling et al. 2008), and this perception of the fairness is enhanced by prolonged observation (Duffield and Spencer 2002; Bullock et al. 2019). System procedures such as having multiple sources of evidence in a variety of clinical settings (triangulation), continuous collection of evidence and tripartite meetings (peer debriefing and member checks) is also seen to improve the perception of fairness of evidence (Webb et al. 2003; Bacon et al. 2017; Watling et al. 2013a).


경계 Boundaries

공정한 판단 결정은 경계가 있다고 볼 수 있다. 이것들은 판단에 도달하고, 판단 결과를 소통하는 과정에서 

    • 허용 가능한/허용되지 않는 것

    • 관련성이 있거나 없는 것, 

    • 목적에 적합한 것/부적합하지 않은 것 사이의 경계선이다

Fair judgement decisions can be seen as having boundaries. These are boundaries between 

    • what is acceptable/not acceptable, 

    • what is relevant/not relevant or 

    • what is fit for purpose/not fit for purpose in the process of arriving at and communicating a judgement. 

경계는 사회적 구인으로서, [가치와 연결되고, 따라서 평가자는 서로 다른 장소마다 경계를 구성]한다. 본질적으로, [경계]는 모호하다. 학습자들은 경계가 어디에 있는지, 그리고 무엇이 "평가가능한지"에 대해 걱정한다. [지속적인 관찰]은 학습자에게 [모든 관찰은 체면을 잃거나 평가 결과에 영향을 줄 수 있는 기회]라는 것을 의미할 수 있다. 한 연구에 따르면 학생들은 인종, 성별, 연령에 기초하여 일부 학생에 대한 교수진의 편파성이 불공평하다고 느꼈으며, 많은 국가에서 이 또한 불법이라고 한다. 암묵적으로 공유된 가치, 표준 문서는 판단 결정을 위한 증거가 될 수 있는 것의 경계를 만드는 데 도움을 준다. 극단적인 관점을 갖는 것은 또한 그들이 내리는 사람과 판단의 신뢰성을 떨어뜨리는 경향이 있다(Kirkland 2012).

Such boundaries are social constructs, connected with values and thus assessors construct boundaries in different places (Houston 2002). By their very nature, boundaries are fuzzy. Learners are concerned about where boundaries lie, and what is “assessable” (Rees and Shepherd 2005). Continuous observation may mean every observation is an opportunity for learners to lose face and impact their assessment outcome (Watling and Ginsburg 2019). One study noted students felt a faculty member’s partiality to some students on the basis of race, gender or age was unfair, (Rodabaugh 1996) and in many countries this is also illegal. Implicit shared values, standard documents assist in creating boundaries of what is able to be evidence for judgement decisions. Holding extreme views, at the edge of boundaries also tends to lower the credibility of the person and the judgements they make (Kirkland 2012).


전문성 Expertise

의학 교육에는 임상 및 교육이라는 두 가지 유형의 전문지식이 있다(Jones 1999). 평가자는 평가자로서의 신뢰성을 갖추려면 전문 임상의로서의 신뢰성이 필요하다고 본다(Watling et al. 2012, 2013b; Telio et al. 2016; Berendonk et al. 2013). 의사결정 위원회는 또한 전문성을 중시하며, 공정성과 신뢰성을 확보하기 위해 교수의 [전문가로서 인지된 지위]에 의존한다(Hauer et al. 2016).

Within medical education, there are two types of expertise, clinical and educational (Jones 1999). Assessors perceive that credibility as an expert clinician is required if one is to have credibility as an assessor (Watling et al. 2012, 2013b; Telio et al. 2016; Berendonk et al. 2013). Decision making committees also value expertise, relying on faculty members’ qualifications via their perceived status as expert to help ensure fairness and credibility (Hauer et al. 2016).


학습자는 교육적 전문지식보다 임상적 전문지식을 중시한다(Watling et al. 2013b). 그러나 의료 교육 전문가들은 일반적으로 정보 및 정보 집합을 가지고 추론할 때 의미 있는 패턴 및 추상화를 더 많이 사용한다(Govaerts et al. 2011). 그들은 잘 발달된 개인 스키마를 가지고 있으며, 그들이 평가하고 있는 특정한 문제나 상황에 근거하여 사용하는 스키마를 선택할 수 있으며, 이것은 예측할 수 없는 맥락에서 판단을 용이하게 하는데 효과적이다(Watling et al. 2012; Govaerts et al. 2013; Marewski et al. 2010). 또한 그들은 다양한 맥락의 특정 정보를 의미 있는 패턴으로 결합하여 평가판단을 내릴 가능성이 더 높으며, 주로 그들이 본 것에 대한 문자적이고 피상적인 설명을 제공하는 초보자에 비해 연습생 성과에 대한 보다 풍부하고 해석적인 설명을 제공한다(Govaerts et al. 2011).

Learners value clinical expertise over educational expertise (Watling et al. 2013b). However, experts in medical education in general make more inferences on information, cluster sets of information into meaningful patterns and abstractions (Govaerts et al. 2011). They have a well-developed set of personal schemas, and are able to choose a schema used based on the specific problem or context they are assessing, which is effective for facilitating judgement in unpredictable contexts (Watling et al. 2012; Govaerts et al. 2013; Marewski et al. 2010). They also are more likely to make evaluative judgements, combining various context specific information into meaningful patterns, providing richer and more interpretive descriptions of trainee performance as compared to novices who mostly provide literal, superficial descriptions of what they had seen (Govaerts et al. 2011).


민첩성 Agility


Govaerts 외 연구진(2013년)은 평가자가 수행능력을 평가할 때 다양한 수행능력의 측면을 고려한다는 점에 주목했다. 예를 들어, 병력청취, 신체검사, 환자관리 중 성과를 평가할 때, 측정자들은 문제의 '의학-기술적' 측면을 적절히 다루는 학생들의 능력뿐만 아니라 의사소통, 대인관계, 시간관리 능력도 평가했다. 이와는 대조적으로 많은 평가 양식은 [맥락에 무관하게 독립적이며 임상 상황에 관계없이 모두 완료해야 하는] 별개의 독립된 실체로 성과 차원을 열거한다. 비록 이러한 방식은 투명하지만, 신뢰도가 낮거나 목적에 적합하지 않으며(Watling 2014; McCready 2007) [맥락적으로 적절하고, 전체론적이며 개별화된 판단 결정을 내릴 수 있는] 평가자의 민첩성을 인식하지 못한다(Govaerts et al. 2013). [지침이나 프로토콜을 엄격히 준수하는 것]과 [높은 "품질"]을 동일시하는 것은 보다 정교한 [전문성의 프로세스]에 대한 증거를 간과하는 것이다(Greenhalg et al. 2014). 

Govaerts et al. (2013) noted that assessors consider multiple performance dimensions when assessing performance. For example, when assessing performance during history taking, physical examination or patient management, raters assessed not only students’ ability to adequately handle the ‘medico-technical’ aspects of the problem, but also communication, interpersonal and time management skills. In contrast, many assessment forms aim to be context independent and list performance dimensions as separate distinct entities which all need to completed regardless of the clinical situation. Although this is transparent, it is not credible or fit for purpose (Watling 2014; McCready 2007) and does not recognise assessors’ agility to make contextually appropriate, holistic and individualised judgement decisions (Govaerts et al. 2013). Equating “quality” with someone who strictly adheres to guidelines or protocols, is to overlook the evidence on the more sophisticated process of expertise (Greenhalgh et al. 2014). 


공정성의 관점에서, 이러한 목적 적합하고 개별화된 전체론적 판단은 [여러 항목으로 된 체크리스트보다 더 낫지는 않더라도] 평가자 합의와 수행능력의 변별력을 입증하며, 사회적으로 더 공평하다왜냐하면 환자들은 상담의 '부분parts'를 할 수 있는 사람이 아니라, 심리학적으로 그들의 심리학적 환경에서 자신들에게 다가갈 수 있는 [전인적인whole person] 사람으로서 건강 전문가가 필요하기 때문이다. 

From a fairness perspective, these fit-for-purpose, individualised holistic judgements demonstrate at least as much, if not more, assessor agreement and performance discrimination than checklists of actual items (Crossley and Jolly 2012; MacRae 1998; Sadler 2009) and are fairer to society because patients need a health professional who can approach them as a whole person, in their psychosocial environment, not one who can do ‘parts’ of an consultation. 


법률적 관점에서, 의학에서는 [맥락]은 논쟁적합성의 판단에 강하게 영향을 미친다는 인식이 증가하고 있으며, 임상적 판단이 개별화되지 않은 경우에는 전문적 판단에서 벗어나는 것으로 간주된다(Stefan 1993).

From a legal perspective, in medicine there is increasing recognition that the context strongly influences the adjudication of argument adequacy and if a clinical judgement is not made on an individualised basis, it constitutes a departure from professional judgement (Stefan 1993).


나아가, [상담이 실시간으로 진화할 때만 문제가 드러나는] 불확실한 상황인 실생활real life에서 평가가 자주 일어나기 때문에, 평가자는 환자의 공정성과 안전을 보장하기 위해 실시간으로 판단해야 한다. 상황을 평가하고, 적절한 조치를 취하고, 결과를 재평가하기 위한 지속적인 모니터링 사이클이 필요하다. 이것은 민첩성을 필요로 한다. 이러한 민첩성과 전문지식이 결합되면, 연습생이 직장에 기반한 학습에 종사할 수 있게 되므로, 실제 환자들에 대한 임상 경험을 획득하여 환자 안전을 보장하면서도 학습을 극대화할 수 있다.

Furthermore, because assessment often occurs in real life, uncertain situations where issues only become apparent as the consult evolves in real time, assessors need to make judgements in real time to ensure patient fairness and safety (Katerndahl et al. 2010; Plsek and Greenhalgh 2001; Kaldjian 2010; Berendonk et al. 2013; Lipshitz et al. 2001; Flin et al. 2007; Epstein 2013). A continuous cycle of monitoring to assess the situation, taking appropriate actions and re‐evaluating the results is required (Flin et al. 2007). This requires agility. This agility, combined with expertise allows for trainees to engage in workplace based learning, gaining clinical experiences on real life patients to maximise learning whilst still ensuring patient safety (Flin et al. 2007).


시스템 수준에서 평가에서 인간 판단의 공정성을 창출하기 위해 필요한 것은 무엇인가?

What is needed to create fairness in human judgement in assessment at a systems level?

개별적인 평가판단은 독립적이지 않고 오히려 평가 시스템의 일부분이다. 시스템 사고의 관점을 활용하면 단순히 개별적인 수준의 공정성을 검사하는 것 보다 공정한 인간 판단의 개인 특성과 가치에 대한 보다 풍부한 검사가 가능하다(Colbert et al. 2015). 시스템 수준에서 공정성의 가치와 개별 특성을 지원할 수 있는 시스템과 환경에는 절차적 공정성, 문서화, 다중 기회, 복수의 평가자 및 타당성 증거가 포함된다.

Individual assessment judgements are not independent, rather they are part of an assessment system. Utilising a systems thinking lens enables a richer examination of individual characteristics and values of fair human judgement than would be possible from simply examining fairness at an individual level alone (Colbert et al. 2015). At a systems level, systems and environments which are able to support the values and individual characteristics of fairness include procedural fairness, documentation, multiple opportunities, multiple assessors and validity evidence.


절차적 공정성 Procedural fairness


절차적 공정성은 무정형의 개념이다. 교육 내에서는 절차적 공정성에 대한 명확한 정의가 없다. 그러나 이 비정형 개념의 중요성은 분명하다. 사람들은 결과를 결정하는 데 공정한 절차가 있다고 생각한다면 당국이 자발적으로 제공하는 결과를 받아들이고자 한다(Van den Bos et al. 1998; Van der Vleuten et al. 1991). 이는 실험실 실험, 조사 연구 및 실제 환경에서 발견되는 사회 심리학에서 가장 자주 복제되는 발견 중 하나이다(Van den Bos et al. 1997). 절차적 공정성은 후보자와 기관 모두에 대한 선발과 평가와 같은 고부담결정의 신뢰성에 중요한 역할을 한다(Burgess et al. 2014; Colbert et al. 2017).

Procedural fairness is an amorphous concept. There is no clear definition of procedural fairness within education. However, the importance of this amorphous concept is clear. People are more willing to voluntarily accept outcomes given to them by an authority if they perceive there is fair procedures in deciding the outcomes (Van den Bos et al. 1998; van der Vleuten et al. 1991). This is one of the most frequently replicated findings in social psychology, found in in laboratory experiments, survey studies and real world environments (Van den Bos et al. 1997). Procedural fairness plays an important role in the credibility of high stakes decisions such as selection and assessment, for both candidates and institutions (Burgess et al. 2014; Colbert et al. 2017).


절차적 공정성에 대한 인식에 긍정적인 영향을 미치는 것으로 보여지는 몇 가지가 있는데, 여기에는 판정이 이루어지는 과정을 명시적으로 기술하는 것(린드와 타일러 1988), 공식적이고 정기적인 판정 과정에 대한 포괄적 검토, 항소 절차의 제공(Hayes et al. 2015) 등이 있다. 또한 절차적 공정성을 위해 중요한 것은 학습자가 자신의 기대치와 이러한 [기대를 충족하지 못할 경우 요구되는 사항을 명시적으로 알려주도록] 하는 것이다(Colbert et al. 2017). 학습자에게 가능한 일찍 정보를 제공하는 것은 학습자가 자신의 의견을 말할 수 있게 해 주듯이 공정성에 대한 인식에 긍정적인 영향을 미치는 것으로 나타났다(Van den Bos et al. 1997). 평가 시기는 또 다른 관련 측면이다. 학습자가 자신의 행동을 바꿔볼 수 있는 기회가 없어 불공평하게 보이기 때문에 로테이션이 끝날 때 제공되는 판단은 잘 받아들여지지 않는다(Ramani et al. 2017; Watling et al. 2008).

There are several things which have been shown to positively influence the perception of procedural fairness which such as explicitly describing the process by which judgements are made (Lind and Tyler 1988), by formal, regular inclusive reviews of the judgement process, and provision of an appeals process (Hays et al. 2015). Also important for procedural fairness is to ensure the learner is explicitly told of their expectations and what else is required if they did not meet these expectations (Colbert et al. 2017). Providing learners with information as early as possible has been shown to positively impact perceptions of fairness, as has allowing learners to voice their opinion (Van den Bos et al. 1997). The timing of assessment is another relevant aspect; judgements provided at the end of a rotation are less well received, as there is no opportunity for learners to modify their behaviour which is seen as unfair (Ramani et al. 2017; Watling et al. 2008).


문서화 Documentation


[내려진 판단에 대한 풍부하고 의미 있는 정보의 문서화][예상되는 가치와 표준의 문서화]는 외부 감사, 재구성, 평가 및 품질 보증과 투명성, 신뢰성 및 방어성을 허용한다(Govaerts and van der Vleeuten 2013; Webb et al. 2003; McCready 2007). 또한 위에서 설명한 절차적 공정성은 평가 정책과 절차를 요약한 명확하고 포괄적인 문서가 필요하다(Hays et al. 2015).

Documentation of rich, meaningful information about judgements made, and documentation of values and standards expected allows for external audit, reconstruction, evaluation and quality assurance and thus transparency, credibility and defensibility (Govaerts and van der Vleuten 2013; Webb et al. 2003; McCready 2007). Furthermore, procedural fairness as described above needs clear and comprehensive documentation outlining assessment policies and procedures (Hays et al. 2015).


필요한 문서의 세부사항은 상황에 따라 달라진다. 한 연구는 평가자가 글로벌 역량 등급만 제공했기 때문에 학습자가 판단의 신뢰성에 의문을 제기했다고 지적했다. 평가자가 의미 없이 체크박스를 하지 않았기 때문에 이것이 잠재적으로 더 신뢰할 수 있는 것으로 보일 수 있지만, 완전한 문서화의 결여는 반대의 효과로 이어졌다(Rees and Shepherd 2005).

The detail of the documentation required depends on the context. One study noted a learner questioned the credibility of a judgement because the assessor only provided a global competency grade. Although this could potentially be seen as more credible because the assessor did not meaninglessly tick boxes, the lack of complete documentation led to the opposite effect (Rees and Shepherd 2005).


다수의 기회 Multiple opportunities


질병은 [사물]이 아니라 [의사들이 징후, 증상, 진행을 해석하도록 요구하는 그림plots]으로 보여질 때 가장 유용하다(Hunter 1996). 마찬가지로, 단일 시점의 시간 평가 판단이 미래의 성과를 예측하기에 적절하지 않다고 제안되었으며, 지식, 기술 및 태도를 보다 지속적으로 평가할 수 있도록 종적 평가가 필요하다(Boulet and Durning 2019). 역량은 주어진 상황에 적용되는 일반적이고 안정적인 특성이 아니기 때문에, 다양한 직무 요구사항에 적응할 수 있는 개인의 성과와 능력을 심층적으로 이해하려면 광범위한 직무, 맥락 및 평가자가 필요하다(Govaerts and van der Vleuten 2013; Schuwirth et al. 2002; Van der Vleuten and Schuwirth 2005). 몇몇 저자들은 인간의 판단을 활용하는 공정하고 방어 가능한 평가 프로그램은 [종합적이고, 복합적이며, 사실에 입각한 지식, 직접 관찰의 충분히 큰 표본, MSF, 포트폴리오 등을 포함함으로써 학습 진행 상황을 모니터링하고 학습 계획과 자기 성찰을 개발할 수 있어야 한다]고 제안한다(Dijksterhuis et al. 2009년). 그러나 일부 교육 프로그램에서는 훈련생 평가에 대한 낮은 return rate가 드물지 않기 때문에 여러 가지 증거를 확보하는 것은 문제가 될 수 있다(Colbert et al. 2017).

Diseases are most useful when they are thought of not as objects but instead seen as plots that unravel over time requiring physicians to interpret signs, symptoms and progression (Hunter 1996). Similarly, it has been suggested a single point in time assessment judgement is not adequate to predict future performance, and longitudinal assessment is needed to allow for a more continuous evaluation of knowledge, skills and attitudes (Boulet and Durning 2019). Because competencies are not generic and stable traits that apply in any given situation, a broad range of tasks, contexts, and assessors are needed to gain an in-depth understanding of a person’s performance and capability to adapt to various task requirements (Govaerts and van der Vleuten 2013; Schuwirth et al. 2002; van der Vleuten and Schuwirth 2005). Several authors suggest that a fair and defensible assessment program utilising human judgement should be comprehensive, multimodal, incorporate factual knowledge, sufficiently large samples of direct observation, multisource feedback, and a portfolio to monitor progress and to develop learning plans and self-reflection (Dijksterhuis et al. 2009). However, obtaining multiple pieces of evidence can be problematic as in some training programs a low return rate for trainee assessment is not uncommon (Colbert et al. 2017).


평가에서 공정한 인간의 판단은 [기회 접근의 공정성]과 불가분의 관계에 있다(Stobart 2005). 감독자는 신체적 기회를 통해서 또는 학생 학습에 대해 한결같이 낮은 기대를 가질 때 학습자의 학습 기회 품질에 영향을 미칠 수 있다(Tierney 2012). 학생들의 공정감각은 [성적 상승 효과가 있는 점수의 수정 또는 조작]보다 [리뷰 세션이 학습지도요령 등 교육행동teaching practice으로 주어진 기회]와 더 밀접한 관계가 있는 것으로 나타났다(Rodabaugh 1996).

Fair human judgement in assessment is inseparable from fairness in access to opportunities (Stobart 2005). Supervisors are able to influence the quality of the learner’s opportunities to learn, both through physical opportunities, or when uniformly low expectations are held for student learning (Tierney 2012). Students’ sense of fairness has been found to be more closely related to opportunities afforded to them by teaching practices such as review sessions and study guides, than scoring modifications or manipulations that have the effect of raising grades (Rodabaugh 1996). 


문헌에 따르면 모든 학습자는 주요 평가에 앞서 모든 평가 유형을 경험할 수 있는 기회를 가져야 하며, 특히 한 가지 평가 유형에서 불이익을 받는 사람에게는 전문성의 증거를 보여줄 수 있는 대체 기회를 주는 것이 특히 중요하다고 제안한다.9. 더욱이, 학습자들은 자신이 받은 피드백을 이해하고 통합했음을 증명할 기회를 가치 있게 여긴다(Watling et al. 2013a, 2008).

The medical literature suggests all learners should have opportunities to experience all assessment types prior to major assessments (Hays et al. 2015), and to allow learners alternative opportunities to demonstrate evidence of expertise, which is especially important for those who are disadvantaged on one type of assessment (Gipps and Stobart 2009). Furthermore, learners value opportunities to demonstrate they have understood and incorporated feedback they have received (Watling et al. 2013a, 2008).


공정성은 종종 '평등한' 대우나 관행으로 여겨져 왔다(Colbert et al. 2017). 그러나, 수많은 철학자와 수학자들은 평등한 대우를 한다고 해서 항상 공정성이 보장되는 것은 아니라고 주장해왔다(Eva 2015; Stobart 2005). 예를 들어, 에바는 '한 명은 편두통 때문에 결석한 반면 다른 한 명은 숙취로 인해 결석했을 때 의무 교육을 받지 못한 두 명의 의대생에게 동등한 치료를 주는 것이 공평한가'라고 묻는다. '중립성, 일관성, 편애 회피는 공정하지만, 모든 학습자를 사용하는 방법이나 피드백을 동일하게 취급하는 것은 다른 한편으로 불공평하다. 왜냐하면 그것은 일부 학생들의 학습 기회를 감소시키고 있기 때문이다(Tierney 2012). 

Fairness has often been viewed as ‘equal’ treatment or practice (Colbert et al. 2017). However, countless philosophers and mathematicians have argued that equal treatment does not always ensure fairness (Eva 2015; Stobart 2005). For example, Eva asks: ‘is it fair to give two medical students equal remediation for missing a mandatory education session when one was absent because he had a migraine headache, whereas the other had a hangover (Eva 2015)?' Neutrality, consistency and avoidance of favoritism is one on hand fair, however, treating all learners the same be it in terms of the methods used, or the feedback given, is on another hand unfair because it is reducing the opportunity of some students to learn (Tierney 2012). 


'중립성'은 맥락-독립적이며, 이런 의미에서 불공평하다. 예를 들어 병동 회진 중에 목소리를 내지 않는 조용한 학습자는 의료지식에 결함이 있는 것으로 잘못 추정될 수 있다(Colbert et al. 2017). 이는 보통 학습자들은 스스로 [공정성을 노력과 관련된 것]으로 본다는 점에서 더욱 상충된다. 예를 들어, 그들은 대부분의 학생들은 [투입과 성과는 반드시 일치하지 않고, [열심히 공부한 학생과 그렇지 않은 학생이 구별되지 않기 때문]에 모든 학생이 높은 점수를 받는 것은  불공평하다고 생각한다또는 판단이 학생들이 가져오는 입력과 일치하지 않기 때문이다(Wycliffe-Jones et al. 2018).

Neutrality is often context independent, and in this sense is unfair. For example, a quiet learner who does not speak up during ward rounds could be incorrectly inferred as having deficits in medical knowledge (Colbert et al. 2017). This is further conflicted by the fact that learners themselves see fairness as related to effort. For example they consider it unfair if most students receive high grades because input does not match output and no distinction is made between those who worked hard and those who did not (Rodabaugh 1996) or if judgements are not aligned with the inputs that the students brings (Wycliffe-Jones et al. 2018).


복수의 평가자가 평가하는 판단

Judgements assessed by multiple assessors


그룹 의사결정은 현재 전 세계 많은 국가에서 평가 결정을 위한 표준 메커니즘이 되었다(Hauer et al. 2016; Bacon et al. 2015; Govaerts and van der Vleuten 2013). 공개 숙의와 비판적 대화를 통해 증거를 비판적으로 검토하기 위한 그룹을 만드는 것은 [학습자에 대한 공유된 주관성shared subjectivity]의 개념을 통하여, 학습자와 평가자 모두에게 방어 가능하고, 신뢰할 수 있으며, 공정하다고 여겨진다. 2009; Hauer et al. 2015; Bacon et al. 2015; Govaerts and van der Vleuten 2013; Krefting 1991; Webb et al. 2003; Ham 1999). 

Group decision making is now a standard mechanism for assessment decisions in many countries around the world (Hauer et al. 2016; Bacon et al. 2015; Govaerts and van der Vleuten 2013). Creating groups to critically review evidence through open deliberative and critical dialogue is seen as defensible, credible and fair by both learners and assessors because there is a concept of shared subjectivity about learners (Tochel et al. 2009; Hauer et al. 2015; Bacon et al. 2015; Govaerts and van der Vleuten 2013; Krefting 1991; Webb et al. 2003; Ham 1999). 


대화는 다음의 것들을 가능하게 한다. 

    • 멤버 체크, 

    • 2차 평가자를 통한 검증, 

    • 검토 및 토론을 통한 평가 프로세스의 장기간 참여 

    • 서로 다른 해석이나 가정들의 표현, 

    • 증거와 분석의 삼각 측량 

    • 상충하는 증거와 판단의 조화

이 모든 것은 합의 이전에 다양성을 허용하며, 이는 전문적 판단의 방어가능성을 향상시키는 데 사용될 수 있다. 또한 이러한 정성적 증거 평가 방법은 [전문직업적 가치]와 같은 덜 유형적인tangible 학습 성과를 포착할 수 있게 한다.

Dialogue allows for member checking, verification with secondary assessors, prolonged engagement in the assessment process through review and discussion, articulation of different interpretations or assumptions, triangulation of evidence and analysis and reconciliation of disconfirming evidence and judgements. All of these things allow for diversity prior to agreement, which can be used to improve the defensibility of the professional judgements (Bacon et al. 2015; Govaerts and van der Vleuten 2013; Krefting 1991; Webb et al. 2003; Ham 1999). These qualitative methods of assessing evidence also allow for less tangible learning outcomes such as professional values to be captured (McCready 2007).


[그룹 구성원의 다양성]은 그룹 구성원이 고려하는 관점의 수를 증가시킴으로써 그룹 기능에 긍정적인 영향을 미칠 수 있다(Hauer et al. 2016). 이는 정보 공유를 촉진하고, 더 많은 그룹 구성원이나 가장 먼저 공유되는 정보에 우선 순위를 매기는 그룹의 경향을 극복하기 위한 전략과 연계될 필요가 있다(Hauer et al. 2016).

Diversity of group members can positively influence group functioning by increasing the number of perspectives considered by group members (Hauer et al. 2016). This needs to be coupled with strategies to facilitate information sharing, to overcome tendances of the group to prioritise information known to more group members or information shared first (Hauer et al. 2016).


그러나 여러 가지 다른 평가 도구에서 복수의 데이터 포인트를 광범위하게 사용할 수 있음에도 불구하고 평가 패널의 판단 결정은 소수의 근거 출처에만 초점을 맞출 수 있다는 점에 주목하였다(Hauer et al. 2015). 더욱이 일부 패널 결정의 검토에서, [우려의 부재]가 마치 [진급할 준비]처럼 해석되어서, 대다수 레지던트에 관한 데이터는 논의되지 않았다(Hauer et al. 2015).

However, it has been noted that judgement decisions from assessment panels may focus on only a few sources of evidence despite the widespread availability of multiple data points from multiple different assessment tools (Hauer et al. 2015). Furthermore, an absence of concern was taken to imply readiness for advancement in a review of some panel decisions, and often the data regarding a majority of residents wasn’t discussed (Hauer et al. 2015).


판단의 타당성 증거 Validity evidence for judgments


타당성 주장을 하려면 증거가 필요하다. 여러 출처와 맥락에서 광범위한 증거를 사용하는 것은 성능 평가의 타당성을 보장할 필요가 있다(Colbert et al. 2015). 판단 결정judgement decision은 관찰된 성과에서 결론과 결정에 이르는 일련의 추론과 가정을 포함한다. 본질적으로 타당성은 근거나 이론적 합리성에 의해 정당화될 수 있는, 해석이 적절하고 적절한 정도를 가리킨다(Govaerts and van der Vleuten 2013). 타당성 주장을 작성하기 위해 적절한 증거를 사용하여 평가자가 작성한 추론과 가정에 대한 타당성 평가가 필요하다(Govaerts and van der Vleuten 2013). 따라서 타당성 추론은 절차적인 측면에서 이루어지는 것이 아니라 판단과 의사결정의 전체 시스템에서 역할을 해야 한다.

Evidence is needed to create validity argument. Using a wide range of evidence from multiple sources and contexts is need to ensure the validity of performance appraisals (Colbert et al. 2015). Judgement decisions involve a series of inferences and assumptions leading from the observed performances to conclusions and decisions. In essence, validity refers to the degree to which the interpretations are adequate and appropriate, as justified by evidence or theoretical rationales (Govaerts and van der Vleuten 2013). Evaluation of the plausibility of the inferences and assumptions made by assessors using appropriate evidence is needed to create a validity argument (Govaerts and van der Vleuten 2013). Validity inferences are therefore not procedural per se, but must play a role in the whole system of judgement and decision-making.


고찰 Discussion


결과 요약 Summary of findings


평가에 인간의 판단을 계속 활용하기 위해서는 이러한 전문가 판단의 공정성을 고려할 필요가 있다. 이 문헌 검토는 공정성이 단순하게 정의될 수 없는 복잡한 구조임을 입증했다. 더욱이, '맥락'은 공정성을 결정하는 데 필수적이며, 어떤 하나의 정의도 여러 환경에 걸쳐 적합하지 않을 것이다. 전문성 문헌을 통해 배웠듯, 공정성이란 [체크리스트를 통해 해결할 수 있는 기술적 또는 단순한 문제]가 아니라 [복잡한 문제]로 프레임을 짜는 것이 중요하다. 전문성 평가에 대한 Ottawa 권고안은 복잡성을 수용했고, 전문성을 개인, 대인관계 및 거시사회(공용) 주제와 함께 다차원적인 것으로 간주했다(Hodges et al. 2011).

To continue to utilise human judgement in assessment, the fairness of these expert judgements needs to be considered. This literature review has demonstrated that fairness is a complex construct which cannot be simplistically defined. Furthermore, context is essential in determining fairness and no one definition will fit across different environments. Learning from the professionalism literature, it is important to frame the problem as the complex problem it is, rather than as a technical or simple problem which can be addressed through checklists (Lucey and Souba 2010). The Ottawa recommendations for the assessment of professionalism embraced complexity and considered professionalism to be multi-dimensional with intrapersonal, interpersonal and macro-societal (public) themes, and interactions between these themes (Hodges et al. 2011). 


Greenhalgh와 Papoutsi (2018)는 보건전문직교육에는 역동적 상호작용과 내러티브를 예측하는 연구 설계와 방법이 필요하며, 시스템 전체가 어떻게 조합되는지에 주목해야 한다고 언급하면서, 이러한 [전체적인holistic 시스템 접근법]을 지지했다. 평가에서 공정한 인간 판단의 단순한 정의는 없지만, 공정성의 기초는 의학교육과 폭넓은 교육 문헌에서 유추된다. 이 검토에서 우리는 이러한 추론, 연구 및 관점을 종합하여 인간 판단의 공정성에 대한 추가 논의를 돕고 이 분야에서 연구와 탐구를 지도하는 데 도움이 되는 개념 모델을 만들려고 시도했다. 이 개념 모델은 복잡성을 수용하는 것을 목표로 하며, 평가에서 가치, 개별 특성 및 시스템 절차를 갖춘 다차원적 인간 판단을 제시한다. 이 모델은 공동 서술과 이해를 제공함으로써 평가에서 공정한 인간의 판단에 대한 기관과 학자들의 내외부 대화를 촉진하는 것을 목표로 한다. 무어는 [문제에 대한 이해당사자들 간에 공통된 이해를 만드는 것]이 핵심이라고 언급했다. 이는 반드시 완전한 합의여야 하는 것이 아니라, "문제에 대한 서로 다른 해석에 대해 지적인 대화를 할 수 있을 정도로 이해 당사자들이 서로의 입장을 잘 이해하고 있으며, 이를 어떻게 해결할 것인가에 대해 집단지성을 발휘하는"(Moore 2011) 것이다.

Greenhalgh and Papoutsi (2018) supported this holistic, systems approach, noting that health professions education needed research designs and methods which foreground dynamic interactions and narratives which paid attention to how systems come together as a whole from different perspectives. Whilst there is no simple definition of fair human judgement in assessment, the underpinning foundations of fairness are inferred in the medical education and broader education literature. In this review we have attempted to bring these inferences, studies and perspectives together to create a conceptual model which can be used as a guide to help further discussions of fairness in human judgement and guide research and exploration in this area. This conceptual model aims to embrace complexity, and present fair human judgement in assessment as multi-dimensional with values, individual characteristics and system procedures. The model aims to facilitate internal and external conversations by institutions and academics about fair human judgement in assessment by providing a shared narrative and understanding. Moore noted that creating shared understanding between stakeholders about the problem was key. This is not necessarily complete agreement, but that “the stakeholders understand each other’s positions well enough to have intelligent dialogue about the different interpretations of the problem, and to exercise collective intelligence about how to solve it” (Moore 2011).


긴장 Tensions


우리는 공정성의 복잡성을 가중시키는 이 개념 모델의 개발에서 몇 가지 긴장감을 드러냈다. 예를 들어, 공정성의 가치로서의 투명성은 신뢰도, 방어성, 목적에의 적합성과 같은 다른 가치와 충돌할 수 있다(Tierney 2012). 투명성은 평가를 학습자에게 알리고 미리 문서화해야 하지만 임상 작업은 예측이 불가능하고 완전한 투명성이란 어려운 일이다. 평가가 목적에 맞으려면, 변화하는 임상 상황에 대처하기 위해 민첩하고 유연하게 대처해야 하지만, 이는 투명성을 제한할 수 있다.

We have revealed several tensions in the development of this conceptual model which add to the complexity of fairness. For example, transparency as a value of fairness can conflict with other values such as credibility, defensibility and fitness for purpose (Tierney 2012). Transparency requires assessment to be known to learners and documented in advance, but clinical work is never predictable and so complete transparency is challenging. If assessment is fit for purpose, it needs to be agile and flexible to respond to the changing clinical situation, however this can limit transparency.


긴장감의 또 다른 예는 모든 학습자에게 '평등한' 치료를 제공하는 것이다. 중립성, 일관성 및 모든 학습자에게 동일한 기회를 제공하는 것은 한 편으로 공정하지만 중립성은 맥락에 따라 독립적이며 이러한 감각은 불공평하다(Eva 2015; Stobart 2005; Tierney 2012). 모든 학습자는 평가에서 동일한 퀄리티의 판단과 의사결정을 받을 권리가 있어야 하지만, 이것이 동일한 과정을 의미하는 것이어서는 안 된다.

Another example of a tension is providing ‘equal’ treatment to all learners. Neutrality, consistency and the providing the same opportunities to all learners is on one hand fair, however neutrality is context independent, and this sense is unfair (Eva 2015; Stobart 2005; Tierney 2012). Every learner is entitled to the same quality of judgement and decision making in their assessment, but this should not mean the same process.


추가적인 긴장은 여러 증거의 필요성과 전문가적이고 전체적인 판단의 균형을 맞추고 있다. 전문 평가인은 일반적으로 맥락적으로 적절하고, 총체적이며 개별화된 판단 결정(Govaerts et al. 2013)을 내리는데, 이는 공정성 관점에서 목적에 적합하다. 그러나 이러한 [총체적 판단]은 학습자의 진행에 대한 결정을 내리는 위원회에 제공할 수 있는 증거의 수가 줄어들 수 있으며, 이는 다른 한편으로는 불공평함을 의미한다.

A further tension is balancing the need for multiple pieces of evidence with expert, holistic judgements. Expert assessors typically make contextually appropriate, holistic and individualised judgement decisions (Govaerts et al. 2013) which from a fairness perspective are fit for purpose. However, these holistic judgements may provide fewer pieces evidence to a committee who are making decisions on a learner’s progression, which on the other hand is unfair.


때로는 환자에게 공평한 것과 학습자에게 공평한 것 사이에 긴장감이 감돌기도 한다. 인간 판단의 공정성에 관한 거의 모든 개인 및 시스템 구성요소는, 평가자, 특히 초보 평가자에게 시간과 훈련을 요구한다. 대부분의 평가자는 바쁜 임상의사여서 환자를 치료하는 데 시간이 걸릴 수 있다. 평가인을 위한 교육의 전문적 발전은 환자에게 영향을 미칠 가능성이 있는 임상적 전문성 개발에도 비용을 들일 수 있다.

At times, there is also a tension between what is fair to patients and what is fair to learners. Almost all individual and system components of fairness in human judgement require time and training for assessors, especially for novice assessors. As most assessors are busy clinicians, this can take time away from treating patients. Professional development in education for assessors can also come at a cost to clinical professional development which has the potential to impact patients.


이러한 긴장과 겉보기에 상충되는 가치나 구성요소를 관리할 필요가 있다. 고버트와 동료들은 평가 시스템이 긴장으로 가득 차 있고 평가에서 인간판단의 공정성도 다르지 않다고 지적한다. 그들은 이러한 긴장이 전통적인 '문제 해결 또는 해결책'에서 관리될 것이 아니라, 긴장을 이해하고 이에 관여하며 최대한 유리하게 활용할 수 있는 양극성polarities으로 볼 것을 제안한다(Govaerts et al. 2019).

These tensions and seemingly conflicting values or components need to be managed. Govaerts and colleagues note that assessment systems are rife with tensions, and fairness in human judgement in assessment is no different. They suggest that these tensions need to managed not in a traditional ‘fix the problem, either-or solutions’ but suggest understanding and engaging with the tensions and seeing them as polarities to be leveraged to maximum advantage (Govaerts et al. 2019).


기존 문헌과의 비교

Comparison with existing literature


우리는 문헌 검색에서 인간의 판단의 공정성에 대한 심층적인 조사를 찾지 못했다. 본 논문 전체에서 우리는 평가, 그 역할, 유익성 및 한계를 고려한 여러 연구와 관점을 인용했다. 우리는 광범위한 문헌을 통합한 리뷰를 만들기 위해 형식적이고 허황된 방법론을 사용하여 이 작품에 추가했다고 믿는다.

We found no in-depth examination of fairness in human judgement in our literature search. Throughout this paper we have cited multiple studies and perspectives which have considered human judgement in assessment, its role, benefits and limitations. We believe we have added to this work by using formal, hermeneutic methodology to create a review which incorporates a wide range of literature.


검토의 답변되지 않은 질문과 제한 사항

Unanswered questions and limitations of the review


이것은 철저한 문헌 검토가 아니라, 복잡한 구조의 패러디한 합성을 생산하려는 시도다. 또한 우리의 주제는 평가의 공정성이 아니라 평가에서 인간의 판단의 공정성에 국한되었다는 점에도 주목할 필요가 있다. 어떤 문헌 리뷰도 편견으로부터 자유롭지 못하다(Eva 2008). 그리고 우리는 이 리뷰도 마찬가지라고 주장하지 않는다. 실제로, 이 리뷰에는 리뷰 적용가능성을 제한할 수 있는 영어 논문만 포함되었다. 또한 이 문헌 검토는 문헌의 복잡성을 줄이는 것을 목표로 하는 것이 아니라, 우리가 수행하는 방식을 지속적으로 개선하고 평가에서 인간의 판단을 활용하려는 공동의 목표를 향해 전진하는 방법을 제공하는 데 도움이 된다. 

This is not an exhaustive literature review, but rather an attempt to produce a parsimonious synthesis of a complex construct. It is also important to note that our topic was confined to fairness in human judgment in assessment not fairness in assessment in general. No literature review is free from bias (Eva 2008) and we do not claim this review is either. Indeed, this review only included English language papers which may limit the reviews applicability. This literature review also does not aim to reduce the complexity of the literature but rather help provide a way forward in our common aim of continuing to improve the way we undertake and utilise human judgement in assessment. 


그는 "적절하게 복잡한 정책 문제에 필요한 모든 증거가 단일 학문으로부터 나오는 것은 드문 일이고, 단일 연구로부터 오는 것은 더 드물다"고 지적하며, 학자들이 정책 입안자와 기관에 제공할 수 있는 가장 유용한 제공물 중 하나는 기존 양적, 질적 정보에 대한 간결하고 통합적인 종합을 생산하여 주제 영역을 이해하도록 돕는 것이다 (Whitty 2015; Greenhalgh and Shaw 2017). 이것이 우리가 여기서 우리의 개념적 모델로 시도했던 것이다.

Whittly noted “it is rare that all the evidence needed for a moderately complex policy problem comes from a single discipline, and rarer still that it comes from a single study” and suggested one of the most useful offerings academics can make to policy makers and institutions is to produce a succinct and integrative synthesis of existing information, incorporating quantitative and qualitative, and make sense of the topic area (Whitty 2015; Greenhalgh and Shaw 2017). This is what we have attempted to do here with our conceptual model.


예상대로, 이 광범위한 검토에도 불구하고, 여전히 답하지 않은 많은 질문들이 있다. 첫째로, 이 분야의 이해당사자들은 문헌과 다른 관점을 가지고 있는가? 전문 평가자, 대학 학자들 그리고 다른 사람들은 현재 전 세계의 많은 평가 프로그램에서 인간의 판단력을 이용하는 방법을 모색하고 있다. 평가에서 문서화되거나 발표되지 않은 인간 판단에 대한 무언의 암묵적 지식이 있는가? 평가 프로그램 내에서 공정한 인간 판단의 실질적인 의미는 무엇인가? 그것은 문헌과 일치하고 그렇지 않다면 왜 안 되는가?

As is to be expected, despite this extensive review, there are still many unanswered questions. Firstly, do the stakeholders in this area hold a different perspective to that of the literature? Expert assessors, university academics and others are currently navigating the use of human judgement in many assessment programs round the world. Is there unspoken tacit knowledge about human judgement in assessment which is not documented or published? What are the practical implications of fair human judgement within their assessment program? Does it match the literature and if not, why not?


둘째, 직장에 기반한 평가의 복잡성을 감안할 때 어떻게 이 개념적 프레임워크를 실용적인 방법으로 사용할 수 있는가? 평가 프로그램이 평가에 인간의 판단을 더 많이 이용하는 경우, 이 개념적 프레임워크를 지침으로 사용할 수 있는가? 학습자, 기관 및 감독자에게 미치는 영향은 무엇인가?

Secondly, how can this conceptual framework be used in a practical manner given the complexity of workplace-based assessment? If assessment programs further utilise human judgement in assessment, then can this conceptual framework be used as a guide? What are the implications for learners, institutions and supervisors?


셋째, 서로 다른 가치들 사이의 긴장을 어떻게 조화시킬 수 있을까? 이러한 가치의 공생, 최대의 이익을 보장하기 위해 무엇이 필요한가? 학습자의 공정성을 달성하려고 노력하는 동시에 환자에게 공정성을 보장하는 방법은 무엇인가?

Thirdly, how can we reconcile the tensions between different values? What is needed to achieve symbiosis of these values, to ensure maximal benefit? How can we also ensure fairness to patients, whilst trying to achieve fairness for learners?


결론 Conclusion


2009년 Gipps와 Stobart는 이렇게 말하였다.

21세기 평가의 도전은 공정성에 대한 우리의 관점을 넓혀 사회문화적 맥락을 보다 충분히 고려하는 것이다. 그러나, 더 큰 사회적 문제들에서 한 발 물러나는 것은 어려운 일이고, 평가 그 자체에 집중하려는 유혹은 편향과 관련되어 있다.

In 2009 Gipps and Stobart said: 

“The challenge for twenty-first-century assessment is to broaden our views of fairness to take fuller account of social and cultural contexts. The temptation, however, is to back away from the larger social issues because they are difficult, and to concentrate on the assessment itself, for example, in relation to bias” (Gipps and Stobart 2009). 


공평성에 대한 우리의 관점을 학습자와 환자 둘 다에 관련되는 것처럼, 단지 객관성을 넘어, 평가에서 인간 판단의 모든 측면과 복잡성을 고려하도록 넓히는 것은 평가 프로그램에서 인간 판단의 지속적인 사용에 도움이 될 수 있다. 본 문헌 검토에서 우리는 [공정한 인간의 판단]을 가치, 개별적 특성 및 시스템 절차를 갖춘 다차원적 복합 개념으로 강조하였다. 이 모델은 이 분야에서 평가와 추가 연구에서 인간의 판단력을 구현하는 데 도움을 주기 위해 사용될 수 있다.

Broadening our view of fairness to consider fairness as it relates to both the learner and to the patient, to look beyond just objectivity and consider all facets and complexity of fairness in human judgement in assessment is likely to be beneficial in our ongoing use of human judgement in assessment programs. In this literature review we have highlighted fair human judgement as a multi-dimensional complex concept with values, individual characteristics and system procedures. This model can be used to help the implementation of human judgement in assessment and further research in this area.








Review

 

. 2020 Oct 29.
 doi: 10.1007/s10459-020-10002-1. Online ahead of print.

Fairness in human judgement in assessment: a hermeneutic literature review and conceptual framework

Affiliations 

Abstract

Human judgement is widely used in workplace-based assessment despite criticism that it does not meet standards of objectivity. There is an ongoing push within the literature to better embrace subjective human judgement in assessment not as a 'problem' to be corrected psychometrically but as legitimate perceptions of performance. Taking a step back and changing perspectives to focus on the fundamental underlying value of fairness in assessment may help re-set the traditional objective approach and provide a more relevant way to determine the appropriateness of subjective human judgements. Changing focus to look at what is 'fair' human judgement in assessment, rather than what is 'objective' human judgement in assessment allows for the embracing of many different perspectives, and the legitimising of human judgement in assessment. However, this requires addressing the question: what makes human judgements fair in health professions assessment? This is not a straightforward question with a single unambiguously 'correct' answer. In this hermeneutic literature review we aimed to produce a scholarly knowledge synthesis and understanding of the factors, definitions and key questions associated with fairness in human judgement in assessment and a resulting conceptual framework, with a view to informing ongoing further research. The complex construct of fair human judgement could be conceptualised through values (credibility, fitness for purpose, transparency and defensibility) which are upheld at an individual level by characteristics of fair human judgement (narrative, boundaries, expertise, agility and evidence) and at a systems level by procedures (procedural fairness, documentation, multiple opportunities, multiple assessors, validity evidence) which help translate fairness in human judgement from concepts into practical components.

Keywords: Assessment; Fairness; Health professions education; Judgement; Subjective.


Getting Started Guide Part 2: Nuts and Bolts of Integrating Arts and Humanities into Medical Education

New section

The many activities listed in Part 1 provide guidance on ways to teach using the arts and humanities. In Part 2 we have put together a list of things to consider as you start planning activities for your learners.






Below are some tips on how to create partnerships with cultural institutions, how to choose arts and humanities material, and how you can join conversations about arts and humanities in medical education. For a more in-depth look at the beginning steps for developing and integrating arts and humanities curricula, read The Fundamental Role of the Arts and Humanities in Medical Education. Learn about specific activities for learners in the Getting Started Guide Part 1: Select Activities for Integrating the Arts and Humanities into Medical Education.

Should you have additional examples to submit for consideration, please email frahme@aamc.org with a description of the activity and suggested resources.

Explore the guide:

1.    Explore partnerships

2.    Select material thoughtfully

3.    Discuss, discover, and disseminate

1. Explore partnerships

Partnering with local or virtual experts or institutions can enhance learners' experiences with the arts and humanities. Partnership ensures that you have an expert available to guide you in work you may never have explored before, expands the number and variety of perspectives your learners are exposed to, and models interdisciplinary collaboration.

·         Are there arts and humanities faculty from your own institution interested in co-teaching?

·         Are there local artists, performers, or writers who have expertise not found in your institution?

·         Are there museums, theatres or archives that can connect you with art, performances or primary source material?

o    Resources for Art Museum and Medical School Partnerships

o    Twelve Tips for Starting a Collaboration with an Art Museum

Return to Top ↑

2. Select material thoughtfully

There are many elements to consider when choosing a work of art, music, literature or film, or a primary historical document to use in teaching. Here are some guiding questions to have in mind:

·         What are the conversations you might have around this material that link to the goals of your session?

·         Is the material appropriate for the learners’ stage of professional development?

·         After exploring the material, will there be enough time left to allow for group discussion?

·         Whose voices and experiences are represented in this material? Whose voices and experiences are missing? Consider aspects such as gender, race, ethnicity, religious beliefs, sexual orientation, cultural practices and age as well as viewpoints of patients, caregivers, and health professionals who are not physicians.

·         Does the delivery of materials offer accessibility options such as open or closed captioning, descriptions of visuals for screen readers, audio descriptions, large print, etc.?

Use existing collections to explore material for use

There are many existing repositories and lists designed for the purpose of helping medical educators find arts and humanities material to use with learners.

History

·         A Guide to History of Medicine Resources

·         Contagion: Historical Views of Diseases and Epidemics

·         Syllabus: A History of Anti-Black Racism in Medicine

Literary Arts

·         Literature Arts Medicine Database

·         MedHum Chat - Poetry Discussion Guides

·         MedHum Chat - Prose Discussion Guides

·         Pulse: Voices from the Heart of Medicine

Film

·         Cinemeducation: FaciLitating Educational Sessions for Medical Students Using the Power of Movies

·         Lights, Camera, Action: Using Film to Teach the ACGME Competencies

·         Movies for Undergraduate Public Health Teaching

Visual Arts

·         Doctors Who Create

·         Literature Arts Medicine Database

·         MedHum Chat - Visual Arts Discussion Guides

·         Rx Museum

Performance Art

·         Literature Arts Medicine Database

Return to Top ↑

3. Discuss, discover and disseminate

If you feel out of your depth, could use suggestions for material, or would like to seek out a partner, here are some places to ask for help or engage in discussion:

·         Health Humanities: A list serve sponsored by the Department of Bioethics at Case Western Reserve University

·         Dr-Ed: A list-serv for medical educators

·         MedHum Chat on Twitter: A website and twice-monthly live Twitter chat about medical humanities

·         American Society for Bioethics and Humanities (ASBH) list-serv: a list-serv for members of ASBH

If you would like to find or share creative work, reflections or case studies on medical humanities, here are some websites where you can discover and disseminate them:

·         Creative Expressions During Times of Uncertainty: Website for the FRAHME Initiative of AAMC that publishes poems or 55-word stories about clinician experiences of uncertainty during 2020

·         MedEdPORTAL: The AAMC's peer-reviewed journal of teaching and learning resources that publishes lessons about arts and humanities in medical education

·         Academic Medicine: A peer-reviewed journal of the AAMC that publishes several humanities columns including Teaching and Learning Moments and Medicine and the ArtsA peer-reviewed journal of the AAMC that publishes several humanities columns including Teaching and Learning Moments and Medicine and the Arts

·         Art of the JAMA Network: A collection of essays and reviews about movies, literature, art, and theatre relevant to clinical medicine

·         Doctors Who Create: A website where medical students and physicians can find or submit their creative work of all kinds

·         Hope Babette Tang Humanism in Healthcare Essay Contest: An annual reflective writing contest for medical and nursing students sponsored by The Arnold P. Gold Foundation

·         Journal of Medical Humanities: A peer-reviewed journal that publishes original research on medical humanities, cultural studies and pedagogy in medicine and medical education

·         Medical Humanities: A BMJ journal that publishes scholarly and critical articles on the history and culture of medicine as well as bioethics

·         Places to publish medical narratives: A list of open-access and subscription journals that accept reflective writing about experiences in medical care

·         Pulse -- Voices from the Heart of Medicine: A website that publishes personal experiences of illness and healing

·         Teaching and Learning in Medicine: An international forum on teaching and learning in the health professions and health education

William Carlos Williams Medical Student Poetry Competition: An annual competition sponsored by Northeast Ohio Medical School open to students attending allopathic or osteopathic schools of medicine in the United States, Puerto Rico, and Canada


출처: https://www.aamc.org/what-we-do/mission-areas/medical-education/getting-started-nuts-bolts

Getting Started Guide Part 1: Select Activities for Integrating the Arts and Humanities into Medical Education


Aligning with the Accreditation Council for Graduate Medical Education’s six general competencies, the activities included below were selected for the Getting Started Guide because they can be conducted at low cost with any group of learners, regardless of developmental stage or specialty. For a more in-depth look at the beginning steps for developing and integrating arts and humanities curricula, read The Fundamental Role of the Arts and Humanities in Medical Education. Find tips about how to start planning activities for learners in the Getting Started Guide Part 2: Nuts and Bolts of Integrating Arts and Humanities into Medical Education.

Should you have additional examples to submit for consideration, please email frahme@aamc.org with a description of the activity and suggested resources.

Explore by competency:

·         Medical Knowledge

·         Interpersonal and Communication Skills

·         Patient Care and Procedural Skills

·         Professionalism

·         Practice-based Learning and Improvement

·         Systems-based Practice

Select Activities for Teaching and Assessing Medical Knowledge

Physicians are expected to be competent in medical knowledge, described as “established and evolving biomedical, clinical, epidemiological and social behavioral sciences, as well as the application of this knowledge to patient care.”

Visual Arts and Thinking Strategies - Observing

·         Formal art observation training improves medical students’ visual diagnostic skills by Naghshineh et al. describes the course “Training the Eye: Improving the Art of Physical Diagnosis” where art observation exercises are paired with physical diagnosis topics.

·         CanadiEm offers a series of activities called “Spot the Diagnosis” where learners are directed to observe pieces of historic art that hint at an underlying medical condition. Guiding questions are listed for each work of art.

·         At the Perelman School of Medicine at the University of Pennsylvania, the course “Art, Observation and Empathy” teaches students how to observe and describe based on the Artful Thinking approach.

·         The video Art and observation: improving patient care through medical humanities from the University of Rochester offers a three minute overview of medical learners being taught observation skills in a museum setting using the Five Question Protocol.

Illustration of a paint palette and a paint brush

Visual Arts and Thinking Strategies - Creating

Many medical schools have incorporated drawing into their curricula to aid learners studying anatomy. Life drawing for medical students: artistic, anatomical and wellbeing benefits by James et al. describes a 10-week elective course in life drawing where both anatomical and artistic concepts were taught.

Cutting deep: the transformative power of art in the anatomy lab by Grogan and Ferguson describes a course that aims to use drawing to enhance visual perception and three-dimensional understanding of the body's interior.

This video shows how Rush University Medical College invites medical illustrators to anatomy lab so that the atmosphere becomes more active than passive; learners can see firsthand how artists transform a three-dimensional body into a two-dimensional drawing.

History

The database “Contagion: Historical Views of Diseases and Epidemics” offers a collection titled Significant Diseases Throughout History where faculty can find historical documents related to various contagious diseases as well as bibliographies for further reading.

Return to Top ↑

Select Activities for Teaching and Assessing Interpersonal and Communication Skills

Physicians are expected to demonstrate interpersonal and communication skills that result in the effective exchange of information and collaboration with patients, their families, and health professionals.

Illustration of a video projector

Film and Television

Using film in teaching can help provide insight into the verbal and non-verbal communication patterns of cultures other than our own. A few recommended films for this purpose include:

·         Worlds Apart -- A series of 4 films, 15 min in length, that tells the story of four culturally diverse patients and families faced with critical medical decisions as they navigate the health care system. This Facilitator's Guide from the Stanford University Center for Biomedical Ethics is specifically designed for use with health professions learners.

·         Hold Your Breath -- A devout Muslim immigrant faces possible death from stomach cancer, but cultural and linguistic confusions complicate his treatment in an American hospital. This Facilitator's Guide from the Stanford University Center for Biomedical Ethics is specifically designed for use with health professions learners.

·         Departures -- A young man returns to his hometown after a failed career as a cellist and stumbles across work as a nōkanshi—a traditional Japanese ritual mortician. He struggles with the strong social taboos against people who deal with death but eventually creates meaningful interpersonal connections through the beauty and dignity of his work.

·         Bagdad Cafe -- Set in southern California desert country, a German tourist named Jasmine finds refuge in a truck-stop motel where she encounters the African American owner of the café and an Indian short-order cook. Initial unconscious/conscious biases based on cultural/racial differences are transformed through compassion that Jasmine brings to the diverse community leading to collaboration.

·         Using feature films as a teaching tool in medical schools by Baños and Bosch provides guidance on how to select films, how to prepare for discussion, how to select discussion questions and how to use assessment measures.

·         Cinemeducation: a comprehensive guide to using film in medical education by Alexander et al. provides descriptions of 450 scenes from 125 movies along with ideas for discussion questions and an index of movies listed by topic.

Music

In the article Jazz and the ‘art’ of medicine: improvisation in the medical encounter, author Paul Haidet uses examples from jazz improvisation to demonstrate communication skills critical to medical encounters such as creating space, developing voice and cultivating ensemble.

Haidet recommends the following jazz pieces for use in teaching:

·         All Blues by Miles Davis

·         Giant Steps by John Coltrane

·         Waltz for Debby by Bill Evans Trio

Illustration of two theatrical masks

Theater and Drama

Interprofessional improv: using theater techniques to teach health professions students empathy in teams by Zelenski describes a 15-hour course at the University of Wisconsin-Madison that employs improv techniques to teach empathy. Students described the impact that these techniques had on their patient care interactions.

In the article Medical improv: a novel approach to teaching communication and professionalism skills, authors Watson and Fu offer descriptions of activities they engage in with medical learners and a video featuring the authors working with trainees.

In Twelve tips for using applied improvisation in medical education by Hoffmann-Longtin et al., authors offer practical advice on using improv with medical learners.

In the three minute video Medical improv, physician and actor Belinda Fu describes the concept of medical improv and its power to improve communication skills in the practice of medicine.

Visual Arts and Thinking Strategies

In the article Applying art observation skills to standardized patients by Monahan et al., authors describe an interprofessional curriculum where medicine, nursing and psychology students learned visual arts observation skills that enhanced their collaboration, communication, and observational skills in standardized patient encounters.

Return to Top ↑

Select Activities for Teaching and Assessing Patient Care and Procedural Skills

Physicians must demonstrate patient care and procedural skills so they can “provide patient care that is compassionate, appropriate, and effective for the treatment of health problems and the promotion of health” and “perform all medical, diagnostic, and surgical procedures considered essential for the area of practice.”

Film and Television

The film States of Grace follows the transformation of a revered physician and her family in the wake of a life-changing accident. Learners can observe how different clinicians gather information from the patient and her family members and see how medical guidance plays out when the patient is faced with ongoing challenges. The accompanying discussion guide can help groups of learners focus on interactions between patients and providers throughout the film.

The four-part MTV documentary series 16 and Recovering follows the lives of students at a recovery high school who must navigate substance use and mental health disorders. The discussion guide offers background about these medical issues as well suggested questions for each episode.

Using feature films as a teaching tool in medical schools by Baños and Bosch provides guidance on how to select films, how to prepare for discussion, how to select discussion questions and how to use assessment measures.

Cinemeducation: a comprehensive guide to using film in medical education by Alexander et al. provides descriptions of 450 scenes from 125 movies along with ideas for discussion questions and an index of movies listed by topic.

Illustration of a lit up lightbulb

Visual Arts and Thinking Strategies

Two visual arts activities from Julia Langley can help teach the Patient Care competency. The Describe and Draw activity (PDF) invites participants to experience both giving and following instructions and is a good corollary for teaching and learning medical procedures. You can use this lesson plan and watch a video to see an example of how it is done.

Another exercise called Looking 10x2 (PDF) invites participants to make observations about a crowded painting. They can relate this to gathering information from patients when their histories are complex. You can see this exercise being conducted at the 2-minute mark of this video and use these instructions and slides to conduct the exercise with your learners.

Dance and Movement

A simple mirroring exercise, shown here as implemented by Parkinson's patients and pre-med students at Brown University's Artists and Scientists As Partners program, can give learners practice with giving their undivided attention to another person and appreciating the perspectives of being both a leader and a follower, analogous to being in conversation with a patient. You can see simple instructions for this mirroring exercise.

Another exercise, often called the Name Game, is when group members introduce themselves by creating a movement to accompany their name. Everyone repeats the person's name and gesture. This simple exercise offers learners a way to express themselves through movement, telling others how they feel in the moment. Analogous to non-verbal behavior with patients, this exercise helps learners be aware of and interpret emotions through gestures. Find instructions and the exercise.

Keeping Reflecting Fresh: A Practical Guide for Clinical Educators by Peterkin and MacLean has a chapter titled Body Language by Batalden et al. This chapter details an activity where students partnered together in learning the basics of ballroom dance then explicitly discussed analogies with patient care such as forming connections, eye contact, posture, etiquette, and comfort.

Theater and Drama

The resources in the Theatre and Dance section of Interpersonal and Communication Skills could also be adapted to teach this competency.

Return to Top ↑

Select Activities for Teaching and Assessing Professionalism

Physicians are required to demonstrate “a commitment to professionalism and an adherence to ethical principles.”

Illustration of a stack of four books

Literature and Narrative Medicine

“Medicine and the silent oracle: an exercise in uncertainty” by Catherine Belling presents a detailed description of a simple exercise for learners. They can read the short story “Perspective Shift” by Daniel Shapiro with the last paragraph missing and create their own ending. This exercise can be used to help learners discuss ambiguity and think about the roles and perspectives of doctors and patients.

One of the sub-competencies for Professionalism is “respect and responsiveness to diverse patient populations.” The article Teaching cultural competency through narrative medicine: intersections of classroom and community by Das Gupta et al. describes a program where pediatric residents participated in a monthly narrative medicine activity with staff members from an inner-city Dominican American community organization. Physician participants reported increased understanding of this culture and improved attitudes.

Reflective Writing

Reflective writing can be useful in discussions about professional identity formation (PDF). Read the description of a two-hour session where learners read two stories by physician-writers and then participate in writing and discussion. Instructors often select pieces from Pulse: Voices from the Heart of Medicine and then prompt students to write about qualities they want to develop as a doctor.

Keeping Reflecting Fresh: A Practical Guide for Clinical Educators by Peterkin and MacLean offers several ideas for reflective activities in reading and writing. For example, the chapter “Letters to a Third Year Student” by Jones and Dhurandhar describes a publication project of fourth year students’ letters to their third-year colleagues as they begin their clinical rotations. The collection of letters includes practical advice, suggestions and reflections and is bound in a volume for their junior clinicians. Authors of the letters are rewarded with a publication credit for their CV.

“Fostering and evaluating reflective capacity in medical education: developing the REFLECT rubric for assessing reflective writing” by Wald et al. offers a helpful rubric for assessment of reflective writing.

Visual Arts and Thinking Strategies

The Professionalism competency includes “compassion, integrity, and respect for others” as well as “respect and responsiveness to diverse patient populations.” The Rx/Museum Initiative (PDF) offers a collection of 52 artworks and essay reflections. Faculty could select artworks by looking at themes such as inequity, self-actualization, and autonomy and partner with art instructors from their institution or a local artist to co-facilitate learner discussion.

Illustration of a quill and an ink bottle

Comics and Graphic Novels

“A novel graphic medicine curriculum for resident physicians: boosting empathy and communication through comics” by Ronan and Czerwiec describes a four week curriculum focusing on empathy, compassion and cultural competency. Residents read about neurological conditions from graphic memoirs, then participated in discussion and drawing exercises. The article includes a list of texts that were used along with the specific drawing prompts that were given to learners.

Return to Top ↑

Practice-based Learning and Improvement

The ACGME's Practice-based Learning and Improvement competency requires learners to demonstrate “the ability to investigate and evaluate their care of patients, to appraise and assimilate scientific evidence, and to continuously improve patient care based on constant self-evaluation and lifelong learning.”

Reflective Writing

An oft-used format for reflective writing is the 55-word story. The article Fifty-five word stories: "small jewels" for personal reflection and teaching by Colleen Fogarty offers instructions on how to write in this format along with examples of student writing. Other examples include the AAMC's own 55-word Creative Expressions During Times of Uncertainty and the 55-word Stories from the University of Wisconsin School of Medicine, all written during the COVID-19 pandemic.

Another approach to trigger reflection is to offer writing prompts to learners. Whole Health: Change the Conversation -- Exercises and Readings for Narrative Medicine Groups by Robinson et al. outlines general writing prompts as well as those that can be completed after reading a recommended short piece of literature as a group.

“Fostering and evaluating reflective capacity in medical education: developing the REFLECT rubric for assessing reflective writing” by Wald et al. offers a helpful rubric for assessment of reflective writing.

Visual Arts and Thinking Strategies - Creating

Illustration of a quill and an ink bottle

A key outcome of the practice-based learning and improvement competency is that learners engage in professional identity formation. Reflecting on one's identity can be accomplished through the creation of visual art. Examining professional identity formation through the ancient art of mask-making by Stephens et al, describes an activity that promotes self-reflection. Learners use a blank papier-mâché mask to represent their sense of themselves as a professional within the broader context of medicine. This activity can offer learners a way to explore identity in a non-linguistic manner.

The resources in the Visual Arts and Thinking Strategies section of the Professionalism page could also be adapted to teach this competency.

Mixed

The MedEd Portal course Pain and the humanities: exploring the meaning of pain in medicine through drama, literature, fine arts and philosophy challenges participants to reflect deeply on their professional values in relation to arts and humanities materials that portray reactions to pain. The files are available for download from the course include a syllabus, instructor's guide, and a student workbook.

Return to Top ↑

Select Activities for Teaching and Assessing Systems-Based Practice

Physicians are required to demonstrate an understanding of systems-based practice, which is defined as -- “an awareness of and responsiveness to the larger context and system of health care, including the social determinants of health, as well as the ability to call effectively on other resources to provide optimal health care.”

Narrative Medicine

One of the sub-competencies for Systems-based Practice is “working in interprofessional teams to enhance patient safety and improve patient care quality.” The article Implementing an interprofessional narrative medicine program in academic clinics: feasibility and program evaluation by Gowda et al. describes how 30 minute narrative medicine sessions were used during monthly meetings at three academic primary care clinics with the goal of increasing interprofessional collaborative practice.

Illustration of a Roman pillar

History

The 1619 Project from the New York Times focuses on the consequences of slavery in the United States. Learners can engage with a variety of material to learn specifically about how Black people have been systematically denied access to healthcare over time.

·         Read the short story “Bad Blood” by Yaa Gyasi about the Tuskegee Study of Untreated Syphilis in the Negro Male. Use the questions in this discussion guide.

·         Read “A Broken Health Care System” by Jeneen Interlandi in the written component of the 1619 Project. Use the accompanying questions in this reading guide.

·         Listen to the podcast, or read the transcript of, Episode 4: How the Bad Blood Started which starts out with a personal story about the author's Uncle and delves into a the story of the first Black woman doctor in the country, hospital segregation, the development of the first federal healthcare programs, and ends with a short story about the Tuskegee Experiment. Use the questions from either of the above reading guides for discussion.

Mixed

The Health Humanities Approach described in Centering patients, revealing structures: the health humanities portrait approach by Sufian et al. pairs patient narratives with humanities scholarship from history or literature and invites learners to explore how patients navigate their worlds without necessarily invoking disease symptomatology. This approach cultivates an understanding of health, illness, disability, and healthcare within social, political and historical context. The nine existing Health Humanities Portraits include social themes such as immigration, gun violence, trauma, and transgender care. A website including these portraits will be launching by the end of 2020.

Film

Film can be a useful medium in examining systems. Recommended films for this use include:

·         The Waiting Room - A documentary film about access to and affordability of healthcare. There is an accompanying discussion guide and a follow-up storytelling project provides additional videos about topics such as language barriers, poverty and violence.

·         Keeper of the House - A 15-minute documentary video featuring environmental service workers at Duke Hospital talking about their contributions to healing. Learners could read this related article about a COVID patient and the support he received from a hospital housekeeper and discuss hierarchy and the role of different staff in their institutions.

Using feature films as a teaching tool in medical schools by Baños and Bosch provides guidance on how to select films, how to prepare for discussion, how to select discussion questions and how to use assessment measures.

Cinemeducation: a comprehensive guide to using film in medical education by Alexander et al. provides descriptions of 450 scenes from 125 movies along with ideas for discussion questions and an index of movies listed by topic.

 

출처: https://www.aamc.org/what-we-do/mission-areas/medical-education/getting-started-activities?s=09


의학교육에서 디자인-기반 연구 접근을 활용한 이론과 실천의 다리놓기: AMEE Guide No. 60 (Med Teach, 2012)

Building bridges between theory and practice in medical education using a design-based research approach: AMEE Guide No. 60

DIANA H. J. M. DOLMANS & D. TIGELAAR

Maastricht University, The Netherlands



도입 Introduction


뭐가 문제야?

What is the problem?


의학 교육 연구는 지난 20년 동안 전세계적으로 엄청나게 성장했다. 과학 학술지가 늘고 의료교육 연구 국제회의 참가자도 늘었다(Eva 2009). 그러나 의학 교육 연구는 교육 관행의 개선으로 이어지고 지식의 발전에 기여하는가?

Medical education research has grown enormously over the past 20 years worldwide. The number of scientific journals has increased and also the number of participants at international conferences on medical education research (Eva 2009). But, does medical education research lead to improvements in educational practice and does it contribute toward the advancement of knowledge?


교육 실무자들은 종종 교육 연구와 교육 실무 사이에 차이가 있다고 불평한다(Badley 2003). 일반교육영역 내에서 이뤄지는 연구는 교육실무와 관련이 없다는 주장이다. 의학 교육 연구 내에서는 의학 교육 연구가 지식체나 이론의 증대에 기여하지 않는다는 주장이 종종 제기된다(Albert et al. 2007).

Educational practitioners often complain that there is a gap between educational research and educational practice (Badley 2003). They argue that the research that is conducted within the general education domain is not relevant for educational practice. Within medical education research, it is often argued that medical education research does not contribute toward an increase of a body of knowledge or theory building (Albert et al. 2007).


많은 연구가 이론적 배경이 부족하다(Albert et al. 2007; Norman 2007). 이건 큰 문제야. 이론에 기반을 두지 않는 연구가 행해지고 있다면, 그 기초적인 요소나 원인을 이해하거나 설명하거나 개입이 작용하거나 작용하지 않는 이유를 설명하는 것은 매우 어려워질 것이다.

A number of studies lack a theoretical background (Albert et al. 2007; Norman 2007). This is a big problem. If studies are being conducted that do not rest on theories, then it will become very difficult to understand or explain the underlying factors or causes or to explain why an intervention works or does not work.


교육 연구는 일반 교육과 의료 교육 모두에서 지식체와 이론 구축(Ribes et al. 2008; Monruxe & Rees 2009)과 교육 실무에서 직면하는 문제 이해(Eva 2009)에 모두 기여해야 한다.

Educational research, both in general education and medical education, should both contribute toward the building of a body of knowledge and theories (Reeves et al. 2008; Monrouxe & Rees 2009) and understanding problems encountered in educational practice (Eva 2009).


교육 연구는 [개입이 작동하는지 여부]를 증명하는 데 목적이 있어야 할 뿐만 아니라 이러한 [복잡성을 이해]하는 데도 목적이 있어야 한다(Regehr 2010).

Education research should not only be aimed at proving whether an intervention works or not but also should be aimed at understanding this complexity (Regehr 2010).


본 가이드에서는, 설계 기반 연구(DBR)가 한편으로는 이론 시험과 정교화, 다른 한편으로는 교육 관행 개선에 기여하기 때문에, 연구와 실천 사이의 격차를 해소하는 데 도움이 될 수 있다고 주장할 것이다.

In this Guide, it will be argued that design-based research (DBR) can help to bridge the gap between research and practice, because it does contribute toward theory testing and refinement on the one hand and improvement of educational practice on the other hand.


DBR 뒤의 이론

The theory behind DBR explained


DBR의 특징은 무엇인가?

What are the characteristics of DBR?


    • 첫 번째 중요한 특징 중 하나는 DBR이 실험실 환경에서 이루어지는 것이 아니라, 학습이 정상적으로 이루어지는 실세계 환경에서 일어난다는 것이다(Barab & Squire 2004). DBR 연구는 실제 학습 맥락에서 학습의 본질에 대한 복잡한 문제에 초점을 맞춘다(Collins et al. 2004).

One first important characteristic is that DBR does not take place in a laboratory setting, but in a reallife setting where learning normally takes place (Barab & Squire 2004). DBR studies’ focus on complex problems about the nature of learning in a real learning context (Collins et al. 2004).


    • DBR의 또 다른 중요한 특징은 설계, 평가, 재설계(Design-Based Research Collective 2003)의 연속적인 사이클에서 일어난다는 것이다. 따라서 설계는 진정한 학습 환경에서 시험되거나 평가된다. 평가는 새로운 통찰력으로 이어지며, 이에 기초하여 설계를 더욱 개선하거나 재설계할 수 있다.

Another important characteristic of DBR is that it takes place in continuous cycles of design, evaluation, and redesign (Design-Based Research Collective 2003). Thus, a design is tested or evaluated in an authentic learning environment. The evaluation leads to new insights, based on which the design can be further improved or redesigned.


    • DBR의 세 번째 중요한 특징은 학습 환경의 설계가 이론적 원리에 기초한다는 것이다. DBR은 이론의 진보를 목표로 한다(Barab & Squire 2004). 이론은 많은 다른 변수들이 상호 작용하는 교육 같은 복잡한 환경에서 특정한 상황에서 어떤 것이 어떻게 작용하거나 작용하지 않는지를 이해하는 데 도움을 주기 때문에 교육 연구에서 매우 중요하다. 즉, 좋은 DBR은 이론과 실무를 발전시킨다(Barab & Squire 2004).

A third important characteristic of DBR is that the design of the learning environment is based on theoretical principles. DBR is aimed at advancing theories (Barab & Squire 2004). Theories are very important in education research because they help us to understand how or why something works or does not work under particular circumstances in a complex environment such as education, in which many different variables interact with each other. In other words, good DBR advances theories and practice (Barab & Squire 2004).


    • DBR의 네 번째 중요한 특성은 설계 평가에 단일 방법을 사용하지 않으며, 혼합 방법 연구가 특징이다. 학생, 교사, 학습 자료 및 평가 도구 사이의 복잡한 상호작용을 더 잘 이해하기 위해 DBR은 어떤 상황에서 어떤 것이 작용하는지 명확히 하는 양적 방법과 질적 방법 모두를 혼합한 방법을 사용한다. 한 연구 내의 혼합된 방법은 자연 환경에서 복잡한 상호작용을 연구할 때 매우 유용하다. 왜냐하면 그 연구 결과가 서로 보완될 수 있고, 결과를 교차 점검할 수 있고 불일치를 발견할 수 있게 할 수 있기 때문이다(Schifferder & Reed 2009).

A fourth important characteristic of DBR is that not a single method is used to evaluate the design, but DBR is characterized by mixed-methods studies. In order to better understand the complex interactions between students, teachers, learning materials, and assessment tools, DBR makes use of mixed methods, both quantitative and qualitative methods that clarify what works under which circumstances. Mixed methods within one study are very useful when studying complex interactions in natural settings, because the findings may complement each other, make it possible to cross-check findings and make it possible to discover inconsistencies (Schifferdecker & Reed 2009).


    • DBR의 다섯 번째 중요한 특징은 서로 다른 전문지식을 가진 설계자, 연구자 및 실무자들이 학습 환경을 설계, 평가 및 재설계하는데 긴밀히 협력한다는 것이다(Barab & Squire 2004). 그들은 서로 자주 교류하고 소통하며, 그들의 생각을 공유하며, 함께 이론과 실무를 다듬는다. 그래서 디자이너, 교사, 연구자와 연구자가 협력하여 전파한다. 이것은 교사와 학습자들의 소유권과 헌신을 만드는 데 기여한다. 또한, 그 디자인이 교육 실무에서 어떻게 재해석되고 각색되는지 명확히 한다(Design-Based Research Collective 2003).

A fifth important characteristic of DBR is that designers, researchers, and practitioners with different expertise work closely together in designing, evaluating, and redesigning the learning environment (Barab & Squire 2004). They interact and communicate with each other frequently, share their ideas, and together refine theories and practice. So, designers, teachers, and research and researchers collaborate in conducting the disseminating it. This contributes toward creating ownership and commitment from teachers and learners. It also makes us clear on how the design is reinterpreted and adapted in educational practice (Design-Based Research Collective 2003).


표 1. DBR의 다섯 가지 중요한 특성.

Table 1. Five important characteristics of DBR.


설계, 평가 및 재설계의 연속적인 사이클에서 수행

Takes place in continuous cycles of design, evaluation, and redesign


학습이 정상적으로 이루어지는 실제 학습 환경에서 수행

Takes place in authentic real-life learning settings where learning takes place normally


이론을 테스트하고 다듬는 동시에 실무의 진보를 목표로 함

Is aimed both at testing and refining theories and also advancing practice


혼합 방법 연구가 특징임

Is characterized by mixed-methods studies


서로 다른 전문지식을 가진 설계자, 연구자 및 실무자가 자주 상호 작용하여 아이디어를 공유

Designers, researchers, and practitioners with different expertise interact frequently and share their ideas


DBR의 짧은 역사

A short history of DBR


DBR 또는 설계 연구는 1990년대 초반에 처음 설명되었다(Ribes et al. 2005). 1992년 브라운(1992년)이 디자인 실험이라는 용어를 도입한 이유는 그 때부터 학습을 연구하기 위해 사용한 방법론의 틈새를 설계 실험이 채울 수 있다는 의견 때문이었다(Collins et al. 2004). [설계 실험design experiment]은 실제 학습 맥락에서 학습의 본질에 관한 이론적 질문을 다루고 이론 원리에 기초하여 교육 설계를 시험하고 다듬는 형성적 평가를 실시하는 것을 목적으로 했다(Collins et al). 2004년). 그 때부터 문헌에서는 설계 실험, 설계 연구, 개발 연구, DBR 등 다른 용어가 사용되고 있다. 이 용어는 서로 바꾸어 사용할 수 있지만, 본조에서는 설계 기반 연구 또는 DBR이라는 용어를 사용한다.

DBR or design research was first described in the early 1990s (Reeves et al. 2005). In 1992, the termdesign experiments was introduced by Brown (1992) because she was of the opinion that design experiments could fill a niche in the methodologies that were used since that time to study learning (Collins et al. 2004). Design experiments were aimed at addressing theoretical questions about the nature of learning in a real learning context and at conducting formative evaluations that test and refine educational designs based on theoretical principles (Collins et al. 2004). Since that time, different terms are being used in the literature such as design experiments, design research, development research, and DBR . The terms can be used interchangeably, but in thisarticle, we use the term design-based research or DBR.


DBR 및 기타 접근 방식

DBR and other approaches


지금까지 이 가이드를 읽은 후 일부 독자들은 DBR이 형성적 평가 또는 행동 연구, 즉 강사가 이를 개선하기 위해 자신의 교수 실습을 연구하거나 평가하는 연구의 새로운 단어라는 결론을 내릴 수 있다. DBR은 설계, 평가 및 재설계의 반복적이고 순환적인 과정과 같이 이러한 접근방식이 많은 공통점을 가질 수 있음에도 불구하고 형성적 평가 연구나 행동 연구action research와는 다르다. DBR은 특정 개입이 특정 기본 표준을 충족하는지 또는 어떤 측면의 개입에 개선이 필요한지를 형성적으로 평가하는 문제만은 아니다.

After having read this Guide so far, some readers might come to the conclusion that DBR is a new word for formative evaluation or action research; i.e., research in which instructors study or evaluate their own teaching practice in order to improve it. DBR is different from formative evaluation studies or action research, even although these approaches might have a lot in common, such as the iterative and cyclic process of design, evaluation, and redesign. DBR is not only a matter of formatively evaluating whether a particular intervention meets certain basic standards or which aspects of the intervention need improvement.


좋은 DBR은 또한 복잡한 학습 환경의 특성에 관한 이론을 시험하거나 다듬는 것을 목적으로 한다(Design-Based Research Collective 2003). 즉, 그 개입이 시험과 밀접하게 연결되어 있는 것은 이론과 정교함, 그리고 학습 환경을 설계하고 개선하는 데 얽혀 있는 이론들이다. [이론과의 연관성]은 DBR과 형성적 평가 또는 행동 연구의 기본적인 차이점이다. DBR은 학습 및 학습 환경에 대한 이론적 지식을 발전시키는 것을 목적으로 한다(Barab & Squire 2004). 이론적 토대와 주장claims이 DBR 접근법의 핵심이다(리브스 외 2005).

Good DBR is also aimed at testing or refining theories about the nature of complex learning environments (Design-Based Research Collective 2003). In other words, the interventions are closely connected to the testing is theories and refinement and of theories intertwined with designing and improving the learning environment. The connection with theory is the basic difference between DBR and formative evaluations or action research. DBR is aimed at advancing theoretical knowledge about learning and learning environments (Barab & Squire 2004). Theoretical foundations and claims are at the heart of the approach (Reeves et al. 2005).


DBR 및 혼합 방법 연구

DBR and mixed-methods research


또한 명심해야 할 중요한 것은 DBR이 여러 가지 방법을 사용한다는 것이다. 

    • 서로 다른 변수가 서로 어떻게 영향을 미치는지에 대한 통찰력을 제공하는 방법. 

    • 결과뿐만 아니라 개입이 왜 작용하는지, 어떻게 작용하지 않는지를 설명할 수 있는 기본 프로세스에 대해서도 주의를 기울이는 방법. 

실험실 환경에서 실험 연구는 DBR에서는 수행되지 않는다. 교육 개입에서 통제된 실험은 다소 환원적이고 사소한trivial 운동으로 이어질 수 있다는 문제 때문이다(Gruppen 2008).

What is also important to keep in mind is that DBR uses multiple methods; 

    • methods that provide insight in how different variables influence each other; and 

    • methods in which not only attention is paid to outcomes but also to the underlying processes that could explain why and how an intervention does work or not. 

Experimental studies in laboratory settings are not conducted within DBR. The problem is that controlled experimentation in educational interventions may lead to a rather reductionist and trivial exercise (Gruppen 2008).


우리는 통제된 실험이 절대 실행되어서는 안 된다고 주장하지 않는다. 그러나 이론과 교육 실습의 시험과 정교함을 모두 향상시키는 진정한 학습 환경에서 학습의 본질에 대한 연구 질문에 답하려면 DBR 접근법과 혼합된 방법론을 사용해야 한다. 혼합 방법 연구는 단일 연구에서 양적, 질적 연구 기법, 방법 또는 접근법을 사용하는 연구에 대한 접근법이다(Johnson & Onwegbuzie 2004).

We do not argue that controlled experiments should never be done. But, if we want to answer research questions about the nature of learning in authentic learning environments that both enhance the testing and refinement of theories and educational practice, we should use a DBR approach and a mixed-methods approach. Mixed-methods research is an approach to research in which quantitative and qualitative research techniques, methods, or approaches are used in a single study (Johnson & Onwuegbuzie 2004).


앞서 설명했듯이 연구자들이 서로 보완하고 강화하는 다른 전략과 방법을 이용해 복수의 데이터를 수집해야 한다는 취지다. 질적 방법은 DBR에서 중요한 역할을 한다. 정성적 방법은 풍부한 데이터를 생성하며 서로 다른 관점을 더 깊이 이해할 수 있다(Kuper et al. 2008). 질적 데이터는 복잡한 현상이 발생하는 방법과 이유를 탐구하고 동적 과정을 연구할 수 있도록 해준다(Johnson & Onwegbuzie 2004). 그러나 질적 데이터가 실제로 복잡한 현상을 설명하는 데 기여하는지는 물론 [질적 데이터가 잘 분석되고 조사 결과를 설명하는 데 기여하는지]에 달려 있다. 그저 테마들 사이의 관계는 설명하지 않고 데이터에서 나온 주제들을 설명하기만 해서는 안 된다(Pope & Mays 2009).

The idea is that researchers should collect multiple data using different strategies and methods that complement and strengthen each other, as also explained before. Qualitative methods play a crucial role in DBR. Qualitative methods generate rich data and can lead to deeper understanding of differing perspectives (Kuper et al. 2008). Qualitative data lend themselves to explore how and why complex phenomena occur and to study dynamic processes (Johnson & Onwuegbuzie 2004). But, whether qualitative data indeed contribute toward explaining complex phenomena is of course dependent on whether qualitative data are well analyzed and contribute toward explaining the findings and not just describing the themes that emerged from the data without explaining the relationships between the themes (Pope & Mays 2009).


실천에서 이론 The theory in practice


DBR 연구의 맥락

The context of the DBR studies


본 기사의 저자들이 참여한 DBR의 예는 고등교육의 맥락 안에서 교사의 전문적 발전을 촉진하기 위한 교수 포트폴리오의 개발을 다루었다(Tigela et al. 2006b, 2008). [평가, 교사의 전문적 개발 및 교수 포트폴리오에 관한 현대적 이론]이 교수 포트폴리오 프로토타입을 개발하기 위해 사용되었다(Tigelaar 등). 2004b).

An example of DBR in which the authors of this article were involved dealt with the development of a teaching portfolio for stimulating teachers’ professional development within the context of higher education (Tigelaar et al. 2006b, 2008). Modern theories on assessment, teachers’ professional development, and teaching portfolios were used to develop a teaching portfolio prototype (Tigelaar et al. 2004b).


교수 포트폴리오는 서로 다른 측정 기구를 포함하고 서로 다른 교수 역량과 관련되며 피드백이 중요한 역할을 하는 진정한 평가 도구다. 학습에 대한 구성주의적 견해와 그에 따른 학습과 평가의 정렬 필요성에 따라, 우리는 고등교육에서 형성적 목적과 총괄적 목적 모두에 적합한 교수 포트폴리오의 절차를 개발하고자 했다. 포트폴리오는 교사들에게 가르치는 과정에서 발생하는 학습 과정에 대한 통찰력을 주어야 하며, 동시에 승진 결정에 대한 적절한 근거를 제공해야 한다. 즉, 실제 교육 성과에 기초하여 교사 경력career을 추구persue할 수 있는 [타당한 결정]을 제공해야 한다. 이러한 결합된 목표는 포트폴리오 절차의 품질과 판단 방법에 높은 요구를 한다. 따라서 본 논문에서 다룬 일반적인 문제의 정의는 다음과 같다.

A teaching portfolio is an authentic assessment tool in which different measurement instruments are included, related to different teaching competencies, and in which feedback plays a crucial role. In line with constructivist views of learning and the corresponding need for alignment of learning and assessment, we wanted to develop a procedure for a teaching portfolio that was suitable for both formative and summative purposes in higher education. The portfolio should give teachers insight into their learning processes that occur as they are teaching and at the same time it should provide an appropriate basis for promotion decisions, i.e., decisions about the feasibility of pursuing a career in teaching on the basis of actual teaching performance. These combined objectives place high demands on the quality of the portfolio procedure and the judgment methods. Thus, the definition of the general problem that we addressed in this thesis was:


형성적 목적과 총괄적 목적 모두에 적합하기 위해 어떤 형태의 교육 포트폴리오를 취해야 하며, 그러한 포트폴리오의 품질을 어떻게 보장할 수 있는가?

What form should a teaching portfolio take to be appropriate for both formative and summative purposes and how can the quality of such a portfolio be guaranteed?


포트폴리오의 설계, 평가 및 재설계와 관련된 다른 단계들은 아래에 설명되어 있다. 또한, 상기 DBR의 5가지 특성이 어떻게 실제 적용되었는지에 대해서도 설명한다. 또한 이 DBR 연구에서 이론시험과 이론의 정교화와 실천의 진보가 어떻게 결정적인 역할을 했는지에 대해서도 설명한다.

The different steps involved in the design, evaluation and redesign of the portfolio are explained below. In addition, it is illustrated as to howthe five characteristics of DBR above were applied in practice. It is also illustrated how theory testing and theory refinement and advancement of practice played a crucial role in this DBR study.


포트폴리오의 설계, 평가 및 재설계의 지속적인 사이클

Continuous cycles of design, evaluation, and redesign of the portfolio


이론적 기초와 설계, 평가 활동 및 재설계를 정의하는 순환 과정이 형태 형성적 및 요약적 교사 평가를 위한 포트폴리오 절차의 개발의 기초가 되었다. 이 연구는 세 가지 주요 단계로 구성되었다.

A cyclic process of defining theoretical underpinnings and design, evaluation activities, and redesign was the basis for the development of a portfolio procedure for both formative and summative teacher assessments. The research consisted of three main steps:


(1) 분석 및 재설계 

(2) 평가 및 재설계 

(3) 분석 및 재설계

(1) Analysis and redesign; 

(2) Evaluation and redesign; and 

(3) Analysis and redesign


첫 번째 분석 및 재설계 단계는 두 개의 하위 단계로 구성되었다. 

The first analysis and redesign phase consisted of two substeps. 


    • 1a단계에서는 고등교육의 교육역량 프레임워크를 개발, 검증하여, 교사의 고등교육 수행평가를 위한 출발점으로 활용할 수 있도록 하였다. 이 틀은 교육 전문가들이 ''고등교육에 경험이 많은 교사에게 각 영역에서 다음과 같은 교수 역량이 얼마나 중요한가?'라는 질문에 답하도록 하는 델파이 연구를 통해 개발되었다.’’

In step 1a, a framework for teaching competencies in higher education was developed and validated, which could be used as a starting point for appraisal of teachers’ performance in higher education. This framework was developed by means of a Delphi study in which educational experts were asked to answer the question: ‘‘How important are the following teaching competencies in each domain for an experienced teacher in higher education?’’


    • 1b단계에서는 이론적 기초에 기초하여 교원양성과 평가를 위한 교수 포트폴리오의 프로토타입이 개발되었다. 이 프로토타입은 포트폴리오를 재설계한 후 포트폴리오 전문가의 의견에 따라 테스트되었다.

In step 1b, a prototype for a teaching portfolio for teacher development and assessment was developed based on theoretical underpinnings. This prototype was tested against the opinions of portfolio experts after which the portfolio was redesigned.


평가 및 재설계 단계는 2a, 2b, 2c 단계로 구성되었다.

The evaluation and redesign step consisted of steps 2a, 2b, and 2c.


    • 2a단계에서는 설계를 구체화하고 수정하기 위해 소규모 연구에서 포트폴리오의 형성적 기능을 탐구했다. 우리는 포트폴리오 과제를 분석하여 교사들의 기능 측면에 대한 성찰의 다양한 예시를 파악했다.

In step 2a, we explored the formative function of the portfolio in a small-scale study in order to specify and revise the design. We analyzed portfolio assignments to identify illustrative teachers’ a variety examples of reflections on of aspects of their functioning.


    • 2b단계에서는 포트폴리오 작업 과정에서 교사의 협력적 성찰의 질을 분석했다. 참여 교사들의 동료 회의 영상 녹화는 세부적인 방식으로 분석되었다.

In step 2b, we analyzed the quality of teachers’ collaborative reflections during the process of working on the portfolio. Video recordings of peer meetings from the participating teachers were content analyzed in a fine-grained way.


    • 2c단계에서는 포트폴리오에 의한 교사의 전문적 발전 자극과 관련된 활성화 및 비활성화 요인을 조사했다. 우리는 또한 교사들이 그 포트폴리오가 전문적 발전을 촉진하고 교육 분야의 직업 전망에 대한 종합적인 결정을 위한 좋은 도구라고 생각하는지 문의했다.

In step 2c, we examined enabling and disabling factors in relation to the stimulation of teachers’ professional development by the portfolio. We also inquired whether teachers thought the portfolio was a good instrument for fostering professional development and for summative decisions about prospects for a career in education.


3단계에서는 정성적 데이터를 평가하는 방법에 대한 이론적 관점을 분석하여 교육 포트폴리오 평가를 위한 품질 기준이나 설계 지침을 정의했다. 본 연구에서 제시된 주장에 기초하여, 교수 포트폴리오에 대한 평가 절차의 구성을 위한 설계 지침이 개발되었다.

In step 3, we defined quality criteria or design guidelines for assessing teaching portfolios based on an analysis of a theoretical perspective on how to assess qualitative data. On the basis of the arguments presented in this study, design guidelines were developed for the organization of assessment procedures for teaching portfolios.


마지막으로, 우리는 일반적인 문제 정의와 목표로 돌아가 우리의 설계와 개발 노력에서 배운 것뿐만 아니라 이론적 기초와 교수 포트폴리오의 실제 구현에 관한 시사점에 대해 토론했다.

Finally, we returned to the general problem definition and aims and discussed what we learned from our design and development efforts as well as the implications with regard to the theoretical underpinnings and the practical implementation of teaching portfolios.


이번 연구는 설계, 평가, 재설계 등의 순환 과정으로 진행됐다. 

The research was carried out as a cyclic process of design, evaluation, and redesign. 


    • 1b단계에서는 포트폴리오 평가 경험이 풍부한 교육자에게 포트폴리오 프로토타입을 평가하도록 했다. 이로 인해 포트폴리오 설계 지침이 몇 가지 갱신되었다. 예를 들어, 교사의 창의성과 학습 과정을 촉진하기 위해 포트폴리오 구조가 개방적이고 유연해야 하며 지나치게 규범적이지 않아야 한다는 설계 지침이 있다.

In step 1b, educationalists with ample experience with portfolio assessment were asked to evaluate the portfolio prototype. This resulted in several updates of the portfolio design guidelines. For example, The design guideline that the portfolio structure should be open and flexible and not be too prescriptive, in order to stimulate teachers’ creativity and learning processes.


    • 2단계에서는 일정한 형성적 평가 과정도 수행했다. 포트폴리오 설계는 다음을 기반으로 업데이트 되었다. 다양한 포트폴리오 과제에 의해 추진되는 교사의 성찰 내용 분석 (2a 단계)

      동료 회의 중 교사의 협력적 성찰의 질에 대한 세분화된 분석 (2b 단계)

      포트폴리오의 유용성에 대한 교사들의 의견 (2c 단계) 

      이는 예를 들어, 교사 개인의 필요에 따라 포트폴리오를 조정할 수 있는 가능성을 열기 위해 차별화된 포트폴리오 과제를 사용해야 한다는 지침에서 비롯되었다.

In step 2, a constant formative evaluation process was carried out as well. The portfolio design was updated based on
an analysis of the content of teachers’ reflections promoted by the different portfolio assignments (step 2a, Tigelaar et al. 2004b),
a fine-grained analysis of the quality of teachers’ collaborative reflections during the peer meetings (step 2b, Tigelaar et al. 2008), and
teachers’ opinions about the usefulness of the portfolio (step 2c, Tigelaar, et al. 2006b).
This resulted, for example, in the guideline that differentiated portfolio assignments should be used in order to open the possibility to tailor a portfolio to a teacher’s individual needs.


    • 포트폴리오 평가를 위한 가이드라인을 구체화하는 데 초점을 맞춘 3단계에서는 설계 가이드라인도 업데이트하는 결과를 낳았다. 문헌 연구에 기초하여, 우리는 이론적 기초와 설계 지침을 업데이트했다. 포트폴리오 평가에 대한 가장 적절한 접근방식은 포트폴리오 내 정보의 질적 특성에 대한 정의가 작용하기 때문에 hermeneutic, 해석적 접근방식이 될 것이라고 결론지었다.

Step 3, which focused on specifying the guidelines for portfolio assessment, resulted in an update of the design guidelines, too. On the basis of a literature study, we updated our theoretical underpinnings and design guidelines. We concluded that the most appropriate approach to portfolio assessment would be a hermeneutic, interpretative approach, because this would do justice to the qualitative nature of the information in portfolios.


또한, 우리는 포트폴리오 평가 프로세스에 대한 설계 가이드라인을 구축하기 위해 [헤르메뉴틱, 해석적 연구에 사용되는 기준](Guba & Lincoln 1989년)이 가장 적합하다고 결론지었다. 우리는 가능한 한 권력power의 불균형이 거의 없는 상태에서 우리의 조형적이고 포괄적인 포트폴리오 평가 절차가 청취, 대화 및 의견 교환으로 특징지어지는 과정이 되도록 설계 지침을 재설계했다.

In addition, we concluded that criteria that are used in hermeneutic, interpretative research (Guba & Lincoln 1989) would be the most appropriate ones for building design guidelines for portfolio assessment processes. We redesigned our design guidelines in such a way that our formative and summative portfolio assessment procedure would be a process that is characterized by listening, dialog, and exchange of views with as little imbalance of power as possible.


설계 지침의 몇 가지 예는 다음과 같다: 

    • 평가자는 포트폴리오의 모든 증거를 신중히 고려해야 하며, 포트폴리오 증거에서 대수를 검색하면서 동료 평가자와 그들의 해석에 도전해야 한다. 

    • 후보자에게는 포트폴리오에 대한 평가 기준과 해석에 대해 토론할 수 있는 기회가 주어지고 최종 판단이 내려지기 전에 포트폴리오에 정보를 추가할 수 있는 기회가 주어진다.

Some examples of design guidelines are: 

    • Assessors should carefully consider all evidence in a portfolio, and challenge their interpretations with a peer assessor, searching for counterexamples in the portfolio evidence. 

    • Candidates should be given the opportunity to discuss about assessment criteria and interpretations about their portfolio and be given the chance to add information to their portfolio before final judgment is being made.


실제 설정

Authentic, real-life settings


평가(2a, 2b, 2c 단계)는 진실한authentic 실생활 환경에서 수행되었다. 5명의 경험 많은 선생님들과 그들의 개인 코치들이 이번 연구에 참여하였다.

The evaluation (steps 2a, 2b, and 2c) was carried out in an authentic, real-life setting. Five experienced teachers and their personal coaches were involved in the study,


평가 단계 동안, 미래 종합 사용의 선택권은 열려있었지만, 교육 포트폴리오의 목적은 주로 형성적이었다. 우리는 교사들에게 다음과 같은 교사들의 역할에 따라 포트폴리오를 구성하도록 요청했다. 2004a:

During the evaluation phase, the purpose of the teaching portfolio was primarily formative, although the option of future summative use was kept open. We asked the teachers to organize the portfolio according to the following roles of teachers: (Tigelaar et al. 2004a):


. 교사로서의 사람, 내용 지식 전문가, 학습 과정 촉진자, 조직자, 학자/평생 학습자. 

. the person as a teacher, expert on content knowledge, facilitator of learning processes, organizer, and scholar/ lifelong learner. 


게다가 교사들은 다음과 같은 6가지 과제를 수행했다. 

In addition, teachers carried out six assignments: 

. 당신의 교수 경력 이력을 설명하시오. 

. 교사로서 당신의 발전에 있어 중요한 사건들을 기술하시오. 

. 개인 학습 목표를 설계하고, 증빙 자료를 선택하시오

. 좋은 선생님의 프로필을 작성하시오

. 반성적인 포트폴리오를 짜시오

. describe your teaching career history; 

. describe critical incidents in your development as a teacher; 

. design personal learning goals; select evidential materials; 

. compose a profile of a good teacher; and 

. compile a reflective portfolio.


각각의 과제가 끝난 후, 교사들은 교대로 두 가지 유형의 사회적 상호작용 중 하나를 수행했다: 개인 코치와 세 번의 만남, 그리고 또래 회의에서 세 번의 만남. 사회적 상호작용을 통해 지원 및 피드백, 심층 분석, 실천 개선 제안, 교사의 인식에 대한 성찰 장려, 자신의 교육실무를 보다 잘 이해하기 위한 결정 등을 통해 과제의 효과를 강화할 수 있을 것으로 기대되었다.

After each assignment, the teachers alternately engaged in one of two types of social interactions: three meeting with their personal coach and three at a peer meeting. The social interactions were expected to reinforce the effects of the assignments through support and feedback, in-depth analysis, suggestions for improving practice, encouragement for teachers to reflect on their perceptions, and decisions in order to better understand their own teaching practice.


이론 테스트 및 정제 및 개선 실습

Testing and refining theory and advancing practice


위의 설명에서, [교사의 창의성과 학습 과정을 자극하기 위해서는], 연구들은 (포트폴리오 구조와 같이) 실천을 개선하기 위한 가이드라인이 개방적이고 유연해야 하며 너무 규범적이어서는 안 된다는 것이 분명해졌다. 아래에서는 형태 형성 평가 동안 지속적으로 그것들을 시험한 결과, 이론적 기초( – 교사 – 학습에 관한 이론에서 파생됨)가 얼마나 정제되었는지 더 자세히 설명한다.

From the description above, it became clear that the studies revealed design guidelines that advanced practice, such as the portfolio structure should be open and flexible and not be too prescriptive, in order to stimulate teachers’ creativity and we learning processes. Below, we illustrate further how refined our theoretical underpinnings (derived from theories about – teacher – learning) as a result of constantly testing those during the formative evaluations,


포트폴리오의 이론적 기초에 대한 첫 번째 개선은 포트폴리오의 목적을 다루었다. 우리는 평가에서 학습, 교육, 평가의 높은 일관성이 요구된다는 이론적 기초에서 출발했다. 이를 흔히 학습과 평가의 높은 일관성이 있는 '정렬alignment'의 원칙이라고 한다(Biggs 1996). 우리의 관점은 포트폴리오가 교사의 학습과 전문적 발전(형성적 기능)을 촉진하고 교육적 직업의 가능성(요약적 기능)과 같은 문제에 대한 결정의 근거를 제공해야 한다는 것이었다. 딜레마는 이것이 두 가지 유형의 목표를 바람직하지 않은 간섭을 일으킬 수 있다는 것이다. 문헌에 따르면 교사 학습 과정에 부정적인 역효과(backwash)가 있을 수 있다. 예를 들어, 교사들은 총괄 평가 기준과 관련하여 자신의 강점만을 제시하려고 할 수 있다(Biggs 1996, 1999).

A first refinement of our theoretical underpinnings of the portfolio dealt with the purpose of the portfolio. We departed from the theoretical underpinning that in assessments, a high consistency between learning, instruction, and assessment is required. This is often referred to as the principle of ‘‘alignment,’’ that is a high consistency between learning and assessment (Biggs 1996). Our viewpoint was that a portfolio should stimulate teachers’ learning and professional development (formative function) and provide a basis for decisions about issues such as the possibility of an educational career (summative function). The dilemma is that this may cause undesirable interference of the two types of goals. The literature indicates that there may be negative backwash effects on teacher learning processes, for instance teachers might be only willing to present their strong points in relation to the criteria for summative assessment (Biggs 1996, 1999).


이것은 교사들의 학습 과정과 그들의 전문적 발달과 같은 [형성적 기능]을 심각하게 약화시킬 것이다. 왜냐하면 그것은 개선이 필요한 영역이 피드백과 비판적 성찰에 노출되지 않은 채로 남아 있을 것이기 때문이다. 평가가 학습을 촉진한다고 알려져 있으므로(Longhurst & Norton 1997), 평가 과정은 의미 있는 학습 경험을 제공할 수 있도록 설계되어야 한다. 우리의 연구는 [교사의 학습과 그들의 전문적 발전]에 주안점을 두고 평가 과정이 신중하고 신뢰할 수 있는 방식으로 수행된다면, 두 가지 목표가 하나의 포트폴리오 절차로 결합될 수 있다는 것을 보여주었다포트폴리오 프로토타입에 대한 전문가 자문부터, 그리고 교육 포트폴리오의 유용성에 대한 참가자의 의견을 바탕으로 포트폴리오 목적에 관한 이론적 토대를 정비했다.

This would seriously weaken the formative function, i.e.: teachers’ learning processes and their professional development, because it would mean that areas that need improvement would remain underexposed to feedback and critical reflection. Since it is known that assessment drives learning (Longhurst & Norton 1997), assessment processes should be designed to provide meaningful learning experiences. Our studies demonstrated that the two aims can be combined in one portfolio procedure as long as the primary focus is on the learning of teachers and their professional development and the assessment process is performed in a careful and trustworthy manner. From our consultation of experts about the portfolio prototype (Tigelaar et al. 2004b), and on the basis of participants’ opinions on the usefulness of the teaching portfolio (Tigelaar et al. 2006b), we refined our theoretical underpinning with respect to portfolio purpose.


우리는 처음부터 총괄적 결정을 위해 사용할 수 있다는 것이 교사들로 하여금 그들의 포트폴리오에 대해 일하도록 동기를 부여한다고 주장했다. 분명, 본질적인 동기 부여가 교사들이 그들의 포트폴리오와 그들의 교육 성과에 대한 성찰에 시간을 소비하는 충분한 동기 부여라고 기대하는 것은 현실적이지 않다. 교사들 또한 궁극적인 목표와 이익이 그들의 노력을 가치 있게 만든다는 것을 확신할 필요가 있다. 따라서 우리는 가능한 한 권력의 불균형이 적은 분위기에서 좋은 가르침에 대한 의견 교환과 평가 기준에 대한 피드백과 대화로 특징지어지도록 설계 지침을 조정했다.

We argued that being able to work toward a summative decision from the start motivates teachers to work on their portfolio. Apparently, it is not realistic to expect that intrinsic motivation is a sufficient incentive for teachers to spend time on their portfolios and on reflecting on their teaching performance. Teachers also need to be convinced that the ultimate goals and profits make their efforts worthwhile. We therefore refined our design guidelines in such a way that a combined formative and summative portfolio procedure should be characterized by feedback and dialog about assessment criteria and an exchange of views about good teaching in a climate with as little imbalance of power as possible.


우리의 [이론적 기반]에 대한 또 다른 개선은 [코치의 역할]을 다루었다. 코치는 코칭 관계의 안전한 환경을 극대화하기 위해 지원 제공자만 되어야 하는가, 아니면 코치가 평가자의 종합적 기능을 가져야 하는가? 드라이센 외 (2005) 코치는 코칭하는 교사와 너무 밀접하게 관련되어 있기 때문에 코칭하는 교사의 공식적인 평가자가 되어서는 안 된다고 명시한다. 우리 연구에서 두 역할이 엄격하게 분리되어서는 안 된다는 결론을 내렸다. 장기간 교전(Guba & Lincoln 1989년)의 이론적 원리에 따르면, 평가자는 후보자의 교육 성과에 대해 이용할 수 있는 모든 종적 정보를 신중하게 고려해야 한다.

Another refinement of our theoretical underpinnings dealt with the role of the coach. Should coaches only be support providers so as to maximize the safe climate of the coaching relationship or should coaches also have the summative function of assessor? Driessen et al. (2005) state that coaches should not be the formal assessors of the teachers they coach, because they are too closely involved with them. In our studies, we concluded that the two roles should not be strictly separated. According to the theoretical principle of prolonged engagement (Guba & Lincoln 1989), it is important that assessors should carefully consider all the longitudinal information that is available about candidates’ teaching performance.


이는 후보들과 가장 오랜 교류가 있는 코치들도 좋은 가르침이 무엇인지에 대해 논의할 평가인 팀에 참여해야 함을 시사한다. 본 연구에서는 [장기간의 참여 원리]와 [학습자의 참여와 통제를 강조하는 학습 및 평가]에 대한 구성주의적 관점을 결합하여 코치 역할에 대한 이론적 원리를 다듬었다(Birenbaum 2003; Segers 2004). 이러한 관점에서, 코치가 [다른 관점에서 가르치는 것에 정통한 다른 멤버들로 구성된 평가자 팀의 일원으로서] candidate에 대한 추가적인 맥락 정보를 제공할 수 있다고 주장하면서, 평가를 받고 있는 교사의 코치에 대한 우리의 설계 지침은 정비되었다.

This suggests that coaches, who have the most prolonged engagement with the candidates, should also be involved in the team of assessors who will discuss about what constitutes good teaching. In our research, we refined our theoretical principle about the coach role by combining the principle of prolonged engagement with constructivist views on learning and assessment, which stress learner participation and control (Birenbaum 2003; Segers 2004). From this viewpoint, our design guideline about the coach of the teacher who is being assessed was refined, arguing that coaches might provide additional context information about their candidates as a member of the team of assessors, which is otherwise comprised of other members, who are knowledgeable on teaching from different perspectives.


우리의 [이론적 기초]에 대한 세 번째 개선은 [분석적 평가]와 [전체론적 평가]의 차이를 다루었다. 분석적 평가는 정밀한 기준과 표준화된 절차의 적용에 초점을 맞추는 반면, 전체론적 평가는 모든 평가 정보에 기초하여 가설을 지속적으로 개발하고 시험하는 모든 구성 요소에 비추어 전체적인 이해를 도모하는 것을 목적으로 한다. 한편, 투명성과 공정성을 촉진하기 위해 명확하게 정의된 분석 평가 기준이 필요한 반면, 그러한 기준에 지나치게 의존하는 것은 포트폴리오 평가를 무의미한 빈칸 채우기 연습으로 바꿀 수 있다. 전체론적인 포트폴리오 평가는 그 반대이다. 

A third refinement of our theoretical underpinnings dealt with the difference between analytic and holistic assessments. Analytic assessment focuses on the application of precise criteria and standardized procedures, whereas holistic assessment is aimed at seeking to understand the whole in the light of all its constituents, constantly developing and testing hypotheses based on all assessment information. On the one hand, clearly defined analytic assessment criteria are needed to promote transparency and fairness, whereas on the other hand too much reliance on such criteria might turn portfolio assessment into a meaningless exercise of filling in blanks. The opposite holds for holistic portfolio assessment. 


우리의 연구로부터, 우리의 [이론적 토대]는 투명성과 공정성보다 의미와 학습 기회가 우선되어야 한다는 결론에 도달했다는 점으로 정제되었다. 설계 지침 업데이트의 경우, 이는 기준이 [지원자는 자신의 기능을 성찰하도록 자극]하고, [평가자는 자신의 관점을 명확히 하도록 장려]하는 가이드로 간주되어야 함을 의미한다. 무엇이 좋은 교육을 구성하는지에 대한 토론과 대화는 평가자들이 포트폴리오를 평가하는 동안 나타나는 다양한 해석을 의미 있는 전체론적 판단으로 통합하도록 유도할 것이다. 즉, 정밀한 기준에 대한 판단을 내릴 필요 없이 평가기준이 고려의 단서를 제공해야 한다. 해석의 기준 또는 단계는 정기적인 개정의 대상이 되어야 한다.

From our studies, our theoretical underpinnings were refined in the sense that we came to the conclusion that meaningfulness and learning opportunities should take precedence over transparency and fairness. For our updates of the design guidelines, this means that criteria should be seen as guidelines that stimulate candidates to reflect on their functioning and encourage assessors to clarify their perspectives. Discussion and dialog about what constitutes good teaching will invite assessors to integrate different interpretations that emerge during the assessment of a portfolio into a meaningful holistic judgment. This means that assessment criteria should offer cues for consideration, without the need to pronounce judgment on precise criteria. The criteria, or steps for making interpretations, should be subject to regular revision.


혼합 방법 연구

Mixed-methods studies


표 2. 교육 포트폴리오를 설계, 평가 및 재설계하기 위해 수행된 연구의 개요.

Table 2. Overview of studies conducted to design, evaluation, and redesign a teaching portfolio.


1단계: 분석 및 재설계

Step 1: Analysis and redesign


1a: 역량강화 프레임워크 개발. 델피는 교육 전문가들 사이에서 연구한다. (티겔라르 외). 2004a)

1a: Development of a framework for teaching competence. Delphi study among educational experts. (Tigelaar et al. 2004a)


1b: 포트폴리오 프로토타입 개발. 포트폴리오 전문가와 인터뷰 연구(Tigelaar 등) 2004b).

1b: Development of portfolio prototype. Interview study with portfolio experts. (Tigelaar et al. 2004b)


2단계: 평가 및 재설계

Step 2: Evaluation and redesign


2a: 교사의 성찰 탐구. 문서 분석. (Tigelaar 등 2006a)

2a: Exploration of teachers’ reflections. Document analysis. (Tigelaar et al. 2006a)


2b: 동료 회의 중 교사의 상호작용 및 협력적 반영 프로세스 비디오 분석. (Tigelaar 등 2008)

2b: Teachers’ interactions and their collaborative reflection processes during peer meetings. Video analysis. (Tigelaar et al. 2008)


2c: 포트폴리오의 유용성에 대한 참가자들의 의견. 인터뷰 연구 (Tigelaar et al.

2c: Participants’ opinions about the usefulness of the portfolio. Interview study. (Tigelaar et al. 2006b)


3단계: 분석 및 재설계

Step 3: Analysis and redesign


3: 포트폴리오 평가 절차와 관련된 품질 기준 및 권고 사항. 문헌 연구 (Tigelaar et al. 2005)

3: Quality criteria and recommendations with regard to the portfolio assessment procedure. Literature study. (Tigelaar et al. 2005)


연구의 1단계에서는 양적 방법과 질적 방법을 조합하여 사용했다. 교육 역량 프레임워크를 개발하기 위해 1a단계에서 델파이 메소드를 사용했다. 우리는 교육 전문가가 작성한 설문지를 여러 라운드에서 개발했다.

In step 1 of the research, a combination of quantitative and qualitative methods was used. In order to develop a teaching competency framework, in step 1a, the Delphi-method was used; we developed a questionnaire which was filled out by educational experts, in different rounds.


이후 이론 원리에 기초한 포트폴리오 프로토타입의 개발인 1b 단계에서, 우리는 프로토타입에 이론적 기초가 어느 정도 반영되어 있는지를 결정하고, 그들이 필요하다고 생각하는 어떤 수정이 필요한지를 나타내기 위해 인터뷰 연구를 수행했다.

Subsequently, in step 1b, the development of a portfolio prototype based on theoretical principles, we carried out an interview study to determine to what extent the theoretical underpinnings were reflected in the prototype and to indicate any modifications they thought were required.


평가 단계인 2단계는 소규모로 진행됐다. 따라서 양적 방법은 그다지 적합하지 않았다. 그러나 서로 다른 질적 방법을 조합하여 혼합 방법 접근법을 적용하였다. 이는 포트폴리오에 의해 자극을 받은 학습 과정과 복잡한 상호작용에 대한 통찰력을 얻기 위해 수행되었다.

Step 2, the evaluation phase, was carried out on a small scale. Therefore, quantitative methods were not very suitable. However, a mixed-methods approach was applied by combining different qualitative methods. This was done in order to gain insight into the learning processes and complex interactions that were stimulated by the portfolio.


2a단계에서는 교사의 과제를 바탕으로 교사의 성찰적 글쓰기 내용을 분석하는 텍스트 분석을 실시했다. 이어서 2b단계에서는 또래회의 중 사회적 상호작용과 교사의 협력적 성찰 과정의 범위에 대해 세분화된 영상분석을 실시했다. 2c단계에서는 포트폴리오 구조의 유용성과 전문성 개발을 촉진하는 사회적 상호작용에 대한 교사와 코치의 의견으로 이러한 데이터를 보완했다. 포트폴리오의 유익성, 활성화 및 비활성화 요인과 관련된 카테고리를 사용하여 인터뷰 연구를 수행하고 결과를 분석하였다.

In step 2a, we carried out a document analysis, analyzing the contents of teachers’ written reflections, based on their assignments. Subsequently, in step 2b, we carried out a fine-grained video analysis on the social interactions during the peer meetings and on the scope of teachers’ collaborative reflection processes. In step 2c, we complemented these data with the opinions of teachers and their coaches about the usefulness of the portfolio structure and social interactions for stimulating their professional development. We carried out an interview study and analyzed findings using categories related to benefits, enabling and disabling factors in the portfolio.


마지막으로, 3단계에서는 포트폴리오 평가를 위한 정교한 설계 가이드라인에 도달하기 위해 포트폴리오 평가 방법 및 포트폴리오 평가 프로세스의 건전성을 보장하기 위한 품질 기준quality criteria에 대한 문헌 연구를 실시했다.

Finally, in step 3, in order to arrive at refined design guidelines for portfolio assessment, we carried out a literature study on methods for judging portfolios and quality criteria for guaranteeing the soundness of portfolio assessment processes.


설계자, 연구자 및 실무자 간의 빈번한 상호 작용

Frequent interaction between designers, researchers, and practitioners


설계 과정에서 연구과정의 일환으로 설계자, 연구자, 실무자 간의 고빈도 커뮤니케이션이 조직되었다. 연구 개발 과정은 4명의 교육 연구원으로 구성된 연구팀이 수행했는데, 이들은 2개의 교육 개발에도 전문지식이 있었다. 이 기사의 저자는 그 팀의 구성원이었다. 디자인 과정에서 교육 전문가와 실무자 모두의 의견을 구했다.

During the design process, frequent communication between designers, researchers, and practitioners was organized as part of the research process. The research and development process was carried out by a research team, consisting of four educational researchers, who also had expertise in two educational development. The authors of this article were members of that team. During the design process, we sought the opinions of both educational experts and practitioners from the field.


교수역량 프레임워크 개발에 초점을 맞춘 델파이 연구(1a단계)에는 고등교육에 종사하는 교육 전문가가 선정됐다. 이후 1b단계에서는 개발 및 평가를 위한 교육 포트폴리오의 프로토타입을 개발 및 테스트했다. 포트폴리오 평가 경험이 풍부한 9명의 교육자의 판단을 위하여 제출된 포트폴리오. 우리의 이론적 선택이 프로토타입에 어느 정도 반영되고 어떤 수정이 필요한지 조사했다.

For the Delphi study (step 1a), which was focused on developing a teaching competency framework, educational experts were selected who work in higher education. Subsequently, in step 1b, we developed and tested a prototype of a teaching portfolio for development and assessment was the purposes. The portfolio submitted to judgment of nine educationalists with ample experience with portfolio assessment. We investigated to what extent our theoretical choices were reflected in the prototype and which modifications were needed.


2a, 2b, 2c 단계에서는 실무자들이 참여하였다. 5명의 숙련된 교사들과 그들의 개인 코치들이 연구에 참여했고, 모든 의사들이 이 연구에 참여했다. 이러한 실무자들은 모두 포트폴리오의 유용성을 평가하는 데 참여했으며, 이들의 의견은 포트폴리오 설계 지침을 최적화하는 데 큰 도움이 되었다.

In steps 2a, 2b, and 2c, practitioners were involved. Five experienced teachers and their personal coaches were involved in the study, all medical doctors. All these practitioners were involved in evaluating the usefulness of the portfolio, and their opinions were of great benefit for optimizing the portfolio design guidelines.


일반적으로 DBR의 함정과 과제

Pitfalls and challenges of DBR in general


국지적 상황에 대한 실제적 목적의 경우에만 해당

Only of practical relevance for local situation


진정한 실세계 학습 환경 내에서 연구를 수행할 때의 단점은 [한 지역적 맥락 안에서 특정 혁신적 학습 환경]에서 흥미로운 통찰력을 얻을 수 있다는 점일 수 있지만, 이러한 연구는 다른 맥락에서는 가치가 제한될 수 있다. 즉, 연구는 종종 소수의 학생 또는 교사가 참여하는 특수 설계 환경에서 이루어졌기 때문에 다른 맥락에서 일반화되지 않을 수 있다.

A disadvantage of conducting studies within an authentic reallife learning setting might be that they may result in interesting insights in a particular innovative learning environment within one local context, but these studies have limited added value for other contexts. In other words, the findings may not generalize to other contexts, because the study took place in a specifically designed context in which often a few students or teachers participate.


반면에, 지역 상황보다 더 광범위한 관련성을 자극하기 위해 몇 가지 이슈를 고려할 수 있다. 

On the other hand, several issues can be taken into account to stimulate a broader relevance than the local situation. 


첫째, 이론에 바탕을 두고 이론들을 사용하여 연구 결과를 설명함으로써. 

둘째, 연구 내용에 대한 상세한 설명을 포함시킴으로써, 독자들은 그 결과를 자신의 상황에 어떻게 또는 어떻게 적용할 수 있는지 이해할 수 있다. 

셋째, 설계 원리를 생성한다.

First of all, by grounding the design on theories and using theories to explain the findings. 

Second, by including a detailed description of the context in the study, due to which readers can understand how or whether the findings can be applied to their own situation. 

Third, by generating design principles.


지역적 맥락은 DBR에서 매우 중요하지만, 좋은 DBR은 유사한 진정한 혁신적 학습 환경에서 일반화될 수 있는 지침을 제공해야 한다. 따라서 DBR은 다른 설정에서 설계가 시험되어야 할 필요가 있다(Design-Based Research Collective 2003). 그러나 다른 설정에 걸친 이 시험은 모든 맥락에 광범위하게 적용될 수 있는 설계 지침으로 귀결될 필요는 없다. 가장 좋은 경우, DBR 연구는 McKenney 등이 주장하는 바와 같이 [특정 이론적 주장 때문에 특정 개입이 특정 맥락에서 구현되기 위해 어떤 특성이 중요한지 명확히 하는 설계 지침]을 정의하도록 이끌어야 한다. (2006). 따라서, 레게르(2010년)의 주장처럼, 교육 실무에 광범위하게 관련되는 모든 맥락에 일반화될 수 있는 단순한 발견이나 설계 지침을 생성하는 문제가 아니다.

Although the local context is very important in DBR, good DBR should yield guidelines that can be generalized across similar authentic innovative learning environments. Therefore, DBR requires testing a design across different settings (Design-Based Research Collective 2003). This testing across different settings does, however, not need to result in design guidelines that can be broadly applied to all contexts. At best, DBR studies should lead to defining design guidelines that make clear which characteristics are crucial for a particular intervention to be implemented in a specific context because of certain theoretical arguments, as argued by McKenney et al. (2006). So, it is not a matter of generating simple findings or design guidelines that can be generalized to all contexts that are broadly relevant for educational practice, as also argued by Regehr (2010).


이론을 발전시키지 않는다.

Does not advance theories


DBR을 수행할 때의 또 다른 단점은 DBR이 실무 설계와 재설계에만 지나치게 집중하고 이론의 시험이나 정교함에 너무 덜 초점을 맞춘다는 것이다. 그러나 앞에서 언급한 바와 같이 좋은 DBR은 복잡한 학습 환경의 특성에 관한 이론을 시험하거나 다듬는 것을 목적으로 한다(DesignBased Research Collective 2003). 그러나 물론 DBR 연구에는 변화가 있다. 일부 DBR 연구는 [이론 테스트 또는 입증(흔히 검증 연구라고 함)]에 더 초점을 맞추고 있는 반면, 다른 연구들은 [이론 사용(개발 연구라고 함)]에 더 초점을 맞추고 있다(Nieven et al. 2006). 한 가지 주요한 차이점은 전자가 이론의 진보에 기여하는 반면 후자는 설계지침의 고도화에 기여한다는 것이다. 그러나 이러한 후기 연구는 문헌의 검토를 바탕으로 설계 지침을 작성하는 것에서부터 시작되는 경우가 많다는 것을 명심해야 한다. 즉, 이러한 발전 연구도 이론을 활용한다. 더욱이 이러한 발전 연구는 이론의 정교화와 이러한 이론들이 실제로 효과가 있는지 시험하는 것으로 이어진다.

Another disadvantage of conducting DBR might be that it is too much focused on designing and redesigning practice and too less focused on testing or refinement of theories. But, as stated before, good DBR is also aimed at testing or refining theories about the nature of complex learning environments (DesignBased Research Collective 2003). But, there are, of course, variations in DBR studies. Some DBR studies focus more on testing or proving theories (often called validation studies), whereas other studies focus more on using theories (often called development studies) (Nieveen et al. 2006). One major difference is that the former contribute toward the advancement of theories, whereas the latter contribute toward de-advancement of design guidelines. However, it is important to keep in mind that these latter studies often start with formulating design guidelines based on a review of the literature. In other words, these development studies also make use of theories. Furthermore, these development studies lead to the refinement of theories and testing whether these theories work in practice.


연구자의 참여는 결과를 편향시킬 수 있다.

The involvement of the researcher might bias findings


많은 DBR 연구에서 연구자와 설계자의 역할은 동일한 사람에 의해 수행된다. 이것은 어려울 수 있는데, 한편으로는 연구자가 디자인을 비판적으로 평가해야 하지만, 다른 한편으로는 디자인을 개발한 사람이고 교사나 학습자에게 디자인의 유용성에 대해 설득해야 하기 때문이다. 물론, DBR에서 설계자, 연구자 및 실무자 간의 긴밀한 상호작용이 깊고 의미 있는 통찰력으로 이어질 것으로 기대되지만, 설계에 대한 덜 비판적인 평가로 이어질 수도 있다왜냐하면 연구자는 개입이 효과가 있다고 확신하거나 학습자나 교사가 디자인을 비판하기 어려울 수 있기 때문이다. 다시 말해서, 이 연구의 결과는 연구자들의 편견에 의해 더 쉽게 영향을 받을 수 있다.

In many DBR studies, the roles of researcher and designer are fulfilled by the same person. This might be difficult, because the researcher on the one hand must critically evaluate the design, but on the other hand is also the one who developed the design and must convince teachers or learners about the usefulness of the design. Of course, close interactions between designer, researcher, and practitioners in DBR are expected to lead to deep and meaningful insights, but it might also lead to a less critical evaluation of the design, e.g., because the researcher is convinced that the intervention does work or because the learners or teachers may find it difficult to criticize the design. In other words, the findings of the study might be more easily influenced by the researchers’ biases.


따라서 데이터 소스와 데이터 방법의 삼각 측정이 매우 중요하다(McKenney et al. 2006). 추가 방법이나 데이터 출처의 강점은 다른 방법의 약점을 극복하기 위해 사용될 수 있으며 혼합된 방법은 증거를 확증하기 때문에 더 강력한 증거를 제공할 수 있다(Johnson & Onwegbuzie 2004). 그러나, 또한 반사성은 매우 중요하다. 즉, 연구자들은 독자들에게 자신이 연구를 수행한 배경과 렌즈, 그리고 기존의 가정과 기대치에 대한 정보를 제공해야 한다. 이 정보를 바탕으로 독자들이 연구의 결과를 비판적으로 해석할 수 있다. (Bunniss & Kelly 2010).

Triangulation of data sources and data methods is therefore of crucial importance (McKenney et al. 2006). The strengths of an additional method or data source can be used to overcome the weaknesses in another method and mixed methods can provide stronger evidence because of corroborating evidence (Johnson & Onwuegbuzie 2004). But, also, reflexivity is of crucial importance; i.e., the researchers should make the reader clear and give them information about their backgrounds and their lenses through which they conducted the study as well as what their pre-existing assumptions and expectations are, based on which readers can critically interpret the findings of the study (Bunniss & Kelly 2010).


DBR은 위험하고 복잡하며 시간이 많이 소요됨

DBR is risky, complicated, and time-consuming


그렇다, 실제로 DBR은 여러 가지 이유로 위험하고 복잡하며 시간이 많이 걸린다. 그 이유 중 하나는 설계가 이론에 근거해야 하고 연구자, 디자이너, 교사와 긴밀한 협업을 통해 개발되어야 하며, 교사와 학습자가 밀접하게 협력하여 실제적으로 구현되어야 한다는 것이다. 그 후에, 그것은 평가될 수 있고 재설계되어야 한다.

Yes, indeed DBR is risky, complicated, and time-consuming, because of several reasons. One of the reasons is that the design must be based on theories and must be developed in close collaboration with researchers, designers, and teachers, and needs to be implemented in practice in close collaboration with teachers and learners. Thereafter, it can be evaluated and it should be redesigned.


이 순환 과정은 위험하고 복잡하며 시간이 많이 걸린다. 교사나 학습자가 철수할 수 있고 상황이 바뀔 수 있기 때문에 연구 설계가 계속 변경될 수 있기 때문에 위험하다. 계속 변화하는 연구 설계는 약하다. 그럼에도 불구하고, 실제 실무에서 유용한 개입을 설계하기 위해서는 여러 이해관계자들과 긴밀히 협력하여 설계에 대한 조정이 이루어져야 한다(McKenney et al. 2006).

This cyclic process is risky, complicated, and time-consuming. It is risky because teachers or learners may withdraw and circumstances may change, from which the research design keeps changing. A research design that keeps changing is weak. Nevertheless, it is important that adjustments can be made to the design in close collaboration with the different stakeholders in order to design interventions that are useful in real practice (McKenney et al. 2006).


실무에서 혁신을 구현하는 것은 종종 [모든 이해관계자의 요구를 충족시키기 위해 변경이 이루어져야 한다]는 것을 암시한다. 다시 말해 실제 현실에서 일어나는 일이다. 또 다른 문제는 DBR이 설계, 평가, 재설계라는 반복적인 과정 때문에 시간이 많이 걸린다는 것이다. 오늘날 연구 프로그램은 종종 여러 연구가 발표되어야 하고 많은 위험을 감수할 수 없는 3, 4년 동안 지속되는 단일 프로젝트로만 구성된다. 그럼에도 불구하고 설계 연구는 여러 연구자들이 함께 일하고 서로 다른 연구가 구축되는 오래 지속되는 잘 정의된 연구 라인이나 연구 프로그램 내에서 수행되어야 한다. DBR 연구자들은 서로 밀접하게 연관되어 있고 서로에게 구축될 수 있는 연구의 양적 방법론과 질적 방법론 모두에 대해 구체적인 전문지식을 가진 다양한 실무자 및 다양한 연구자들과 함께 일하는 팀으로 일해야 한다.

Implementing innovations in practice often implies that changes must be made in order to meet the needs of all stakeholders. In other words, this is what happens in real practice. Another problem is that DBR is time-consuming because of its iterative process of design, evaluation, and redesign. Research programs nowadays often only consist of single projects that last for 3 or 4 years in which several studies need to be published and in which not much risks can be taken. Nevertheless, design studies should be conducted within long-lasting well-defined research lines or research programs in which different researchers work together and in which different studies are built upon each other. DBR researchers should work in teams in which they work together with various practitioners and various researchers with specific expertise on both quantitative and qualitative methodologies on studies that are closely related to each other and can be built upon each other.


실무에서 DBR의 함정과 과제에 대처

Dealing with pitfalls and challenges of DBR in practice


현지 상황을 벗어난 실질적인 관련성

Practical relevance beyond the local situation


첫째로, 개발 과정을 이론적 합리성에 토디를 두고, 이러한 합리성을 이용하여 우리의 연구 결과를 설명함으로써, 우리의 연구는 더 많은 청중들이 관심을 가질 수 있도록 하기 위한 것이었다.

First, by grounding the development process on theoretical rationales, and using these rationales to explain our findings, our studies were aimed to be of interest to a broader audience.


둘째, 명확한 맥락적 정보를 제공하고, 우리의 분석 방법에 투명함을 제공함으로써, 우리는 독자들이 자신의 맥락에서 우리의 발견의 적용 가능성을 판단할 수 있도록 돕고 싶었다.

Second, by providing clear context information, and by being transparent in our analysis methods, we wanted to assist our readers in being able to judge applicability of our findings to their own contexts.


셋째, 이론과 실천 사이의 반복적인 프로세스에서 우리의 설계 원리를 생성하고, 우리의 설계 원리와 이론적 합리성의 관계를 보여줌으로써, 우리는 우리의 발견과 다른 초기 연구를 토대로 하여 독자들이 포트폴리오 설계 프로세스를 그들 자신의 맥락에서 수행하도록 고무하는 것을 목표로 했다.

Third, by generating our design principles in an iterative process between theory and practice, and by showing the relationship between our design principles and our theoretical rationales, we aimed at inspiring the reader to carry out portfolio design processes in their own contexts, by building on our findings and other earlier studies.


소견의 적용성에 관한 연구의 제한은 종합 평가 절차의 설계에 대한 세부사항의 결여, 프로토타입이 두 번밖에 시험되지 않았다는 사실, 그리고 연구의 범위, 특히 고등교육에 초점을 맞춘다는 것이었다. 따라서 포트폴리오 프로세스의 모든 요소를 세부적으로 조정할 수 있도록 포트폴리오를 먼저 서로 다른 설정에 걸쳐 테스트할 것을 권고했다.

A limitation to our study with respect to applicability of findings was the lack of detail in the design of the summative assessment procedure, the fact that the prototype was tested only twice, and the scope of the research, being particularly focused on higher education. Therefore, we recommended that a portfolio should first be tested across different settings to enable fine-tuning of all the elements in the portfolio process.


이론의 진보

Advancing theories


우리 연구의 주요 초점은 이론(즉, 개발 연구)을 사용함으로써 포트폴리오에 대한 설계 원리의 발전에 기여하고 이론(즉, 검증 연구)을 시험하거나 입증하는 것이 아니었다(Nieven et al. 2006). 다만 기존 문헌을 바탕으로 디자인 가이드라인을 짜는 것부터 시작했다. 게다가, 우리는 우리의 발견에 기초하여 이론적 합리성theoretical rationales을 다듬었다. (이 문제에 대한 자세한 내용은 "이론 테스트 및 정제 및 선진화 관행" 섹션 참조) 이러한 이론적 합리성theoretical rationales은 다른 환경에서 시험할 필요가 있다.

The main focus of our studies was to contribute toward the advancement of design principles for portfolios by the use of theories (i.e., a development study) and not on testing or proving theories (i.e., validation studies) (Nieveen et al. 2006). However, we started with formulating design guidelines based on existing literature. Furthermore, we refined our theoretical rationales, based on our findings (for more on this issue, see section ‘‘testing and refining theory and advancing practice’’). These theoretical rationales need to be tested in other settings.


연구원의 참여에 의한 소견의 편향 방지

Preventing bias of findings by involvement of the researcher


다른 많은 DBR 연구와 마찬가지로, 연구자와 설계자의 역할은 동일한 사람에 의해 수행되었다. 연구의 결과가 연구자의 편향에 의해 영향을 받는 것을 방지하기 위해, 데이터 출처와 데이터 방법의 삼각 측량을 사용했다(McKenney et al. 2006). 이것은 앞에서 설명한 것처럼 연구의 평가 단계에서 특히 행해졌다.

Similar to many other DBR studies, the roles of researcher and designer were fulfilled by the same persons. In order to prevent the findings of the study to be influenced by the researchers’ biases, we used triangulation of data sources and data methods (McKenney et al. 2006). This was particularly done in the evaluation phase of the research, as explained before.


게다가, 우리는 우리가 연구를 수행한 렌즈에 대한 정보와 기존의 가정과 기대가 무엇인지를 명확히 함으로써 반사성의 원리를 적용했다. 이것은 우리의 이론적 합리성을 명확하게 기술하고 우리의 결과를 분석하는 투명한 방법에 의해 이루어졌다. 이것은 또한 데이터의 독립적 분석 후에 저자가 서로의 해석에 도전하도록 하는 등 데이터 분석의 품질 보증 조치를 포함시키고, 해석에 대한 의견 불일치가 있을 경우 원래의 데이터로 되돌아가는 방식으로 수행되었다.

Furthermore, we applied principles of reflexivity by making them clear and providing information about the lenses through which we conducted our study as well as what our pre-existing assumptions and expectations were. This was done by clearly describing our theoretical rationales and by a transparent way of analyzing our results. This was also done by including measures for quality assurance of data analysis, such as having the authors challenge each others’ interpretations after an independent analysis of the data, and by going back to the original data in case of disagreements about interpretations.


위험 및 복잡성 감소: 연구가 너무 많은 시간을 소모하는 것을 방지

Reducing risks and complications: Preventing the research from being too time-consuming


이 포트폴리오는 실생활 환경에서 단 한 번, 그리고 소규모로 시험되었는데, 5명의 교사와 5명의 코치가 참여하여 연구가 너무 많은 시간이 걸리는 것을 방지했다. 실생활 환경에서 또 다른 시험 주기가 연구를 더 강하게 만들었겠지만, 우리는 포트폴리오가 교사의 전문적 발전에 미치는 영향에 대한 풍부한 데이터를 생성하기 위해 다른 데이터 출처와 방법을 사용하는 데 투자했다. 나아가, 비록 우리의 연구 설계와 설계 과정의 다른 단계는 처음부터 분명했지만, 연구를 전체적으로 특징짓는 끊임없는 형성적 평가의 결과에 따라 설계를 조정할 수 있었다. 이는 예비 연구 문항이 우리의 결과에 따라 다듬어지고, 그 과정에서 우리 연구에 대한 이론적 합리성이 미세 조정되었다는 것을 의미한다. 또한 연구 개발팀은 다양한 종류의 전문성을 가진 구성원으로 구성하여 서로 다른 연구 관점이 결합될 수 있도록 하였다. 마지막으로, 우리는 연구를 수행하기 위해 기존 연구 라인에 구축된 명확한 이론적 합리성을 이용했다.

The portfolio was tested in a real-life setting only once, and on a small scale, involving five teachers and their five coaches to prevent that the research would become too time-consuming. Although another cycle of testing in a real-life setting would have made the research stronger, we invested in using different data sources and methods in order to generate rich data on the impact of the portfolio on the teachers’ professional development. Furthermore, while our research design and the different steps in the design process were clear from the beginning, it was possible to make adjustments to the design according to the results of the constant formative evaluations that characterized the research as a whole. This means that preliminary research questions were refined according to our results, and that the theoretical rationales to our research were fine-tuned along the process. In addition, the research and development team consisted of members with different kinds of expertise, so that different research perspectives could be combined. Finally, we used clear theoretical rationales which built on existing research lines in order to carry out our research.



향후 애플리케이션 및 개발

Future applications and developments


물론 DBR은 의료 교육 연구에 적용할 수 있는 접근방식은 다른 것 중 단 한 가지에 불과하다. 어떤 접근법을 선택해야 하는지는 물론 답해야 할 구체적인 연구 질문에 달려 있다. DBR은 디자인 포커스가 있는 교육 연구에 잘 맞는 접근법이다(Elives et al. 2005). 디자인 포커스가 있는 많은 연구, 예를 들어, 혁신적인 학습 환경을 만들고 테스트하는 연구, 교육에 교수 기술을 도입하거나, 혁신 학습 환경을 위한 평가 프로그램을 설계하는 연구 등에 적용할 수 있다. 

DBR is, of course, only one approach among others that can be applied in medical education research. Which approach should be chosen is, of course, dependent on the specific research questions to be answered. DBR is an approach that fits well for educational research with a design focus (Reeves et al. 2005). It can be applied in many studies with a design focus, e.g., studies that focus on 

  • creating and testing innovative learning environments, 

  • introducing instructional technology in education, or 

  • designing assessment programs for innovative learning environments. 

DBR 연구는 '어떻게 작용하는가'와 '왜 작용하는가?'와 같은 질문에 답하고자 하는 명확화 연구와 의학 교육에 대한 우리의 이해를 심화시키고 발전시키는 연구로 분류될 수 있다(Cook et al. 2008).

DBR studies can be classified as clarification studies which seek to answer questions such as ‘‘How does it work?’’ and ‘‘Why does it work?’’ and studies that deepen and advance our understanding of medical education (Cook et al. 2008).


업무 기반 학습

Work-based learning


업무 기반 학습 영역에 대한 연구는 이러한 학습 환경에 대한 몇 가지 통찰력을 밝혀냈다; WBL은 의료 교육에서 지배적인 역할을 하는 환경이다. 작업 기반 학습 환경은 학생들에게 환자 및 의료 전문가와 상호작용하거나 임상 실습에 참여할 수 있는 많은 가능성을 제공한다(Dornan et al. 2007; Teunissen et al. 2007). 학생에 대한 감독 부족 및 피드백 부족과 같은 이러한 환경 내에서 직면하는 어려움에 대해 많은 연구가 보고되었다(Grant et al. 2003; Daelmans et al.). 2004; Hofman & Donaldson 2004; Dolmans et al. 2008).

Research in the domain of work-based learning has revealed several insights about this learning environment; an environment that plays a dominant role in medical education. Workbased learning environments offer students many possibilities to interact with patients and medical experts or to participate in clinical practice (Dornan et al. 2007; Teunissen et al. 2007). Many studies reported about the difficulties encountered within this environment, such as a lack of supervision of students and lack of feedback (Grant et al. 2003; Daelmans et al. 2004; Hofman & Donaldson 2004; Dolmans et al. 2008).


이것은 큰 문제인데, 왜냐하면 슈퍼비전은 직장에서 효과적인 학생 학습을 위한 핵심 성공 요인이기 때문이다(Wimmers et al. 2006; Kilminster et al. 2007). 예를 들어, 이 분야에서의 연구는 임상 학습 환경의 품질 평가(Boor et al. 2007) 또는 임상 감독자의 성과를 평가하는 데 사용할 수 있는 기구의 개발 및 구현으로 이어졌다(Scalmeijer et al. 2008). 최근에는, 환자·감독자와의 학생 연속성을 높이기 위해 학부 의료 연수 프로그램에 longitudinal attachment을 실시하는 것으로 이어지고 있다(Wamsley et al.). 2009). 또한 인지 도제 이론에 기초한 임상 교수 모델의 개발로 이어져서, 가이드라인을 제공하기 위한 3단계 임상 교수 교사 접근법을 설명하기도 했다.

This is a big problem, because supervision is a key success factor for effective student learning at the workplace (Wimmers et al. 2006; Kilminster et al. 2007). Studies within this field have, for example, led to the development and implementation of instruments that can be used to evaluate the quality of the clinical learning environment (Boor et al. 2007) or to evaluate the performance of clinical supervisors (Stalmeijer et al. 2008). Recently, it has led to the implementation of longitudinal attachments in undergraduate medical training programs to increase student continuity with patients and supervisors (Wamsley et al. 2009). It has also led to the development of a clinical teaching model, based on theories of cognitive apprenticeship, describing a three-step clinical teaching teachers approach, that provides guidelines for (Stalmeijer et al. 2010).


그러나 직장 학습을 개선하려면 교육 실무에서 새로운 도구나 디자인의 도입뿐만 아니라, 직장 내 모든 참여자의 문화적 변화, 헌신, 참여가 필요하다. 이는 의료진, 학생, 설계자, 연구자 모두가 밀접하게 협업하는 DBR을 실시함으로써 강화될 수 있다. DBR은 업무 기반 학습 환경에 대한 보다 풍부한 이해에 기여하고, 견습 학습 이론에 기여하며, 업무 기반 학습의 추가 개선에도 기여할 수 있다.

But, improving workplace learning requires not only the introduction of new tools or designs in educational practice, but also a cultural change, commitment, and involvement from all participants at the workplace. This can be enhanced by conducting DBR in which both clinical staff, students, designers, and researchers closely collaborate. DBR could contribute toward richer understanding of work-based learning environments, contribute toward apprenticeship learning theories, and also toward further improvement of work-based learning.


평가

Assessment


여전히, 평가가 어떻게 학생들을 심층 학습으로 이끌 수 있는지 또는 학습을 강화시킬 수 있는지에 대해서는 거의 알려져 있지 않다. 어떻게 평가와 학습이 분리되어 있는 것이 아니라 통합되어 있다는 것을 보장할 수 있을까? 셰퍼드(2000년)는 평가가 학습을 강화해야 한다는 기대를 학생과 교사가 함께 가질 수 있는 학습문화를 만들어야 한다고 주장한다. 교사와 학생들은 평가를 보상과 처벌의 출처source가 아니라, 통찰력과 도움의 원천으로 보아야 한다. 슈와르트와 반데르 벨레우텐(2004)도 평가와 학습이나 가르침이 서로 일치해야 하며, 예를 들어 동료와 자기 평가를 도입하는 등의 방법으로 학생들을 평가에 참여시켜야 한다고 주장한다. 또 다른 최근의 plea는 다른 평가 방법과 학생 학습을 유도하고 의사결정을 위해 취합할 수 있는 데이터의 조합으로 구성된 교육에서 평가에 대한 프로그램적 접근법을 사용하라는 것이다(Van der Vleuten & Schuwirth 2005; Van der Vleuten et al. 제출). 이를 위해서는 학습과 평가가 얽혀 있는 실제 실천에서의 연구가 필요하다.

Still, little is known about how assessment can drive students toward deep learning or enhance learning. How can we insure that assessment and learning are not separate, but integrated? Shephard (2000) argues that we should create a learning culture where students and teachers would have a shared expectation that assessment should enhance learning. Teachers and students should look to assessment as a source of insight and help instead of a source for rewarding and punishing. Schuwirth and van der Vleuten (2004) also argue that assessment and learning or teaching should be congruent with each other and that we should involve students in our assessments, e.g., by means of introducing peer and selfassessments. Another recent plea is to use a programmatic approach about assessment in education which consists of a combination of different assessment methods and data that drive student learning and can be aggregated for making decisions (Van der Vleuten & Schuwirth 2005; Van der Vleuten et al. submitted). This requires research in actual practice in which learning and assessment are intertwined.


미래 발전

Future developments


이론은 복잡한 문제들을 살펴보는 다른 "렌즈"를 준다. 이론은 상황에 대한 우리의 이해를 넓히고 실제로 적용될 수 있다(리브스 외 2008). DBR은 이론과 실제 사이의 교량 구축에 기여할 수 있다. 의학 교육 같은 복잡한 환경에서 더 깊은 통찰력을 얻기 위해서는 DBR의 연구원, 설계자 및 실무자 간의 긴밀한 협업과 상호작용이 필수적이다. DBR은 혼합 방법을 사용하고 특정 목적을 가진 개입이 어떤 상황에서 어떤 맥락에서 성공하는지를 설명하는 다양한 정보 출처를 삼각측량한다.

Theories give different ‘‘lenses’’ through which to look at complicated issues. Theories broaden our understanding of situations and can be applied in practice (Reeves et al. 2008). DBR can contribute to bridge building between theory and practice. A close collaboration and interaction between researchers, designers, and practitioners in DBR is crucial to obtain deeper insight in such complex settings as medical education. DBR uses mixed methods and triangulates different sources of information that explain why an intervention with a particular aim is successful under which circumstances and in which context.


결론 Conclusions


DBR은 설계 연구에 있어 생산적인fruitful 접근법으로, 한편으로는 실무와 관련성이 높은 연구에 기여하고, 다른 한편으로는 이론 시험과 정교화에 기여한다. DBR은 학습이 정상적으로 이루어지는 진정한 실생활 환경에서 진행된다. 나아가 DBR에서는 연구자, 디자이너, 실무자(교사와 학생)가 서로 밀접하게 교류하며 아이디어를 공유한다. 두 가지 특성 모두 교육 실무에 대한 이러한 유형의 연구의 유용성에 기여한다. 또한 좋은 DBR은 이론의 시험과 정교화로 이어지며, 특정 목적을 가진 특정 설계가 특정 맥락에서 작동하는 이유를 명확히 하는 데 초점을 맞추고 있으며, 따라서 이론과 설계 원리의 발전에 기여한다.

DBR is a fruitful approach in design research that on the one hand contributes toward studies that are highly relevant for practice and on the other hand contribute toward theory testing and refinement. DBR is conducted in authentic real-life settings where learning normally takes place. Furthermore, in DBR, researchers, designers, and practitioners (teachers and students) closely interact with each other and share their ideas. Both characteristics contribute to the usefulness of this type of research for educational practice. Good DBR also leads to testing and refinement of theories and focuses on clarifying why a specific design with a specific aim does work in a specific context and as such contributes toward the advancement of theories and design principles.





. 2012;34(1):1-10.
 doi: 10.3109/0142159X.2011.595437.

Building bridges between theory and practice in medical education using a design-based research approach: AMEE Guide No. 60

Affiliations 

Affiliation

  • 1Department of Educational Development & Research, Maastricht University, The Netherlands. d.dolmans@maastrichtuniversity.nl

Abstract

Medical education research has grown enormously over the past 20 years, but it does not sufficiently make use of theories, according to influential leaders and researchers in this field. In this AMEE Guide, it is argued that design-based research (DBR) studies should be conducted much more in medical education design research because these studies both advance the testing and refinement of theories and advance educational practice. In this Guide, the essential characteristics of DBR as well as how DBR differs from other approach such as formative evaluation are explained. It is also explained what the pitfalls and challenges of DBR are. The main challenges deal with how to insure that DBR studies reveal findings that are of a broader relevance than the local situation and how to insure that DBR contributes toward theory testing and refinement. An example of a series of DBR studies on the design of a teaching portfolio in higher education that is aimed at stimulating a teacher's professional development is described, to illustrate how DBR studies actually work in practice. Finally, it is argued that DBR-studies could play an important role in the advancement of theory and practice in the two broad domains of designing or redesigning work-based learning environments and assessment programs.


임상술기 교육의 팁(BMC Med Educ, 2020)

Tips for teaching procedural skills

Annette Burgess1,2*, Christie van Diggele2,3, Chris Roberts1,2 and Craig Mellis4




배경 Background

건강 전문가들은 광범위한 임상 기술을 능숙하게 수행할 수 있는 능력을 가지고 있어야 한다. 여기에는 일반적으로 병력청취, 신체검사, 절차능력 등이 포함된다. 일부 절차적 기술은 특정 분야에 한정되어 있지만, 안전한 환자 진료를 보장하려면 기술 수행의 역량이 필요하다. 올바른 손 씻기 기술, 위관 삽입, 식인, 소생, 목발의 올바른 사용, 병상 난독증 평가, 침대 대 의자 이동, 걸음걸이 분석 등이 그 예다. 

Health professionals must have the ability to perform a wide range of clinical skills competently. These generally include history taking, physical examination, and procedural skills. While some procedural skills are specific to particular disciplines, competency in the performance of skills is required to ensure the delivery of safe patient care. Examples include correct hand washing technique, gastric tube insertion, cannulation, resuscitation, correct use of crutches, bedside dysphagia assessment, bed-to-chair transfer, and gait analysis. 


연습 기간을 넘어 학습되고 유지되는 기술은 다양한 임상 환경에서 회수되고 능숙하게 수행될 수 있다[1]. 보건 전문가들은 정기적으로 이러한 임상 기술을 동료, 주니어 직원 및 학생들에게 가르쳐야 한다. 그러나, 스킬 교육의 효과성은 불확실하며, 주니어 보건 전문가들이 실제 기술을 가르치는 능력에 지나치게 자신하고 있다는 것을 암시하는 증거가 있다[2]. 이 논문은 비복잡한 절차적 스킬에 초점을 맞추어 스킬을 배우는 방법, 스킬 성과 향상 방법, 역량 결정, 효과적인 피드백 제공 등을 탐구하는 것을 목적으로 한다.

A skill that is learned and retained beyond the period of practice, can be recalled and competently performed in a variety of clinical settings [1]. Health professionals are regularly required to teach these clinical skills to their peers, junior staff, and students. However, the effectiveness of skills teaching is uncertain, and there is evidence suggesting junior health professionals are overconfident in their ability to teach practical skills [2]. With a focus on non-complex procedural skills, this paper aims to explore how skills are learned; ways to improve skills performance; determining competency; and the provision of effective feedback.


기술은 어떻게 배우는가?

How are skills learned?


20세기 후반에, 많은 모터 학습 이론가들은 심리학 기술을 가르치는 데 필요한 단계를 상정했다[3,4,5,6]. 이 연구를 바탕으로, 연구자들은 그 이후 교육 및 학습 절차적 기술을 위한 모터 학습 모델을 제안하였다[7, 8]. 문헌을 가르치는 대부분의 기술에 공통적으로, 기술은 간단하든 복잡하든 간에 순서가 정립되고 단계적인 교수 접근법을 따르는 것으로 가장 잘 학습된다는 것이다. 

In the last half of the twentieth century, many motor learning theorists posited the required steps to teach a psychomotor skill [3,4,5,6]. Building on this work, researchers have since proposed motor learning models for teaching and learning procedural skills [7, 8]. Common to most skills teaching literature is that skills are best learned by following a sequenced and stepped approach to teaching – whether a simple or complex task. 


그러나 의료에 필요한 대다수의 기술은 복잡하여 7개 이상의 기술 요소[9]가 필요하며, 가르치고, 배우고, 유지하기 어렵다. 조지 및 도토의 5단계 모델을 사용하여 간단한 치과 기술을 가르칠 때, 초보자는 한 번의 시도 끝에 이 과제를 수행할 수 있었다고 보고되었다[10]. 마찬가지로 페이튼의 [7] 4단계 모델을 사용하여 봉합을 배울 때 의대생들의 간단한 기술 습득이 강화되었다고 보고되었다 [11]. 그러나 복잡한 과제를 가르칠 때 4단계와 5단계 모델은 스킬 획득과 유지를 지원하는 제한된 효용성을 가질 수 있다. 

However, the majority of skills required in healthcare are complex, requiring more than seven skill elements [9], and are difficult to teach, learn and retain. It has been reported that when using George and Doto’s (2001) five-step model to teach a simple dental skill, novices were able to perform the task after one attempt [10]. Similarly it has been reported that use of Peyton's [7] four-step model enhanced medical students' aquisition of simple skills when learning suturing [11]. When teaching complex tasks, however, the four- and five- step models may have limited utility to assist skill acquisition and retention. 


예를 들어, 일부 연구는 시뮬레이션 수동 제세동[12], 후두 마스크 기도 삽입[13], 시뮬레이션 위관 삽입[14]과 같은 복잡한 기술을 가르치는 2단계, 4단계 또는 5단계 접근방식을 사용할 때 학습 성과에 차이가 없다고 보고했다. 니콜스 외 연구진(2016년)은 현대 모터 학습에 대한 리뷰에서 다부분의 사이코모터 기술을 가르치기 위한 통합적 교육 모델을 제안하여 임상 실습에 필요한 복잡한 기술을 가르치기 위한 보다 효과적인 접근법을 제공한다. 저자들은 복잡한 psychomotor 기술을 가르치는 데 필요한 교육 단계를 제공했다[9].

For example, some studies have reported no difference in learning outcomes when using a two step, four step or five step approach to teaching complex skills, such as simulated manual defibrillation [12], laryngeal mask airway insertion [13], and simulated gastric tub insertion [14]. Nicholls et al. (2016), in their review of contemporary motor learning, suggest an integrated instructional model to teach multi-part psychomotor skills provides a more effective approach to teaching complex skills required for clinical practice. The authors have provided the educational steps required to teach complex psychomotor skills [9].


교수 기술에 사용되는 방법은 강의 내용에 사용되는 방법과 다르다. 프레임워크, 관찰 및 피드백을 활용한 절차적 기술 가르침과 반복적인 연습 기회 제공 [7, 8, 15, 16] 환자 이력을 챙기기, 신체검사 수행, 데이터 합성 및 제시와 같은 임상 기술은 다중 인지 및 심리운동 기술이 필요하다. 이와 같이 임상기술은 보여주는 것이 말로 설명하는 것보다 쉽다. 한 번 기술이 정기적으로 수행되면 전문가로서 무의식적으로 수행되는 것이 어려움 중 하나이다. 결과적으로, 다른 사람들에게 그 과정을 명확하게 전달하기 위한 구조적 단계로 분해하기가 쉽지 않다[2]. 

The method used for teaching skills differs from that for teaching content. Teaching of procedural skills utilising frameworks, observation and feedback, with opportunities for repeated practice assists in the learner's acquisition and retention of skills [7, 8, 15, 16]. Clinical skills, such as taking a patient history, performing a physical examination, synthesising and presenting data, require multiple cognitive and psychomotor skills. As such, clinical skills are more readily demonstrated than described. One of the difficulties is that once a skill is performed regularly – as an expert – it is performed subconsciously. As a result, it is not easy to break it down into structural steps to clearly communicate the process to others [2]. 


시뮬레이션 환자, 마네킹, 동영상, 가상 현실, 컴퓨터 사용 등 기술을 가르치는 방법은 다양하다. 강의에서 절차적 기술 실험실을 사용하면 환자에게 이러한 절차를 수행하기 전에 안전한 연습을 할 수 있는 기회를 제공한다. 이를 통해 학습자는 환자에게 시술하기 전에 연습하고, 즉각적인 피드백을 받고, 자신의 역량과 자신감을 더욱 높일 수 있다. 소생술과 같은 일부 기술은 기술 실습실에서 가르칠 수 있지만, 학생들은 일반적으로 임상 환경에서 안전한 절차를 수행하는 연습을 해야 할 것이다. 일반적으로 스킬은:

There are many ways to teach a skill, including the use of simulated patients, manikins, videos, virtual reality and computers. The use of procedural skills labs in teaching provides opportunities for safe practice before performing these procedures on patients. This gives learners the opportunity for practice, to receive immediate feedback, and to further refine their competence and confidence - before undertaking the procedure on a patient. Although some skills, such as resuscitation, can be taught in skills labs, students will generally need to practise carrying out safe procedures in the clinical setting. Generally, a skill:


    • 타고나는 것이 아니라 배운 것이다.

    • 명확한 단계로 나눌 수 있다.

    • 개선을 위해 연습이 필요하다.

    • 측정할 수 있는, 특정한 목표나 결과를 가지고 있다.


    • is learned, and not innate

    • is able to be broken into explicit steps

    • requires practice in order to improve

    • has a specific goal or outcome, that is measurable


기술을 배우는 것은 단순히 기술을 손으로 수행하는 것 이상의 것을 포함한다. 절차에 대한 지식(예: 왜 그것이 수행되고 있는지, 어떻게 그리고 무엇이 잠재적 위험인지)과 의사소통 기술을 포함한 다른 고려사항들이 있다. 스킬에 competent하다는 것은 세 가지 주요 요소인 지식, 의사소통 및 성능[2, 17]을 포함한다. 그림 1과 같이.

Learning a skill involves more than just performing the skill manually. There are other considerations, including knowledge of the procedure (such as why it is being done, how, and what are potential risks) and communication skills. Becoming competent in a skill involves three main components: knowledge, communication and performance [2, 17], as displayed in Fig. 1.


그림 1. 스킬 역량의 세 가지 주요 구성요소 [2, 17]

Fig. 1 The three main components of skill competency [2, 17]


임상 기술을 가르치기 위한 팁

Tips for teaching clinical skills


기술을 가르칠 때는 손씻기와 같은 가장 기본적인 단계라도 포함시켜야 한다. 어떤 가정도 해서는 안 되며, 모든 세부사항을 보여줄 필요가 있다. 임상 기술을 가르치기 위한 몇 가지 팁은 [7] 아래에 열거되어 있다.

When teaching a skill, even the most basic of steps should be included, such as handwashing. No assumptions should be made, and every detail needs to be demonstrated. Some tips for teaching clinical skills are listed below [7]:


    • 기초 사항 포함(예: 손씻기)

    • 데모: 학습자가 볼 수 있도록 명확한 데모 제공

    • 이론과 실천의 통합: 학습자는 임상적 추론을 촉진하는 행동의 이면에 있는 증거를 볼 수 있다.

    • 스킬/프로세스를 단계별로 세분화: 학습자가 이미 알고 있는 내용을 파악하고 그 단계부터 진행

    • 협동적 문제 해결 사용: 학습자가 함께 해결 방법을 찾을 수 있도록 허용

    • 피드백 제공: 적절한 환경에서 명확하고 건설적인 피드백 제공


    • Include the fundamentals: for example, handwashing

    • Demonstration: provide clear demonstrations for learners to see

    • Integrate theory with practice: learners can see the evidence behind the action, which promotes clinical reasoning

    • Break skills/procedures down into steps: find out what the learners already know, and proceed from there

    • Use collaborative problem solving: allow learners to work together towards a solution

    • Provide feedback: that is clear and constructive, in an appropriate environment


구조 단계로서의 기술

Skills as structural steps


필요한 것을 정확히 보여주고 전달하기 위해 다른 사람들을 가르칠 때 기술은 작고 별개의 단계로 세분되어야 한다. 많은 모델이 있지만 유용하고 잘 연구된 방법은 표 1에 표시된 페이튼의 4단계 접근법[7]으로 임상 환경에서 교육에 성공적으로 적용할 수 있다. Krautter 외 연구진(2011년)의 통제된 실험 결과, 페이튼의 4단계 접근방식을 사용하여 기술 기술을 가르치는 것이 표준 교육보다 우수하며, 전문성, 의사소통 및 기술의 더 빠른 수행이라는 분야에서 혜택을 받는 것으로 나타났다[14].

Skills need to be broken down into small, discrete steps when teaching others in order to demonstrate and communicate exactly what is required. Although there are many models, a useful, well researched method is Peyton’s four step approach [7], displayed in Table 1, which can successfully be applied to teaching in the clinical setting. A controlled trial by Krautter et al. (2011) found that using Peyton’s four step approach to teach a technical skill was superior to standard instruction, with benefits in the areas of professionalism, communication and faster performance of the skill [14].


표 1 스킬 티칭에 대한 페이튼의 4단계 접근법[7]

Table 1 Peyton’s four step approach to skills teaching [7]



즉각적인 피드백 제공

Provision of immediate feedback


절차적 기술의 습득은 작업의 수행과 피드백에 의존한다[2]. 반복은 물론, 페이튼의 4단계 접근법은 학습자가 스스로 스킬 수행을 시도하기 전에 처음부터 끝까지 실시간으로 스킬이 수행되고 강사에 의해 반복되는 모습을 볼 수 있도록 한다. 이를 통해 학습의 강화와 오류를 수정하고 피드백을 제공할 수 있는 기회를 확보할 수 있다. 즉각적인 피드백과 오류 수정은 기술이 잘못 수행되고 연습되고 장기 기억장치에 저장되고 회수되고 잘못 수행되는 위험을 방지한다 [1, 18]. 학습자의 성과에 대한 건설적인 피드백을 제공하는 것은 스킬 획득의 필수적인 부분이다. Salmoni와 동료(1984)는 과도한 구두 정보 없이 학습자가 스킬의 각 요소에 집중하면서 연습할 수 있도록 스킬이 끝날 때까지 피드백을 보류해야 한다고 제안한다[19]. 학습자가 개선이 필요한 영역을 올바르게 연습할 수 있도록 즉시 피드백을 제공해야 한다. 또한 학습자에게는 스킬 세션이 끝날 때 질문을 할 수 있는 기회가 제공되어야 한다. 그림 2에 표시된 펜들턴의 피드백 모델[20]과 같은 참가자 주도 방법은 학습자가 자신의 수행능력을 먼저 반영하도록 하는 데 유용하다.

The acquisition of procedural skills is reliant on task practice and feedback [2]. As well as repetition, Peyton’s four-step approach allows learners to see the skill being performed in real time, from beginning to end, and repeated by the instructor, before attempting performance of the skill themselves. This allows for the reinforcement of learning and opportunities to correct any errors and provide feedback. Immediate feedback and error correction avoids the risk of the skill being performed and practiced incorrectly, stored in long term memory, recalled and performed incorrectly [1, 18]. Provision of constructive feedback on the learners’ performance is an essential part of skills acquisition. Salmoni and colleagues (1984) suggest that feedback should be withheld until the conclusion of the skill to allow the learner to practice while focussing on each element of the skill, without excessive verbal information [19]. Feedback should be given immediately in order for the learner to correctly practice areas requiring improvement. The learner should also be provided with opportunities to ask questions at the end of the skill session. A participant-driven method, such as Pendleton’s feedback model [20], displayed in Fig. 2, is useful to ensure the learner reflects first on their own performance.


그림 2 피드백 모델(펜들턴 외, 1984) [20]

Fig. 2 Feedback Model (adapted from Pendleton et al, 1984) [20]



스킬 티칭에서 학습자를 교육할 때, Peyton의 4단계 접근법[7]에 이어 동료 및 교사 피드백을 모델링할 수 있다. 예를 들어, 3-5명의 학습자로 구성된 소규모 그룹에서 각 학습자는 페이튼의 4단계 접근법을 사용하여 다른 학습자에게 기술을 가르친다. 각 학습자는 또한 펜들턴의 피드백 모델을 사용하여 자신의 교육에 대한 피드백을 동료에게 제공하는 책임을 진다. 동료교육활동(기술 지도 및 피드백 제공)은 채점 가이드를 사용하여 촉진자에 의해 형성적으로 평가될 수 있다. 단, 기술을 가르치는 데 사용될 수 있는 다른 모델이 있을 뿐만 아니라, 기술 교육에 적용할 수 있는 피드백 모델도 많이 있다는 점에 유의해야 한다. 여기에는 침상 교습에 유용하게 적용할 수 있는 실버맨의 SET-GO, ALOBA [21] 방법과 같은 모델이 포함된다. 편안하고 익숙한 사용법을 찾는 것이 중요하다.

When training learners in skills teaching, Peyton’s four-step approach method [7], followed by provision of peer and teacher feedback can be modelled. For example, in small groups of three to five learners, each learner teaches a skill to another learner, using Peyton’s four-step approach. Each learner also takes responsibility for providing feedback to a peer on their teaching, using Pendleton’s feedback model. The activity (teaching a skill and providing feedback) may be formatively assessed by the facilitator using marking guides. However, it should be noted that as well as there being different models that may be used to teach a skill, there are also many models of feedback that can be applied to skills teaching. These include models such as Silverman’s SET-GO and ALOBA [21] methods, which can be usefully applied to bedside teaching. It is important to find suitable methods that you are comfortable and familiar with using.


역량개발

Development of competency


학습자는 기술에서 유능해지기 전에 일련의 단계를 거친다(그림 3) [22]. 기술 습득에는 4단계가 있다: 

1) 무의식적으로 무능하고, 

2) 의식적으로 무능하고, 

3) 의식적으로 유능하고, 

4) 무의식적으로 유능하다. 

Learners move through a series of stages before becoming competent at a skill (see Fig. 3) [22]. There are four levels in skill acquisition: 

1) Unconsciously incompetent, 

2) Consciously incompetent, 

3) Consciously competent, 

4) Unconsciously competent. 


이러한 단계를 감상하려면 일상적인 기술 습득, 예를 들어 자동차 운전을 배운 방법에 대해 성찰하는 것이 유용하다. 초보자들은 처음에는 '의심 없이 무능하다'(충분히 운전을 하는 데 필요한 지식과 기술을 알지 못함)로 시작하여 역량의 단계를 거치게 된다(충분히 자동차를 운전하는 지식과 기술을 가질 때까지). 그러나, 또다시 '의심할 수 없을 정도로 무능력한' 상태가 될 수 있는 장기적 잠재력이 있다(예를 들어, 운전 능력을 과대평가하거나 새로운 권고사항이나 도로규칙에 대해 최신 상태를 유지하지 않는 것).

To appreciate these stages it is useful to reflect on acquisition of an everyday skill, for example, on how you learnt to drive a car. Novices will start initially as being ‘unconsciously incompetent’ (not aware of the knowledge and skills needed to competently drive), moving through the stages of competence (until they have the knowledge and skills to competently drive a car). However, there is the long-term potential of again becoming ‘unconsciously incompetent’ (for example, over-estimating their driving ability, and/or not staying up to date on new recommendations or road rules).


그림 3 역량 개발 (페이튼, 1998년 채택) [22]

Fig. 3 Development of Competency (adapted from Peyton, 1998) [22]



역량 결정

Determining competency


떤 사람이 역량있는지 아는 것은 평가하기 어려울 수 있다. 일반적으로 학습자는 절차나 기술을 혼자서 수행하거나 감독 없이 수행할 수 있으면 역량이 있다고 간주된다. 역량은 때때로 학습자가 절차를 수행한 횟수(예: 기관지경)를 단순히 기록하거나 공식적인 관찰 평가를 완료한 후에 결정된다. 각 스킬은 역량 결정에 다른 접근방식을 요구할 수 있다[23]. 누군가가 역량을 갖추었는지 확인하는 중요한 측면은...

Knowing when someone is competent can be difficult to assess. Learners are generally deemed competent once they can perform the procedure or skill alone, or without supervision. Competence is sometimes determined simply by noting the number of times the learner has performed the procedure (for example, bronchoscopy), or after completing a formal, observed assessment. Each skill may require a different approach to determining competence [23]. The important aspects of ensuring someone is competent are [23]:


    • 결과를 설정하고 알아본다.

    • 기대치를 설정하고 알아본다.

    • 스킬 수행에 대한 여러 관찰을 한다.

    • 일반적인 오류를 찾는다.

    • Setting and knowing the outcomes

    • Setting and knowing expectations

    • Multiple observations of skill performance

    • Looking for common errors


밀러의 피라미드 [24]는 기술을 수행하는 학습자의 능력을 결정하는 유용한 계층구조를 제공한다(그림 4 참조). 피라미드의 하단은 지식(실제적으로 그리고 객관식 질문(MCQ)에 의해 평가됨)에 기초하여, '어떻게 하는지 알기'(임상적으로 그리고 객관적인 구조 임상 검사(OSCE) 또는 임상 긴 사례로 평가됨)로 이동하여, "직무에서" 수행함으로써 기술을 수행하는 방법을 입증한다. 임상의가 수행하는 대부분의 평가는 피라미드의 상위 단계에 기초하며 작업장에서 수행된다.

Miller’s pyramid [24] provides a useful hierarchy to determine a learner’s competency in performing a skill (see Fig. 4). The bottom of the pyramid is based on knowledge (taught didactically and assessed by multiple choice questions (MCQs)), moving to ‘knows how’ (taught clinically and assessed with Objective Structured Clinical Examinations (OSCEs) or clinical long cases), to demonstrating how to carry out the skill by “on the job” performance. Most assessments that clinicians undertake are based on the upper levels of the pyramid and are carried out in the workplace.


그림 4 임상 평가를 위한 프레임워크 (Miller, 1990년 채택) [24]

Fig. 4 Framework for clinical assessment (adapted from Miller, 1990) [24]


스킬 유지 및 성능 향상

Maintaining a skill and improving performance


기술은 의도적 연습을 통해 습득된다[15]. Nicholls와 동료 (2016)는 스킬 연습이 여러 가지, 간격, 짧은 기간 및 가변적인 작업에 의존하고 있으며, 학습자가 스킬 습득과 장기 보유를 촉진할 수 있는 연습 기회가 있다고 제안한다[9]. 자연적인 기술 쇠퇴를 피하기 위해서는 일단 습득한 기술을 유지하는 것이 중요하다. 이것은 규칙적인 연습을 통해서만 달성할 수 있다. 에릭슨 & 차르네스(2004)에 따르면, 높은 수준의 기술을 획득한 사람들은 지속적으로 자신의 성과를 성찰하기 때문에 그렇게 한다[15]. 잘하지 못하는 분야에 집중해서 그 역량을 실천하는 경향이 있다. 이것은 의도적 연습으로 알려져 있으며 엘리트 스포츠맨과 음악가뿐만 아니라 임상 기술 훈련에도 큰 관련이 있다. 의도적 연습의 핵심 요소는 다음과 같다.

Skills are acquired through diligent practice [15]. Nicholls and colleagues (2016) suggest skill practice is reliant upon multiple, spaced, short duration, and variable tasks, with practice opportunities to promote skill acquisition and long-term retention by the learner [9]. In order to avoid natural skill decay, it is important for health professionals to maintain their skills once acquired. This can only be achieved through regular practice. According to Ericsson & Charness (2004), those that attain high skill levels do so because they continually reflect on their own performance [15]. They tend to focus on the areas in which they are not doing well and practice that competence. This is what is known as deliberate practice and is highly relevant for clinical skills training, as well as elite sportspersons and musicians. The key elements to deliberate practice are:


    • 잘 정의된 태스크

    • 연습 및 개선 기회

    • 반복하고 반영할 수 있는 기회

    • 관찰자의 정기적인 피드백

    • Well defined tasks

    • Opportunities to practice and improve

    • Opportunities to repeat and reflect

    • Regular feedback from an observer


절차적 기술을 가르칠 때 시뮬레이션의 사용

The use of simulation in teaching procedural skills


시뮬레이션 기반 의료 교육의 사용은 더 나은 환자 치료 및 향상된 환자 안전과 연관되어 있다는 점에 유의해야 한다[25]. 직무 수행 빈도와 반복은 시뮬레이션된 임상 환경에서 실제 임상 환경으로의 기술 보유, 회수 및 전달성에 영향을 미친다 [1, 18]. 시뮬레이션은 환자 위해의 위험 없이 절차를 연습할 수 있는 기회를 제공하며, 훈련과 평가 도구로서 널리 사용된다. 역량 기반 교육을 이용한 목표 지향적 학습은 성인 학습의 특징이다. 역량 기반 교육은 기술을 전수받은 모든 사람이 그 기술을 수행할 수 있다고 가정하기보다는 훈련의 기준을 강화한다. 

It is important to note that the use of simulation-based healthcare education has been associated with better patient care and improved patient safety [25]. The frequency and repetition with which a task is practiced impacts skill retention, recall, and transferability from the simulated to real clinical environment [1, 18]. Simulation offers the opportunity to practice procedures without any risk of patient harm, and is widely used as both a training and assessment tool. Goal-orientated learning using competency-based instruction, is a characteristic of adult learning. It reinforces a standard of training, rather than assuming that everyone who has been taught the skill can perform the skill. 


최근의 체계적 검토에서는 절차적 능력의 효과적인 가르침에서 시뮬레이션과 역량 기반 교수 패러다임의 사용에 대한 강력한 증거를 보여주었다[26]. 체계적 검토 결과, 절차적 능력 훈련을 성인 학습자의 요구에 맞추어 조정하는 데 가장 효과적인 접근방식은 [[반복적인 연습, 숙달 학습, 의도적 연습, 그리고 영상과 같은 시각적 보조 기구로 보완]하는 고품질 시뮬레이션]이라는 것이 밝혀졌다[26]. 소여 외 연구진(2016)은 준비, 스킬 습득 및 스킬 유지보수를 결합한 스킬을 가르치는 6단계 접근법을 개발했다. "학습, 보기, 연습, 증명, 도, 유지" [25]. 이 6단계 접근법은 성인 학습 이론을 사용하여 절차적 능력의 개발, 평가 및 유지보수의 필요성을 강화한다.

A recent systematic review showed strong evidence for the use of simulation and competency-based teaching paradigms in the effective teaching of procedural skills [26]. The systematic review found that the most effective approach in aligning procedural skills training with the needs of the adult learners is high-quality simulation that includes repetitive practice, mastery of learning, and deliberate practice, supplemented by visual aids, such as videos [26]. Sawyer et al. (2016) developed a six- step approach to teaching a skill that combines preparation, skill acquisition, and maintenance of the skill: “Learn, See, Practice, Prove, Do, Maintain” [25]. This six-step approach uses adult learning theory to reinforce the need for the development, assessment and maintenance of procedural skills:


1. 학습: 지식 습득

2. 보기: 프로시져 관찰

3. 연습: 시뮬레이션을 사용하여 신중한 연습

4. 입증: 역량 평가

5. 하기: 환자에게 시술은 학습자가 독립적으로 시술하도록 위임될 때까지 직접 감독하여 수행한다.

6. 유지: 지속적인 임상 실습, 시뮬레이션 기반 교육으로 보완.


1. Learn: knowledge acquisition

2. See: observation of the procedure

3. Practice: deliberate practice using simulation

4. Prove: competency is assessed

5. Do: the procedure is performed on a patient, with direct supervision until the learner is entrusted to perform the procedure independently

6. Maintain: continued clinical practice, supplemented by simulation-based training.


결론 

Conclusion


임상 및 절차적 기술에서의 역량 획득은 의료 훈련의 기본이다. 임상 환경에서는 다른 사람에게 기술을 가르쳐야 하는 요건이 있기 때문에 이를 가장 효과적으로 하는 방법을 배우는 것이 중요하다. 시뮬레이션은 환자 위해의 위험 없이 절차를 연습할 수 있는 기회를 제공하며, 일반적으로 훈련과 평가 도구로 사용된다. 단계적 구조 접근법을 사용하는 것이 기술 습득과 유지를 가장 잘 안내한다는 것은 오래 전부터 주장되어 왔다. 페이튼의 4단계 접근법[7]과 같은 프레임워크는 기술의 가르침을 별개의 단계로 해체할 수 있는 유용한 모델이다. 피드백의 제공은 현재와 원하는 성능의 차이를 줄이는데 필수적이다. 일단 기술이 습득되면, 기술의 성과를 유지하고 향상시키기 위해서는 신중한 연습이 중요하다.

Acquisition of competency in clinical and procedural skills is fundamental to healthcare training. In the clinical setting, there is a requirement to teach skills to others, so it is important to learn how to do this most effectively. Simulation offers the opportunity to practice procedures without any risk of patient harm, and is commonly used as both a training and assessment tool. It has long been posited that using a stepped structural approach best guides skills acquisition and retention. A framework, such as Peyton’s four-step approach [7], is a useful model to break the teaching of a skill into discrete steps. The provision of feedback is essential in reducing the gap between current and desired performance. Once skills are acquired, deliberate practice is important in maintaining and improving the performance of a skill.


테이크홈 메시지

Take home message


• 기술은 다른 사람을 가르칠 때 더 작은 단계로 세분되어야 하며, 예를 들어, 파이튼의 4단계는 유용한 접근법을 제공한다.

• 예를 들어, 펜들턴의 모델을 사용하는 건설적인 피드백의 제공은 기술 교육 과정의 필수적인 부분이다.

• 일단 스킬을 습득한 후에는 의도적 연습을 통해 스킬을 유지해야 한다.


• Skills need to be broken down into smaller steps when teaching others, and the use of frameworks, for example, Peyton’s four steps provide useful approaches.

• Provision of constructive feedback, for example, using Pendleton’s model is an integral part of the skills teaching process.

• Once skills are acquired, they must be maintained through deliberate practice.







Review
 
. 2020 Dec 3;20(Suppl 2):458.
 doi: 10.1186/s12909-020-02284-1.

Tips for teaching procedural skills

Affiliations 

Affiliations

  • 1The University of Sydney, Faculty of Medicine and Health, Sydney Medical School - Education Office, The University of Sydney, Edward Ford Building A27, Sydney, NSW, 2006, Australia. Annette.burgess@sydney.edu.au.
  • 2The University of Sydney, Faculty of Medicine and Health, Sydney Health Professional Education Research Network, The University of Sydney, Sydney, Australia. Annette.burgess@sydney.edu.au.
  • 3The University of Sydney, Faculty of Medicine and Health, Sydney Health Professional Education Research Network, The University of Sydney, Sydney, Australia.
  • 4The University of Sydney, Faculty of Medicine and Health, The University of Sydney, Sydney, Australia.
  • 5The University of Sydney, Faculty of Medicine and Health, Sydney Medical School - Education Office, The University of Sydney, Edward Ford Building A27, Sydney, NSW, 2006, Australia.
  • 6The University of Sydney, Faculty of Medicine and Health, Sydney Medical School, Central Clinical School, The University of Sydney, Sydney, Australia.
Free PMC article

Abstract

The teaching of procedural skills required for clinical practice remains an ongoing challenge in healthcare education. Health professionals must be competent to perform a wide range of clinical skills, and are also regularly required to teach these clinical skills to their peers, junior staff, and students. Teaching of procedural skills through the use of frameworks, observation and provision of feedback, with opportunities for repeated practice assists in the learners' acquisition and retention of skills. With a focus on the teaching of non-complex skills, this paper explores how skills are learned; ways to improve skill performance; determining competency; and the provision of effective feedback.

Keywords: Deliberate practice; Determining competency; Peyton’s four-step approach; Procedural skills teaching; Provision of feedback.


임상 교육의 주요 팁(BMC Med Educ, 2020)

Key tips for teaching in the clinical setting

Annette Burgess1,2*, Christie van Diggele2,3, Chris Roberts1,2 and Craig Mellis4




배경 Background

비록 시뮬레이션이 건강 전문 교육에 점점 더 많이 사용되고 있지만, 오랫동안 유지되어온 실제 환자들의 참여로 가르치는 전통은 여전히 귀중한 것으로 남아 있다. 침상 및 외래 환자와 같은 임상 환경 내의 가르침은 의료 교육의 핵심에 위치하여 임상 교육에 필수적인 요소를 제공한다. 이 튜토리얼은 학생들이 임상 환경의 문화와 사회적 측면에 적응하도록 하고, 연습을 준비하면서 학생들의 직업적 가치를 형성한다[1]. 이들은 학생들에게 임상 활동에 참여할 수 있는 의미 있는 기회, 의사소통 능력, 병력청취, 신체검사 능력 등을 연습하고 개발할 수 있는 기회를 제공한다. 그러나 임상 환경에서 학생들의 학습은 주로 그들에게 제공되는 정서적, 교육적, 조직적 지원에 의존한다 [2,3,4,5,6].

Although simulation is increasingly used in health professional education, the long-held tradition of teaching with the involvement of real patients, remains invaluable. Teaching within the clinical setting, such as bedside and out-patient clinic, lies at the heart of healthcare education, providing a vital component to clinical training. These tutorials orientate students to the culture and social aspects of the clinical environment, and shape students’ professional values as they prepare for practice [1]. They offer students meaningful opportunities to participate in clinical activities, practicing and developing their communication skills, history taking and physical examination competence. However, students’ learning in the clinical environment is largely dependent upon the affective, pedagogic and organisational support afforded to them [2,3,4,5,6].


참여가 사회화 과정을 수반하는 임상 환경에서 의료 커리큘럼 내에서는, 피어 및 니어-피어 튜터링이 특히 서포트의 원천source로서 잘 수용된다[3, 6]. 임상 과외는 자신의 건강 전문직과 조직의 기대되는 문화와 직업적 가치를 증명하는 사회화 요원socializing agents으로 활동한다. 즉, 피어투피어(Peer-to-Peer) 또는 임상의와 학생 사이에 있는 임상 지도교사들이 '숨겨진 커리큘럼'의 주요 구성요소를 보여준다[7]. 본 논문의 목적은 동료 및 근거리 동료 교육에 관련된 보건 전문 학생과 초기 직업 보건 전문가에게 임상 환경에서 가르치기 위한 접근법과 핵심 팁의 개요를 제공하는 것이다. 임상 환경에서는 학생들이 개발한 역량이 많지만, 우리의 가르침은 의학 지식, 대인관계 및 의사소통 능력, 전문성 분야에 초점을 맞추고 있다.

Peer and near peer tutoring are well accepted as sources of support within healthcare curricula, particularly in the clinical setting, where participation involves a process of socialisation [3, 6]. Clinical tutors act as socialising agents, demonstrating the expected culture and professional values of their respective health professions, and their organisation. That is, clinical tutors, whether peer-to-peer, or clinician to student, demonstrate key components of the ‘hidden curriculum’ [7]. The aim of this paper is to provide health professional students and early career health professionals involved in peer and near peer teaching, with an overview of approaches and key tips for teaching in the clinical setting. Although there are many competencies developed by students in the clinical setting, our tips for teaching focus on the domains of medical knowledge, interpersonal and communication skills, and professionalism.


환자와 함께 강의하기 위한 팁

Tips for teaching with patients


입원 및 외래 환자(사무실 기반)의 가르침은 임상 환경에서 기본적인 교육방법으로 남아 있으며, 임상 실습의 많은 측면을 가르치고 모델링할 수 있다[8]. 진단 과정과 환자 치료에서 전체적인 접근방식이 제공되며, 여기에는 이력서, 신체검사 기술 및 직업적 태도가 결합된다[8]. 일반적으로, 환자들은 가르치는 과정에 포함되는 것을 즐긴다. 기본적으로 환자와 함께 가르치는 것은 세 가지 핵심 학습 영역을 가르침과 통합할 수 있게 해준다 [9].

Bedside and out-patient (office-based) teaching remains a primary teaching modality in the clinical setting, where many aspects of clinical practice can be taught and modelled [8]. A holistic approach in the diagnostic process and patient care is provided in bedside teaching, where history taking, physical examination skills and professional attitude are combined [8]. As a general rule, patients enjoy being included in the teaching process. Essentially, teaching with patients permits three key learning domains to be integrated with teaching [9]:


1. 임상(지식과 기술)

2. 전문성(팀워크, 윤리적 고려)

3. 의사 소통(직원 및 환자와의 소통)

1. Clinical (knowledge and skills).

2. Professionalism (teamwork, ethical considerations).

3. Communication (with staff and patients).


의료계열 학생들은 특히 환자가 적대적이거나, 화가 나거나, 비협조적이거나, 무관심하거나, 지나치게 말이 많거나, 만성적인 고통을 경험하는 경우, 일부 환자들과의 상호작용이 어렵다challenging고 생각한다[10]. 환자와 함께 강의할 때 고려해야 할 중요한 사항은 다음과 같다.

Healthcare students find interactions with some patients to be challenging, particularly if the patient is hostile, angry, uncooperative, disinterested, overly talkative, or experiencing chronic pain [10]. When teaching with a patient there a number of important considerations:


  • 상호작용이 "핵심적 교육 순간"으로 통합되고, 교사들이 학생들의 의사소통 능력 향상을 도울 수 있는 기회[11]

  • 교육에 대한 환자의 참여와 환자 중심성 보장 [12]

  • 환자가 있든 없든 환자의 안락과 권리를 존중한다 [13, 14]

  • 항상 환자의 동의를 얻으십시오.

  • 명확한 커뮤니케이션을 통해 환자가 자신의 역할을 수행할 준비가 되어 있는지 확인하십시오.

  • 환자가 질문을 하고 피드백을 할 수 있도록 허용

  • 환자가 이해할 수 있는 적절한 언어 사용

  • 교육 세션에 대한 구체적 목적/목적을 가지고 있음

  • 학생의 과제와 시간을 파악하여 학생이 환자와 함께 보내는 시간 제한

  • 환자로부터 멀리 떨어진 학생에게 피드백(특히 부정적인 피드백) 제공

  • 그룹 앞에서 일부 환자 상태에 대해 논의하는 것은 적절하지 않을 수 있다는 점을 유념하십시오.


  • Incorporate interactions as “key teaching moments”, with opportunities for tutors to help students develop competence in communication skills [11]

  • Ensure patient involvement in education, and patient centredness [12]

  • Respect the comfort and rights of patients, whether in the presence of the patient, or otherwise [13, 14]

  • Always obtain the patient’s consent

  • Ensure the patient is prepared for their role through clear communication

  • Allow the patient to ask questions and give feedback

  • Use appropriate language that the patient can understand

  • Have a specific purpose/objective for the teaching session

  • Limit the time the student spends with the patient by identifying the tasks and timeframe for the student

  • Provide feedback (particularly negative feedback) to the student away from the patient

  • Be aware that it may not be appropriate to discuss some patient conditions in front of a group


임상 지도교사의 역할 중 일부는 의료 분야로의 사회화 과정을 촉진하여, 의료 분야에서 학생들의 현재와 미래의 역할과 관련된 정체성을 형성하는 것이다 [15,16,17,18,19,20]. 튜터들은 학생들의 학습을 육성하는 책임을 맡기고 학생들의 태도, 가치관, 전문적 역량 개발을 돕는다. 긍정적 역할 모델의 세 가지 핵심 특성은 다음을 포함한다.

Part of the role of clinical tutors is to facilitate the process of socialisation into the healthcare profession, creating a sense of identity relating to the students’ current and future roles in healthcare [15,16,17,18,19,20]. Tutors are entrusted with responsibilities to foster students’ learning, helping to develop students’ attitudes, values and professional competencies. Three core characteristics of a positive role model include [15,16,17,18,19,20]:


1. 임상 속성

2. 개인적 자질

3. 교수기술

1. Clinical attributes

2. Personal qualities

3. Teaching skills


환자에 대한 공감, 존중 및 연민을 포괄하는 인문학적 행동의 표시는 학생들에게 가장 중요하다. 임상 과외 교사의 바람직하지 않은 행동에는 튜터 중심의 환자 상호작용, 학생의 굴욕, 동료에 대한 부정적 발언이 포함된다[18, 24]. 표 1은 의료 전문 교육에서 확인된 롤모델로서의 임상 교사의 긍정적 및 부정적 속성을 요약한다[18, 27]. 

Displays of humanistic behaviours, encompassing empathy, respect and compassion for patients are of the utmost importance to students [16,17,18, 21,22,23,24,25,26]. Undesirable behaviours by clinical tutors include tutor-centred patient interactions; the humiliation of students; and negative remarks about colleagues [18, 24]. Table 1 summarises positive and negative attributes of clinical teachers as role models, identified within health professional education [18, 27]. 


표 1 역할 모델로서의 임상 교사의 긍정적 및 부정적 속성

Table 1 Positive and negative attributes of clinical teachers as role models



교육 계획을 위한 팁

Tips for planning teaching


교육 세션이 잘 계획되어 있고 모든 평가가 학습 성과 및 내용과 일치하는지 확인하십시오 [28]. 중요한 고려사항은 다음과 같다.

Ensure that your teaching session is well planned and any assessments are aligned with the learning outcomes and content [28]. Important considerations include:


  • OAS(Outcomes, Activity, Summary)와 같은 프레임워크의 사용(표 2)

  • 당신의 강의 세션은 이전(예: 강의)과 미래의 학습 활동(예: 형태 형성 평가)과 어떻게 연결될 것인가?

  • '지식'이 '실력'과 '성격'보다 더 쉽게 전달되고 평가되는 가운데, 어떻게 지식, 기술, 태도의 가르침을 세션에 통합할 것인가[29]

  • 교사, 학습자, 환자의 역할은 무엇이며, 각 개인은 세션에 어떻게 기여할 것인가?

  • 별도 고려가 필요한 교육환경의 측면이 있는가? 여기에는 학생이 침대 옆이나 외래환자실에 어떻게 배치되는지, 환자 기밀 유지, 브리핑 및 보고가 이루어지는 장소(자습서실 예약이 필요할 수 있음)가 포함될 수 있다.


  • Use of a framework, such as ‘Outcomes, Activity, Summary’ (OAS) (Table 2).

  • How will your teaching session link to previous (for example, lectures) and future learning activities (for example, formative assessments)?

  • How will you incorporate the teaching of knowledge, skills and attitudes (Fig. 1) into your session, with ‘knowledge’ being more easily imparted and assessed than ‘skills’ and ‘attitudes’ [29]

  • What will be the role of the teacher, the learner, and the patient, and how will each individual contribute to the session?

  • Are there aspects of the teaching environment that require consideration? These might include how the students will be placed around the bedside, or in the outpatient room; patient confidentiality; and where briefing and debriefing will take place (booking of a tutorial room may be required).


표 2 강의 계획 및 강의에 대한 'OAS' 방법

Table 2 The ‘OAS’ method for lesson planning and teaching


그림 1. 쉽고 어려운 교육, 학습 및 지식, 기술 및 태도 평가

Fig. 1 Ease and difficulty of teaching, learning and assessing knowledge, skills and attitude



교육 전략에 대한 팁

Tips for teaching strategies


외래환자/사무실 환경에서 사례발표를 위해 학습자 중심의 교육모델을 위한 니모닉으로 개발된 SNAPPS(그림 2)와 같은 적절한 교육전략을 적용한다[30]. SNAPPS 형식의 이점은 다음과 같다.

Apply an appropriate teaching strategy, such as SNAPPS (Fig. 2), developed as a mnemonic for a learner-centred teaching model for case presentations in the outpatient/office setting [30]. The benefits of the SNAPPS format include:

  • 학생이 체계적이고 간략히 발표하도록 장려하다.

  • 학습자가 자신의 지식 격차를 탐색하고 표현하도록 한다(즉, 학생이 자신의 불확실성에 대해 튜터를 "평가"함).

  • 전통적인 튜터 상호작용에 비해 학습자들은 더 적극적으로 참여하고 더 많은 질문을 한다.

  • 개인 교사들이 각 학습자의 특정한 개별적 니즈를 다룰 수 있도록 한다[30].


  • encourages a structured and brief presentation by the student

  • engages the learner to explore, and express their own knowledge gaps (that is, the student “probes” the tutor about their uncertainties)

  • compared to more traditional tutor interactions, learners are more actively involved, and ask more questions

  • enables tutors to address each learners’ specific, individual needs [30].


Fig. 2 The SNAPPS model [30]



임상적 추리

Clinical reasoning


학습자의 임상적 추론[31, 32] - 환자의 제시 문제에 대한 진단과 관리의 기초가 되는 인지 프로세스를 촉진하기 위해 최선을 다하십시오. 이 프로세스에는 다음이 포함된다.

Do your best to promote the learners’ clinical reasoning [31, 32] - the cognitive process underlying diagnosis and management of a patient’s presenting problem. The process involves:


  • 데이터 수집

  • 진단 추론

  • 치료 추론

  • 개입 계획 및 권고

  • The collection of data

  • Diagnostic reasoning

  • Therapeutic reasoning

  • Planning intervention and recommendations


환자 치료에 지식을 통합하고 적용하는 과정은 학생들이 습득하기 복잡하고 어려운 기술이다 [32,33,34]. 특히 환자 상호작용 중에는 학생들이 환자 정보를 탐색하기 어렵다. 임상추론을 촉진하는 세 가지 주요 방법이 있다[24, 31, 35](그림 3):

The process of integrating and applying knowledge to patient care is a complex, difficult skill for students to acquire [32,33,34]. In particular, it is difficult for students to navigate patient information during patient interactions. There are three main ways to promote clinical reasoning [24, 31, 35] (Fig. 3):


1. 학습자 설명: 학습자는 그들의 사고 과정을 설명하여, 과외자가 학습자의 추리 능력을 관찰할 수 있게 하고, 그들이 결론을 내리기 위해 취하는 과정을 말한다.

2. 역할 모델링: 튜터 역할은 그들의 추리를 설명하면서 그들 자신의 사고 과정을 모델링한다.

3. 학습자에게 질문하기: 튜터교사는 질문을 사용하여 "만약에?"라는 질문을 던진다.


1. Learner explanation: The learner explains their thinking process, allowing the tutor to observe the learner’s reasoning ability, and the process they take to form a conclusion.

2. Role modelling: The tutor role models their own thinking process, explaining their reasoning (‘thinking aloud’).

3. Questioning the learner: The tutor uses questioning to promote reasoning, “what if?” questions are asked.


그림 3 임상적 추론을 촉진하기 위한 세 가지 팁

Fig. 3 Three tips for promoting clinical reasoning



페이튼의 모델 [36]에서 채택된 임상 추론을 가르치는 제안된 프레임워크는 표 3에 나와 있다. 또한 임상 추론을 가르치는 것은 개인교사들이 자신의 임상 추론기술을 되돌아볼 수 있는 좋은 기회를 제공한다. 반성의 이점은 가정 회피, 불필요한 조사의 감소 및 진단 시간 단축을 포함할 수 있다[34].

A suggested framework for teaching clinical reasoning [34], which was adapted from Peyton’s model [36], is shown in Table 3. Teaching clinical reasoning also provides an excellent opportunity for tutors to reflect on their own clinical reasoning skills. The benefits of reflection may include the avoidance of assumptions, reduction of unnecessary investigations, and improvement in time to diagnosis [34].


표 3 임상 추론 프레임워크 (Linn 등, 2012에서 채택) [34]

Table 3 Clinical reasoning framework (adapted from Linn et al., 2012) [34]



평가 전략 팁 Tips for assessment strategies


평가는 배움의 주요 원동력을 제공한다. 학습한 정보와 기술을 보강하고, 학습자에게 강점과 약점 영역에 대한 정보를 제공하며, 교사에게 재교육이 필요할 수 있는 영역에 대한 정보를 제공한다[14, 37]. 평가 활동이 학생에게 가치가 있으려면, 이러한 결과에 대한 성과 지표와 개선 방법에 대한 지침이 필요하다 [37,38,39].

Assessment provides a key driving force for learning. It reinforces the information and skills learned, provides the learner with information on their areas of strength and weakness, and provides the teacher with information on areas that may need to be re-taught [14, 37]. In order for the assessment activity to be worthwhile students need clear outcomes, an indication of their performance against these outcomes and guidelines on how to improve [37,38,39].


평가의 효용성 또는 유용성은 신뢰성, 타당성, 비용 효율성, 수용성, 교육적 영향 및 타당성의 산물로 정의되었다[40,41,42,43]. 학생을 위한 적절한 평가를 선택하고 작성할 때 고려해야 할 요인은 다음과 같다

The utility or usefulness of an assessment has been defined as a product of its reliability, validity, cost-effectiveness, acceptability, educational impact and feasibility [40,41,42,43]. Factors to consider when selecting and creating an appropriate assessment for students include [14]:


1. 신뢰도: 유사한 상황에서 반복될 경우 평가에서 얻은 점수의 재현성을 의미한다[41].

1. Reliability: refers to the reproducibility of the scores obtained from an assessment if repeated under similar circumstances [41].


2. 타당도: 도구가 실제로 의도하는 바를 측정하는지를 의미한다. 타당도 증거는 특정 목적에 대한 평가 결과의 사용을 뒷받침한다[43].

2. Validity: refers to whether an instrument actually does measure what it is purposed to [41]. Evidence of the validity supports the use of the results of an assessment for a particular purpose [43].


3. 실현가능성: 사정 및 맥락으로 볼 때 평가가 실제적이고 현실적이며 합리적인지 여부를 가리킨다[43]. 이상적인 평가에 대한 제약조건은 심사관의 가용성, 자료 개발을 위한 학문의 시간, 평가를 구현하기 위한 행정 자원, 교수진 훈련 요건 및 평가 분석[42]이다.

3. Feasibility: refers to whether the assessment is practical, realistic, and sensible, given the circumstances and context [43]. Constraints on an ideal assessment include availability of examiners, the time of academics to develop the material, administrative resources to implement assessments, faculty training requirements and analysis of assessment [42].


4. 수용성: 평가, 평가 과정 및 결과가 이해관계자에 의해 신뢰할 수 있는 것으로 간주되는 정도를 말한다[43].

4. Acceptability: refers to the extent to which the assessment, the assessment process and results are considered credible by the stakeholders [43].


5. 교육적 영향: 평가가 학습자와 커리큘럼에 미치는 교육적 영향을 의미한다. 예기치 않은 영향을 포함한다[40].

5. Educational impact: refers to the educational effects of assessment on both the learner and the curriculum; including unexpected impacts [40].


6. 평가 비용: 시험 시간뿐만 아니라 시험 생산 비용 측면에서도 중요한 자원 영향을 미치는 장기 시험을 말한다. 이는 지속 가능한 방식으로 자원의 효과적인 사용에 대한 결정에 영향을 미친다 [40].

6. The cost of an assessment: refers to lengthy tests having major resource implications, both in terms of testing time as well as in terms of cost to produce these tests. This impacts decisions on the effective use of resources in a sustainable way [40].


임상 환경에서 형성적 평가 방법

Formative assessment methods in the clinical setting


형성 평가는 학습자에게 특정 시점에서 진행 상황을 알려주는 강력한 도구를 제공한다[14]. 최근 몇 년 동안 형성평가는 임상 환경에 맞게 재구성되고 공식화되었다[44]. 이러한 개선은 기존의 [느슨하게 계획된 임상 실습]에서 [사전 설정된 성과의 달성과 연계된 커리큘럼 기반 경험]으로 진화했다. 임상 환경에서 직접 관찰에 기초한 피드백을 제공하기에 적합한 잘 기술된 많은 형태 형성적 평가 방법(표 4)이 최근 몇 년 동안 개발되었다[45]. 학습자의 성과와 능력을 잘 이해하기 위해, 형성적 평가가 여러 번 이루어진다. 이를 통해 평가자는 의사소통 기술, 절차 기술, 전문성 수준, 임상 기술 및 일반적인 역량을 관찰하고 모니터링할 수 있는 여러 기회를 가질 수 있다.

Formative assessment offers a powerful tool to inform the learner of their progress at a particular point in time [14]. In recent years, formative assessments have been reshaped and formalised to suit the clinical setting [44]. These improvements have evolved from a previously loosely planned clinical immersion, to a curriculum-based experience linked to achievement of pre-determined outcomes. A number of well described formative assessment methods (Table 4), suitable for providing feedback based on direct observation in the clinical setting, have been developed in recent years [45]. In order to gain a well-rounded understanding of a learner’s performance and ability, increasingly, formative assessment takes place over multiple occasions. This allows the assessor to have multiple opportunities to observe and monitor communication skills, procedural skills, levels of professionalism, clinical skills and general competence [38, 39, 46].


표 4 형성 평가 방법의 예

Table 4 Examples of formative assessment methods



효과적인 피드백 제공에 대한 팁

Tips for provision of effective feedback


학생에 대한 피드백은 학습 과정의 중요한 부분을 형성하며, 항상 임상 튜토리얼에 포함되어야 한다. 효과적인 피드백 제공에 대한 팁은 표 5에 요약되어 있다. 피드백이 임상 성과에 미치는 영향을 탐구하는 메타 분석에서는 피드백 제공이 포함된 연구의 75% 이상에 긍정적인 영향을 미친다는 것을 발견했다[47]. 효과적이고 규칙적인 피드백은 자기 성찰을 촉진하고, 좋은 관행을 강화하며, 학습자가 요구되는 결과를 향해 연습하도록 지시할 수 있는 잠재력을 가지고 있다[37]. 

Feedback to students forms a crucial part of the learning process, and should always be included within clinical tutorials. Tips for provision of effective feedback are outlined in Table 5. A meta–analysis exploring the effect of feedback on clinical performance found that the provision of feedback had a positive impact in over 75% of the included studies [47]. Effective and regular feedback has the potential to promote self-reflection, reinforce good practice; and directs the learner to practice towards the required outcome [37]. 


피드백은 즉각적이고, 직접적인 관찰에 기초할 때 학생들의 행동에 가장 큰 영향을 미친다[37, 48]. 펜들턴의 모델[49]과 같은 기존 피드백 프레임워크는 학습자 중심이며, 학습자가 자신의 수행practice을 평가할 수 있는 기회를 제공한다. 먼저, 튜터는 학습자에게 무엇을 잘했다고 생각하는지 물어본 다음, 잘한 부분을 설명하고, 학습자에게 어떻게 개선할 수 있는지 물어본 다음, 학습자에게 어떻게 개선할 수 있는지 제안한다. 어떤 피드백 모델을 선택하든, 가정교사의 피드백은 정직하고, 서술적이고, 구체적이어야 한다.

Feedback has the greatest impact on students’ behaviour when it is based on direct observation, and is immediate [37, 48]. Existing feedback frameworks, such as Pendleton’s model [49] is learner-centred, and offers the learner the opportunity to evaluate their own practice. First, the tutor asks the learner what they think they did well, then describes areas that were done well; then the tutor asks the learner how they could improve, and then suggests to the learner how they can improve. Whatever model of feedback is chosen, feedback from the tutor should be honest, descriptive and specific.


표 5 효과적인 피드백 제공을 위한 팁

Table 5 Tips for provision of effective feedback



결론 Conclusion


임상 환경에서의 가르침, 특히 침상 옆 교육은 환자, 학생, 교사들에 의해 귀중한 가르침 방법으로 간주된다. 학습을 최적화하고 학생의 참여를 극대화하기 위해 임상 환경에서 학습 활동을 계획, 구조화 및 커리큘럼 및 평가와 연계해야 한다[50]. 학생들이 과외 교사를 관찰하고 모방하는 것을 통해 학습하기 때문에, 역할 모델링은 학생들의 학습과 행동에 영향을 미치는 중요한 역할을 한다. 임상의와 상급생에 의한 역할 모델링은 의료 학생의 전문적 역량, 가치관 및 태도 개발에 도움이 된다. 피드백은 학습 과정에서 중요한 역할을 한다. 관찰하고, 학생들에게 정확한 피드백을 제공함으로써, 실제와 원하는 수행 사이의 차이를 좁힌다.

Teaching in the clinical setting, and particularly, bedside teaching is viewed by patients, students and tutors as an invaluable teaching method. To optimise learning and maximise student engagement, learning activities in the clinical environment should be planned, structured, and aligned with the curriculum, and assessment [50]. Since students learn largely through observing and imitating their tutors, role modelling plays a critical role in influencing students’ learning and behaviour. Role modelling by clinicians, and by senior students, assists in the development of healthcare students’ professional competencies, values, and attitudes. Feedback plays a crucial role in the learning process. By observing, and providing students with accurate feedback, the gap between actual and desired performance is narrowed.


테이크홈 메시지

Take-home message


• 교육 및 학습 활동이 임상 환경에서 이루어질 때 환자의 권리가 항상 존중되는지 확인하십시오.

• 체계적인 형식으로 성공적인 교육 활동을 계획한다.

• "SNAPPS"와 같은 구조화된 교육 방법은 세션 형식을 지정하는 데 도움이 된다.

• 직접적인 관찰과 피드백 제공은 학생 학습에 필수적이다.

• Always ensure the rights of patients are respected when teaching and learning activities take place in the clinical setting.

• Successful teaching activities are well planned, with a structured format.

• Structured teaching methods, such as “SNAPPS”, help to format the session.

• Direct observation and provision of feedback is essential to student learning.








Review

 

. 2020 Dec 3;20(Suppl 2):463.
 doi: 10.1186/s12909-020-02283-2.

Key tips for teaching in the clinical setting

Affiliations 

Affiliations

  • 1The University of Sydney, Faculty of Medicine and Health, Sydney Medical School - Education Office, The University of Sydney, Edward Ford Building A27, Sydney, NSW, 2006, Australia. annette.burgess@sydney.edu.au.
  • 2The University of Sydney, Faculty of Medicine and Health, Sydney Health Professional Education Research Network, The University of Sydney, Sydney, Australia. annette.burgess@sydney.edu.au.
  • 3The University of Sydney, Faculty of Medicine and Health, Sydney Health Professional Education Research Network, The University of Sydney, Sydney, Australia.
  • 4The University of Sydney, Faculty of Medicine and Health, The University of Sydney, Sydney, Australia.
  • 5The University of Sydney, Faculty of Medicine and Health, Sydney Medical School - Education Office, The University of Sydney, Edward Ford Building A27, Sydney, NSW, 2006, Australia.
  • 6The University of Sydney, Faculty of Medicine and Health, Sydney Medical School - Central Clinical School, The University of Sydney, Sydney, Australia.

Abstract

Teaching with real patients in the clinical setting lies at the heart of health professional education, providing an essential component to clinical training. This is true of all the health disciplines - particularly medicine, nursing, dentistry, physiotherapy, and dietetics. Clinical tutorials orientate students to the culture and social aspects of the healthcare environment, and shape their professional values as they prepare for practice. These patient-based tutorials introduce students to the clinical environment in a supervised and structured manner, providing opportunities to participate in communication skills, history taking, physical examination, clinical reasoning, diagnosis and management. It is only through participation that new practices are learnt, and progressively, new tasks are undertaken. The aim of this paper is to provide health professional students and early career health professionals involved in peer and near peer teaching, with an overview of approaches and key tips for teaching in the clinical setting. Although there are many competencies developed by students in the clinical setting, our tips for teaching focus on the domains of medical knowledge, interpersonal and communication skills, and professionalism.

Keywords: Bedside teaching; Clinical reasoning; Clinical teaching; Clinical tutorials; Near-peer teaching; Peer-peer teaching; Role modelling.


임상에서 피드백(BMC Med Educ, 2020)

Feedback in the clinical setting

Annette Burgess1,2*, Christie van Diggele2,3, Chris Roberts1,2 and Craig Mellis4



배경 Background

보건전문교육에서 피드백은 "훈련자의 수행능력을 향상시키려는 의도로 주어진, 훈련생의 관찰된 수행능력과 표준의 비교에 관한 구체적인 정보"로 설명되어 왔다[1]. 피드백은 '선생님'과 '학습자' 사이의 가장 중요한 상호작용 형태 중 하나이다. 그러나 의료 및 기타 보건 전문가 학생은 임상 배치 중에 직접 관찰하고 피드백을 제공하는 경우가 거의 없다는 것이 널리 알려져 있다[2]. 따라서 피드백 촉진에 대한 관심이 증가했다[2]. 

  • 피드백 제공은 학습 과정의 필수적인 부분을 형성하며(그림 1) [2] 실제 성과와 원하는 성과 사이의 격차를 줄이는 데 도움이 된다. 

  • 피드백 프로세스는 학습자에게 수행 품질에 대한 정보를 제공하고 학습 전략의 개선을 이끈다. 

  • 피드백은 학습자의 효과적인 의사결정을 지원하고 학습 성과를 개선하는 데 도움이 된다. 

  • 피드백은 학습자에게 자신의 수행에 대한 판단을 제공하여 교육적 진보를 돕는 강력한 도구 역할을 한다. 

그러나 건강 전문 교육자, 학생 및 동료들은 피드백 실천을 통해 하나 또는 다른 하나로부터 배우는 것이 어렵다는 것을 발견할 수 있다[3]. 피드백 연습은 종종 지속 불가능하고 학생들에게 활력을 잃게 한다[3, 4]. 피드백을 평가하고 제공하는 능력은 학습된 기술로서 적절한 수준의 훈련을 필요로 한다.

Within health professional education, feedback has been described as “Specific information about the comparison between a trainee’s observed performance and a standard, given with the intent to improve the trainee’s performance” [1]. Feedback is one of the most important forms of interactions between the ‘teacher’ and the ‘learner’. However, it has been widely reported that medical and other health professional students are rarely directly observed and given feedback during their clinical placements [2]. Accordingly, there has been increased interest in the facilitation of feedback [2]. Provision of feedback forms an integral part of the learning process (Fig. 1) [2], helping to narrow the gap between actual and desired performance. The feedback process engages the learner with information about the quality of their performance, and leads to improvements in learning strategies. Feedback supports learners’ effective decision making, and helps to improve learning outcomes. It serves as a powerful tool to provide the learner with judgements on their performance, assisting in their educational progress. However, health professional educators, students and peers can find it difficult to learn from one and other through feedback practices [3]. Feedback practices are often unsustainable, and de-motivating for students [3, 4]. The ability to assess and provide feedback is a learnt skill, requiring an appropriate level of training.


이 논문은 학습 과정 내에서 피드백의 역할, 피드백 프로세스에 대한 장벽, 피드백을 용이하게 하기 위한 실용적인 가이드라인을 간략히 탐구한다.

This paper briefly explores the role of feedback within the learning process, barriers to the feedback process, and practical guidelines for facilitating feedback.



피드백의 목적 Purpose of feedback

피드백은 학습을 지원하고 강화하는 교육 과정의 지속적인 부분으로 작용한다[5]. 그것은 별도의 교육 유닛이 아니라 지속적인 교육 및 평가 단위의 일부분이다[6]. 형성 평가의 핵심 요소로서[7], 피드백은 세 가지 방법으로 학습을 촉진한다[5].

Feedback acts as a continuing part of the instructional process that supports and enhances learning [5]. It is part of an ongoing unit of instruction and assessment, rather than a separate educational entity [6]. A core component of formative assessment [7], feedback promotes learning in three ways [5]:


• 학생에게 진행 상황을 알린다

• 개선을 위한 관찰된 학습 니즈를 학생에게 통지

• 학생이 적절한 학습 활동에 참여하도록 동기 부여

Informs the student of their progress

Informs the student regarding observed learning needs for improvement

Motivates the student to engage in appropriate learning activities


피드백을 위한 지원 환경 조성

Creating a supportive environment for feedback

지속가능하고 의미 있는 피드백의 필수요건은 [피드백 제공]에서 [피드백의 촉진을 촉진하는 학습 환경의 설계]로 초점을 이동시킨다[3]. 개별적인 정보 제공과 리셉션을 촉진하기보다는 피드백을 적극적 학습의 촉진으로 보아야 한다. 교사는 학생과 동료, 학생과 교직원 간의 상호작용을 촉진할 책임이 있다. 학생들이 스스로 변화의 주체로 보고 자율규제를 강화하고 스스로 학습을 추진하는 학습 환경이 조성돼야 한다. 높은 수준의 학생참여를 육성하면 피드백을 찾고 자신의 성과를 성찰하는 능동적proactive '학습자'로서의 학생의 정체성을 발전시키는 데 도움이 된다.

Requirements for sustainable and meaningful feedback shifts the focus from the provision of feedback to the design of the learning environment that promotes facilitation of feedback [3]. Rather than facilitating individual acts of information provision and reception, feedback should be viewed as the promotion of active learning. Teachers are responsible for fostering interactions between students and their peers, and students and staff. Learning environments should be created where students see themselves as agents of their own change, fostering self-regulation and driving their own learning. Fostering high levels of student engagement helps to develop the identity of students as proactive ‘learners’, who seek feedback and reflect on their own performance.


피드백 프로세스에 대한 장벽

Barriers to the feedback process

피드백의 과정은 상호 작용과 방향을 필요로 하며 임상 교육에 필수적인 것으로 보아야 한다. 피드백이 없을 때, 학습자에게 새로운 임상 환경의 불확실성이 심화된다. 피드백 프로세스에 다음과 같은 여러 가지 장벽이 있을 수 있다.

The process of feedback requires interaction and direction, and should be viewed as essential to clinical education. In the absence of feedback, the uncertainty of a new clinical environment for a learner is intensified. There may be a number of barriers to the feedback process, including:


작업에 대한 직접적인 관찰 부족 피드백은 특정 과제의 직접적인 관찰에 기초하여 제공되었을 때 학생들의 행동에 가장 큰 영향을 미친다[2]. 바쁜 임상 환경에서는 직접 관찰이 부족한 경우가 많다.

Lack of direct observation of tasks. Feedback has the greatest impact on students’ behaviour when it is provided based on direct observation of a specific task [2]. In the busy clinical setting, direct observation is often lacking.


• 정직하고 비판적인 피드백을 통해 학생들의 기분을 상하게 하지 않으려는 욕구[2]. 피드백은 학습자의 성적이 수준 이하일 때 제공하기가 더 어려울 수 있으며, 학습자에게 실망스러울 수 있다. 그러한 피드백을 제공하려면 프로세스와 기술에 대한 이해가 필요하다. 학습자의 기분을 상하게 하지 않으려는 욕구가 있을 수 있지만, 의미 있는 피드백을 피하는 "바니싱 피드백"[8]이 될 수 있다.

The desire to avoid upsetting students with honest and critical feedback [2]. Feedback can be more difficult to provide when the learner’s performance is below par, and may be disappointing to the learner. The provision of such feedback requires an understanding of the process, and skill. Although there may be a desire to avoid upsetting a learner, this can result in “vanishing feedback” [8], where meaningful feedback is avoided.


외부 피드백 부족. 외부 피드백이 없으면 학생들은 그들 자신의 피드백을 생성할 수 있지만, 자기 평가는 종종 틀린다[4]. 높은 수행자는 자신의 수행 능력을 과소평가하는 경향이 있고, 낮은 수행자는 과대평가하는 경향이 있다[9].

Lack of external feedback. Without external feedback, students may generate their own feedback - but, self-assessment is often wrong [4]. High performers tend to underestimate their own performance, and lower performers tend to overestimate [9].


학습자 피드백 수신

Learner reception of feedback

피드백을 주는 것과 비슷하게, 피드백을 받는 것은 수동적이고 단순한 행동이 아니다. 피드백 수용은 임상기술의 연습과 향상에 대한 솔직한 자기반성과 헌신을 수반한다. 학습자들은 항상 피드백을 받을 준비가 되어 있지 않으며, 더 중요한 것은 피드백을 받아들일 준비가 되어 있지 않다. 또한 피드백에 대한 상황 및 관계적 측면이 있을 수 있다[10]. 분명히, 피드백의 수용과 효과는 제공자의 인식된 신뢰도에 따라 달라질 수 있다[10]. 학습자는 제공자가 커리큘럼과 학습 목표를 잘 이해하고 있다고 인식하면 피드백을 더 잘 수용한다.

Similar to giving feedback, receiving feedback is not a passive, simple act. It entails honest self reflection and commitment to practice and improvement of clinical skills. Learners are not always prepared for receiving, and more importantly, accepting feedback. Additionally, there may be contextual and relational aspects regarding the feedback [10]. Clearly, acceptance and effectiveness of the feedback may be dependent upon the perceived credibility of the provider [10]. The learner is more accepting of the feedback if they perceive the provider to have a good understanding of the curriculum, and the learning objectives.


학생 피어 투 피어 피드백

Student peer-to-peer feedback

[또래 학생들에게 피드백을 제공하는 연습]은 학생들에 의해 지식, 기술 및 전문적 속성의 발전에 이로운 것으로 인식된다[11]. 동료에게 피드백 제공을 연습함으로써 학생들에게 높은 수준의 책임을 강화시킬 수 있으며 [11, 12] 일부 학생들은 인식적 이득을 보고한다[11,12,13]. 그러나, 놀랄 것도 없이, 또래 피드백의 정직성과 정확성에 관한 실질적인 우려가 있다[11,12,13,14,15]. 학생들이 또래 학생들에게 건설적인 피드백을 제공할 수 없는 것은 훈련 부족과 사회적 불편함 둘 다에 기인한다[16]. 분명히, 학생들은 동료들에게 부정적인 피드백을 제공하는 것, 그들의 피드백의 질, 그리고 이러한 부정적인 피드백이 동료들의 질문에 미치는 결과에 대해 매우 우려하고 있다[11, 17]. 다행히도, 학생들은 동료들에게 피드백을 제공하기 위해 구조화된 방법을 사용하는 것이 유용하다는 것을 발견한다 [10, 11].

The practice of providing feedback to peers is perceived by students as beneficial to development of knowledge, skills, and professional attributes [11]. Provision of feedback from peers can foster high levels of responsibility in students [11, 12], and some students report metacognitive gains [11,12,13]. However, unsurprisingly, there are real concerns regarding the honesty and accuracy of peer feedback [11,12,13,14,15]. The inability of students to provide constructive feedback to peers has been attributed to both inadequate training, and social discomfort [16]. Obviously, students are very concerned about providing negative feedback to their peers, the quality of their feedback, and the consequences of this negative feedback on their peers’ progession [11, 17]. Fortunately, students find that using a strucutred method for providing feedback to peers is useful [10, 11].


성과에 대한 자체 평가 및 성찰

Self-assessment and reflection on performance

피드백은 학습자의 수행능력을 향상시키는 목적이 있을 뿐만 아니라, 수행에 대한 자기 평가와 반성을 함양하는 도구로 작용한다. 증거는 자기 평가가 부정확하다는 것을 보여준다; 높은 성과를 거둔 사람들은 자신을 과소평가하는 반면, 가난한 성과자들은 과대평가한다[1, 9]. 그러나 외부 피드백을 받는 것은 학습자에게 적절한 기준에 따라 자신의 자체 평가를 벤치마킹할 수 있는 기회를 준다.

Feedback not only has the purpose of improving a learners’ performance, it also acts as a tool to cultivative self-assessment and reflection on performance. Evidence suggests that self-assessment is inaccurate; high performers underestimate themselves, while poor performers overestimate [1, 9]. Receiving external feedback, however, gives learners the opportunity to benchmark their own self assessment against appropriate criteria.


효과적인 피드백 Effective feedback

효과적인 피드백은 학습 과정의 필수적인 부분이다. 효과적이고 규칙적인 피드백은 좋은 관행을 강화하고, 자기 성찰을 촉진하며, 학습자가 원하는 결과를 위해 노력하도록 동기를 부여한다[2]. 피드백 전달 방식은 학생의 결과에 영향을 미칠 수 있다. 피드백은 학생들이 그들의 성과를 성찰하고 향상시키도록 유도할 수도 있고, 부정적이고 사기를 떨어뜨릴 수도 있다. 우리는 표 1에 설명된 펜들턴의 모델(1984)과 같은 구조화된 방법을 사용하는 것이 피드백을 제공하는 데 유용하다는 것을 발견했다 [11, 18,19,20]. 이 피드백 모델은 학습자에게 자신의 관행을 평가하고 개선 방법을 식별할 수 있는 기회를 제공한다. 또한 관찰자의 즉각적인 피드백을 허용한다.

Effective feedback is an essential part of the learning process. Effective and regular feedback reinforces good practice, promotes self-reflection, and motivates the learner to work towards their desired outcome [2]. The style of feedback delivery can influence the outcome on the student. Feedback can inspire the student to reflect and improve their performance, or it can be negative and demoralising. We have found that using a structured method, such as Pendleton’s model (1984), illustrated in Table 1, is useful for providing feedback [11, 18,19,20]. This model of feedback offers learners the opportunity to evaluate their own practice, and identify ways of improving. It also allows for immediate feedback from the observer.


표 1 피드백 모델(펜들턴 외, 1984년 데이터) [18]

Table 1 Feedback model (data from Pendleton et al., 1984) [18]



표 2는 펜들턴의 피드백 모델 사용에 대한 연습과 반성을 가능하게 하는 활동을 제공한다.

Table 2 provides an activity that allows practice and reflection on the use of Pendleton’s model of feedback.


표 2 활동: 피드백 제공 및 수신

Table 2 An activity: giving and receiving feedback


효과적인 피드백 제공 

Giving effective feedback

효과적인 피드백을 제공할 때 직접적인 관찰과 명확한 목표가 필요하며, 좋은 성과가 재초점되고, 나쁜 성과가 시정된다[21]. 비록 학습자 수행의 긍정적인 측면과 부정적인 측면을 모두 상세히 기술하는 건설적인 피드백을 제공하는 것은 시간이 많이 걸리고 어려울 수 있지만, 피드백을 제공하지 않는 것은 상당한 부정적인 영향을 미칠 수 있다. 신중하게 전달되지 않으면 피드백은 성능 저하를 초래할 수 있다[4, 21]. 만약 제대로 다루지 않으면, 피드백은 또한 학습자에게 방어력과 당혹감을 줄 수 있다. 피드백은 본질적으로 비판단적이고 서술적이어야 한다 [22]. 효과적인 피드백을 수행할 때 고려해야 할 몇 가지 핵심 원칙이 있다[2]. 즉, 피드백은 다음과 같아야 한다.

Direct observation, and clear goals are needed in the provision of effective feedback, with good performance being reinfoced, and poor performance being corrected [21]. Although provision of constructive feedback detailing both positive and negative aspects of the learner’s performance can be time consuming and difficult, not giving feedback can have a substantial negative effect. If not relayed carefully, feedback can result in a deterioration in performance [4, 21]. If handled poorly, feedback can also cause defensiveness and embarrassment to the learner. Feedback must be non-judgemental and descriptive in nature [22]. There are a number of key principles to consider when conducting effective feedback [2]. Namely, feedback should be:


1. 장소, 시기, 환경 등을 고려하여 계획됨

2. 명시적

3. 서술적

4. 성격이 아닌 행동에 초점을 맞춘다.

5. 구체적

6. 간결

7. 피드백 받는 사람에 의해 확인됨

8. 정직한

1. Planned, considering the place, timing and environment

2. Explicit

3. Descriptive

4. Focused on behaviour, not personality

5. Specific

6. Concise

7. Verified by the recipient

8. Honest


피드백 세션의 성공은 아래에 요약되고 표 3에 요약된 구조, 형식 및 내용이라는 세 가지 광범위한 영역에 따라 좌우된다[2, 23].

The success of a feedback session is dependent on three broad areas: structure, format, and content, as outlined below and summarised in Table 3 [2, 23].


표 3 성공적인 피드백 세션의 세 가지 주요 영역 [2]

Table 3 Three key areas of a successful feedback session [2]


구조 Structure

피드백의 타이밍은 적절한 준비 시간을 허용하면서 쌍방에 대해 고려할 필요가 있다. 회의의 목적이 모두에게 명백하게 밝혀지는 등, 피드백이 비밀이 보장되는 장소에서 이루어지도록 하는 것이 필요할 수 있다. 학생을 위협하지 않도록 방 환경도 고려해야 한다. 피드백의 이해를 돕기 위해 서술어를 사용하는 것과 함께, 피드백이 관찰된 태도, 행동 및 지식에 집중되는 것이 중요하다. 상호 신뢰와 존중이 확립되어야 하며, 공동의 목표는 학습자의 성과 향상을 위해 노력하는 것이다[9].

The timing of feedback needs to be considered for both parties, allowing adequate time for preparation. It may be necessary to ensure the feedback is given in a confidential location, with the purpose of the meeting being made clear to all. The room setting should also be considered, so to not intimidate the student. It is important that feedback is focused on the attitudes, behaviour and knowledge observed, with the use of descriptive words to assist in the understanding of the feedback. Mutual trust and respect should be established, with the shared goal being working towards improving the learner’s performance [9].


포맷 Format

제공된 피드백이 정확하고 가치 있으며, 부정적인 점과 긍정적인 점 둘 다 만들어져야 한다[9]. 이 세션의 목적은 학습자의 성과를 향상시키는 것이다. 회의의 단계에는 학습자의 자기평가, 교사의 평가뿐 아니라 향후 성과 개선을 위한 실천계획이 제시된다. 펜들턴의 피드백 모델의 핵심은 자기 성찰을 장려하고 학생이 피드백에 대한 접근법을 선도하도록 하는 것이다(표 1 참조). [18].

It is essential the feedback provided is accurate and valuable, with both negative and positive points being made [9]. The aim of the session is to improve the performance of the learner. The steps in the meeting include the learner’s self-assessment, the teacher’s assessment, as well as providing an action plan for future improvement of performance. The key to Pendleton’s model of feedback is to encourage self-reflection and have the student lead the approach to feedback (see Table 1) [18].


내용 Content

교사와 학습자가 회의를 준비하기 위해서는 적절한 시간이 제공되어야 한다[9]. 공식적인 학습 목표와 개인적 목표는 학습이 이루어진 것을 평가할 때 고려할 필요가 있다. 교사가 학생의 성적을 직접 관찰하게 하는 것은 좋은 성적의 구체적인 예와 개선 영역을 제공할 것이다. 개선을 위한 특정 영역(가장 중요한 영역 중 두 개 또는 세 개만 해당)만 단일 피드백 세션에서 다루어야 한다.

Adequate time needs to be provided in order for the teacher and learner to prepare for the meeting [9]. Formal learning objectives and personal objectives need to be considered when assessing what learning has taken place. Having the teacher directly observe the student’s performance will provide specific examples of good performance, and areas for improvement. Only a limited number of specific areas for improvement (say two or three of the most crucial only) should be addressed in a single feedback session.


피드백을 촉진하기 위한 커리큘럼 설계의 역할

The role of curriculum design in promoting feedback

커리큘럼은 학생들이 피드백에 참여하도록 의도적으로 설계되어야 한다[3]. 피드백은 모든 커리큘럼의 필수 요소로 간주되어야 하며, 학생 학습의 중심이 되어야 한다. 피드백을 촉진하기 위한 개입은 학습자가 자신의 작업에 적용할 수 있는 적절한 표준을 식별할 수 있도록 조직의 커리큘럼과 문화에 '스며들' 필요가 있다[3]. 학생들이 자신의 일에 대해 판단을 내릴 수 있는 능력을 연습하고 적극적으로 구축하기 위해 알찬 학습 환경을 구축해야 한다. 교과과정의 초기에 성과 비교를 장려해야 한다. 이것은 학생들이 현재의 능력에 대한 인식을 발전시키고, 그들 자신의 학습 욕구에 대한 계획을 세우는 것을 돕는다.

The curriculum should be deliberately designed to inspire students to engage in feedback [3]. Feedback should be viewed as a required element of any curriculum, and central to student learning. Interventions to promote feedback need to ‘permeate’ the curriculum and the culture of organisations, to ensure learners are able to identify appropriate standards to apply to their work [3]. Fruitful learning environments should be constructed by students to practice and actively build on their ability to make judgements about their own work. Comparisons of performance should be encouraged early in the curriculum. This helps students to develop an awareness of their current capabilities, and plan for their own learning needs.


자기조절학습(SRL)은 학생들이 자신의 학습에 적극적으로 참여하고 지도할 수 있는 과정을 제공한다[24]. 학생들에게 SRL 사용에 대한 피드백을 제공하여 명확하고 구체적이며 스스로 모니터링하고 반성하는 학습 전략을 장려할 수 있다. 교육자들의 과제는 교육과정 내에서 자기분석을 하나의 기대치로 체계적으로 구축하는 것이다. 정기적인 자기 분석은 자기 분석과 외부 분석의 비교를 촉진하는 습관을 형성하는 데 도움이 된다[3]. 피드백을 핵심 속성으로 포지셔닝하는 커리큘럼 설계 팁:

Self regulated learning (SRL) offers a process that empowers students to actively engage in and direct their own learning [24]. The use of SRL helps students to set goals, actively engage in learning activities, and monitor their own progress and actions in achievement of their goals [24, 25]. Feedback can be given to students on their use of SRL to encourage strategies in learning that are clear and specific, self-monitored, and reflected upon [25]. The challenge for educators is to systematically build self-analysis as an expectation within the curriculum. Regular self-analysis helps to build habits that promote comparison between self-analysis and external analysis [3]. Tips for designing a curriculum that positions feedback as a key attribute include:


• 학생에게 피드백의 목적을 설명

• 학생에게 피드백 방법을 안내

• 형성적 평가 및 피드백을 통해 여러 과제에 대한 기회 촉진

• 점진적으로 도전적인 과제 개발

• 학생이 피드백을 받을 수 있는 기회 제공1

Orientate the students to the purpose of feedback

Orientate students to methods of feedback

Promote opportunities for multiple tasks with formative assessment and feedback

Develop incremental challenges for tasks

Provide opportunities for students to not only receive, but practice giving feedback1


결론 Conclusion

피드백은 학습 과정의 필수적인 요소로서, 커리큘럼의 필수적인 부분으로 간주된다. 피드백을 둘러싼 문학의 몸집이 커지고 있음에도 불구하고, 최선의 접근법에 대한 합의는 거의 없다. 모든 임상 상황에서 단일 피드백 모델은 작동하지 않을 것이다. 각 임상 교육자는 피드백 과정에 참여해야 하며, 자신의 모범 사례를 개발하는 기회를 가질 수 있다. 규칙적이고 효과적인 피드백은 좋은 연습을 강화하고 학습자가 원하는 결과를 얻도록 동기를 부여하는 데 도움이 된다. 건강 전문가 학생들에게 피드백을 주고 받는 기술은 좀처럼 가르쳐지지 않기 때문에 임상의가 부족한 경우가 많다. 직접 관찰과 피드백은 학습자에게 특정 시점에서 진행 상황을 알려주는 강력한 도구를 제공한다 [24, 26]. 교육 과정의 실효성을 높이기 위해서는 학습자와 교사 모두 피드백의 목적과 구조를 이해하는 것이 중요하다.

Feedback is an essential component of the learning process, and is considered an integral part of the curriculum. Despite the growing body of literature surrounding feedback, there is little agreement on the best approach. No single feedback model will work across all clinical contexts. Each clinical educator needs to engage in the process of feedback, and can take the opportunity to develop their own best practice. Regular and effective feedback helps to reinforce good practice and motivate the learner towards the desired outcome. Because skills in giving and receiving feedback are rarely taught to health professional students, they are often lacking in clinicians. Direct observation and feedback offers a powerful tool to inform the learner of their progress at a specific point in time [24, 26]. In order to increase the efficacy of the educational process, it is important for both learners and teachers to understand the purpose and structure of feedback.




테이크홈 메시지

Take-home message


• 학습 환경은 피드백을 강화해야 한다.

• 효과적인 피드백은 스킬을 향상시키고 학습자의 행동을 변화시킬 수 있는 잠재력을 가진다.

• 피드백을 제공하기 위해 구조화된 형식을 사용(예: 펜들턴의 모델)하면 자기 성찰과 명확하고 건설적인 조언 제공에 도움이 된다.

• 커리큘럼은 학생들이 피드백에 참여하도록 의도적으로 설계되어야 한다.

• The learning environment should foster feedback.

• Effective feedback has the potential to improve skills and change the learner’s behaviour.

• Using a structured format to provide feedback (such as Pendleton’s model), assists in self-reflection and the provision of clear, constructive advice.

• The curriculum should be deliberately designed to inspire students to engage in feedback.





Review

 

. 2020 Dec 3;20(Suppl 2):460.
 doi: 10.1186/s12909-020-02280-5.

Feedback in the clinical setting

Affiliations 

Affiliations

  • 1The University of Sydney, Faculty of Medicine and Health, Sydney Medical School - Education Office, The University of Sydney, Edward Ford Building A27, Sydney, NSW, 2006, Australia. Annette.burgess@sydney.edu.au.
  • 2The University of Sydney, Faculty of Medicine and Health, Sydney Health Professional Education Research Network, The University of Sydney, Sydney, Australia. Annette.burgess@sydney.edu.au.
  • 3The University of Sydney, Faculty of Medicine and Health, Sydney Health Professional Education Research Network, The University of Sydney, Sydney, Australia.
  • 4The University of Sydney, Faculty of Medicine and Health, The University of Sydney, Sydney, Australia.
  • 5The University of Sydney, Faculty of Medicine and Health, Sydney Medical School - Education Office, The University of Sydney, Edward Ford Building A27, Sydney, NSW, 2006, Australia.
  • 6The University of Sydney, Faculty of Medicine and Health, Sydney Medical School, Central Clinical School, The University of Sydney, Sydney, Australia.

Abstract

Provision of feedback forms an integral part of the learning process. Receipt of feedback enriches the learning experience, and helps to narrow the gap between actual and desired performance. Effective feedback helps to reinforce good practice, motivating the learner towards the desired outcome. However, a common complaint from learners is that the receipt of feedback is infrequent and inadequate. This paper briefly explores the role of feedback within the learning process, the barriers to the feedback process, and practical guidelines for facilitating feedback.

Keywords: Clinical teaching; Feedback; Peer teaching; Student peer-to-peer feedback.


수행 평가: 2020 오타와 컨퍼런스의 합의문과 권고(Med Teach, 2020)

Performance assessment: Consensus statement and recommendations from the 2020 Ottawa Conference

Katharine Boursicot , Sandra Kemp , Tim Wilkinson , Ardi Findyartini , Claire

Canning , Francois Cilliers & Richard Fuller



도입 Introduction


본 논문은 2010년 오타와 콘퍼런스(이센베르크 2011)에 따른 컨센서스 성명 시리즈의 일환으로 AMEE(유럽의료교육협회)가 의뢰한 2011년 의료교사 성과평가 컨센서스 성명(Boursicot et al. 2011)부터 계속 업데이트하고 있다.

This paper continues from, and updates, the 2011 Performance Assessment Consensus Statement in Medical Teacher (Boursicot et al. 2011) which was commissioned by AMEE (Association for Medical Education in Europe), as part of the series of Consensus Statements following the 2010 Ottawa Conference (Issenberg 2011).


우리는 [학업 및 직장 환경 모두에서 기술과 행동에 대한 평가]로 정의되는 수행 평가를 다룰 것이며, Miller의 임상 역량 수준의 '어떻게 하는지'와 '어떻게 하는지' 수준에서 모범 사례를 다룰 것이다(Miller 1990).

we will address performance assessment, defined as the assessment of skills and behaviours, both in academic and workplace settings, and will address best practice in the ‘shows how’ and ‘does’ levels of Miller’s levels of clinical competence (Miller 1990).


2011년 이후 성과 평가와 관련된 개발 동향 개요

Overview of trends in developments related to performance assessment since 2011


평가 시스템

Systems of assessment


국제적으로, 단순히 개별 도구에만 초점을 맞추는 것이 아니라 평가 시스템을 설계하는 경향이 있었다(Eva et al. 2016; Norcini et al. 2018). 이러한 경향은 [학습 성과에 매핑된 평가 시스템]에 따라 연구 프로그램에 대한 명확한 학습 목표가 일치하면서 역량 또는 결과 기반 의료 교육으로의 세계적global 움직임과 병행되었다(Dijkstra et al. 2010; Lockyer et al. 2017).

There has been a trend internationally to design systems of assessment, rather than just focusing on individual tools (Eva et al. 2016; Norcini et al. 2018). This trend has paralleled the global move to competency or outcomes-based medical education, with clear learning goals for a programme of study being matched by a system of assessment mapped to the learning outcomes (Dijkstra et al. 2010; Lockyer et al. 2017).


지식 응용과 임상 및 의사소통 능력을 시험하기 위한 평가 시스템을 설계하는 것은 비교적 간단하지만, 밀러의 피라미드(Miller 1990)의 'Does' 수준을 시험하기 위한 시스템을 설계하는 것은 더욱 어려웠다. WBA의 사용은 여러 변수가 관련된 복잡한 사업(L€orwald et al. 2019)이다.

While designing a system of assessment for testing knowledge application and clinical and communication skills is relatively straightforward, it has been more challenging to design systems for testing the ‘does’ level of Miller’s pyramid (Miller 1990). The use of WBAs is a complex undertaking (L€orwald et al. 2019) with multiple variables involved.


평가를 위한 유효성 기준

Validity standards for assessment


'타당성 증거의 출처'가 정의된 케인 타당성 프레임워크(Kane 2013a)는 테스트/검사(예: OSCE)에 적용되었을 때 가장 유용하지만 WBA 세계에서도 영향력을 획득했다(Cook et al. 2016; Oudkerk Pool et al. 2018). 이는 특히 WBA에 관한 많은 문헌이 [수치 점수]에서 [학습 지원에 대한 피드백을 중심으로 질적 및 서술적 '점수']로 이동했기 때문에 가치가 높다(Yeates et al. 2015).

The Kane validity framework (Kane 2013a) with its defined ‘sources of validity evidence’ is most useful when applied to tests/examinations (e.g. OSCEs) but has also gained traction in the world of WBAs (Cook et al. 2016; Oudkerk Pool et al. 2018). This is particularly valuable as much of the literature on WBAs has moved from numerical scoring to qualitative and narrative ‘scoring’ with emphasis on feedback for supporting learning (Yeates et al. 2015).


평가자 인식 

Rater cognition


역사적으로, '평가자 오류'와 '평가자 합의'의 결여에 대한 관점은 (비록 약간의 성공이 있었지만) 평가자의 판단이 좀 더 일관되도록 훈련하는 데 초점을 맞추는 결과를 가져왔다(Hodges and McIlroy 2003; Whlan et al. 2005). 지난 10년 동안, 연구는 OSCE 심사원들뿐만 아니라 WBA에서도 격차의 차이를 이해하려고 노력하고, 그러한 차이가 첫 번째 생각만큼 중요한지에 대해 의문을 제기하는 데 있어 더욱 미묘한 차이를 보이고 있다. 최근의 연구는 평가자 분산rater variance이 의미 있고 그러한 차이점을 통제하기 보다는 수용해야 한다고 제시한다(Gingerich et al., 2017; Govaerts et al., 2013; Chahine et al. 2016).

Historically, perspectives of ‘rater error’ and lack of rater agreement have resulted in a focus on training examiners to be more consistent in their judgements albeit with variable success (Hodges and McIlroy 2003; Whelan et al. 2005). In the last 10years, research has become more nuanced in trying to understand rater differences, not only for OSCE examiners but also in WBA, and questioning whether such differences are as important as first thought. Recent work suggests that rater variance is meaningful and such differences should be embraced rather than controlled (Gingerich et al. 2011, 2017; Govaerts et al. 2011, 2013; Chahine et al. 2016).


피드백 Feedback


피드백을 대화형 과정, 대화 또는 학습 대화로 보는 것은 이제 일반적이다(Ossenberg et al. 2019). 이 작품은 피드백 제공의 역학에서 벗어나, 관계(Ramani와 Krackov 2012)에 중점을 두고 피드백을 활용하여 학습을 촉진(Eva et al. 2016)했다. 피드백에 대한 학습자 행동learner action 확보(Hattie 및 Clarke 2018)과 교육, 평가 및 피드백 간의 연결의 중요성은 계속적으로 필수적이다(van der Lew et al. 2018; Watling and Ginsburg 2019). 이제 학습 문화와 피드백으로부터의 학습 사이의 연관성에 대한 관심이 높아지고 있다(Watling et al. 2014; Ramani et al. 2019). 대화를 통한 질적 피드백 기회(Tekian et al. 2017)와 (학습자에게) 의미 있는 피드백에 집중하는 기회가 강조된다(Voyer et al. 2016; LaDonna et al. 2018).

Viewing feedback as an interactive process, a dialogue, or a learning conversation is now common (Ossenberg et al. 2019). This work has shifted emphasis towards relationships (Ramani and Krackov 2012) and harnessing feedback to promote learning (Eva et al. 2016), away from the mechanics of providing feedback. Ensuring learner action on feedback (Hattie and Clarke 2018) and the importance of the connection between teaching, assessment, and feedback continue to be integral (van der Leeuw et al. 2018; Watling and Ginsburg 2019). There is now increased attention to the links between the learning culture and learning from feedback (Watling et al. 2014; Ramani et al. 2019). Opportunities for qualitative feedback through conversation (Tekian et al. 2017) and focus on meaningful (to the learner) feedback are emphasised (Voyer et al. 2016; LaDonna et al. 2018).


객관적 구조화 임상 검사(OSCE)

Objective structured clinical examinations (OSCEs)


세계적으로 OSCE는 검사 환경에서 임상 및 통신 기술을 테스트하기 위한 평가 방법이 되었다(Khan et al. 2013; Harden 2016; Boursicot et al. 2018).

Globally, OSCEs have become the assessment method of choice for testing clinical and communication skills in an examination setting (Khan et al. 2013; Harden 2016; Boursicot et al. 2018).


섹션 1: OSCE의 의도된 용도 또는 목적에 대한 명확한 설명.

섹션 2: OSCE의 결과에 기초하여 이루어진 추론과 결정을 뒷받침하고 정당화할 수 있는 의미 있는 증거.

제3장: 내린 결정을 변호하기 위한 '논의' 또는 정당성.

Section 1: a clear statement of intended use or purpose for the OSCE.

Section 2: meaningful evidence to support and justify the inferences and decisions made on the basis of the outcomes of the OSCE.

Section 3: the ‘argument’ or justification for defending the decisions made.


섹션 1: 용도

Section 1: Intended use


OSCE는 임상 및 의사소통 기술을 시험하는데 사용되어야 한다. 이는 원래 설계 의도(Harden 및 Gleeson 1979년)였으며, 여전히 이 평가 형식(Harden 2016)의 사용에 기초하는 핵심 원리로 남아 있다.

OSCEs should be used to test clinical and communication skills. This was the original design intention (Harden and Gleeson 1979) and still remains a key principle underlying the use of this assessment format (Harden 2016).


OSCE의 목적 진술문purpose statement은 [설계와 전달에서 데이터와 결과의 분석까지] OSCE 프로세스의 모든 단계를 뒷받침해야 한다(Daniels and Pugh 2018). 어떤 평가 방법과 마찬가지로, OSCE의 목적은 예를 들어, 교수진, 후보자, 심사원, 고용주, 규제 기관 및 대중 등 모든 이해관계자에게 명시되어야 한다.

The purpose statement for the OSCE should underpin all stages of the OSCE process, from design and delivery, to analysis of the data and outcomes (Daniels and Pugh 2018). As with any assessment method, the purpose of the OSCE should be made explicit to all stakeholders: for example, faculty, candidates, examiners, employers, regulatory bodies, and the public.


제2장: 유효성 증거의 출처

Section 2: Sources of validity evidence


내용 Content


OSCE의 내용에 대해 명시적으로 설명해야 하며, 테스트의 내용이 테스트해야 할 내용을 적절하게 테스트할 수 있도록 해야 한다(Downing 2003). OSCE를 학습 목표/결과로 설계하는 것은 모든 시험을 계획하는 데 있어 필수적인 단계다(Coderre et al. 2009; Sales et al. 2010; Raymond and Grande 2019). 시험 대상과 학습 목표/결과 사이에 명확한 관계가 있어야 하며, 적절한 매핑(건설적 정렬)을 입증해야 한다(Biggs 1996). 블루프린팅은 코스 내용 영역이 적절히 테스트된다는 것을 증명할 뿐만 아니라 서로 다른 영역에 걸쳐 테스트되는 기술의 균형을 상세하게 설명해야 한다.

There should be an explicitly stated explanation for the content of the OSCE, to ensure that the content of the test does test appropriately what it is supposed to be testing (Downing 2003). Blueprinting an OSCE to learning objectives/outcomes is an essential step in the planning of any examination (Coderre et al. 2009; Sales et al. 2010; Raymond and Grande 2019). There should be a clear relationship between what is being tested and the learning objectives/outcomes, demonstrating appropriate mapping (constructive alignment) (Biggs 1996). Blueprinting should detail the balance of skills being tested across different domains as well as demonstrate that the course content areas are appropriately tested.


OSCE에서 시험해야 하는 일반적인 역량은 다음과 같다.

The typical competencies which should be tested in an OSCE are:

        •    병력청취 기술

        •    신체검사 기술.

        •    설명/자문/협의형 커뮤니케이션 기술

        •    실용적/테크니컬 스킬.

        •    임상적 추론 기술(보여지는 환자와 관련됨)

   History taking skills.  

   Physical examination skills.

   Explanation/advice/consent type communication skills.

   Practical/technical skills.

   Clinical reasoning skills (related to the patient being seen).


OSCE에 (구조화된) 구두 토론, 객관식 질문(MCQ) 또는 단답형 질문(SAQ)을 포함시키는 것은 부적절하며 OSCE의 타당성에 심각한 위협을 가한다. 이는 임상 기술을 입증해야 하는 활동이 아니기 때문이다(Downing and Haladyna 2004).

The inclusion of (structured) oral discussions, Multiple Choice Questions (MCQs), or Short Answer Questions (SAQs) in an OSCE is inappropriate and poses a serious threat to the validity of an OSCE, as these are not activities which require the demonstration of clinical skills (Downing and Haladyna 2004)


내부구조

Internal structure


OSCE를 구성할 때는 충분한 샘플링 계획(스테이션 수, 스테이션 길이, 검사자)에 주의를 기울여야 한다. 이는 OSCE 블루프린트에서 입증되어야 한다. 불충분한 샘플링은 방어할 수 있는 합격/불합격 결정을 내리는 데 충분한 데이터를 제공하지 못할 것이다. 12개 스테이션 이하 및/또는 150분 미만의 테스트 시간으로 구성된 OSCE는 신뢰할 수 있는 결과를 산출하지 못할 것이다(Sandson 등 1999년).

When constructing the OSCE, attention should be paid to planning sufficient sampling (numbers of stations, length of stations, examiners). This should be demonstrated in the OSCE blueprint. Insufficient sampling will not provide sufficient data on which to make defensible pass/fail decisions. OSCEs consisting of less than 12 stations and/or less than 150min of testing time will not yield reliable results (Swanson et al. 1999).


적절한 표시/점수 체계를 선택해야 한다. OSCE가 처음 개발되었을 때는 체크리스트에 의해 점수가 매겨졌지만, 시간이 지남에 따라 [등급 척도rating scale]가 더 진보된 임상 학습자를 평가하는데 더 적합한 것으로 나타났다(Hodges et al. 1999; Ilgen et al. 2015). 그러나 일부 논쟁은 여전히 계속되고 있으며(Yudkowsky et al. 2014; Pugh et al. 2016; Wood and Pugh 2020) 적절한 경우 등급 척도와 체크리스트를 신중하게 결합할 수 있다(특히 기술력 테스트의 경우).

An appropriate marking/scoring scheme should be chosen. When OSCEs were first developed, the scoring was by checklists, but over time rating scales were shown to be more appropriate in assessing more advanced clinical learners (Hodges et al. 1999; Ilgen et al. 2015). However, some debate still continues (Yudkowsky et al. 2014; Pugh et al. 2016; Wood and Pugh 2020) and it is possible to carefully combine rating scales and checklists where appropriate, particularly for technical skills testing.


표준 설정의 경우, 2011년 컨센서스 성명(Boursicot et al. 2011)에서 논의한 바와 같이, 보더라인 회귀 분석 방법은 현재 OSCE의 표준 설정 방법(Hejri et al. 2013; McKinley and Norcini 2014; Yousuf et al. 2015)으로 간주되고 있다. 지원자의 수가 적을 경우 오류 발생원에 대한 보다 세심한 검토가 필요하다(Homer et al. 2016, 2020).

For standard setting, as discussed in the 2011 Consensus Statement (Boursicot et al. 2011), the Borderline Regression Method is currently regarded as the standard setting method of choice for OSCEs (Hejri et al. 2013; McKinley and Norcini 2014; Yousuf et al. 2015). With small cohorts of candidates, more careful consideration of sources of error are required (Homer et al. 2016, 2020).


적절한 정신측정학 분석을 수행해야 한다. OSCE에 대한 품질보증의 중요한 부분은 신뢰성과 스테이션 레벨 문제를 검사하기 위한 심리측정학 분석 수행이다(Pell et al. 2010; Fuller et al. 2013).

Appropriate psychometric analyses should be conducted. A crucial part of the quality assurance for OSCEs is the conduct of psychometric analyses to examine reliability and station level issues (Pell et al. 2010; Fuller et al. 2013).


응답 프로세스 Response process


채점 체계(또는 채점 일정)는 [평가하려는 임상 과제의 특성 측면]과 [평가자의 사고]에 맞춰야 한다(Daniels and Pugh 2018). 이 두 가지 측면 모두 세심한 배려가 필요하다. [체크리스트의 남용은 과제를 trivialize시킬 위험]을 유발할 수 있는 반면, [등급 척도의 남용은 신뢰도 저하로 이어질 수 있다는 우려]가 있었다(Wood and Pugh 2020). 후자의 우려는 위에서 설명한 바와 같이, 실제로 문제가 되는 것 같지는 않다. 채점 스킴을 구성하려면 다음 두 가지 측면을 고려해야 한다. 

      • (1) 채점 체계 언어를 임상 사고에 맞추어 조정한다(Weller et al. 2009) 

      • (2) 임상적 의사결정에 도달하기 위한 핵심 단계를 설명하고 채점 체계와의 정렬을 보장하는 핵심 기능을 사용한다(Pugh et al. 2016).

두 경우 모두 좋은 교육 설계는 [시험관 인지 부하를 줄일 수 있고, 단지 일상적인 행동으로 응시자에게 점수를 주지 않기 때문에] 진정성을 도울 수 있다.

Marking schemes (or scoring schedules) need to align to the aspects of the clinical task under scrutiny and to examiner thinking (Daniels and Pugh 2018). Both these aspects require careful consideration. Overuse of checklists can risk trivializing the task, while there has been concern that overuse of rating scales leads to poorer reliability (Wood and Pugh 2020). The latter concern, as outlined above, does not seem to be borne out in practice. Constructing marking schemes involves considering two aspects: 

      • (1) aligning the marking scheme language to clinical thinking (Weller et al. 2009) and 

      • (2) using key features whereby the key steps to reach a clinical decision are elucidated and then ensuring alignment with the marking scheme (Pugh et al. 2016). 

In both cases, good instructional design can reduce examiner cognitive load, and help authenticity through avoidance of giving marks to candidates for just routine actions.


평가자 교육은 OSCE 구현의 중요한 부분으로 간주되어 왔다. 평가자 훈련이 효과적이라는 증거는 혼합되어 있으며(Hodges and McIlroy 2003; Pell et al. 2008; Schurouttpelz-Brauns et al. 2019; Yeates et al. 2019) '표준화된 평가자'의 생산을 시도하는 것은 아무런 결실도 없어 보인다. 대신에, 다수의 관측자가 다수의 관측을 하게 만듦으로써 더 큰 신뢰성이 발생할 수 있다. 이는 충분한 샘플링이 있는 경우 OSCE가 신뢰할 수 있는 이유 중 하나로 인식된다. 이제 시험관 다양성을 수용하는 것이 유리할 수 있으며, 평가자 가변성은 종종 스테이션 설계 문제와 채점 체계(Fuller et al. 2017)의 결과일 수 있다는 견해도 있다. 이러한 주장은 임상 작업이 복잡하고 다차원적이라는 인식에 근거한다. 이것은 서로 다른 평가자들은 서로 다른 차원을 잘 볼 수 있고, detractor가 아니라 타당성에 기여하는 것으로 보일 수 있다는 것을 의미한다. 평가자 훈련은 점점 더 심사관의 행동, 행동 및 의식과 무의식적인 편견의 인식에 초점을 맞추고 있다.

Examiner training has been considered an important part of OSCE implementation. The evidence that examiner training is effective is mixed (Hodges and McIlroy 2003; Pell et al. 2008; Sch€uttpelz-Brauns et al. 2019; Yeates et al. 2019) and it seems fruitless to attempt to produce ‘standardised examiners’. Instead, greater reliability can arise from using multiple observations by multiple observers. This is now recognized as one of the reasons that OSCEs are reliable, if there is sufficient sampling. There is now also a view that embracing examiner diversity could be an advantage, and that apparent examiner variability can often be the result of design issues in station and marking schemes (Fuller et al. 2017). This argument is based on the realization that clinical tasks are complex and multidimensional. This means that different examiners may well look at different dimensions from each other and can be seen as contributor to validity rather than a detractor. Examiner training increasingly focuses on examiner conduct, behaviours, and recognition of conscious and unconscious bias.


OSCE에 대한 시험 보안은 논쟁의 대상이 되어왔다. 임상 기술에 대한 평가는 지원자가 자신이 알고 있는 것에 기반하여 자신이 할 수 있는 것을 증명해야 한다. 기술을 수행하는 능력은 연습과 경험이 필요하다. 그러므로 그 일을 미리 알고 있는 것이 얼마나 후보자에게 실질적인 이점을 제공하는지 의문이다. 예를 들어, 24시간 전에 과제가 나쁜 소식을 전하는 것과 관련이 있다는 것을 아는 것은 후보자가 짧은 시간 내에 이 분야에서 그들의 기술을 향상시킬 수 있다는 것을 의미하지 않는다. 이는 OSCE에서 엄격한 시험 보안(예: '시퀀시스터' 또는 장기간 격리)의 필요성에 의문을 제기한다. 보고서는 상반된 결과를 주장하고 다른 제안을 제공한다(Cohen et al. 1993; Niehaus et al. 1996; Gotzmann et al. 2017). 그러나 보안이 위태로워졌을 때 그 영향은 미미해 보인다. 후보들에 대한 공정성 대책에는 모든 후보가 더 짧은 시간 내에 일련의 스테이션을 통과하도록 하는 스테이션 그룹화와 세션에 걸친 피평가자의 무작위 할당, 체계적 편차variation에 대한 데이터 분석 등이 포함될 수 있다(Ghouri et al. 2018).

Test security for OSCEs has been subject to debate. Assessment of clinical skills requires a candidate to demonstrate what they can do, underpinned by what they know. The ability to perform a skill requires practice and experience. It is therefore questionable the extent to which knowing the task in advance offers any substantial advantage to a candidate. For example, knowing 24h in advance that the task relates to breaking bad news is unlikely to mean a candidate could improve their skills in this area in a short time frame. This questions the necessity for stringent exam security in an OSCE (such as ‘sequestering’ or quarantining for long periods). Reports argue conflicting outcomes and offer different suggestions (Cohen et al. 1993; Niehaus et al. 1996; Gotzmann et al. 2017). However, when security has been compromised the effect seems minimal. Measures for fairness to candidates can involve grouping stations so all candidates pass through a set of stations in a shorter time frame, random allocation of candidates across sessions, and analysis of data for systematic variations (Ghouri et al. 2018).


다른 변수에 대한 관계

Relationship to other variables


OSCE의 수행 결과가 의대생(Wilkinson 및 Frampton 2004)의 임상 성과뿐만 아니라 국가 수준의 임상 시험 성과(Simon et al. 2002;)와 잘 상관관계가 있다는 증거가 증가하고 있다.

There is increasing evidence that the outcomes of performance in OSCEs correlate well with clinical performance of medical students (Wilkinson and Frampton 2004) as well as performance in national level clinical examinations (Simon et al. 2002;Pughetal.2016; Tannenbaum and Kane 2019).


평가에 대한 프로그램적 접근법을 취하는 것의 원칙 중 하나는 모든 개별 평가 에피소드 후에 반드시 판단을 내리는 것이 아니라, [body of evidence에 대해서 결정이 이루어져야 한다]는 것이다. 이는 평가방식별 의사결정이 아니라, 영역별 의사결정의 가능성도 열어준다. 예를 들어, 학습자가 병력청취 학습에 필요한 표준에 도달했는지 판단하는 것은 OSCE의 구성요소로서 병력청취, Mini-CEX의 구성요소에서의 병력청취 및 환자 의견 조사에서의 병력청취 등으로부터 가져올 수 있다. 의사결정에 정보를 활용할 때 이러한 데이터의 삼각측량을 [강력한 의사결정의 중요한 구성요소]로 본다.

One of the tenets of taking a programmatic approach to assessment is that decisions should be made on a body of evidence, not necessarily after every assessment episode. This also opens up the possibility of making decisions by domain rather than by assessment method. For example, determining if a learner has reached the required standard for history taking might draw on the history taking components of an OSCE, together with the history taking components of a Mini-CEX, and alongside the history taking components of a patient opinion survey. We see this triangulation of data in informing decisions as an important component of robust decision making (Torre et al. 2020).


결과들

Consequences


OSCE를 종합적 목적으로 사용할 경우, 합격/불합격 결정은 입증된 최선의 방법(Yousf et al. 2015)을 사용하여 표준 설정에 기초하여 결정이 견고하고 공정하며 방어할 수 있도록 하는 것이 중요하다. OSCE를 오로지 형성적 목적으로만 사용하는 경우에도 타당성 기준을 충족해야 생산되는 정보가 의미가 있다(Tannenbaum과 Kane 2019). OSCE를 실시할 때 중요한 측면은 이 평가 방법을 사용할 경우의 교육적 영향(즉, 학생들은 임상, 의사소통, 실무/기술적 기술을 수행하는 학습에 초점을 맞추게 된다)을 고려하는 것이다.(Pugh et al. 2018).

When OSCEs are used for summative purposes, it is important that pass/fail decisions are based on standard setting using the best evidenced method (Yousuf et al. 2015), to ensure that decisions are robust, fair, and defensible. Even when OSCEs are used solely for formative purposes, they should fulfil validity criteria so the information produced is meaningful (Tannenbaum and Kane 2019). An important aspect of conducting OSCEs is to consider the educational impact of using this assessment method: students will focus on the learning to perform clinical, communication, and practical/technical skills (Pugh et al. 2018).


궤적을 학습하고 수험생에게 의미 있는 피드백을 제공하는 데 중요한 동기 요소로 피드백의 효과를 과소평가할 수 없다(Humphrey-Murto et al. 2016; Tekian et al. 2017; Ossenberg et al. 2019).

The effect of feedback cannot be underestimated as a critical motivating factor in learning trajectories and producing meaningful feedback for test-takers should be routine (Humphrey-Murto et al. 2016; Tekian et al. 2017; Ossenberg et al. 2019).


제3장: '논의/명분'

Section 3: The ‘argument/justification’


모든 유효성 근거의 출처를 취합하여 시험 점수의 결과에 기초하여 내린 결정을 정당화해야 한다(Downing and Haladyna 2004; Kane 2013b). 이러한 분석에서 나타나는 취약 영역은 품질 개선을 알릴 수 있다. 시험 점수에 기초한 결정을 정당화하기 위한 점수-일반화-외삽-함의(Cook et al. 2015)의 적용은 OSCE의 품질 보증의 중요한 척도다.

All sources of validity evidence should be gathered to justify any decisions made based on the results of the test scores (Downing and Haladyna 2004; Kane 2013b). Areas of weakness which emerge from such analyses can inform quality improvement. Application of the scoring–generalisation–extrapolation–implications to justify the decisions based on the test scores (Cook et al. 2015) is an important measure of quality assurance for an OSCE.


OSCE에 대한 권장 사항

Recommendations for OSCEs


OSCE에 대한 권고사항은 표 1에 요약되어 있다. 2011 Consensus Statement에서 여전히 유효한 중요한 메시지에는 다음에 대한 권고사항:

The recommendations for OSCEs are summarised in Table 1. Important messages that are still valid from the 2011 Consensus Statement include recommendations for:

  • [시험의 목적을 정의]하고 OSCE를 사용하여 [임상 상호작용을 테스트]한다.

  • OSCE를 학습 목표/성과를 블루프린팅

  • OSCE에 (잘 인정받는) 준거참조 기준설정 방법 – Borderline Regression Method을 사용

  • OSCE의 콘텐츠가 충분한 스테이션과 테스트 시간을 통해 적절하게 샘플링되도록 보장한다.

Defining the purpose of testing and using an OSCE to test clinical interactions.

Blueprinting the OSCE to learning objectives/outcomes.

Using a recognized criterion referenced standard setting method appropriate for OSCEs – Borderline Regression Method.

Ensuring content in the OSCE is adequately sampled through sufficient stations and testing time.


2011년 이후 문헌에서 나타난 새로운 측면에는 다음과 같은 권고사항이 있다.

New aspects that have emerged from the literature since 2011 include recommendations to:

  • OSCE가 평가 시스템의 일부로 설계되었는지 확인하십시오.

  • 타당성 프레임워크 기준을 준수하고 OSCE 점수 해석을 위한 증거를 수집하십시오.

  • 등급 척도 대 체크리스트의 사용을 고려하여 적절한 표시 방식을 설계하고 채점 방식을 임상의 언어에 맞게 조정하십시오.

  • 심사관의 판단을 표준화하기보다는 평가자의 수를 충분히 보장함으로써 평가자의 가변성을 수용한다.

  • 그룹 스테이션에 대한 작업 설계 및 OSCE 회로 설계를 통해 테스트 보안을 처리한다.

  • OSCE는 MCQ를 사용한 테스트와 같은 다른 평가 방법과 비교하여 메트릭에 대한 다른 접근 방식을 요구하므로 적절한 메트릭스를 생성하십시오.

  • OSCE 데이터를 다른 평가와 삼각측량하여 중요도가 높은 의사 결정을 통보한다.

Ensure OSCEs are designed as part of a system of assessment.

Adhere to validity framework criteria and gather evidence for the interpretation of the OSCE scores.

Design an appropriate marking scheme by considering the use of rating scales versus checklists and align marking scheme to the language of clinicians.

Embrace examiner variability by ensuring sufficient numbers of examiners, rather than trying to standardize their judgements.

Handle test security through task design and OSCE circuit design to group stations.

Generate appropriate metrics given that OSCEs require a different approach to metrics compared to other assessment methods such as tests using MCQs.

Triangulate OSCE data with other assessments to inform high-stakes decision making.



Workplace-based assessments (WBAs)


WBA 도구 사용 

Uses of WBA tools


WBA 도구 사용 방법은 중요하며 성공에 필수적이다. WBA 도구 또는 도구 세트의 '의도한 사용'과 WBA 데이터에서 이루어진 결정은 타당성 증거의 중요한 원천이다(Kane 2013a). 타당성이 도구 자체의 특성이 아니라는 점을 고려할 때(AERA et al. 2014), 단일 WBA 도구 안에서의 variation 간 비교보다는 도구가 사용되는 방법이 더 중요하다.

How WBA tools are used is important and integral to success. The ‘intended use’ of the WBA tool, or set of tools, and decisions made from WBA data are important, essential sources of validity evidence (Kane 2013a). Given that validity is not a property of the instrument itself (AERA et al. 2014), comparisons between variations in a single WBA tool design are not as critical as how the tool is used.


각 단일 WBA 도구는 통합되고 일관성 있는 WBA 세트의 일부로 설계 및 구현되어야 한다. WBA 세트는 더 넓은 평가 시스템에 내장되거나 그 자체로 평가 시스템으로 볼 수 있다. 따라서 좋은 평가 시스템의 기준에 주의를 기울여야 한다. 그런 다음 WBA를 하나의 시스템(또는 시스템의 일부)으로 설계하면 평가의 프로그램적 접근방법에 따라 학습의 종적 측면, 도구들의 신중한 조합(Govaerts and Van der Vleuten 2013), 훈련 단계의 정렬에 대한 주의를 유발한다(Schuwirth and Van der Vleuten 2011).

Each single WBA tool should be designed and implemented as part of an integrated, coherent set of WBAs. The set of WBAs can be embedded in a wider system of assessment or seen as an assessment system in itself. Therefore, attention should be given to the criteria for et good systems of assessment (Norcini al. 2018). Designing WBAs as a system (or part of system) then triggers attention to the longitudinal aspects of learning, careful combination of tools (Govaerts and van der Vleuten 2013), and alignment to the stage of training, in keeping with theories of programmatic approaches to assessment (Schuwirth and Van der Vleuten 2011).


WBA의 목적 

Purposes of WBAs


(시스템 또는 시스템의 일부로서) WBA 세트를 설계하는 것이 목적에 부합한다. 목적은 WBA 평가 시스템 내에서 서로 다른 단계에서 다를 수 있다. 

    • 예를 들어, 통합된 WBA 세트는 주로 [형성적 목적]을 위해 설계될 수 있다(학습 강화). 이 목적은 학습자가 피드백에 대해 조치를 취할 수 있는 서술적 피드백과 기회를 미리 파악한다. 

    • 이와 달리 [총괄적 목적]을 위해 설계된 WBA 세트(예: 다음 단계의 훈련 준비 상태에 대한 판단)도 있다. 이 목적은 충분한 데이터 지점의 생성(즉, 다중 관측), 심리학적 특성(평가의 의도된 사용에 적절한 경우), 사전 정의된 표준을 충족하기 위한 성과에 대한 방어 가능한 해석을 중요시한다. 

프로그램적 접근방식은 학습 향상에 초점을 맞춘 일련의 낮은 이해도 WBA와 함께 연속적으로 설계된다. 종방향으로 수행되는 복수의 저위험 WBA는 궁극적으로 종합판정에 사용되는 정보를 제공할 수 있다(Schuwirth and van der Vleuten 2012; Torre et al. 2020).

The design of the set of WBAs (as a system or part of a system) will align with the purpose/s. Purposes may differ at different stages within the WBA system of assessment. 

    • For example, an integrated set of WBAs might be designed primarily for formative purposes (to enhance learning). This purpose foregrounds narrative feedback and opportunities for learners to take action on feedback. 

    • This is in contrast to a set of WBAs designed primarily for summative purposes (e.g. to make judgements about readiness for next stage of training). This purpose foregrounds the generation of sufficient data points (i.e. multiple observations), attention to psychometric properties (where appropriate for the intended use of the assessment), and a defensible interpretation of achievement to meet pre-defined standards. 

Programmatic approaches are designed on a continuum, with a series of low stakes WBAs that focus on enhancing learning. Multiple low stakes WBAs conducted longitudinally can ultimately provide information used for a summative judgment (Schuwirth and van der Vleuten 2012; Torre et al. 2020).


학습 및 학습 행동에 미치는 영향

Effects on learning and learning behaviours


WBA의 피드백은 작업 방법(임상 기술), 학습 방법(학습에 대한 계정성) 및 느낌 방법(감정적 웰빙)에 따른 영향을 준다는 증거가 있으며, 교육생에게 다양한 영향을 미친다(Voyer et al. 2016). WBA는 감독자(Sabey and Harris 2011; Barrett et al. 2016)와의 접촉 시간을 늘리거나 보호하는 데 유용하고 피드백의 빈도나 품질을 개선하는 것을 포함하여 학습 과정에 바람직한 영향을 미친다(Weller et al.). 2009; Barrett 등 2016). 이러한 현상이 발생하는 학습 환경은 피드백과의 연관성에 상당한 영향을 미친다(BingYou et al. 2019). 연습자 기관, 소속 또는 존중에 [부정적인 영향을 미치는 분위기]는 피드백 효능을 저해할 가능성이 더 높다(Sargeant et al. 2009. 궁극적으로 피드백은 근무지에서의 학습과 관련된 것에 초점을 맞출 필요가 있다(van der Lew et al. 2018). 이것은 일반적으로 숫자/점수의 등급 척도를 포함하는 WBA가 학습자에게 직장에서 개선 방법을 알려주기에는 한계가 있는 부분이다(Hattie and Timperley 2007; Bing-You et al. 2017). 기술이 변화함에 따라 피드백에 대한 빅데이터 및 학습 분석(Tekian et al. 2017; Van der Schaaf et al. 2017)을 포함한 기술 사용 사례(Joynes Fuller 2016)가 점점 늘어나고 있다.

Feedback from WBAs has a range of effects on trainees, with some evidence of benefits accruing to ways of working (clinical skills), ways of learning (accountability for learning), and ways of feeling (emotional wellbeing) (Voyer et al. 2016). WBAs have desirable effects on the process of learning including being useful for increasing (or protecting) contact time with supervisors (Sabey and Harris 2011; Barrett et al. 2016) and improving the frequency or quality of feedback (Weller et al. 2009; Barrett et al. 2016). The learning climate within which this takes place significantly influences the nature of engagement with feedback (BingYou et al. 2019). A climate that negatively influences trainee agency, affiliation or esteem is more likely to undermine feedback efficacy (Sargeant et al. 2009). Ultimately, feedback needs to focus on what is relevant to the learning in the workplace (van der Leeuw et al. 2018). This is where WBAs that commonly include a rating scale with numbers/ scores have limitations for informing learners about how to improve (Hattie and Timperley 2007; Bing-You et al. 2017) in the workplace. As technologies change, there are of and increasing examples uses of technology (Joynes Fuller 2016) including big data and learning analytics for feedback (Tekian et al. 2017; van der Schaaf et al. 2017).


또한 WBA는 바람직하지 않은 학습 효과를 유발할 수 있다. WBA를 학습의 메커니즘이라기 보다는 [체크박스 연습에 지나지 않는다]고 보는 교육생들의 시각은 지난 10년 동안 지속적인 관심사로 남아 있다(Bindal et al. 2011; Barrettt et al. 2017). WBA에서 척도/숫자의 유행이 한 가지 원인이 되며, 등급 척도를 사용할 때 설계는 진정한 임상 성과를 반영하는 descriptor의 문구에 주의를 기울여야 한다(Crossley and Jolly 2012). 또 다른 요인은 WBA가 총괄적 목적으로 사용될 때 [관대한 평가자를 찾는 학습자의 전략적이고 바람직하지 않은 행동]을 유발하는 방식으로 사용되는 점이다. 예를 들어, 결과가 좋지 않거나 복잡도가 높은 환자 사례에 대한 논의를 회피하고, 필요한 최소 수의 WBA만 수행하고, 단계별 성과를 창출하며, 더 긍정적인 점수를 기대하면서 '널널한' 평가자를 찾는 학생/수련생이 이에 해당한다(빈달 외 2011; 매시 앤 알리 2016; 바렛 외 2017).). 이는 학습자 분석에서 병행되는 작업에 의해 반영되며, 단순한 '계측 및 측정counting and measuring'에만 초점을 맞추면 불안, 주의 산만 및 실패가 증가하면서 학습자 참여에 해로운 영향을 미칠 수 있다(Foster and Francis 2019; Archer and Prinsloo 2020).

WBAs can also induce undesirable learning effects. Trainees’ perspectives of WBAs as being no more than a tick-box exercise, rather than a mechanism for learning, has remained an ongoing issue of concern for the past decade (Bindal et al. 2011; Barrett et al. 2017). The prevalence of scales/numbers on WBAs is one contributing factor and when rating scales are used, design should pay attention to wording of descriptors that reflect authentic clinical performance (Crossley and Jolly 2012). Another factor is where WBAs are used primarily for a summative purpose in a way that encourages strategic, and undesirable, behaviours from learners who seek lenient assessors. These include, for example, students/trainees avoiding discussion of patient cases with poor outcomes or a high degree of complexity, undertaking only the minimum number of WBAs required, generating a staged performance, and seeking ‘friendly’ assessors, hoping for a more positive score (Bindal et al. 2011; Massie and Ali 2016; Barrett et al. 2017). This is mirrored by parallel work in learner analytics, where a focus on simply ‘counting and measuring’ assessment may also lead to detrimental effects on learner engagement, with increased anxiety, distraction and failure (Foster and Francis 2019; Archer and Prinsloo 2020).


다른 상황에서는, [평가자와의 권력 관계의 특성]이 피드백 획득에 대한 학습자의 신뢰도와 평가자의 성과 향상 약속에 대한 신뢰에 영향을 미친다(Yang and Carless 2013). 이를 통해 학습자가 자신보다 더 박식하다는 인상을 주려고 노력하는 '수행능력을 연기하는staging a performance'(LaDonna et al. 2017) 현상이 나타날 수 있는데, 이는 종합평가에서 자신들에게 불리할 수 있는 약점을 감추기 위한 것이다. 학습자가 encounter의 

    • 부담stakes이 낮다고 인식하는 경우, 더욱 '이 encounter에서 무엇을 배울 수 있는가'를 묻는 방식으로 접근할 수 있다. 

    • 부담이 높다고 인식되는 경우, '인상 관리'는 응답, 확립된 문헌 판단의 미러링 및 '인상 형성'에 대해 학습자 평가자가 더 가능성이 높다.

In other settings, the nature of a power relationship with an assessor influences learner confidence in obtaining feedback and their trust in the assessor’s commitment to enhancing their performance (Yang and Carless 2013). This can lead to the phenomenon of ‘staging a performance’ (LaDonna et al. 2017) where learners try to give the impression that they are more knowledgeable than they are, driven to hide weaknesses that may count against them in summative assessment. 

    • Where learners perceive the stakes in an encounter to be low/none, they are more likely to approach the encounter asking ‘what can I learn from this encounter’. 

    • If the stakes are perceived to be high, ‘impression management’ is the more likely learner assessor about response, mirroring established literature judgements and ‘impression formation’.


WBA 시스템의 설계는 학습 과정을 강조하고 학습자의 행동을 최소화하거나 제거하여 학습 비용을 절감하는 학습자 행동을 촉진해야 한다. 다양한 맥락에서, 그리고 평가되는 각 개인에 대해 풍부한 데이터를 제공하기 위해 복수의 평가자와 함께 WBA를 사용하는 것이 중요하다. 단일 WBA 인스턴스는 의미를 제공하지 않으며 성능 패턴에 대한 데이터를 생성하는 것이 목표여야 한다(Govaerts and van der Vleuten 2013; Hodges 2013). 전문적 판단의 주관적 성격을 맥락에서 회피하고, 이를 문제점으로 보기보다는 맥락을 설명하는 만큼 강점이 된다(Kogan et al. 2011).

Designs of WBA systems need to drive learner behaviours which emphasise the process of learning and minimise, or eliminate, learner behaviours to gain a performance outcome, at the expense of learning. It is valuable to use WBAs for range of tasks, in a variety of contexts, and with multiple assessors to provide rich data for and about each individual being assessed. Single WBA instances do not provide meaning and generating data about patterns of performance should be the aim (Govaerts and van der Vleuten 2013; Hodges 2013). Rather than avoid the subjective nature of professional judgement in context, and view it as problematic, it is a strength as it accounts for context (Kogan et al. 2011).


WBA의 평가/진행 결정

Assessment/progression decisions from WBAs


WBA는 진행과 같은 결과적 의사결정을 위한 WBA 집합으로 간주되어야 한다. 세트는 동일한 WBA 도구 또는 [필요한 도메인 전체에 걸쳐 샘플링]을 보장하기 위해 다양한 WBA 도구를 결합한 세트일 수 있다.

WBAs should be viewed as a set of WBAs for consequential decisions, such as progression. The set could be a number of the same WBA tool, or a set which combines a variety of WBA tools to ensure sampling across required domains.


다양한 설정과 다음을 포함한 다양한 컨텍스트를 관찰하기 위해 서로 다른 WBA 도구가 개발되었다.

Different WBA tools have been developed for different settings and for observing different contexts including:

    • 1. 단일 환자 접점: 학습자와 환자 간의 임상적 상호작용이 관찰되는 경우: 예: Mini-CEX(Mini-Cleinical Evaluation Action, Mini-CEX) 또는 Direct(DOPS(절대 절차적 기술의 관찰) 외. 2011).

    • 2. 다중 환자 접촉: 리더십 및 복잡성 관리에 초점을 맞춘 경우: OCAT(Ottawa Clinic Assessment Tool) (Kelleher et al. 2020).

    • 3. 간접 환자 접점: 환자와 관련된 임상 활동에 초점을 맞추고 있지만 환자 상호작용이 관찰되지 않는 경우: 예: 사례 기반 토론(CBD) 또는 인도 도구(HAT) (RCGP 2020)

1. A single patient encounter: where a clinical interaction between learner and patient is observed: e.g. MiniClinical Evaluation Exercise (Mini-CEX) or Direct Observation of Procedural Skills (DOPS) (Pelgrim et al. 2011).

2. Multiple patient encounters: where the focus is on e.g. leadership and management of complexity: Ottawa Clinic Assessment Tool (OCAT) (Kelleher et al. 2020).

3. An indirect patient encounter: where the focus is on clinical activities that relate to a patient but the patient interaction is not observed: e.g. Case-based Discussion (CBD) or Handover Tool (HAT) (RCGP 2020).


다른 유형의 WBA에는 위탁 가능한 프로페셔널 활동(EPAs)이 포함된다(10 Cate 2005). EPA의 경우, 임상 감리자는 훈련자의 성과에 대해 특정 업무를 '위임'할 수 있는지에 대해 판단을 내린다(Hatala et al. 2019). 위임 결정에는 일반적으로 다음의 것들을 고려한다.

    • 학생/교습자의 특성, 

    • 이전 감독 경험, 

    • 과거 평가 및 현재 역량에 대한 증거, 

    • 환자 및 사례 복잡성과 같은 맥락

    • 연습생의 겸손과 성실성과 같은 속성을 포함한다(Duijn et al. 2018). 

Another type of WBA includes Entrustable Professional Activities (EPAs) (ten Cate 2005). In EPAs, clinical supervisors make judgments on trainees’ performance about whether they can ‘entrust’ the trainee with specific tasks (Hatala et al. 2019). The entrustment usually requires several considerations: 

    • characteristics of the student/trainee, 

    • previous supervision experience, 

    • past assessment and evidence of current competencies, and 

    • context such as the patient and case complexity (Cianciolo and Kegg 2013). 

    • Entrustment decision making also involves attributes such as humility and integrity of the trainee (Duijn et al. 2018). 


WBA의 한 유형으로서 EPA의 핵심 요소는 [감독자의 일상적인 임상 작업 활동과 적절한 수준의 감독]에 맞춰 구성된 [위임가능도 평가 척도] 개발을 포함한다(Reckman et al. 2016). 이는 위탁 규모에 따라 임상 감독자들이 이상적인 훈련생 성과에 대한 추상적인 모델이 아닌 실제적인 판단을 하도록 장려하기 때문에 WBA의 형태로서 EPA의 의미를 강화한다(Reckman et al. 2016). [위임가능도 평가 척도 사용]에서 위탁을 결정하는 감독자의 역할인 위탁에 대한 상이한 이해로 인해 긴장이 발생하며, 위임이라는 것이 임상업무 학습의 종단적 성격과 감독자-연수자 관계로 인해 [discrete, point-in-time assessment가 아니라는 점]에서 발생한다.

A key element of EPAs as a type of WBA involves the development of entrustment scales which are construct-aligned with the day-to-day activities of clinical work of supervisors and the appropriate level of supervision (Rekman et al. 2016). This reinforces the meaning of EPAs as a form of WBA because the entrustment scales encourage clinical supervisors to make real-world judgments rather than an abstract model of ideal trainee performance (Rekman et al. 2016). Tensions in using entrustment scales arise from different understandings of entrustment, the role of supervisor in determining the entrustment, and that the entrustment is not a discrete, point-in-time assessment due to longitudinal nature of learning clinical tasks and supervisor–trainee relationships (ten Cate 2020).


WBA 유형에 관계없이, WBA의 단일 인스턴스는 성능 표준에 대한 방어적 판단에 불충분하다. 의학교육의 일부 관행은 consequence에 부합하지 않거나, 하나의 시험이 갖는 부담stakes의 복잡성을 과소평가한다(Tannenbaum and Kannenbaum, kane 2019). 한 예로 단일 WBA 인스턴스(또는 소수의 인스턴스)가 통과/실패 결정에 연결되는 경우를 들 수 있다. 요컨대, '개별 데이터 포인트는 높은 수준의 의사결정에 적합하지 않다'(van der Vleuten 2016 2016)는 것이다. 또 다른 하나는 작은 퍼센트가 단일 WBA에 첨부되고(지분이 낮다는 것을 의미함) 나중에 여러 인스턴스를 합산하여 종합 평가에 사용되는 비율을 형성하는 것이다. 이는 일련의 WBA(Tannenbaum and Kane 2019) 또는 정신측정학 문제에 걸친 결과의 프로파일을 설명하지 않는다. 서술적 데이터를 취합하고 해석하는 것은 방어할 수 있는 판단을 뒷받침할 수 있다(Oudkerk Pool et al. 2018). 의사결정에 위원회가 필요하다는 것이 보고된 바 있다.(Soleas et al. 2020; Thoma et al. 2020).

Regardless of the type of WBA, single instances of a WBA are insufficient for defensible judgements about standards of performance. Some practices in medical education are not consonant with consequences or underestimate the complexity of stakes in testing (Tannenbaum and Kane 2019). One example is where a single WBA instance (or a small number of instances) links to a pass/fail decision. In short, ‘individual data points are not very suitable for high-stakes decisions’ (van der Vleuten 2016). Another is where a small percentage is attached to a single WBA (to imply low stakes) and multiple instances are then later summed to form a percentage used for summative assessment. This does not account for the profile of consequences across a set of WBAs (Tannenbaum and Kane 2019)or psychometric issues. Aggregating and interpreting narrative data can support defensible judgements (Oudkerk Pool et al. 2018). The use of committees for decision making have been documented (Soleas et al. 2020; Thoma et al. 2020).


심리측정적 이슈

Psychometric issues


고부담 판단과 관련하여 WBA를 사용함으로써 여러 임상 현장에서 다양한 WBA 도구, 서로 다른 평가자를 사용한 판단의 신뢰성 또는 재현성에 대한 논쟁을 불러일으켰다WBA 데이터를 사용한 일반적 타당성 분석의 경우 데이터에 적합한 모델은 시간이 지남에 따라 성장 가능성(연습생 기술 향상)을 허용할 필요가 있다. 그렇지 않으면 일반화 분석에서 측정 오차의 원인이 된다. 서로 다른 사이트의 데이터를 결합할 때 '연결성connectedness'에 주목하지 않는 한 심각한 정신측정학 문제가 발생할 수 있다. 연결성은 OSCE 문헌의 작업에서 등장햇는데, WBA분석에도 적용되어야 한다여러 유형의 WBA 도구를 결합할 때 신뢰성이 향상되었다는 증거가 있다(Moon-van Loon et al. 2013). WBA의 목적이 학습을 강조할 때 낮은 신뢰성은 문제가 되지 않는데, 그 이유는 타당성 증거가 학습 효과에 더 초점을 맞출 것이기 때문이다. 그러나 WBA를 종합적 목적 또는 높은 평가를 위해 사용할 경우, 심리측정적 특성에 대한 관심이 더욱 중요해진다(Norcini et al. 2018; Pearce 2020).

The use of WBAs in connection with high-stakes judgements has generated debate about reliability (in psychometric terms), or reproducibility, of judgements with various WBA tools, different assessors, in different clinical sites. For generalisability analyses using WBA data, the model fit to the data needs to allow for possibility of growth (improvement in trainees’ skills) over time. Otherwise, this will contribute to measurement error in generalizability analyses. Combining data from different sites generates serious psychometric issues unless there is attention to ‘connectedness’, a design requirement arising from work in the OSCE literature that should also be applied to WBA analyses (Swanson et al. 1999; Swanson and van der Vleuten 2013). There is evidence of gains in reliability when different types of WBA tools are combined (Moonen-van Loon et al. 2013). Low reliability is not a concern when the purpose of WBAs emphasises learning, as validity evidence will then focus more on learning effectiveness. However, when WBAs are used for summative purposes, or highstakes judgements, attention to psychometric properties becomes more critical (Norcini et al. 2018; Pearce 2020).


평가자 관점 

Rater perspectives


WBA가 해결해야 할 과제 중 하나는 평가자들이 underperformance을 나타내는 정보 제공을 꺼리는 '실패-실패' 현상이다(Yepes-Rios et al. 2016). 이 문제는 특히 모든 WBA 에피소드 후에 종합판단을 하는 것과 관련이 있다. 일반적으로 평가자가 WBA에서 후보자의 성과를 확신하지 못할 때, 그 의심을 핑계로, 후보자를 '통과pass'시키는 경향이 있다. 이는 일련의 marginal performance들을 패스로 넘김으로써, 이들의 합성에 기초하여 높은 점수를 주는 결정을 내리게 할 수 있다. 가능한 경우, 각 WBA 종료 시 결정을 합격/불합격 결정이 아닌 서술적 논평(학습에 도움이 되는 의견)으로 제한하는 것이 도움이 될 수 있다(Cook et al. 2016; Oudkerk Pool et al. 2018).

One of the challenges for WBAs that remains is the ‘failure to fail’ phenomenon whereby assessors are reluctant to provide information that indicates underperformance (Yepes-Rios et al. 2016). This problem is particularly linked to making a summative judgement after every WBA episode. In general, when an assessor is unsure about a candidate’s performance on a WBA, they tend to give the benefit of the doubt and ‘pass’ the candidate. This can lead to a series of marginal performances all being conveyed as passes which then makes high-stakes decision based on the synthesis of such observations less robust. Where possible, restricting the decision at the end of each WBA to narrative comments (which aid learning) rather than a pass/fail decision can help (Cook et al. 2016; Oudkerk Pool et al. 2018).


저성능underperformance 에 대한 평가자 응답에는 불쾌한 메시지에 대해 침묵하는 것(Scarff et al. 2019), '헷징'(Ginsburg et al. 2017) 또는 예의를 지키는 것(BingYou et al. 2019)이 포함된다. 평가자는 훈련 초기에 학습자를 낙제시키는 것을 꺼리거나(개선할 시간이 있다고 가정해서), 다음 단계로 넘겨버린다(학습자와 공감하기 때문에). (다른 직업과 대조적으로) 의료계 내에서 비평, 피드백 및 감독자 역할에 대한 규범이 이러한 평가자 행동을 뒷받침하는 것으로 보인다. WBA의 BEME 리뷰에서 저성능underperformance 을 식별하거나 교정하기 위한 최적의 구현 조건에 대한 혼합된 증거를 발견한 것은 여전히 우려로 남아 있다(Barrett et al. 2016).

Assessor/rater responses to underperformance include keeping quiet about unpleasant messages (Scarff et al. 2019), ‘hedging’ (Ginsburg et al. 2017), or being polite (BingYou et al. 2019). Assessors are reluctant to fail learners early in training (on an assumption there is time to improve) and advanced in training (due to sympathising with the learner). Norms for critique, feedback, and the supervisor role within the medical profession (in contrast with other professions) (Watling et al. 2014;Ginsburgetal.2017;Scarffetal.2019) appear to underpin these assessor behaviours in the workplace. It remains a concern that a Best Evidence in Medical Education (BEME) review of WBAs found mixed evidence about the optimal implementation conditions for identifying or remediating underperformance (Barrett et al. 2016).


해결되지 않은 이슈

Unresolved issues for WBAs


    • WBA 시스템 자체는 학습자와 평가자 사이의 만남에 어떤 영향을 미칩니까? (단일 만남의 피드백 학습자에게 미치는 영향과 대조적으로)?

    • 모든 WBA 도구가 다른 수준의 교육에서 동등하게 효과적인가?

    • WBA를 가치있지만 복잡한 결과와 역량을 육성하는데 사용할 수 있는가?

    • WBA에 대한 프로그램적 접근이 WBA의 학습 효과를 개선할 수 있는가?

    • 학습을 촉진하면서 강력한 의사 결정을 알리기 위해 WBA의 결과를 종합하는 가장 좋은 방법은 무엇인가?

What impact does a WBA system itself have on an encounter between learner and assessor (in contrast with the impact on the learner of feedback from a single encounter)?

Are all WBA tools equally effective at different levels of training?

Can or should WBAs be used to foster valued but complex outcomes and competencies?

Can a programmatic approach to WBAs improve the learning effects of WBAs?

What is the best way to synthesise results of WBAs to inform robust decisions, while still promoting learning?


WBA에 대한 권고 Recommendations for WBAs


WBA에 대한 권고사항은 표 2에 요약되어 있다.

Recommendations for WBAs are summarised in Table 2.

  • WBA와 학습의 통합.

  • WBA와 종단적으로 정기적으로 engagement

  • WBA의 목적을 명확하게 표현한다.

  • 환자, 평가자 및 도구 전반에 걸친 광범위한 샘플링

Integration of WBA with learning.

Regular engagement with WBAs longitudinally.

Clear articulation of purpose of WBAs.

Broad sampling across patients, assessors, and tools.


2011년 이후 문헌에서 나타난 새로운 측면에는 다음과 같은 권고사항이 있다.

New aspects that have emerged from the literature since 2011 include recommendations to:


  • WBA를 통합되고 일관성 있는 WBA 집합으로 설계하고 평가 시스템 또는 시스템의 일부로 설계한다.

  • 바람직한 학습 행동과 효과를 창출하기 위한 설계: 피드백에 초점을 맞추고, 학습 과정을 강조하고, '실패' 현상을 설명하십시오.

  • 판단의 방어가능성을 뒷받침할 수 있는 타당성 증거를 확보. 다음 단계의 훈련으로 진행하기 위한 것과 단일 기술의 숙달 여부를 확인하는 것.

  • 전체론적이고 직장에서의 여러 관찰로부터 데이터를 해석하여 판단을 내리십시오.

  • 임상 실무에 대한 실제 description에 포함된 언어를 채택하는 채점 체계를 사용하십시오.

Design WBAs as an integrated, coherent set of WBAs, and as an assessment system or part of a system.

Design to generate desirable learning behaviours and effects: focus on feedback, emphasise process of learning, and account for ‘failure to fail’ phenomenon.

Ensure validity evidence to support the defensibility of judgements: progression to next stage of training versus identifying mastery of a single skill.

Make judgements that are holistic and require interpretation of data from multiple observations in the workplace.

Use marking schemes that adopt language framed in authentic descriptions of clinical practice.


결론 Conclusion


일반적으로 성과 평가에 대한 다음과 같은 권고사항으로 결론을 내린다.

We conclude with the following recommendations about performance assessment in general:

  • 바람직한 학습 행동을 유도하고 바람직하지 않은/전략적 행동을 억제하는 시스템으로 설계 성과 평가

  • 수행 평가에서 (i) 시간 경과에 따른 기술 증가, (ii) 복수 사이트 및/또는 (iii) 다른 수준의 훈련을 포함하는 경우 정신측정학 영향을 고려한다.

  • 학습과 개선이 바람직한 곳에 서술적 피드백을 포함시키고 해석한다.

Design performance assessment as a system which drives desirable learning behaviours (and discourages undesirable/strategic behaviours).

Account for psychometric implications when performance assessment involves: (i) growth in skills over time; (ii) multiple sites; and/or (iii) different levels of training.

Include, and interpret, narrative feedback where learning and improvement is desirable.







Ghouri A, Boachie C, McDowall S, Parle J, Ditchfield CA, McConnachie A, Walters MR, Ghouri N. 2018. Gaining an advantage by sitting an OSCE after your peers: a retrospective study. Med Teach. 40(11): 1136–1142.


Daniels VJ, Pugh D. 2018. Twelve tips for developing an OSCE that measures what you want. Med Teach. 40(12):1208–1213.


Oudkerk Pool A, Govaerts MJ, Jaarsma D, Driessen EW. 2018. From aggregation to interpretation: how assessors judge complex data in a competency-based portfolio. Adv Health Sci Educ Theory Pract. 23(2):275–287.


Raymond MR, Grande JP. 2019. A practical guide to test blueprinting. Med Teach. 41(8):854–861.


Ossenberg C, Henderson A, Mitchell M. 2019. What attributes guide best practice for effective feedback? A scoping review. Adv Health Sci Educ Theory Pract. 24(2):383–401.


Tannenbaum RJ, Kane MT. 2019. Stakes in testing: not a simple dichotomy but a profile of consequences that guides needed evidence of measurement quality. ETS Res Rep Ser. 2019(1):1–16.


Wood TJ, Pugh D. 2020. Are rating scales really better than checklists for measuring increasing levels of expertise? Med Teach. 42(1): 46–51.






. 2020 Oct 14;1-10.
 doi: 10.1080/0142159X.2020.1830052. Online ahead of print.

Performance assessment: Consensus statement and recommendations from the 2020 Ottawa Conference

Affiliations 

Affiliations

  • 1Department of Assessment and Progression, Duke-National University of Singapore, Singapore, Singapore.
  • 2Curtin Medical School, Curtin University, Perth, Australia.
  • 3Dean's Department, University of Otago, Christchurch, New Zealand.
  • 4Department of Medical Education, Universitas Indonesia, Jakarta, Indonesia.
  • 5Department of Health Sciences Education, University of Cape Town, Cape Town, South Africa.
  • 6School of Medicine, Liverpool University, Liverpool, UK.

Abstract

Introduction: In 2011 the Consensus Statement on Performance Assessment was published in Medical Teacher. That paper was commissioned by AMEE (Association for Medical Education in Europe) as part of the series of Consensus Statements following the 2010 Ottawa Conference. In 2019, it was recommended that a working group be reconvened to review and consider developments in performance assessment since the 2011 publication.

Methods: Following review of the original recommendations in the 2011 paper and shifts in the field across the past 10 years, the group identified areas of consensus and yet to be resolved issues for performance assessment.

Results and discussion: This paper addresses developments in performance assessment since 2011, reiterates relevant aspects of the 2011 paper, and summarises contemporary best practice recommendations for OSCEs and WBAs, fit-for-purpose methods for performance assessment in the health professions.

Keywords: OSCE; Ottawa consensus; Performance assessment; WBA; assessment; validity.


문학과 의학: 평가의 문제(Acad Med, 2006)

Literature and Medicine: A Problem of Assessment

Ayelet Kuper



의사들은 문학과 의학 분야에 관한 기사에 꾸준히 노출되고 있다.

Physicians are being exposed to a steady stream of articles about the field of literature and medicine.


사실상 영어권에서는 문학과 의학 강좌가 성행하고 있다. 1994년까지 미국 의과대학의 약 3분의 1이 그들의 의학 커리큘럼 내에서 문학을 가르치고 있는 것으로 알려져 있다.7 1998년, 그들 중 74%가 그것을 선택과목으로 지정했고, 39%는 그것을 적어도 하나의 과정의 일부로 요구했다.33 2003-2004년, 의학 인문학 전체는 125개의 미국 의과대학 중 88개의 필수과목과 55개의 선택과목으로 대표되었다.34 영국의 경우, 일반적으로 인문학의 강좌 수는, 특히 문학 및 의학 강좌, 35–38은 1993년 보고서인 투모로우 닥터스 39에서 인문학 강좌를 의대생을 위한 적절한 선택 과정으로 승인하고 2003년에 이 개념을 반복한 것에 대한 일반의사회의 승인에 따라 성장했다.

Practically speaking, literature and medicine courses have been flourishing across the English-speaking world. By 1994, about a third of American medical schools were known to be teaching literature within their medical curricula.7 In 1998, 74%of themoffered it as an elective, whereas 39%required it as part of at least one course.33 In 2003–2004, the medical humanities as a whole were represented by at least one required course at 88 of 125 American medical schools and in an elective course at 55 schools.34 In the United Kingdom, the number of humanities courses in general, and literature and medicine courses in particular,35–38 grew in response to the General Medical Council’s endorsement of the humanities as appropriate selective courses for medical students in their 1993 report, Tomorrow’s Doctors,39 and their reiteration of this concept in 2003.40


그러나, 이러한 번창해 보이는 분야에도 불구하고, 의학 교육 문헌에서는 그것의 가치와 정당성에 대한 의문이 계속되고 있다.

Yet, despite this seemingly thriving field, questions regarding its value and legitimacy continue in the medical education literature.


의학(그리고 문학에서는 잘 알려진 하위 학문인 50)과 의과대학에서는 문학과 의학이 받아들여지고 있는 것 같지만 의학 교육의 학문 분야에서는 그렇지 않다. 왜 안 되지? 의학 교육 연구 내에서 문학과 의학 분야가 직면하고 있는 투쟁의 한 가지 잠재적인 이유는 [두 학문의 매우 다른 담론]과 관련이 있다.

It seems that literature and medicine is being accepted in medicine (and in literature,50 where it is a well-recognized subdiscipline64), and in medical schools, but not within the academic field of medical education. Why not? One potential reason for the struggle that the field of literature and medicine is facing within medical education research relates to the two disciplines’ very different discourses.


배경 Background


의료 교육 연구가 성과와 평가에 의해 점점 더 추진되고 있는 것은 이제 사실이다.7

  • 미국에서는 ACGME(Accredit Council for Colonge Medical Education)의 결과 프로젝트가 레지던트 연수에서 목표와 평가 사이의 명확한 연계를 통해 교육적 성과를 강하게 강조하고 있으며, 의대 목표 프로젝트(MSOP)는 학부 의료교육에서도 유사한 문제에 초점을 맞추고 있다. 

  • 캐나다 왕립 의사 및 외과의사 대학과 영국 일반의사협회와 같은 다른 영향력 있는 기관들도 의료 훈련에 대한 결과 기반 접근법을 채택했다. 측정 가능한 목표와 평가 사이의 이러한 연결고리는 의료 교육생들이 자신이 겪을 평가의 요건을 충족시키기 위해 학습을 지도한다는 사실에 직면하여 대중의 기대, 책임 의제, 실용주의에 의해 추진되었다.  

  • 또한 증거 기반 의료 교육 촉진 및 이 과정에 대해 보증된 도구에서 현재의 의료 연구와 실천에 중심이 되는 증거 기반 의료(EBM) 운동으로부터 상당한 spillover가 있었다.81–84

It is by now a truism that medical education research is increasingly driven by outcomes and by evaluation.71 

  • In the United States, the Outcome Project of the Accreditation Council for Graduate Medical Education (ACGME) has put a strong emphasis on educational outcomes in residency training, with a clear link between objectives and assessment,72 and the Medical School Objectives Project (MSOP) has focused on similar issues in undergraduate medical education.73 

  • Other influential bodies, such as the Royal College of Physicians and Surgeons of Canada74,75 and Britain’s General Medical Council,40 have also adopted an outcomes-based approach to medical training. This link between measurable objectives and assessment has been driven by public expectations,72,73,76 the accountability agenda,77 and pragmatism in face of the fact that medical trainees guide their learning to meet the requirements of the evaluations that they will undergo.78–80 

  • There has also been considerable spillover from the evidence-based medicine (EBM) movement, so central to current medical research and practice, in the promotion of evidence-based medical education and in the tools being endorsed for this process.81–84


따라서 전제가 되는 학생 평가와 관련된 이슈들은 [일반적으로 정신분석학의 담론을 이용하여] 의학교육 연구의 맥락에서 다루어져 왔다. 신뢰성 및 타당성과 같은 교육적 시험에 사용되는 통계적 개념은 많은 논의의 틀이 되었다. 타당하고 신뢰할 수 있는 전체론적 등급 척도로 시험을 만들 수 있으며, [복잡한 작업을 객관화된 구성요소 부분으로 분해하면, 전체적인 구성을 경시하여 평가의 타당성을 감소시킬 수 있다는 것]이 두 가지 모두 입증되었다. 우리는 이제 신뢰성과 주관성이 상호 배타적이지 않으며 신뢰성과 객관성이 불가분의 관계에 있는 것이 아니라는 것도 안다.

The issues around student assessment that are thereby foregrounded have generally been addressed, in the context of medical education research, using the discourse of psychometrics.85–87 Statistical concepts used in educational testing, such as reliability and validity,88 have framed much of the discussion.71,86,89 It has been shown both that it is possible to create tests with holistic rating scales that are valid and reliable90 and that the breakdown of complex tasks into objectified component parts can trivialize the overall construct, thereby decreasing the validity of the assessment.91 We now know that reliability and subjectivity are not mutually exclusive nor are reliability and objectivity inextricably linked.80,92


그럼에도 불구하고, 신뢰도를 향상시키기 위해 더 객관적으로 점수를 매기고 따라서 더 "구체적인" 검사를 사용하려는 움직임이 오랫동안 있어왔다. 또한 "평가의 가치는 숫자로만 연구되고 기술될 수 있다"는 암시가 있다. 그리하여, 의학교육 연구의 전반적인 풍토는 능력, 구성, 내용 등 자신이 공부하고 있는 요소 부분으로 [세분화하여 이를 조작하고 분류할 수 있는 수치적 가치로 축소하려는 경향]을 갖고 있다마찬가지로, 신뢰도, 일반성, 오류에 대한 어떤 논의에서도 명백하게 만들어진 "진짜true" 점수에 대한 추구search는 기초적인 실증적 의료 교육 연구를 강조하는데, 이것은 현대의학 교육의 상당 부분을 지배하는 패러다임을 반영한다.

Nonetheless, there has long been a movement towards using more objectively scored93 and hence more “granular” examinations in an attempt to improve reliability.94 There is also an implication “that the value of the assessment can be researched and described in numbers only.”87 The overall ethos of medical education research, then, incorporates a tendency to break down into component parts that which it is studying, whether competencies, constructs, or content, and to reduce it to numerical values that can be manipulated and classified. Similarly, the search for the “true” score, made explicit in any discussion of reliability, generalizability, and error,88 highlights the underlying positivismin medical education research, which reflects a paradigmthat pervades much of modern medical education.58


문학의 학습은 의학적인 맥락 안에 놓였을 때에도 단순화된 분석에 저항하며, 직접적인 실증주의와 양립할 수 없다. 문학에서 의미와 씨름하는 것은, 구성된 현실의 맥락에서, 필연적으로 이 분야에서 평가에 있어서 중대한 문제에 직면하게 된다. 텍스트를 논할 때 옳은 답은 있을 수 없으며, 사실, 바로 이 모호성은 문헌에서 배울 수 있는 교훈 중 하나이며, 환자 치료의 맥락에도 해당된다. 그것은 문학 교과 과정에서 학생들의 능력과 업적에 차등을 둬서는 안 된다는 것이 아니라, 고등교육에서 이러한 차등의 수단이 중요한 논쟁을 불러일으키지 않았다는 것이다.

The study of literature, even when placed within the medical context, is resistant to simplified analysis and is not compatible with straightforward positivism. Grappling with meaning in literature, in the context of a constructed reality, inevitably encounters a major problem with assessment in this area: there can be no one right answer when discussing a text and, indeed, this very ambiguity is one of the lessons that may be learned fromliterature and carried forward into the context of patient care.60 That is not to say that one should not discriminate between students’ abilities and achievements in a literature curriculum, but rather that the means of this discrimination in higher education has not engendered significant debate.


의학교육의 이 영역에서 평가의 문제점을 무시하기보다는, 문학과 의학의 학습을 통해 달성하고자 하는 중요한 역량을 존중하고 강화하는 학생평가의 엄격한 방법을 의학교육계가 개발, 적응 또는 인정해야 할 때다.

Rather than ignoring the problems of assessment in this area of medical education, it is time for the medical education community to develop, adapt, or recognize rigorous methods of student evaluation that respect and reinforce the important competencies intended to be attained through the study of literature and medicine.


방법 Method


개별 기사는 양적 방법, 정성적 방법, 헤르메뉴틱* 텍스트 분석 등 자신의 분야에 적합한 방법론을 사용하여 평가되었다.

Individual articles were evaluated using methodologies appropriate to their fields, including tools fromquantitative methods, qualitative methods, and hermeneutic* textual analysis.


*문자 해석의 한 방법으로, 헤르메뉴틱스는 모든 부분이 하나의 일관된 의미에 기여할 때까지 전체 텍스트에 대한 텍스트 부분의 반복적인 분석을 의미한. 독자는 본문이 처음 만들어진 문맥뿐만 아니라 자신의 사회사적 입장과 지적 전통을 이 해석에서 고려해야 한다.97

*As a method of textual interpretation, hermeneutics involves iterative analysis of the parts of a text against the whole until all of those parts contribute to a single consistent meaning. The reader must take his or her own sociohistorical position and intellectual tradition, as well as the context in which the text was originally created, into account in this interpretation.97


결과 Results


문학 및 의학 커리큘럼 목표

Curricular objectives for literature and medicine


Charon 외 연구진의 개념 체계7은 문학 및 의학 커리큘럼에 대해 주장되고 있는 명시적 목표를 기술하기 위한 유용한 출발점을 제공한다. 의대생들에게 문학을 introducing하는 다섯 가지 이유를 개략적으로 설명하고 있다. 

    • 이 중 하나인 [서사적 윤리]는 전통적인 이론에 기반한 윤리와 대조적으로 제시되지만 우리의 목적을 위해 의료 윤리 과목에 대한 대안적 교육학적 접근법으로서, 이미 널리 가르쳐져 있고 자체 평가 프레임워크를 가지고 있다. 따라서 이번 논문은 이러한 특별한 근거를 다루지 않을 것이다.

Charon et al.’s conceptual framework7 provides a useful starting point for delineating explicit objectives being claimed for literature and medicine curricula. It outlines five rationales for introducing literature to medical students. 

    • One of these, narrative ethics, is presented in contrast to traditional precept-based ethics but is for our purposes an alternative pedagogic approach to the subject of medical ethics, which is already widely taught98 and has its own evaluatory frameworks. The current paper, therefore, will not address this particular rationale.


    • 또 다른 근거인 [문학 이론의 학습]은 의사, 환자, 그리고 그들의 실습에 대한 흥미로운 "새로운 관점"7을 제공하지만, 이 분야의 학생 학습은 문학의 방법과 본문에서 선험적인 근거를 필요로 할 것이다. 따라서 이러한 근거는 본 논문에서도 다루지 않을 것이다.

    • Another rationale, the study of literary theory, offers interesting “new perspectives”7 on physicians, their patients, and their practice, but student learning in this area would require an a priori grounding in the methods and texts of literature. This rationale will thus also not be addressed in this paper.


여기서는 그 대신 나머지 세 가지 이유rationales에서 도출된 목표의 평가에 초점을 맞출 것이다.

    • 환자 경험에 대한 대응 능력

    • 의사 경험에 대한 성찰 능력

    • 실제로 내러티브 기술을 개발하고 활용할 수 있는 능력  

Instead, this paper will focus on the evaluation of objectives drawn from the remaining three rationales: 

    • the ability to respond to the patient experience, 

    • the ability to reflect on the physician experience, and 

    • the ability to develop and make use of narrative skills in practice.


환자(및 의사)는 인생을 내러티브로 살아간다. 환자의 질병에 대한 환자의 감정적, 실존적 반응에 대한 전체적인 이해를 통해 의학을 구현하기 위해 환자의 내러티브를 사전에 파악해야 한다는 점을 특히 강조하는 [내러티브 기반 의학' 운동]이 두드러지게 나타났다. 의학 교육의 영역 내에서, 현실주의와 관련성을 위해 선택된 문학 문헌들이 "[질병에 관한 사실들을 아는 것]과 [환자의 질병 경험을 이해하는 것] 사이의 간격을 메우는 데 도움이 될 수 있다"고 주장되어 왔으며, 여기에는 중요한 사회경제적, 문화적 맥락이 조명된다. 따라서 질병에 대한 이야기는 환자의 아픈 경험을 상상하고 이해할 수 있는 의사들의 능력을 향상시켜 공감하는 환자 중심의 진료를 제공할 수 있는 능력에 잠재적으로 기여할 수 있다.

Patients (and doctors) live their lives as narratives.4,10,99 A significant Narrative- Based Medicine movement has emerged, specifically highlighting the need to foreground patients’ narratives in order to imbue medicine with a holistic understanding of patients’ emotional and existential responses to their illnesses.4 Within the realm of medical education, it has been posited that literary texts selected for realism and relevance “can help bridge the gap between knowing the facts about the disease and understanding the patient’s illness experience [emphasis in the original],”100 including illuminating its important socioeconomic and cultural contexts.26,55 Stories about illness could therefore enhance physicians’ abilities to imagine and understand the experiences of their sick patients,7 potentially contributing to their capacity to provide empathic50 patient- centered care.


[내러티브 역량]"인간이 이야기를 (문자에서 도출된 것이든, 환자에서 나온 것이든, 비전문적 만남에서 나온 것이든) 흡수, 해석, 반응하기 위해 사용하는 능력"으로 정의되며, 문학적인 텍스트의 긴밀한 읽기와 관여를 통해 가르친다.5 이 역량은 의사-환자 관계에서 전문성과 공감의 양면에 기여하는 것으로 생각된다. 따라서 서술적 역량의 구조는 다음과 같이 더욱 복잡한 구조의 대리 끝점surrogate endpoint으로 개념화될 수 있다. 

    • 예를 들어, [이야기 속의 등장인물의 감정과 경험을 식별하고 반영하는 능력]은 [환자와 사랑하는 사람들의 경험에 대한 나중에 이해하고 반응하는 능력]에 대한 잠재적인 대리지표이다.

Narrative competence, defined as “the competence that human beings use to absorb, interpret, and respond to stories”5 (whether derived from texts, from patients, or from nonprofessional encounters), is taught through the close reading of and engagement with literary texts.5 It is thought to contribute to the development of both professionalism101,102 and empathy5,8 in the physician–patient relationship. Thus, the construct of narrative competence might be conceptualized as a surrogate endpoint for these more complex constructs, with, 

    • for example, students’ abilities to identify and reflect on the emotions and experiences of characters in stories as potential surrogate markers for their later understanding of and responses to the experiences of patients and their loved ones.


마찬가지로, 문학은 훈련생들에게 "의사의 종종 꽤 외로운 직업임을 이해하는 생생한 수단"을 제공한다. 특히 학생 및 레지던트 수련 기간 동안 의사들은 평범한 사람들의 영역 밖에서 생활한다. 그들의 일상적인 죽음, 고통, 치유 경험은 일상 언어의 테두리를 벗어나 있다. 정서적으로 어려운 상황과의 정기적인 만남은 학업 스트레스 요인과 결합되어 의대생들의 스트레스와 우울증 비율이 동료들에 비해 증가함에 반영된다. 이야기와 시는 의학교육에서 달리 놓친 과제를 수행할 수 있는데, 여기서 이야기와 시는 "의사가 해야 할 모든 일에 대한 중요한 개인적 성찰과 검사를 자극할 수 있다"고 한다.  즉, 문학은 연습생들에게 환자 치료 능력이 아닌 자신과 자신의 감정에 대해 성찰하는 언어와 도구를 제공할 수 있으며, 그로 인해 [초기의 치유자를 치유]하는 데 도움이 될 수도 있다.

Similarly, literature provides trainees with “a vivid means of understanding the physician’s often quite lonely job.”68 Physicians, especially during the intense years of student and residency training, live outside the realm of the commonplace. Their everyday experience of death, suffering, and healing is situated outside the boundaries of everyday language. Regular encounters with emotionally challenging situations, combined with academic stressors, are reflected103 in the increased rates of stress and depression among medical students as compared to their peers.103,104 Stories and poems may perform tasks otherwise missing in medical education, wherein they “can stimulate important personal introspection about and examination of all that the physician is called on to do.”7 In other words, literature may provide trainees with the language and the tools to reflect, not about their patient care abilities, but about themselves50 and their own emotions,100 and thereby may help to heal the nascent healer.18


의료 커리큘럼에 있는 어떤 것도 연습생들에게 "그 다음 순간"을 적절하게 준비시키지 못한다.

    • 그들이 환자의 병실을 나오며 방금 누군가에게 당신이 곧 죽을 거라고 말한 것을 깨닫는 순간, 

    • 그들이 다음 만남으로 나아가고 자신의 삶을 이어나갈 수 있도록 생각과 감정을 인식하고 반응할 수 있는 틀을 갖춰야 하는 순간. 

내러티브 능력을 창조함으로써, 연습생들에게 (그들 자신의 삶에서 사용할 서사적 도구 세트를 제공하기 위한) 감정적인 자기 성찰의 과정을 연습할 수 있었. 그러므로 서술적 역량과 감정적 자기반사 능력은 실존적 고통과 냉소와 냉소가 생겨날 때 훈련생을 보호할 수 있는, [감정적으로 도전적인 상황에 대한 회복탄력성]을 위한 잠재적 교실 기반의 대리 결과물이다.

Nothing in the medical curriculum adequately prepares trainees for “the moment after”—the moment they walk out of a patient’s room and realize that they have just told someone that they are going to die, the moment when they must have a framework for recognizing and responding to their thoughts and emotions in order to be able to move on to the next encounter and to carry on with their own lives. By creating narrative competence, this process of emotional self-reflection could be practiced in order to provide trainees with a set of narrative tools to use in their own lives. Narrative competence and emotional self-reflective ability are therefore potential classroom- based proxy outcomes for the resilience to emotionally challenging situations that may protect trainees from existential distress and from the development of callousness and cynicism.


문학 학습은 또한 연습생들에게 "내러티브 기술"이라는 일반적인 루브릭에 따라 분류될 수 있는 유용한 임상 능력을 제공할 수 있다. 가장 단순하게 말해서, 이야기를 읽고 그것에 대해 쓰는 것은 더 일반적인 의사소통 능력을 향상시킬 수 있다. 다른 내러티브 기술은 내러티브 역량의 더 큰 구성의 구성요소로서, 이것은 공감뿐만 아니라 [환자의 병력, 신체적 발견 및 기타 보조 데이터에서 수집할 복잡한 이야기를 구성하고 의미 있게 통합하는 의사의 능력]에 기여한다고 여겨진다. 이러한 기술들은 임상 지식의 기초가 되는 서사적 구조를 명시적으로 이용한다. 그렇다면 [문학에서 가져간 이야기에 대해 글을 쓸 수 있는 능력]은 환자 진단과 치료를 위한 일관성 있고 수사적으로 건전한 계획을 수립하고 전달하는 능력에 유용한 대리 성과가 될 수 있다.

The study of literature could also provide trainees with useful clinical abilities that may be grouped under the general rubric of “narrative skills.” Most prosaically, reading stories and writing about them can enhance more general communication skills.41 Other narrative skills are components of the larger construct of narrative competence, which is believed to contribute not only to empathy but also to the physician’s ability to organize and meaningfully integrate the complex stories to be gleaned from patients’ histories, physical findings, and other ancillary data.7 These skills make explicit use of the narrative structure that underlies clinical knowledge.16,68,105 The ability to write about stories taken from literature, then, might become a useful surrogate outcome for the ability to construct and communicate a coherent and rhetorically sound plan for patient diagnosis and treatment.


무수히 많은 해석이 가능한 문학에 대한 연구도 모호성 개념에 대한 학생들의 노출을 증가시킨다. 이는 그들이 일반적인 전문 훈련과 특히 의료 훈련의 "실천에 대한 실증주의적 인식론" 이외의 방법을 아는 방법에 노출시킴으로써 임상 실습에서 전문가로서 직면해야 할 불확실성과 모호성에 대비하는 데 도움이 될 수 있다. 따라서 문학적 본문에 대한 반응을 통해 평가한 바와 같이 이러한 모호성 개념에 대한 그들의 파악은 환자 치료의 맥락에서 이를 접하기 위한 준비의 대용으로서 검토될 수 있을 것이다.

The study of literature, in which there are myriad possible interpretations, also increases students’ exposure to the concept of ambiguity.28,60,106 This may help prepare them12,64 for the uncertainty107 and ambiguity99 they will have to face as professionals in clinical practice by exposing them to ways of knowing other than the “[p]ositivist epistemology of practice” of professional training in general107 and of medical training in particular.58 Their grasp of this concept of ambiguity, as assessed through their responses to literary texts, could therefore be examined as a proxy for their preparedness for encountering it in the context of patient care.


그런 다음, 문학 및 의학 강좌의 목표를 안전한 강의실 상황에서 [임상 실습과 관련된 일련의 중요한 기술 개발]로 해석할 수 있다. 이러한 기술은 문헌과 의학이 개발하고자 하는 고차원의 목표에 대한 잠재적 대리 결과물이다. 서사적 역량 개발은 환자의 질병 경험 및 치료 경험에 대한 공감적 이해를 위해 필요한 기술이다. 감정적 자기성찰능력의 발달은 환자 치료에 대한 배려적이고 연계된 전문적 접근방식을 유지하는 능력에 필요한 기술이다. 마지막으로 [일관되고 종합적인 임상 상황clinical picture의 구성]을 위해서는 내러티브 기술의 발전이 필요하다.

It is possible, then, to interpret the objectives for courses in literature and medicine as being the development, in a safe, classroom situation, of a set of critical skills relevant to clinical practice. These skills are potential proxy outcomes for the higher-order objectives intended to be developed by literature and medicine. The development of narrative competence is a skill necessary for empathic understanding of patients’ experiences of illness and treatment. The development of emotional self-reflective ability is a skill necessary for the ability to maintain a caring and connected professional approach to patient care. Finally, the development of narrative skills is necessary for the construction of coherent and comprehensive clinical pictures.


문헌 및 의학 분야의 평가 기법

Assessment techniques in literature and medicine


문학 및 의학 강좌는 현재 길고 짧은 에세이, 논술 시험, 포트폴리오, 구두 발표, 포스터, 사례 쓰기, 저널, 응답 논문, 시, 단편 소설, 환자의 목소리에 담긴 내러티브와 같은 창조적 프로젝트, 심지어 객관적 구조화된 임상 시험 (OSCE) 스테이션 등 다양한 평가 도구를 사용하고 있다. 

Literature and medicine courses currently use a wide variety of assessment tools, including long or short essays, essay examinations, portfolios, oral presentations, posters, case write-ups, journals, response papers, creative projects such as poems, short stories, narratives in the patient’s voice, and even objective structured clinical examination (OSCE) stations.


사용할 평가 방법을 선택하기 위한 근거를 명시적으로 언급하는 과정 설명은 거의 없다. 그러나 분명한 것은 객관식 문항과 그 종류의 것들은 신뢰성과 행정의 용이성, 채점 때문에 의학교육에서 다른 곳에서 가장 많이 사용되는 서면평가 형태이나, 이 영역에서는 학생평가에 적합하지 않은 것으로 여겨지고 있다는 점이다.

Few course descriptions comment explicitly on the rationale for selecting the method(s) of evaluation to be used. What seems clear, however, is that multiple- choice questions and their ilk, which are the most commonly used forms of written assessment elsewhere in medical education because of their reliability and ease of administration and marking,89 have not been seen as suitable for student evaluation in this domain.


문학 및 의학 강좌에 대한 적절한 평가의 성격을 논하는 유일한 작가 중 한 명인 스퀴어 등은 서면 과제들을 형성 평가와 총괄 평가로 사용하는 것을 지지한다. 그러나 그녀는 이 지지에 대한 어떤 증거도 제시하지 않으며, "점수에 대한 지나친 집중을 피하고" "자기반성, 해석, 창의성"을 권장하는 것 외에 채점제나 가이드라인을 제시하지 않고, "학생들 사이의 차등화"보다는 피드백과 코멘트를 제공하는 데 초점을 맞추고 있다.

Squier,100 one of the only authors who discusses the nature of appropriate assessment for courses in literature and medicine, endorses the use of written assignments as both formative and summative assessments. However, she provides no evidence for this endorsement, nor does she propose a marking scheme or guidelines other than to “avoid an excessive focus on grading” and to encourage with such grading “self reflection, interpretation, and creativity,” focusing on giving feedback and comments rather than making “[f]ine distinctions between students.”100


이와 유사하게, 다우니는 다음과 같이 쓰고 있다: "의학 인문학 과정을 평가하는 데는 어려움이 없다. 그것은 시험이나 논술, 그 밖의 다른 프로젝트로 평가될 수 있다. 이런 일은 수세기 동안 예술 교수진에서 일어났고 이런 종류의 평가에 대한 예술 교수진에서 많은 경험이 있다."106그는 계속해서 표준 예술 수업에서 텍스트(이 경우, 시)가 어떻게 가르쳐질지, 그리고 그것에 관한 에세이가 어떻게 표시될지에 대해 고찰한다. —일관된 논거와 그 논거의 방향보다는 본문과 그 역사적 배경에 근거한 논거의 존재에 의해. 하지만, 그도 역시 자신의 주장을 정당화하거나 증거를 제시하지 않는다.

Similarly, Downie writes: “There is no difficulty about evaluating a medical humanities course. It can be assessed by examination or essay or other project. This has happened in Arts faculties for centuries and there is a great deal of experience in Arts faculties of this sort of evaluation.”106 He goes on to discuss how a text (in this case, a poem) might be taught, and an essay about it would then be marked, in a standard arts class—by the presence of coherence and of an argument grounded in the text and its historical background, rather than by the direction of that argument.106 Again, he does not justify or provide evidence for his assertions.


영국 고등 교육 품질 보증청 영문학과 언어의 학부 강의와 관련해 주제 벤치마크인 영어는 에세이가 "평가 과정에서 필수적인 요소"가 될 것을 요구하고 있으며, 에세이가 이 분야에서 요구되는 기술력의 입증에 적절하다는 의견을 제시한다.108

the British Quality Assurance Agency for Higher Education (QAA). Regarding undergraduate instruction in English literature and language, its subject benchmark statement, English, mandates that essays be “an essential component in the assessment process” and comments on their appropriateness to the demonstration of the skills required in this discipline.108


문학 연구나 관련 고등교육 영역에서는 그다지 두드러지지는 않지만, 의학 교육에서는 인문학 관련 커리큘럼에서 에세이처럼 포트폴리가 활용되어 왔다.52

Although they are not as prominent in the study of literature and in related higher education domains, portfolios, like essays, have been used in humanities- related curricula in medical education.52


[포트폴리오] 개발에 관한 현재의 일반 교과서는, 포트폴리오를 [학생이 시간 경과에 따라 성취한 것(또는 성취하려고 노력한 것)을 보여주는 최소한 부분적으로 선택된 작품 모음]으로 기술하고 있다. 여기에는 특히 "학생 자기 평가와 성찰을 중심에 두고, 포트폴리오 내 작업이 달성되는 과정을 그릴portray 수 있는 기회"에 대한 강조가 포함된다. '포트폴리오'라는 용어의 의미는 특히 성찰 요건에 관하여 최근 의학 교육 문헌에서 논쟁의 대상이 되어 왔다. 어떤 사람은 어렵고, 시간이 많이 소요되며, 잠재적으로 불필요하다고 간주하고 있으며, 다른 사람은 도구의 독특하고 근본적인 측면이라고 믿고 있다. 포트폴리오의 정의의 일부로서 자기성찰을 널리 인식하지 않는다면, 일반적인 교육 문헌과 특히 의학교육 내에서, 이 논문에서는 포트폴리오라는 용어는 [성찰의 증거를 포함하는 작품의 모음]을 일컫는 말라 사용할 것이다.

A current general textbook on portfolio development describes a portfolio as a compilation of works, at least partially student-selected, that shows what the student has accomplished (or tried to accomplish) over time; this includes a particular emphasis on “the centrality of student self-evaluation and reflection and the opportunity to portray the processes by which the work in the portfolio is achieved.”113 The meaning of the term“portfolio” has been the subject of recent debate in the medical education literature, particularly with respect to the requirement for reflection, which some have viewed as difficult, time-consuming, and potentially unnecessary114 and others believe to be a unique and fundamental aspect of the tool.115,116 Given the otherwise widespread recognition of self- reflection as part of the definition of a portfolio, both in the education literature in general113 and within medical education in particular,117–120 within this paper the use of the term portfolio will refer to a collection of works which includes evidence of reflection.


이러한 문헌은 타당성과 신뢰성의 담론에 관여하거나 인정하지도 않으며, 증거 출처에 대한 정성적 방법론을 명시적으로 검토하지도 않는다. 재현성, 정확성, 표시 용이성 등을 논하지 않으며 기준 참조도 없다. 그럼에도 불구하고 그것들은 의학 교육 내에서 나온 수사학적 주장과 관련이 있다. 1991년 문헌을 검토한 노먼 외 연구진, 91명은 동일한 구성물에 대한 주관적 시험과 객관화된 시험이 높은 상관관계를 갖는다고 결론지었다. 이 저자들은 "학생들은 서로에 대한 지식의 여러 측면을 다루어야 하는" 에세이와 같은 질문 유형이 아닌, 객관식 또는 단답형 질문을 사용할 경우, 특정 구조를 경시할 위험을 미리 예측했다. 

These literatures neither engage in nor acknowledge the discourse of validity and reliability, nor do they look explicitly to qualitative methodology for sources of evidence. They discuss neither reproducibility, accuracy, nor ease of marking, and they have no criterion reference. They are nonetheless related to rhetorical arguments that have emerged from within medical education. Norman et al.,91 reviewing the literature in 1991, concluded that subjective and objectified tests of the same construct were highly correlated. These authors foregrounded the risk of trivializing certain constructs using either multiple-choice or short- answer questions, as opposed to question types, such as essays, “which require students to handle several aspects of knowledge in relation to each other.”91


따라서 그들은 후자를 시험의 합법적 옵션으로, 특히 고차 구조의 사용을 받아들였다. 더구나 슈와르트와 반데르 벨루텐은 시험의 목표가 있다면 그렇게 말할 정도였다. 

    • 시험의 목표가 "추론 과정을 설정하거나, 정보를 요약하거나, 또는 알려진 원리를 다른 맥락에서 적용하는 것이라면", 그리고 특히 한 사람이 글쓰기 능력에도 관심이 있다면, 그렇다면, 유일한 적절한 유형의 필기 질문은 에세이이다. 

다음의 요약이 설명하듯이, 평가 기법으로서 에세이와 포트폴리오의 가치에 대해서도 상당한 양의 심리학적 연구가 있었는데, 그 중 많은 부분이 논란의 여지가 있었다.

They therefore accepted the use of the latter as a legitimate option for testing, particularly of higher-order constructs.91 Moreover, Schuwirth and van der Vleuten have gone so far as to say that 

    • if the goal of a test is “to set up a reasoning process or summarise information, or [. . .] to apply a known principle in different contexts” then the only appropriate type of written question is an essay,121 particularly if one is also concerned with writing ability.122 

As the following summary will illustrate, there has also been a significant amount of psychometric research, much of it controversial, on the value of essays and portfolios as evaluative techniques.


에세이 및 포트폴리오

Essays and portfolios


[에세이 평가의 구성적 타당성]은 의학적인 맥락에서 구체적으로 연구되었다. 예를 들어 1990년 연구에서 대학원 수준의 임상적 판단 평가를 위해 논술 시험이 검증되었다. 에세이의 상호 신뢰도 측면에서 여러 연구들이 상반된 결과를 내놓았다. 그들의 일반화 가능성에 대한 연구도 있었다. 예를 들어, 세부적인 체크리스트를 사용하는 비의사 3명이 전체적 표시를 하는 의사 3명으로 교체되었을 때 임상적 판단에 대한 논술 테스트의 일반화가능성은 향상되었다(그리고 필요한 테스트 시간은 감소하였다). Frijns 외 연구진은 [비록 4시간에서 6시간 사이에 1개 또는 2개의 평가자가 있어야 일반화 계수 0.80 이상을 달성할 수 있었지만], 개방된open 문제에 대해 재현 가능한 방식으로 의사-평가자가 채점할 수 있다는 것을 보여주었다. 

The construct validity of essay assessments has been specifically studied in the medical context. For example, in a 1990 study, an essay test was validated for the assessment of clinical judgment at the postgraduate level.123 In terms of essays’ interrater reliability, several studies have given conflicting results.94,124–126 There has also been research into their generalizability. For instance, the generalizability of an essay test of clinical judgment improved (and its required testing time decreased) when three nonphysicians using a detailed checklist were replaced by three physicians marking holistically.127 Frijns et al.128 showed that open-ended questions could be marked by physician-raters in a reproducible manner, although achieving a generalizability coefficient of 0.80 or above with one or two raters required between four and six hours of testing time.


심리측정학 기준이 [평가도구 형식의 고유한 특성이 아니라는 현재의 이해]와 함께 에세이를 채점하는 데 신뢰성의 문제는 [시험 형식에 내재된 문제]가 아니라 [적절한 시험 시간과 전문가 채점자의 가용성]에 대한 문제인 것이다. 슈와르트와 반 데르 벨루텐은 평가되는 구조의 사소한 것을 피하기 위해 에세이를 표시하기 위해 과도한 구조물을 구성하지 않도록 조심하지만, 신뢰도를 향상시키고 그에 따라 그러한 자원의 필요성을 감소시키는 여러 가지 방법이 문헌에 제시되었다.

 In keeping with our current understanding that psychometric criteria are not inherent qualities of an instrument’s format,80 the issue of reliability for marking essays is not an intrinsic problemwith the test type but rather a question of the availability of adequate testing time and of expert markers. Multiple means of improving reliability, and thereby decreasing the need for those resources, have been suggested in the literature,88,121,122,125,126,129–131 although Schuwirth and van der Vleuten caution against overstructuring rubrics for marking essays to avoid trivializing the construct being assessed.121,122


포트폴리오는, [의학 교육에서 보다 개인적이고 프로세스 지향적일 뿐만 아니라] 새로운 것이다. 지금까지 의학적인 맥락에서 연구된 구조와 관련하여 타당성을 입증하는 것은 어려웠다. 포트폴리오에 대해 가장 잘 확립된 형태의 타당성은 시간의 경과에 따른 성찰 및 퍼포먼스을 포함한 건설에 대한 안면 타당성이다. 그러한 구성에 대한 예측, 기준 및 구성 타당성을 설정하는 것은 어려울 것이다. 

Portfolios are newer to medical education, as well as more individual and process-oriented. It has thus far been difficult to establish their validity with respect to the constructs for which they have been studied in the medical context. The best established form of validity for portfolios is face validity for constructs including reflection119,132 and performance over time.119 Establishing their predictive, criterion, and construct validity for such constructs will be challenging.117,119,132,133 


2001년 말 스코틀랜드 던디에서 의대생들의 최종 시험의 일부로 사용된 포트폴리오의 한 연구의 저자들은 보다 전통적인 시험 구성 요소로는 평가되지 않는 태도와 근면성과 같은 구조물에 대한 다양한 타당성의 증거를 주장했다. 정신건강의학과 레지던시 교육에서 포트폴리오에 대한 최근의 연구는 정신과적 지식과 훈련 수준에 대한 적당한 합치성을 보여주었다.

The authors of a study published in late 2001 of portfolios used as part of the final examination for medical students in Dundee, Scotland claimed evidence of divergent validity for constructs, such as attitude and diligence, which are not assessed by their more traditional examination components.134 A more recent study of portfolios in psychiatry residency education demonstrated modest convergent validity for psychiatric knowledge and level of training.135


포트폴리오 평가의 신뢰도도도 연구되었으며, 평가자 간 신뢰도 추정치는 0.1에서 0.82까지이다. 일반화 및 의사결정 연구는 또한 최소 0.8의 일반화에 필요한 광범위한 항목 및/또는 측정자를 생성했다. 포트폴리오 평가에서 신뢰도 향상을 위한 전략의 여러 제안이 나왔다. 여기에는 구체적인 기준과 표준화를 통한 객관화가 포함된다. 그러나, 컨텐츠의 표준화와 구체적인 기준의 개발은, 아마도 실제로 신뢰성의 문제를 제거하지 않고, 학생 성찰과 학습의 범위를 제한함으로써, 평가의 타당성에 위협이 된다는 우려는 남아 있다.

The reliability of portfolio assessments has also been studied, with estimates of interrater reliability ranging from0.1 to 0.82.119,136–138 Generalizability and decision studies have also generated a wide range of numbers of items and/or raters required for a generalizability of at least 0.8.119,135,137 Multiple suggestions of strategies to improve reliability in portfolio evaluation have been made.120,132,139 These include objectification through specific criteria and standardization.120,132 The concern remains, however, that the standardization of content and the development of specific criteria present threats to the validity of the assessment by limiting the range of student reflection and learning,119,120 perhaps without actually eliminating the problem of reliability.140


그래서 우리는 지금 난관에 봉착했다. 에세이와 포트폴리오가 문학과 의학의 평가에 가장 적합한 도구로 홍보되고 있으며, [공감, 개인적 성찰, 전문성과 같이 쉽게 평가할 수 없지만 점점 중요해지고 있는 역량]을 우리가 살펴볼 수 있게 해준다. 그러나, 도구로서, 그것들은 우리의 전통적인 정신 측정학의 세분화된 기법을 사용하여 쉽게 분석될 수 없으며, 어떤 조치들에 의해서 그것들은 총괄적 결정에 사용할 만큼 "좋지" 않다. 그럼에도 불구하고, 이러한 중요한 구조와 그것들을 홍보하기 위해 고안된 커리큘럼을 포기하는 것은 너무 급진적인 선택이다.

So we are now faced with a conundrum. Essays and portfolios are promoted as the most appropriate tools for the evaluation of literature and medicine, and they may allow us to tap into competencies that we cannot easily assess but which are becoming increasingly important, like empathy, personal reflection, and professionalism. However, as tools, they are not readily analyzable using the granular techniques of our traditional psychometrics, and by some measures they are not “good” enough to use for summative decisions. Nonetheless, abandoning these important constructs, and a curriculum that is designed to promote them, is too radical an option.


캐닝스 외 연구진이 다음과 같이 요약한다. 

"진실로 신뢰할 수 있는 평가를 찾기 위한 노력에서, 우리는 때때로 '주관적인' 작품을 평가해야 할 필요성을 간과해서는 안 된다. 그러한 채점에서 신뢰성이 다소 떨어질 것이라는 점을 받아들여야 한다"고 덧붙였다. 

또는 스내든은 우리에게 경고한다. 

"만약 우리가 측정할 수 없는 것을 측정하려고 애쓰게 된다면, [. .we]는 그것이 더 쉽기 때문에 관련 없는 것을 측정하게 될지도 모른다." 

다행히 좀 더 주관적인 평가 도구의 엄격함rigour은 측정에 의존하지 않고 다른 방법으로 평가할 수 있으며, 그러한 평가의 예시들이 의학 문헌에 등장하기 시작하고 있다.

As Cannings et al. summarizes: “In our efforts to find a truly reliable assessment, we must not lose sight of the need to occasionally assess a ‘subjective’ piece of work [. . .]. We then have to accept that there will be some loss of reliability in the marking that follows.”130 Otherwise, Snadden warns us, if we “continue to struggle to measure the unmeasurable, [. . .we] may end up measuring the irrelevant because it is easier.”141 Fortunately, the rigor of more subjective evaluation tools can be assessed in other ways, without relying on measurement, and examples of such assessment are beginning to enter the medical literature.


정성적 방법 및 평가로서의 병리학

Qualitative methods and hermeneutics as assessment


환자 경험, 의사 경험, 모호성의 질적, 개별화된 세계에 정량적 엄격성의 규칙을 적용하려고 시도하기보다는, 우리는 어떤 형태의 평가가 더 잘 연구될 수 있고, 어떤 질문은 질적 방법론을 사용하여 더 잘 대답할 수 있다는 것이 점점 더 많이 공표되는 인식을 볼 수 있다. 

Rather than attempting to apply the rules of quantitative rigor to the qualitative, individualized world of patient experience, physician experience, and ambiguity, we can look to the increasing published recognition that some forms of assessment can be better studied, and some questions better answered, using qualitative methodology.80,87,92


이러한 경향에 반영되고 있는 것은 의료실습과 의학교육의 서술적 세계에서 '해석-의식의 구별'의 중요성에 대한 이해의 증대다. 이는 포트폴리오와 에세이가 제공하는 질적 정보의 풍부함을 감안할 때 특히 해당될 수 있다. 다른 분야의 논술 평가에 대한 분석은 질적 접근법을 취하였다. 포트폴리오가 학생 평가에 대한 정성적 또는 양적, 질적 접근법을 혼합한 것으로 설명되어 왔기 때문에, 일부에서는 의료 교육에서 평가 도구로서의 포트폴리오 평가도 [질적 연구에 기초하여 수립된 접근방식]에서 이익을 얻을 수 있다고 주장해 왔다.

 Reflected in this trend is a growing understanding of the importance of “interpretation—the discernment of meaning”4 in the narrative worlds of medical practice and medical education. This may be particularly true of portfolios and essays, given the wealth of qualitative information that they provide. Analyses of essay evaluations in other disciplines have taken qualitative approaches.142 Because portfolios have been described as embodying a qualitative113 or a mixed quantitative and qualitative119 approach to student assessment, some have argued that the evaluation of portfolios as an assessment tool in health care education could also benefit from an approach founded in qualitative research.138,140,141,143,144


이것은 최근에 마스트리히트 대학의 의과대학에서 시도되었다.145 연구자들은 다음과 같은 세 가지 기본적인 전제에서 그들의 개입을 뿌리내렸다. 

This has recently been tried at the medical school at Maastricht University.145 The researchers rooted their intervention in three basic premises: 


    • (1) 포트폴리오 평가의 가치가 표준화에 의해 상실되는 진정한 개인적 경험의 풍부함에 대한 기초에서 비롯된다는 것. 

(1) that the value of portfolio evaluation stems from its basis in the richness of authentic personal experience, which would be lost by standardization; 


    • (2) 평가자 훈련과 체크리스트는 기존의 정신측정학 방법에 의해 평가된 적절한 신뢰성을 산출하기 위한 표준화의 결여를 보상할 수 없다는 것 

(2) that rater training and checklists cannot compensate for this lack of standardization to produce adequate reliability as assessed by traditional psychometric methods; and 


    • (3) 질적 연구 전통에서 도출된 질적(및 주관적) 방법은 학생 평가에 대한 새로운 접근법을 제공할 수 있다는 것

(3) that qualitative (and subjective) methods, derived from the qualitative research tradition, can offer novel approaches to student assessment. 


그들은 네 가지 의사 역할("의료 전문가, 과학자, 의료 종사자 및 개인")과 관련된 개인의 장단점에 대한 반성과 증거를 포함하도록 의도된 포트폴리오의 형태별 및 종합 평가와 이러한 영역을 다루기 위한 학습 계획을 모두 수행했다. 종합평가에서 각 학생의 멘토는 '장점과 약점 분석의 질', '학습목표의 명확성과 실현가능성' 등 복수의 글로벌 기준을 활용했다.  그 후, 구분, 합격, 불합격 중 하나일 수 있는 멘토가 부여한 등급에 대해 학생과의 논의를 거쳐, 1, 2명의 다른 독자에 의해 확인되었으며, 13명의 평가위원(학생 멘토 포함)이 심사한 결과 계속 의견 불일치가 발생하는 경우.

They carried out both formative and summative evaluations of portfolios intended to contain reflections on, and evidence of, personal strengths and weaknesses in relation to four physician roles (“medical expert, scientist, health care worker and person”145) as well as learning plans to address these areas. In the summative evaluations, each student’s mentor used multiple global criteria such as “the quality of the analysis of strengths and weaknesses” and “the clarity and feasibility of the learning objectives.”145 The grade assigned by the mentor, which could be either distinction, pass, or fail, was then discussed with the student, confirmed by one or two other readers, and in cases of continuing disagreement reviewed by a committee of 13 assessors (including the student’s mentor).


정성적 연구 내에서 [구성주의적 전통으로부터 두 가지 방법론적 기준을 도입]함으로써, 신뢰성과 신뢰성의 병행적 타당성과 신뢰성에 이용할 수 있다. 그리고 나서 그들은 다음을 보장하기 위해 질적인 방법의 영역에서 받아들여진 전략을 사용했다. 

    • 신뢰도(절제, 장기적 참여, 회원 확인) 및 

    • 종합 평가의 신뢰도(추적 추적, 신뢰도 감사)

Having introduced two methodological criteria from the constructivist tradition146 within qualitative research, credibility and dependability, which can be used to parallel validity and reliability, they then used accepted strategies from the realm of qualitative methods for ensuring the 

    • credibility (triangulation, prolonged engagement, member checking) and 

    • dependability (audit trail, dependability audit) of their summative assessment.


그러나, 방법론의 진정한 계층이 없는 경우, 우리는 [하나의 전통의 기준]을 [다른 타당성 담론의 이미 엄격한 방법론]에 강요하지 않도록 주의해야 한다. 그렇게 되면 "[단일 평가 수행 기준에 기초한 기계적인 결정]은 [복수의 평가 정보 출처에 걸쳐 축적되고 삼각된 정보에 기초한 전문적 판단]으로 대체된다."

However, in the absence of a true hierarchy of methodologies, we should be careful to avoid imposing the criteria of one tradition onto the already rigorous methodology of another valid discourse, wherein the “mechanistic decision based on a standard of performance on a single assessment is replaced by a professional judgment based on accumulated and triangulated information across multiple sources of assessment information.”87


평가 연구에서 질적 방법의 맥락에서 자주 논의되는 세 번째 방법론적 기준은 authenticity로서, 이는 "측정된 결과가 인간 성과의 적절하고, 의미 있고, 중요하고, 가치 있는 형태를 나타내는 정도"로 정의된다. 

    • 특히 포트폴리오가 '일정 기간 동안의 실제 수행, 즉 이론의 적용과 학생이나 의사의 수행 정도를 평가한다'는 평가를 할 수 있다는 점에서 진정한authentic 평가의 형태로 제시되어 왔다. 

    • 비슷하게 에세이는 서면 의사소통 기술과 서술 구조와 같은 역량에 대한 진정한 평가 도구라고 주장될 수 있다. 

A third methodological criterion which is often discussed in the context of qualitative methods in assessment research is that of authenticity, defined as “the extent to which the outcomes measured represent appropriate, meaningful, significant and worthwhile forms of human accomplishments.”147 

    • Portfolios in particular have been advocated as authentic forms of assessment119 in that they allow the evaluation of “performance in practice over a period of time, in other words they assess the application of theory and the performance of the student or doctor.”117 

    • Essays can similarly be argued to be authentic evaluative tools for competencies such as written communication skills and narrative structure. 


이러한 진정성은 "한편으로는 평가와 교육목표, 다른 한편으론 미래실천 요구 사이의 최적의 조화를 가능하게 한다." 그러나, 우리가 본 바와 같이, 신뢰도를 높이기 위해 종종 심리학 담론에서 주창되는, 할당된 업무의 표준화 및 평가의 구조화는, 진정성에 중대한 위협을 제기한다.

Such authenticity allows “optimal congruence between assessment on the one hand and educational goals and the demands of future practice on the other.”92 However, the standardization of assigned tasks and the structuring of their assessment, which, as we have seen, are often advocated in the psychometric discourse to increase reliability, present a significant threat to authenticity.119


서면 본문의 평가에 대한 또 다른 흥미로운 비심리학적 접근법은 모스의 평가방법에 의한 것이다. 이는 마스트리히트 집단의 정성적 기준보다 덜 엄격한 구성주의적 방법론을 사용하며, 대신 헤르메네우틱 텍스트 분석의 고전적 전통에 기초한다(위의 방법 섹션 참조). 모스는 교육에서의 헤르메틱학을 진보적 통합에 기초한 실천으로 묘사하고 있는데, 여기서는,

인간의 현상(문예작품이든 학생의 시험이든)은 "전체를 그 부분에 비추어 이해하려고 노력하며, 각 부분이 전체의 일관성 있는 해석으로 설명될 수 있을 때까지 가용한 증거에 대한 해석을 반복적으로 시험한다"고 해독한다.

Another interesting nonpsychometric approach to the evaluation of written texts comes from Moss’s hermeneutics of assessment. This uses less rigidly constructivist methodology than the Maastricht group’s qualitative criteria, drawing instead on the classic tradition of hermeneutic textual analysis (see the Methods section, above). Moss describes hermeneutics in education as a practice based on progressive integration, in which 

human phenomena (whether literary works or students’ tests) are deciphered by trying “to understand the whole in light of its parts, repeatedly testing interpretations against the available evidence until each of the parts can be accounted for in a coherent interpretation of the whole.”148 


그녀의 방법은 맥락을 강조하고, 포트폴리오에 있을 수 있는 것과 같은 일련의 텍스트에 대한 평가와 관련된 토론과 토론을 문서화되고 단계적인 방식으로 수행된다.

Her methods highlight context and promote discussion and debate around the assessment of a series of texts, such as might be in a portfolio, carried out in a documented, stepwise manner.113


고찰 Discussion


정량적으로 결정된 심리학적 결함에도 불구하고, 에세이와 포트폴리오가 문학 및 의학 교과목의 많은 목표를 평가하는 데 적합한 도구로 남을 수 있다예를 들어, 에세이는 추리력, 쓰기 능력과 같은 구성의 평가에 적합한 반면, 포트폴리오들은 반성의 촉진과 평가를 위해 특별히 개발되었다. 따라서 에세이와 관련된 서면 과제는 서사적 능력과 서면 의사소통 능력을 포함한 서술적 능력의 평가에 적절한 메커니즘을 제시한다. 가장 간단히 말해서, 그들은 의사가 [분리된 임상 정보로부터 논리 정연한 병력를 만들어 내고자 면밀한 독서close reading를 하듯] 글에서 이야기를 추출하는 능력을 평가하는 데 사용될 수 있다.

In spite of their quantitatively- determined psychometric flaws, essays and portfolios may remain suitable tools for the assessment of many of the objectives of a literature and medicine curriculum. For example, essays are appropriate for the assessment of constructs such as reasoning and writing skills, whereas portfolios have been specifically developed for the promotion and evaluation of reflection. Essays and related written assignments therefore present an appropriate mechanism for the evaluation of narrative skills, including narrative competence and written communication skills. Most simply, they can be used to assess the ability to extract a story from a text by close reading in the way that physicians fashion a coherent history from disjointed pieces of clinical information.


(에세이나 포트폴리오의) 주관성은 비록 심리측적적 프레임워크 측면에서 문제가 있지만, 모호한 텍스트, 개념, 감정의 탐구에 도움이 된다. 예를 들어, 임상실습 전에 쓴 에세이는, 환자와 의사의 관점에서 제시된 이야기들에 관한 것으로, 학생들에게 다음을 하게끔 한다

  • 환자의 경험에 대한 이해를 보여준다

  • 환자의 질병이 의사와 다른 보호자에게 미칠 수 있는 정서적 영향을 탐구한다

  • 잠재적으로 어려운 직업적 딜레마를 반성한다

Their subjectiveness, although problematic within a psychometric framework, also lends itself to the exploration of ambiguous texts, concepts, and feelings. Essays written in the preclerkship, for example, about stories presented from patients’ and physicians’ points of view, can allow a student 

  • to show an understanding of a patient’s experience, 

  • to explore possible emotional repercussions of a patient’s illness on her physicians and other caregivers, and 

  • to reflect on potentially difficult professional dilemmas. 


내용보다는 과정을 강조함으로써 실생활에서 이런 상황을 경험해야 하기 전에 공감과 정서적 자기반성과 관련된 기술을 개발하는 데 도움이 될 수 있다. 그러한 에세이에 대한 "정답"의 결여는 적절히 프레임을 짜면 문학이나 의학 모두에서 불확실성의 개념을 도입할 수 있다.

By emphasizing process rather than content, this can help develop skills related to empathy and emotional self-reflection before having to experience such situations in real life. The lack of a “right answer” for such an essay can, if framed appropriately, introduce the idea of uncertainty both in literature and in medicine.


현실적인 이유로, 공식적인 에세이는 임상 기간 동안 배정하기 어렵다. 그러나, 임상실습 전에 가르친 스킬을 바탕으로 하는 짧은 성찰 포트폴리오(또는 커리큘럼의 나머지 부분에 따라 더 일반적인 포트폴리오의 한 부분)는 공감, 자기 성찰의 과정, 그리고 서술적 스킬을 계속해서 장려하고 평가할 수 있다.

For practical reasons, formal essays are hard to assign during the clinical years. However, a portfolio of short reflections (or a section of a more general portfolio, depending on the rest of the curriculum), which builds on skills originally taught in the preclerkship, can continue to encourage and assess empathy, the process of self-reflection, and narrative skills.


포트폴리오가 개인, 개인의 속성 및 경험에 초점을 맞추기 때문에 서술적 지식으로 고무된 "한 명의 참가자 또는 관찰자가 한 상황에 대해 지역적이고 특정한 이해"를 표현하는 데 이상적이다. 이러한 맥락에서 학생 성찰의 중요성을 고려할 때, "포트폴리오의 성공적인 성찰적 사용"에 필요한 조건을 만들기 위해 주의를 기울여야 한다. 

  • 멘토별 코칭 

  • 초기initial 구조(특히 weaker 학생에 대하여). 학생들이 일단 성찰에 익숙해지면 그 구조에서 벗어날 수 있는 자유가 있다. 

  • 최종적인 총괄 평가 

  • 경험 또는 기타 성찰해야 할 자료의 가용성.

Because portfolios focus on personal, individual attributes and experiences,119 they are ideal for expressing the “local and particular understandings about one situation by one participant or observer”5 encouraged by narrative knowledge. Given the importance of student reflection in this context, care must be taken to create the conditions necessary for “successful reflective use of portfolios”: 

  • coaching by mentors; 

  • initial structure, especially for weaker students, with the freedom for students to move away from that structure once they are good at reflecting; 

  • eventual summative assessment; 

  • and the availability of experiences or other material on which to reflect.149


전반적으로 내용보다는 과정에 초점을 두고 있으며, 종합평가는 포트폴리오가 시간이 지남에 따라 발전함에 따라 광범위한 형성적 피드백을 동반해야 한다. 멘토에 의한 선별된 문예지문의 제공은 적절한 실제 경험이 없는 상황에서 자료의 이용가능성 문제에 도움이 될 수 있다. 학생들은 또한 할당된 문학 작품들에 대해 계속해서 간략하게 성찰할 수 있는데, 특히 일련의 짧은 작품들이 그들의 회전을 동반하도록 선택된다면 더욱 그러하다.† 포트폴리오에 통합될 수 있는 그 밖의 관련 항목으로는 병렬parallel 차트가 있다. 이 차트는 학생이 "임상 차트에 속하지 않지만 반드시 어딘가에 기록되어야 하는 환자의 관리 측면에 대하여,"150 또는 환자 이름이 제거된 실제 임상 노트와 편지 사본을 작성하여 서면 의사소통 능력을 평가한다. 

Overall, the focus remains on process, rather than on content, and summative assessment must be accompanied by extensive formative feedback as the portfolio develops over time. The provision of selected literary texts by mentors when needed can help with the issue of availability of material in the absence of appropriate real experiences. Students can also continue to reflect briefly on assigned works of literature, particularly if a series of short works is chosen to accompany their rotations.† Other related items that could be integrated into a portfolio include parallel charts, in which students write “about aspects of the care of their patients that don’t belong in the clinical chart but must be written somewhere,”150 or copies of real clinical notes and letters, with patients names removed, to assess written communication skills. 


결론 Conclusion

문학 및 의학 교과 과정에 적합한 평가 도구는 심리학 담론의 전통적인 평가 기준을 충족하지 못하며, 그 진위를 보존하려면, 향후에 그 평가 도구에 부합하지 않을 가능성이 높다. 그러나 의료 교육 연구에 서서히 도입되고 있는 질적 연구라는 또 다른 담론에서 따온 엄격하고 유용한 기준들이 있다. 이론적인 관점에서, 진리의 실증주의적 개념을 회피하는 평가 전략을 사용하는 것은 문학 및 의학 교과과정의 목적과 일치한다. 문학이 "무엇보다 질적 구별점을 가지고 있다"고 가정한다면, 질적 척도는 적절하다. 그것이 추진하는 학습과 일치하는 평가를 만들 필요가 있음을 반영하여, 평가에 대한 구성주의적 접근법과 헤르메뉴틱 접근법 내에서 개성과 참여에 대한 강조는 문학과 의학의 맥락에 대한 적합성을 더욱 강조한다.

The assessment tools appropriate for a literature and medicine curriculum do not meet the psychometric discourse’s traditional evaluation criteria and, if they are to preserve their authenticity, are not likely to conform to them in the future. However, there are rigorous, usable criteria taken from another discourse, that of qualitative research, which are slowly being introduced into medical education research. From a theoretical perspective, using evaluation strategies that shun the positivist notion of truth is consistent with the objectives of a literature and medicine curriculum; given that literature is “concerned above all with qualitative distinctions,”106 qualitative measures are apposite. Reflective of the need to create assessment congruent with the learning that it drives, the emphasis on individuality and engagement within both the constructivist and hermeneutic approaches to evaluation further highlight their suitability for the context of literature and medicine.





Review

 

. 2006 Oct;81(10 Suppl):S128-37.
 doi: 10.1097/00001888-200610001-00032.

Literature and medicine: a problem of assessment

Affiliations 

Affiliation

  • 1Wilson Centre for Research in Education, University Health Network, 200 Elizabeth Street, Eaton South 1-565, Toronto, Ontario, Canada M5G 2C4. ayelet94@post.harvard.edu

Abstract

Background: "Literature and medicine" is increasingly common in medical schools but not within medical education research. This absence may relate to it not being problematizable in the quantitative way in which this psychometrically-oriented community tends to conceptualize research questions.

Method: Databases were searched using relevant keywords. Articles were evaluated using methodologies appropriate to their fields. The resulting information was structured around a framework of construct-appropriate assessment methods.

Results: Literature and medicine is intended to develop skills as potential proxy outcomes for important constructs. Proposed tools to assess these skills are difficult to evaluate using the field's traditional quantitative framework. Methodologies derived from the qualitative tradition offer alternative assessment methods.

Conclusion: The medical education research community should take on the challenges presented by literature and medicine. Otherwise, we run the risk that the current evaluation system will prevent important constructs from being effectively taught and assessed.


두 개입이 동일하다는 것은 무엇인가? 교육에서 보고 가이드라인의 함의 (Med Educ, 2018)

When are two interventions the same? Implications for reporting guidelines in education

Tanya Horsley1 & Glenn Regehr2



보건전문교육(HPE) 문헌에는 '임상의 교육자가 [효과적인 것으로 입증된 개입에 대한 연구 증거]를 실제로 translate할 수 있도록 하기 위해, 증거 기반 실무 교육 시험의 [개입 세부사항에 대한 완전한 보고]가 필수적'이라는 목소리가 높아지고 있다.1 이러한 노력을 지원하기 위해, 교육 개입에 대한 보고의 완전성을 평가하기 위해 특별히 고안된 체크리스트(GHEET2, TIDieR3)의 수가 증가하고 있다. 흥미롭게도, 이 운동은 그들 자신의 기관에서 교육적 개입을 복제하기를 원하는 교육자들뿐만 아니라, 연구 전반에 걸쳐 증거를 종합하려는 연구자들에게도 가치가 있을 수 있다.

there is a growing chorus of voices in the health professional education (HPE) literature suggesting that ‘complete reporting of intervention details of evidence-based practice education trials is essential to enable clinician educators to translate research evidence about interventions shown to be effective into practice’.1 To support such efforts, the number of checklists specifically designed to assess the completeness of reporting for educational interventions (such as the GREET2 and TIDieR3) is increasing. Interestingly, this movement may be valuable not only for educators who are hoping to replicate an educational intervention in their own institution, but also for researchers who are trying to synthesise evidence across studies


이러한 근거 합성 과정에 참여하는 사람들에게 중요한 질문은 [특정 교육 모델을 나타낸다고 알려진 어떤 연구를 "실제로 그 모델의 구현"이라고 판단받을 자격이 있는가] 하는 것이다.

For those engaging in this process of evidence synthesis, the key question is which studies, purported to represent a particular educational model, actually qualify for inclusion as an implementation of that model?


그러나 일반적 및 개입적 특정 보고 지침을 모두 작성하려는 이러한 노력은 특정 개입을 제정하거나 상황에 따라 개입을 완전히 복제하는 것이 무엇을 의미하는지 의문을 제기한다.

However, these efforts to create both general and intervention-specific reporting guidelines raise questions about what it means to enact a particular intervention or to wholly replicate that intervention across contexts.


복제는, 그 정의상, 특정 개입이 높은 수준의 '동일성'으로 복제, 재생산 또는 반복된다는 것을 암시한다. 그러나 Varpio와 동료들은 교육 프로그램이나 혁신을 다른 환경에서 구현하는 것은 표면 구현에서 거의 확실히 타협이 필요할 것이라고 제안했다. 이러한 변화(또는 아이러니하게도 표면 특성 또는 개입 요소를 동일하게 유지하려는 노력)는 기술혁신의 기본 원칙이 새로운 환경에서 이전, 변형 또는 폐기되는 결과를 초래할 수 있다.6

Replication by its very definition suggests an intervention is duplicated, reproduced or repeated with a high-level of ‘sameness’. Yet, Varpio and colleagues have suggested that implementing an educational programme or innovation in a different setting will almost certainly require compromises in the surface implementation. These changes (or, ironically, efforts to keep the surface characteristics, or intervention elements, the same) may result in the innovation’s underlying fundamental principles being either transferred, transformed or abandoned in the new setting.6


이러한 생각은 Hawe의 '개입 무결성intervention integrity' 개념과 일치한다.7 Hawe는 어떤 복잡한 개입도 [(표준 요소의 집합이 아닌) 원칙이나 이론에 근거한 유연한 적용]으로 개념화되어야 한다고 주장해왔다. 이러한 개념화에서, 표준 요소 집합은 더 이상 개입의 능동적active 구성요소로 보이지 않고 단지 기초적인 원리나 이론을 표현하는 메커니즘으로만 보여진다. 따라서, "개입 무결성"은 [가설로 세운 복잡성(교육적) 과정의 이론이나 원리가 '적합성의 증거evidence of fit'를 갖는 것]으로 정의된다.7

This idea is consistent with Hawe’s notion of ‘intervention integrity’.7 Hawe has argued that any complex intervention should be conceptualised as a flexible application based on principles or theories, rather than as a set of standard elements. In this conceptualisation, the set of standard elements are no longer seen as the active ingredients of an intervention, but merely as the mechanism to express the underlying principles or theories. Thus, intervention integrity is defined as having ‘evidence of fit’ with the theory or principles of the hypothesised complex (educational) process.7


이는 교육 개입의 적용과 보고를 표준화하려는 현재의 노력에 대해 비판적인 의문을 제기한다. 우리가 특정한 맥락에서 교육적 개입을 시행할 때, 성공적인 구현이 이루어졌음을 보장하기 위해 우리는 무엇을 주의해야 하며, 그리고 맥락에 걸친 구현 사이에 충분한 '동일성'을 결정할 수 있도록 무엇을 보고해야 하는가? 요컨대, 교육 모델은 구체적인 실천요강인가, 아니면 실천요강이 창조하고자 하는 학습조건인가? 복제(교육자용) 또는 통합(연구자용)이 가능하도록 어느 정도 동일성의 측정치를 달성하는 것이 목표라는 데 동의한다면, 복잡한 개입의 모든 가시적 요소(예: 워크숍 기간)를 '체크-리스팅'하는 것에서 벗어나서, [개입을 뒷받침하는 원칙이나 이론에 따르는 보고]로 진화해나가야 함을 상상해야 할지도 모른다.

This raises critical questions for current efforts to standardise the application and reporting of educational interventions. As we implement an educational intervention in a particular context, to what should we be attentive to ensure successful implementation has occurred, and what should be reported to enable the determination of sufficient ‘sameness’ between implementations across contexts? In short, is the educational model the specific practices or is it the conditions of learning that the practices intend to create? If we agree that the goal is to achieve some measure of sameness so as to allow for replication (for educators) or aggregation (for researchers), we might have to imagine an evolution of reporting that moves away from ‘check-listing’ all visible elements of a complex intervention (e.g. length of workshop) and instead attends to the principles or theories that underlie it.


이러한 생각들은 의학 교육에서 이론과 실천의 접점, 그리고 우리가 우리의 실험 연구에서 확립하기를 바라는 인과관계의 수준에 대한 오랜 논의를 촉발시킨다.8

These ideas invoke the long-standing discussions about the interface of theory and practice in medical education and the level of causality that we are hoping to establish in our experimental studies.8


즉, 어떤 개입이 연구에서 '성공'을 입증하지 못한다면, 우리는 다음 중 어떻게 결론을 내려야 하는가?. 

  • 교육 개입을 뒷받침하는 학습의 이론적 모델을 의심해야 하는가?(즉, 교육 모델의 철학이 잘못되었는가?).

  • 또는 지 이 맥락에서 특정 교육적 practice가 교육 모델의 기반이 되는 학습 조건을 만들지 못했다고 생각해야 하는가?(즉, 교육 모델을 성공적인 구현하지 못했기 때문인가?) 

그리고 도입implementation 후 긍정적인 효과가 나타난다면, 어느 정도까지 그 성과가 [교육 모델에 의해 가정된 학습 조건에 적절하게 특정 practice를 실행]했기 때문이라고 봐야 하는가? 혹은 심리학적 또는 사회적 절차와 같은 다른 메커니즘을 통해 학습에 영향을 받은 것으로 보면 안 되는가?

That is, if an intervention fails to demonstrate ‘success’ in a study, should we conclude 

  • that the theoretical model of learning underpinning the educational intervention must be questioned (i.e. that the philosophy of the educational model is wrong) or 

  • merely that the particular educational practices in this context failed to create the learning conditions upon which the educational model is based (i.e. that this was an unsuccessful implementation of the educational model)? 

And if we see a positive effect following implementation, to what extent can we confidently attribute this to the particular practices having properly invoked the conditions of learning hypothesised by the educational model, rather than those practices having influenced learning through some other mechanism, such as psychological or social processes (e.g. a novelty effect)?


아마도 이러한 이유로 전통적인 역학접근법을 이용하여 '대교육grand educational experiment 실험'9을 실시하려는 노력이 비난받아온 것일지도 모른다.

It is, perhaps, for this reason that efforts to conduct ‘grand educational experiments’9 using traditional epidemiological approaches have been criticised.


복잡한 개입의 보고 가이드에는 두 가지를 고려해야 한다. 

  • 첫째, 학습방법의 세부적인 내용을 보고할 필요가 있는 것처럼, 교육개입의 세부사항(하웨이가 '표준요소'라고 부를 것)도 철저히 보고해야 한다. 그러나 연습이 필수 학습 조건에 미치는 영향에 영향을 미칠 수 있는 모든 변수의 보고는 불가능하다.

two conditions require consideration within reporting guidelines of complex interventions. 

First, just as it is necessary to report the details of the study methods,10,11 the details of the educational intervention (what Hawe would call the ‘standard elements’) should be reported thoroughly. However, the reporting of all variables that might affect the impact of practices on the required learning conditions is untenable.


  • 따라서 [표준 요소 보고] 외에도 [특정 현장에서 구현된 표준 요소가 개입의 기반이 되는 교육 모델을 뒷받침하는 학습 조건을 만든 정도]를 보고하는 메커니즘의 개발을 제안할 것이다. 즉, 무작위 조정 시험에서 무작위화 절차가 성공적이었음을 입증하기 위해 인구통계학적 보고와 동등한 교육적 '조작 검사'를 사용하고 보고할 것을 제안한다.

 Thus, in addition to reporting the standard elements, we would propose the development of mechanisms that report the extent to which the standard elements, as implemented at a particular site, created the learning conditions that underpin the educational model on which the intervention was based. In other words, we suggest the use and reporting of educational ‘manipulation checks’, the educational equivalent of demographic reporting to demonstrate that the randomisation procedure was successful in randomised controlled trials.





Comment

 

. 2018 Feb;52(2):141-143.
 doi: 10.1111/medu.13496.

When are two interventions the same? Implications for reporting guidelines in education

Affiliations 

Affiliations

  • 1Ottawa, Ontario, Canada.
  • 2Vancouver, British Columbia, Canada.


의학교육연구에 일반화가능성과 편향의 적용가능성 (Med Educ, 2020)

The applicability of generalisability and bias to health professions education's research

Lara Varpio1 | Bridget O'Brien2 | Charlotte E. Rees3,4 | Lynn Monrouxe5 | Rola Ajjawi6 | Elise Paradis7




1 도입 

1 | INTRODUCTION


HPE의 초기의 학자들은 객관적인 데이터 수집과 분석에 착수하면서 전형적으로 포스트 포시티브 패러다임에 의존했다(이 원고에 사용된 주요 용어의 정의는 표 1 참조). 다른 패러다임(예: 구성주의)에서 일하는 연구자들은 그들의 방법론과 방법의 정당성을 도입하고 옹호함으로써 이러한 조상에 직면해야 했다.1 그럼에도 불구하고, 이 유산의 영향은 여전히 널리 감지되고 있다.

HPE's founding scholars typically relied on the post-positivist paradigm, setting out to engage in objective data collection and analysis (see Table 1 for definitions of key terms used in this manuscript). Researchers working from other paradigms (e.g., constructivism) have had to confront this ancestry by introducing and defending the legitimacy of their methodologies and methods.1 And yet, the influence of this heritage is still widely felt.


구성주의 

구성주의에서, 인간은 외부 현실에 대한 진실을 발견하거나 발견하는 것으로 생각되지 않고 대신, 사람들은 스스로 지식을 쌓거나 만든다. 사람들은 세상과 그들의 경험을 이해하기 위해 개념, 모델, 그리고 스키마를 만든다. 이 건축은 타인을 격리하여 이루어지는 것이 아니라, 개인이 타인과 공유되는 언어, 관행, 문화 등을 배경으로 의미를 구성한다.24

Constructivism Constructivism is a paradigm wherein humans are not conceived of as discovering or finding truths about external reality; instead, people build or make knowledge. People construct concepts, models and schemas to understand the world and their experiences. This construction does not happen in isolation of others; instead, individuals construct meaning against a backdrop of the languages, practices, cultures, etc. that are shared with others.24


인식론

인식론은 지식의 발달과 관련이 있다. 패러다임의 인식론을 이해하려면 '우리는 진짜가 무엇인지 어떻게 알까?' '지식의 본질은 무엇인가?'와 같은 질문에 대답할 수 있어야 한다. 인식론학은 '연구자들이 합법적이고 가치 있는 것으로 여겨질 지식을 개발하기 위해 연구에 어떻게 참여해야 하는지에 대해 성찰할 것을 요구한다.'2

Epistemology Epistemology is concerned with the development of knowledge. To understand a paradigm's epistemology, we must be able to answer questions like: ‘How do we know what is real?’ and ‘What is the nature of knowledge?’ Epistemology ‘requires us to reflect on how researchers should engage in inquiry to develop knowledge that will be considered legitimate and valuable’.2


방법론

방법론은 연구가 어떻게 수행되어야 하는지를 구체화하는 일련의 지침과 원칙이다. 그것은 '탐구inquiry에 대한 특정 접근방법의 가정, 원칙 및 절차에 대한 분석'.24(페이지 193)

Methodology Methodology is a set of guidelines and principles that shape how research should be carried out. It ‘involves analysis of the assumptions, principles, and procedures in a particular approach to inquiry’.24(pg. 193)


객관주의 

객관주의는 단일의 외부 현실이 존재하며, 연구는 [중립적이고 분리된 방식으로 질문에 답하여, 개인 및 사회 현상에 대한 우리의 이해]에 기여하도록 노력해야 한다는 가정으로부터 작용한다.3,4

Objectivism Objectivism works from the assumption that a single, external reality exists and that research should strive to answer questions in a neutral and detached manner to contribute to our understanding of individual and social phenomena that exist.3,4


온톨로지 

온톨로지(Ontology Ontology)는 현실 자체의 본질과 관련이 있다. 패러다임의 온톨로지(Ontology)를 이해하려면 '현실의 본질은 무엇인가?' '존재의 본질은 무엇인가?'와 같은 질문에 대답할 수 있어야 한다.2

Ontology Ontology is concerned with the nature of reality itself. To understand a paradigm's ontology, we must be able to answer questions like: ‘What is the nature of reality?’ and ‘What is the nature of being?’2


패러다임 

쿤은 패러다임을 [과학자들이 문제를 어떻게 이해하고 연구해야 하는지에 대해 공유하는 믿음과 합의]로 정의했다.30 패러다임은 '과학에 대한 특정 접근방식을 정의하는 개념, 관행 및 언어'로 구성된다.2(pg. 687)

Paradigm Kuhn defined a paradigm as the beliefs and agreements that scientists share about how problems should be understood and studied.30 A paradigm consists of ‘the concepts, practices, and language that define a particular approach to science’.2(pg. 687)


후기실증주의 

후기실증주의는 [인간이 지식을 발견하는 것]으로 착상되는 패러다임이다. 이 패러다임에서는 하나의 객관적 현실이 존재한다고 믿으며, 연구자들은 외부 현실의 진리를 알기 위해 노력한다. 포스트 실증주의는 연구자들이 그러한 진실을 포착하고 완전히 이해할 수 없다는 것을 인정한다; 대신에, 연구자들은 그들의 서술이 항상 불완전하다는 것을 알면서, 이 진실을 묘사하기 위해 끊임없이 노력한다.

Post-positivism Post-positivism is a paradigm in which humans are conceived of as discovering knowledge. In this paradigm, a single, objective reality is believed to exist, and researchers strive to know the truth of the external reality. Post-positivism acknowledges that researchers cannot capture and fully understand such truth; instead, researchers continually strive to describe this truth, knowing that their descriptions are always incomplete.


주관주의 

주관주의는 사람들이 신념, 인식, 경험을 바탕으로 스스로 현실을 구축한다는 전제에서 작용한다. 연구자들은 사람들이 형성하는 개별적이고 특정한 현실에 대한 이해를 탐구하고 구성하고자 한다. 5,6

Subjectivism Subjectivism works from the premise that people build reality for themselves based on beliefs, perceptions, and experiences. Researchers seek to explore and compose understandings of the individual and particular realities that people build.5,6


저널 편집자와 리뷰어로서, 우리는 엄격한 정성적 연구 논문에서, 연구에 참여한 참가자가 소수임을 한탄하는 부분이 포함되어 있는 것을 보아왔다. 이러한 이해의 차이를 메우기 위해 많은 작업이 이루어졌지만, 이러한 브리징(다리놓기)은 각 연구 접근방식과 관련된 품질 측정에 대해 무심코 혼란을 야기했다. HPE 연구의 독자들은 각각의 원고를 면밀히 검토하여 패러다임 기반(즉, 온톨로지, 인식론, 방법론)2를 추론할 필요가 있다. 왜냐하면 어떤 특정한 연구에 대한 엄격함의 marker는 그들의 근본적인 철학적 가정에 따라 크게 다르기 때문이다. 요컨대, 한 HPE 연구에서 엄격함이 입증되는 방식이 반드시 다른 HPE 연구에서 미러링되는 것은 아니다.

As journal editors and reviewers, we have seen rigorous qualitative research papers include limitation sections lamenting the small number of participants engaged in the studies. Much work has been done to bridge such differences in understanding, but this bridging inadvertently generated confusion about the measures of quality associated with each research approach. Readers of HPE research are required to closely examine each manuscript to deduce its paradigmatic underpinnings (i.e., ontology, epistemology, methodology)2 because markers of rigour for any particular study vary greatly depending on their underlying philosophical assumptions. In short, the way rigour is demonstrated in one HPE study will not necessarily be mirrored in another;


우리는 지식과 연구에 대한 두 가지 다른 지향점 즉 객관주의와 주관주의를 중심으로 이 토론을 구성한다.

We construct this discussion around two different orientations towards knowledge and research—objectivist and subjectivist.


[객관주의 지향]단일의 외부 현실이 존재하고, 연구가 중립적이고 분리된 방식으로 질문에 답하여 현상에 대한 우리의 이해에 기여하도록 노력해야 한다는 전제하에 있다.3,4 객관주의 지향으로부터, 연구 과정은 [현실을 공정하게 이해하는 연구자의 능력을 모호하게 만드는] 내적 요인과 외적 요인을 측정하거나 설명할 수 있어야 한다. 

An objectivist orientation rests on the premise that a single, external reality exists and that research should strive to answer questions in a neutral and detached manner to contribute to our understanding of phenomena.3,4 From the objectivist orientation, the research process must be able to measure or account for intrinsic and extrinsic factors that obscure a researcher's ability to understand reality impartially.


이와는 대조적으로 [주관주의 지향]사람들이 신념, 인식, 경험에 기초하여 스스로 현실을 구성한다는 전제에서 출발한다. 주관주의적 지향의 연구는 사람들이 형성하는 개별적이고 특정한 현실에 대한 이해를 탐구하고 구성하는 것을 목표로 한다.5,6 이에 상응하여, 개인과 사회 현상은 시간, 장소, 사람, 문화 등에 위치한situated 것으로 이해되어야 한다. 즉 내적 요인과 외적 요인은 진리를 이해하는 데 결정적이며 더 깊이 또는 보편적으로 경험하는 진리에 도달하기 위해 제거되거나 통제될 수 없다.

In contrast, a subjectivist orientation starts from the premise that people construct reality for themselves based on beliefs, perceptions, and experiences. Research from a subjectivist orientation aims to explore and compose understandings of the individual and particular realities that people build.5,6 Correspondingly, individual and social phenomena must be understood as situated in time, place, persons, cultures, etc. In other words, intrinsic and extrinsic factors are crucial to understanding truth and cannot be removed or controlled to reach a deeper or universally experienced truth.


우리는 일반성과 편견의 개념이 모든 HPE 연구의 엄격함을 확립하는 데 보편적으로 적용될 수 없다고 주장한다. 첫째, 우리는 객관주의 지향과 관련하여 일반성을 정의하며, 주관주의적 지향의 연구에 적용되었을 때 그것이 어떻게 다시 개념화되어야 하는지를 기술한다. 다음으로, 우리는 객관주의자들이 어떻게 편견에 대해 연구자의 주관성이 데이터를 오염시키는 사례로 생각하나 주관주의자들이 데이터의 구성 요소이기 때문에 편견을 수용하는 방법에 주목함으로써 편향을 다룬다. 이러한 주제를 설명하기 위해 박스 1에 사례 시나리오를 포함시키고 객관주의와 주관주의 지향성이 일반성과 편향성의 문제를 어떻게 다르게 다루는지 강조한다.

We argue that the concepts of generalisability and bias are not universally applicable to establish the rigour of all HPE research. First, we define generalisability in relation to an objectivist orientation, and we describe how it must be re-conceptualised when applied to research from a subjectivist orientation. Next, we address bias by attending to how objectivists conceive of bias as instances when researchers' subjectivities contaminate data but how subjectivists embrace bias because subjectivities are constitutive elements of data. To illustrate these topics, we include a case scenario in Box 1 and highlight how objectivist and subjectivist orientations would handle issues of generalisability and bias differently.



2 | 객관주의 및 주관주의 연구 접근법

2 | OBJECTIVIST AND SUBJECTIVIST RESEARCH APPROACHES


객관주의 대 주관주의 지향성이 일반성과 편향성에 미치는 영향을 설명하기 위해, 우리는 이러한 입장을 HPE 연구에서 일반적으로 사용되는 두 가지 패러다임인 [후기 실증주의]와 [구성주의]의 근본 요소로서 설명한다.

To illustrate the impact of an objectivist vs subjectivist orientation on generalisability and bias, we explain these positions as foundational elements of post-positivism and constructivism, two paradigms commonly used in HPE research.


  1. 후기실증주의가 채택하는 존재론(즉, 연구자들이 무엇이 진짜인지 어떻게 이해하는가)2는 [객관주의]적인 것이다. 후기실증주의는 '단일한, 객관적이고, 외적인, 유형적이고, 측정할 수 있는 현실'7이 존재하며, 이 현실은 한 명의 인간의 바깥에 존재하고, 영속된다persist고 주장한다. 

  2. 이러한 존재론은 특정한 인식론(즉, 연구자들이 지식의 본질과 알 수 있는 것을 어떻게 상상하는지)을 낳는다.2 사후 추정론자들은 외부 현실의 진리를 아는 것이 가능하다고 주장하지만, 그러한 진리를 포착하고 이해하는 연구자들의 능력은 절대적이지 않다는 것을 인정한다.7 연구자들은 이 진리를 명확하게 설명하기 위해 끊임없이 노력하지만, 그것을 완전히 아는 것은 불가능하다는 것을 알고 있다.

  3. 7 이러한 인식론을 고려할 때, 사후 포시티브론자들은 현실의 근사치를 돕는 구체적인 방법론(즉, 현실을 알고 지식을 쌓는 방법)2을 고수하지만, 이러한 연구자들은 그들이 질문하는 방식, 즉 그 방법들을 인정한다. 그들이 설계하는 연구와 그들이 개발한 발견에 대한 해석은 그들의 사전 지식, 가치, 신념에 의해 영향을 받을 위험이 있다.7 그러므로 포스트 포시티브리스트들은 그들의 연구에 대한 주관성의 영향을 완화시키기 위해 노력한다. 후기실증주의적 연구의 엄격성은 주관성의 영향력을 최소화하고, 그럼으로써 객관성이 뒷받침되고 유지되는 정도에 의해 평가된다.7

  1. The ontology (i.e., how researchers understand what is real)2 that post-positivism adopts is an objectivist one. Post-positivism maintains that there is ‘a single, objective, external, tangible, measurable reality’7 that exists outside of, and persists beyond, any single human. 

  2. This ontology gives rise to a specific epistemology (i.e., how researchers conceive of the nature of knowledge and what can be known).2 Post-positivists maintain that it is possible to know the truth of the external reality; however, they acknowledge that researchers' abilities to capture and understand such truth are not absolute.7 Researchers continually strive to articulate this truth, but know that it is impossible to ever fully know it.7 

  3. Given this epistemology, post-positivists adhere to specific methodologies (i.e., ways of knowing reality and building knowledge)2 that help them approximate reality, but these researchers acknowledge that the way they ask questions, the studies they design, and the interpretations of findings they develop are at risk of being influenced by their prior knowledge, values, and beliefs.7 Therefore, post-positivists work to mitigate the influence of their subjectivities on their research. The rigour of a post-positivist study is assessed by the extent to which that influence is diminished and that objectivity is supported and maintained.7


이와는 대조적으로, 구성주의자들의 주관주의적 지향은 극명하게 다른 개념화를 유지한다

  1. 그들의 온톨로지(Ontology)는 '여러가지 정신구축, 사회적이고 경험적으로 기초하고, 지역적이고 구체적이며, 그들을 안고 있는 사람에 대한 그들의 형태와 내용에 의존한다'는 형태로 다중적인 현실multiple realities이 존재한다고 주장한다.8(pg 27) 현실은 개인이 살아 있는 경험을 통해, 그리고 그들의 사회적 맥락에서 다른 사람들과 연계하여 자신을 위해 건설하는 것이다. 

  2. 무엇이 진짜인지 알고 현실을 구성하기 위해 구성주의자들은 주관성을 수용한다; 연구자들과 참여자들은 함께 연구되고 있는 현상을 이해하기 위해 의미와 데이터를 공동 구성한다.9 이 인식론은 '궁극적인 또는 "정확한" 알 수 있는 방법은 하나도 없다'고 주장한다.10 대신, 모든 개인은 현실에 대한 그들만의 독특한 이해를 가지고 있다. 

  3. 이러한 관점을 고려할 때, 방법론적으로 구성주의자들은 종종 관찰과 인터뷰와 같은 질적인 방법에 의존하여 개인의 경험 설명과 현실구성을 이끌어낸다. 주관성은 구성론적 연구의 기본 요소이기 때문에, 그것을 제거하려는 어떠한 노력도 연구에는 반대antithetical되는 것이다. 왜냐하면, 이 패러다임에서 주관성은 현실과 그 현실에 대한 지식의 초석이기 때문이다. 따라서, 구성주의 연구의 엄격성은 [저자가 자신의 주관성에 대해 성찰하고 데이터를 성공적으로 사용하여 이러한 데이터로부터 창출한 설명을 서포트하는 정도]에 의해 평가된다.11

In contrast, constructivists' subjectivist orientation maintains starkly different conceptualisations. 

  1. Their ontology asserts that multiple realities exist in the form of ‘multiple mental constructions, socially and experientially based, local and specific, dependent for their form and content on the persons who hold them’.8(pg. 27) Reality is something that individuals construct for themselves through lived experiences and in conjunction with others in their social contexts. 

  2. To know what is real and to construct reality, constructivists embrace subjectivity; the researchers and participants co-construct meaning and data to make sense of the phenomenon being studied together.9 This epistemology asserts that ‘there is no one ultimate or “correct” way of knowing’.10 Instead, every individual holds their own unique understanding of reality. 

  3. Given these perspectives, methodologically, constructivists often rely on qualitative methods, such as observations and interviews, to elicit individuals' descriptions of experiences and their constructions of reality. Since subjectivity is a foundational component of constructivist research, any effort to remove it is antithetical to the research enterprise because, in this paradigm, subjectivity is the cornerstone of reality and knowledge of that reality. Therefore, the rigour of a constructivist study is assessed by the extent to which authors reflect on their own subjectivity and successfully use data to support the account that they have created from these data.11


요약하자면, 

  • 포스트 포시티브 연구자들은 보편적 진리가 바깥 세상에 존재하며(즉, 인간 사상과는 무관) 연구의 목적은 그 현실의 패턴(예: 일관성, 규칙성, 법칙)을 설명하는 것이라고 믿는다. 포스트 포시티브는 객관성을 인정하고 연구 샘플을 넘어 더 넓은 인구로 확장될 수 있는 연구 결과를 개발하기 위해 노력한다. 

  • 반면에 구성주의자들은 복수의 진리가 존재하며(즉, 인간구조에 의존함) 연구의 목적은 개별적인 사례(예: 특이성, 특수성)를 깊이 이해하는 것이라고 주장한다. 그러므로, 구성주의자들은 주관성에 특권을 부여하고 어떤 현상에 대한 다중적이고 다양한 해석을 옹호한다.12

To summarise, 

  • post-positivist researchers believe that a universal truth exists out there (i.e., independent of human thought) and that the purpose of research is to explain patterns (e.g., consistencies, regularities, and laws) of that reality. Post-positivists prize objectivity and strive to develop research findings that can extend beyond a study sample to the broader population. 

  • Constructivists, on the other hand, maintain that multiple truths exist (i.e., dependent on human constructions) and that the purpose of research is to deeply understand individual cases (e.g., idiosyncrasies, particularities). Therefore, constructivists privilege subjectivity and champion multiple, diverse interpretations of a phenomenon.12


3 일반화가능성

3 | GENERALISABILITY


[특정 효과를 적용할 수 있는 모집단, 설정, 치료 변수 및 측정 변수]로 정의되는 일반화가능성은 종종 엄격함의 필수적인 표시로 간주된다. 그러나 1993년의 획기적인 기사에서 파이어스톤은 연구자들을 초청하여 일반성에 대한 세 가지 다른 주장에 대해 생각해 보게 했다. 그는 이러한 주장이 연구자들이 불완전한 자료에서 확실한 결론으로 나아갈 수 있도록 하는 것이라고 주장했다. 이 세 가지 일반성 주장은 '

  • (a) 표본에서 모집단으로의 외삽, 

  • (b) 이론을 이용한 분석 일반화 또는 외삽, 

  • (c) 사례 대 사례 중개translation'이다.14

Defined as the populations, settings, treatment variables, and measurement variables to which particular effects can be applied,13 generalisability is often considered an essential marker of rigour. In a landmark 1993 article, however, Firestone invited researchers to think about three different claims to generalisability. These claims, he argued, are what allow researchers to go from imperfect data to solid conclusions. These three generalisability claims are ‘

  • (a) extrapolation from sample to population, 

  • (b) analytic generalisation or extrapolation using a theory, and 

  • (c) case-to-case translation’.14


  • 표본에서 모집단으로의 확장인 첫 번째 주장은 통계적 일반성과 관련이 있다. 이러한 형태의 일반성은 특히 포스트 실증주의와 관련된 객관주의적 가정과 관련이 있지만, 구성주의적 연구의 주관주의적 가정과는 무관하다. 대부분의 구성주의적 방법론(종종 질적 연구와 관련됨)의 주관주의적 토대를 고려할 때, 통계적 일반성을 달성하는 것은 가능하지도 바람직하지도 않다.

The first argument—extrapolation from sample to population—relates to statistical generalisability. This form of generalisability is particularly relevant to the objectivist assumptions associated with postpositivism, but it is irrelevant for the subjectivist assumptions of constructivist research. Given the subjectivist foundations of most constructivist methodologies (often associated with qualitative research), achieving statistical generalisability is neither possible nor desirable.


  • 두 번째 주장은 분석적 또는 이론적 일반화가능성이며, 여기서 연구자들은 [이론을 개발하거나 기존 이론에 기여함으로써 국소적인 발견을 일반화하는 것]을 목표로 한다.14,15 일반성에 대한 이러한 접근방식에서, 연구자들은 많은 연구 참여자들과 관련된 고차원적 추상화를 생성하기 위해 유도적이고 심층적인 데이터 분석에 참여한다. 이러한 추상화(연구 노력에 의해 개발되고 있는 이론이나 개념)는 일반화가능한 결과이다. 따라서, 연구 설계가 통계적 일반성의 표준을 허용하지 않거나 도달하지 못함에도 불구하고, 연구는 이론적 또는 개념적 일반성을 달성할 수 있다. 많은 주관주의적 연구는 일반성의 개념화와 상당히 관련이 있다고 생각하지만, 연구자들은 그들의 지식 생산 노력을 지원하기 위해 [이론적 일반화가능성theoretical generalisability]이라는 용어를 거의 동원하지 않는다. 이론적 일반성은 '연구가 수행되는 조건과 다양한 이론multiple theories과의 관련성을 명시'함으로써 촉진될 수 있고, 이 작업은 많은 구성주의적 연구를 단단하게 뒷받침해주는 심층 분석적 작업deep analytic work와 유사한 과정이다.

The second argument is analytic or theoretical generalisability, where researchers aim to generalise local findings by developing theories or contributing to pre-existing theories.14,15 In this approach to generalisability, researchers engage in inductive, in-depth data analysis to generate higher-order abstractions relevant to many of their research participants. These abstractions—the theories or concepts being developed by the research effort—are the outcomes that are generalisable. Thus, despite research designs not allowing for—or reaching—the standards of statistical generalisability, research can achieve theoretical or conceptual generalisability. While much subjectivist research would find this conceptualisation of generalisability quite relevant, researchers seldom mobilise the language of theoretical generalisability in support of their knowledge production efforts. Theoretical generalisability can be facilitated by ‘specifying the conditions under which a study is done and their relevance to multiple theories’,14 a process akin to the deep analytic work undergirding much constructivist research.


  • 마지막으로, Firestone의 세 번째 주장은 독자나 자연주의적 일반성과 유사하게 사례 대 사례 번역이다.16 Firestone은 이러한 종류의 일반성을 '한 세팅에 있는 사람이 다른 세팅에서 프로그램이나 아이디어를 채택하는 것을 고려하는 것'.을 의미한다14 이것은 링컨과 구바의 전달 가능성transferability 개념과 유사하다.17 Firestone의 case-to-case translation은 연구자들을 그들의 원고에 사례에 대한 두꺼운 설명thick description을 제공하도록 초청하여 다른 사람들이 연구의 통찰력이 그들 자신의 사례에 적용되는지 여부를 결정하는 데 필요한 정보를 얻도록 한다. 폴리트와 벡이 분명히 말했듯이, 이 노력은 저자와 독자에 의해 실현된 '협업적 사업collaborative enterprise'으로 가장 잘 이해된다.

Finally, Firestone's third argument is case-to-case translation, akin to reader or naturalistic generalisability.16 Firestone describes this kind of generalisability as instances when ‘a person in one setting considers adopting a program or idea from another one’.14 This is similar to Lincoln and Guba's concept of transferability.17 Firestone's case-to-case translation invites researchers to offer thick descriptions of cases in their manuscripts so that others have the necessary information to decide whether insights from research apply to their own cases. As Polit and Beck articulated, this effort is best understood as a ‘collaborative enterprise’,15 realised by author and reader.


우리가 이런 방식으로 일반성을 재구성할 때, 우리는 명확한 패러다임 차이를 볼 수 있다. 

When we reframe generalisability in this manner, we can see clear paradigmatic differences. 


  • 객관주의적 성향과 추론 통계에 의존하는 포스트 실증주의 연구자들은 [개별 표본에서 더 큰 모집단으로 추론을 이끌어내기 위해 노력한다]. 이러한 추론에 대한 방어 가능한 주장을 구축하기 위해, 연구자들은 표본이 무작위로 선택되었고, 더 큰 모집단을 합리적으로 대표하며, 분석적 주장을 뒷받침할 만큼 충분히 검정력power이 크다는 것을 확인하려고 한다. 본질적으로, 표본으로부터 도출된 모집단에 대한 추론이 일반화된다는 가정은 현상이 다른 맥락에 복제될 수 있다는 것을 의미한다. 후기실증주의적 연구자들 또한 이론적 일반성과 사례 대 사례 번역에 도달하기 위해 노력할 수 있지만, 통계적 일반성이 객관주의적 기초의 핵심이다.

Post-positivist researchers relying on an objectivist orientation and inferential statistics endeavour to draw inferences from samples of individuals to larger populations. To build defensible arguments for these inferences, researchers seek to ensure that samples have been randomly selected, are reasonably representative of larger populations, and are sufficiently large to support, or ‘power’,18 analytic claims. In essence, the assumption that inferences made from samples generalise to the populations from which they are drawn means that phenomena are replicable to other contexts. Post-positivist researchers can also strive to reach theoretical generalisability and case-to-case translation, but statistical generalisability is a linchpin of their objectivist underpinnings.


  • 이와는 대조적으로 주관주의적 지향성이 지배하는 구성주의적 패러다임에서 수행된 연구는 이론적 또는 자연주의적 일반성에 도달하기 위해 노력할 것이다. 위에서 논의한 바와 같이, 구성론적 연구와 같은 주관주의적 사고에 기반을 둔 연구는 일반적으로 개별 사례의 특수성에 초점을 맞추고, 관련 연구 참여자의 선별된 수를 식별하기 위해 목적적 샘플링을 채택한다. 그러한 목적적 표본의 결과의 목적은 더 넓은 집단에 일반화하는 것이 아니다. 그 대신, 그러한 연구는 [이론에 기여하는 통찰력을 제공하거나, 이론을 통한 다른 사례와 관련되거나, 전이성을 통해 다른 영역의 경험을 반영하는 것]을 목적으로 한다. 더욱이, 다중적 주관성multiple subjectivities에 특권을 주고서는privileging, 참가자들의 현실이 연구 표본 밖의 다른 사람들의 현실에 반드시 외삽가능하다고 주장하는 것은 이치에 맞지 않는다.19

In contrast, research carried out from a constructivist paradigm— where subjectivist orientations hold sway—might endeavour to reach theoretical and/or naturalistic generalisability. As discussed above, research grounded in subjectivist thinking—like constructivist research— typically focuses on the particularities of individual cases and employs purposive sampling to identify select numbers of relevant study participants. The aim of results from such purposive samples is not to generalise to broader populations. Instead, such research aims to provide insights contributing to theory, relating to other cases through theory, or echoing experiences in other domains through transferability. Furthermore, with a privileging of multiple subjectivities, it does not make sense that participants' realities would necessarily extrapolate to the realities of others outside of the research sample.19


후기실증주의적 사고의 잔재가 HPE에서 우위를 점할 때, 일반 가능성(특히 통계적 일반성)은 연구의 패러다임과 관계없이 모든 연구에서 예상되는 엄격성의 기준이 된다결과적으로, 구성주의 내 접근방식에서 수행된 것을 포함하여 주관적 연구에 대한 많은 HPE 원고 보고가 [이러한 형태의 일반성이 그들의 연구 설계에 대한 적절한 기대치가 아님에도 불구하고] 통계적 일반성의 결여를 한탄하는 '내 탓이로소이다' 식의 진술을 제공한다(예를 들어, 본 연구의 결과는 모든 건강관리 학생을 대표할 수 없는 견해를 가진 한 의과대학의 소수의 의대생을 기반으로 한다. ) 

When remnants of post-positivist thinking hold sway in HPE, generalisability—particularly statistical generalisability—becomes an expected criterion of rigour for all research, regardless of a study's paradigm. Consequently, many HPE manuscripts reporting on subjectivist research, including those conducted from within constructivist approaches, offer mea culpa statements lamenting the lack of statistical generalisability (e.g., findings from this study are based on a small number of medical students from one medical school whose views may not be representative of all healthcare students), despite the fact that this form of generalisability is not an appropriate expectation for their research designs.19 


따라서 일부 구성주의 연구자들은 연구목표로서의 일반성을 노골적으로 거부하며, 대신에 질적 데이터의 논리, 구조 및 의미에 대한 깊은 해석을 선호한다. 다른 (Firestone 포함)은 주관주의적 지향에 부합하는 적절한 개념으로 전달 가능성transferability(자연주의적 일반성에 대한 개념과 유사)으로 구별했다.17

Some constructivist researchers therefore reject generalisability as a research goal outright, instead favouring deep interpretations of the logic, structure, and meaning of qualitative data.20 Others (including Firestone) have identified transferability (akin to naturalistic generalisability) as a suitable concept aligning with subjectivist orientations.17


궁극적으로 어떤 종류의—일반성이 관련성이 있는지 결정하기 위해서는 연구의 존재론적 뿌리에 대한 세심한 고려가 필요하다. 

  • 연구가 객관적 현실과 관련된 보편적 진리를 설명하고자 하는 경우 통계적 일반성이 핵심이고, 

  • 연구가 개인이 구성한 주관적 현실을 사회적 상호작용을 통해 이해하고자 하는 경우 이론적 일반성 또는 자연주의적 일반성이 필요할 수 있다.

Ultimately, to decide what kind of—generalisability is relevant, careful consideration of a study's ontological roots is required. 

  • If an investigation seeks to explain a universal truth associated with an objective reality, then statistical generalisability is key; 

  • if a study seeks to understand subjective realities constructed by individuals and through social interactions, then theoretical and/or naturalistic generalisability may be necessary.


따라서, 주관적 HPE 연구(예: 구성주의적 연구)의 연구자와 독자들은 (통계적 일반성의 결여를 한탄하기보다는) 일반성의 다양한 형태를 더 잘 이해하고 연구의 패러다임적 토대를 바탕으로 그 타당성을 평가할 필요가 있다. 그들은 또한 그들의 연구를 ['사소하고, 대수롭지 않으며, 거의 가치가 없는' 것으로 변질시키거나, 그들 자신의 합법화 노력을 훼손하지 않도록] 보다 뉘앙스를 가지고 일반성의 개념에 관여해야 한다. 21

Therefore, instead of lamenting a lack of statistical generalisability, researchers and readers of subjectivist HPE research (eg, constructivist research) need to better understand the varied forms of generalisability and evaluate their appropriateness based on the paradigmatic underpinnings of the research. They also should engage with the concept of generalisability with more nuance lest they undermine their own legitimation efforts, turning their research into something that ‘is of little use, insignificant, and hardly worth doing’. 21


좀 더 구체적으로, 파이어스톤의 세 가지 주장 측면에서 일반성에 대해 생각하는 것은 HPE 연구자들이 그들의 발견의 중요성과 도달 범위를 더 잘 정당화할 수 있게 할 수 있다. 주관주의적 지향성을 가진 대부분의 프로젝트는 통계적 일반성을 달성할 수 없고, 달성하려고 노력해서는 안 되지만, 데이터와 이론과의 깊은 관계를 통해 분석적 기여와 전달 가능성 잠재력을 설명해야 한다.15

More concretely, thinking about generalisability in terms of Firestone's three arguments can enable HPE researchers to better justify the importance and reach of their findings. While most projects with subjectivist orientations will not be able to— and should not strive to—achieve statistical generalisability, they should describe their analytic contributions and transferability potential through deep engagement with their data and theory.15


4 편향 4 | BIAS


질적 연구의 Sage 사전에는 편향의 두 가지 정의가 나열되어 있다.24 

  • 첫째는 연구자가 데이터 수집이나 해석에 영향을 미침으로써 [연구 결정, 데이터 출처 및 판단을 편견을 갖게 하는] 견제받지 않는 관행이나 행동이라고 정의한다. 예를 들어, 연구자들이 연구 목적에 대해 참가자들에게 너무 많은 것을 드러내면, 참가자들의 반응은 연구자들을 기쁘게 하는 것을 목표로 하기 때문에 편향될 수 있다( 이른바 '사회적 만족도 편견')

  • 두 번째 정의는 편견을 '개인의 선호, 성향 또는 중립성과 객관성을 막는 성향'으로 특징짓는다. 예를 들어, 연구자가 특정 요인이 특정 현상의 발현에 영향을 미친다고 가정할 경우(예: 계층 구조는 안전성 우려의 목소리를 내는 의지에 영향을 미친다), 그러면 그들은 다른 영향력 있는 요소(예: 불확실성, 문화적 규범)를 무시하거나 전체 참여자 관점을 도출하는 질문을 하지 않을 수 있다.

The Sage Dictionary of Qualitative Research lists two definitions of bias.24 

  • The first defines bias as unchecked practices or actions where researchers influence data collection or interpretation and thus prejudice research decisions, data sources, and judgements.24 For example, when researchers reveal too much about a study's purpose to participants, participants' responses can be biased as they aim to please researchers (the so-called ‘social desirability bias’).25 

  • The second definition characterises bias as ‘individual preferences, predispositions, or predilections that prevent neutrality and objectivity’.24 For example, if researchers assume that certain factors impact the manifestation of a particular phenomenon (e.g., hierarchy influences willingness to voice safety concerns), then they may ignore other influential factors (e.g., uncertainty, cultural norms) or fail to ask questions eliciting the full range of participant perspectives.


이 두 가지 정의는 연구의 편견이 [이원론]과 [객관주의]라는 두 가지 원칙의 위반을 구성한다는 주장과 일치한다.26 

  • 이원론은 연구에 관여하는 연구자와 연구 참여자를 분리하여 편견을 최소화해야 한다는 믿음(후기 실증주의 연구에서의 공통점)이다.7 

  • 객관주의는 앞에서 서술한 바와 같이 [연구자의 가치, 신념 또는 가정으로부터 야기될 수 있는 편견]이 연구에 없는 것을 말한다.7

These two definitions align with the claim that bias in research constitutes the violation of two principles: dualism and objectivism.26 

  • Dualism is the belief (common in post-positivist research) that researcher and research participants involved in a study should be separated to minimise bias.7 

  • Objectivism, as previously articulated, refers to the absence of bias in a study that could result from researchers' values, beliefs or assumptions.7


  • 객관주의적 지향에서 일하는 사람들은 편견을 주관성과 부정적으로 동일시하는 경향이 있는 반면, 

  • 구성주의적 패러다임 내에서 일하는 사람은 일반적으로 연구자들의 행동, 선호도 및 성향은 연구 과정과 제품과 불가분하게 연관되어 있으며, 편견은 그 과정에서 제거될 수 없다는 것을 인식한다. 

주관주의적 지향으로부터, 구성주의 연구자들의 주관성은 현실 자체의 본질과 그것으로부터 우리가 개발할 수 있는 지식에 기초하기 때문에 연구 과정 내내 그들의 학문적 노력을 알려준다. 간단히 말해서, 연구자들은 그들의 연구 과정을 통해 그들이 이해하는apprehending 현실을 구성한다.

  • While those working from an objectivist orientation tend to negatively equate bias with subjectivity,27 

  • those working within a constructivist paradigm typically recognise that researchers' actions, preferences, and predispositions are inextricably linked with research processes and products; they cannot be removed from the process. 

From a subjectivist orientation, constructivist researchers' subjectivities inform their scholarly efforts throughout the research process because subjectivity is foundational to the nature of reality itself and the knowledge we can develop from it. Put simply: the researchers construct the reality that they are apprehending through their research processes.


[구성주의 연구자들의 주관성]은 연구가 어떻게 설계되고, 데이터가 수집되고, 연구 결과가 분석되는지를 형성할 뿐만 아니라, 원고에 그들의 연구 결과를 어떻게 나타내는지에도 영향을 미친다. 예를 들어, 구성주의 연구자들은 종종 발췌한 데이터를 참여자의 목소리로 해석하는 근거에 포함시킨다. 이는 연구의 엄격함rigour을 보여주기 위해 권장되는 접근법이다. 11 면접, 초점 그룹 또는 관찰을 통해 생성된 데이터는 참여자와 연구자 간에 공동 구성된 것으로 보인다. 이 경우에 데이터는 참가자의 목소리를 엄격하게 반영하지 않는다. 그보다, 이런 데이터는 연구자들에 의해 도출되고, 형성되고, 해석된 참가자의 목소리를 반영한다. 이러한 고려를 고려할 때, HPE의 구성주의적 연구의 많은 부분이 이원론자와 객관주의자가 보기에는 변명의 여지가 없을 정도로 주관적이거나 '편향적'이라는 것은 분명하다.

Constructivist researchers' subjectivities not only shape how research is designed, data are collected, and findings are analysed, but their subjectivities also affect how they represent their findings in manuscripts. For example, constructivist researchers often incorporate data excerpts into the findings of articles to ground their interpretations in participants' voices—an approach encouraged to show rigour.11 The data generated through interviews, focus groups, or observations are seen as co-constructed between participants and researchers. In this way, data do not strictly mirror the voices of participants; rather, data reflect the voices of participants as they were elicited, shaped, and interpreted by researchers. Given these considerations, it is clear that much of HPE's constructivist research is unapologetically subjective—or ‘biased’ in both the dualist and objectivist senses.


그러나 구성주의적 접근법을 통해 생성된 데이터가 주관적이라면, 어떻게 독자는 발견이 그들 자신의 맥락에서 추가적인 고려나 구현을 할 가치가 있는지 알 수 있는가? 주관주의적 연구 결과와 통찰력을 평가하기 위해, 우리는 엄격함에 대한 객관주의적 수단을 사용할 수 없다. 사실, 주관성을 수용하게 되면 [편견이 없는 연구]에 대한 어떠한 기대도 터무니없는 것으로 만든다.

But if data generated through constructivist approaches are subjective, how then does the reader know if findings merit further consideration or implementation in their own context? To evaluate subjectivist research findings and insights, we cannot use objectivist measures of rigour. In fact, embracing subjectivity makes any expectation of bias-free research nonsensical.


한 가지 진일보한 방법은 연구자 자신의 개인적 존재론적 및 인식론적 입장과 연구 과정에 미치는 영향을 탐구하는 것을 목표로 하는 성찰적 실천reflexive practices을 통해 연구 중 작용하는 역동dynamics을 탐구하고 문서화하는 것이다.28 이를 위해 롤스턴과 쉘튼27은 세 가지 기법을 제안한다. 

  • 첫 번째 기법(주제론적 연구와 객관주의적 연구에 모두 적용됨)에서 조사자들은 연구의 이론적 기초와 연구 설계, 방법 및 행동 사이에 명확한 일치를 보장하기 위해 연구 설계를 성찰한다. 

  • 두 번째 기법은 연구자들에게 질문의 작성, 샘플링 선택, 연구 참여자와의 상호작용, 데이터 분석, 연구 결과의 제시를 포함한 연구 과정의 모든 단계에서 그들의 역할과 위치positioning를 검토examine하도록 요구한다. 

  • 세 번째 기법은 한 걸음 더 나아가 연구자들을 자신의 연구에 대해서 분석하는 것이다. 예를 들어, 연구 참가자들에게 제시된 질문을 체계적으로 검토하거나, 이런 질문에 연구자들의 관점을 어떻게 반영되었는지 검토하거나, 그 질문들이 어떻게 특정 유형의 반응을 고무시키거나 다른 사람들을 배제시켰는지를 고려한다.

One way forward is to explore and document the dynamics at play during research through reflexive practices aimed at exploring the researcher's own personal ontological and epistemological positions and their influence on the research process.28 To do this, Roulston and Shelton27 propose three techniques. 

  • In the first technique (applicable to both subjectivist and objectivist research), investigators reflect on study designs to ensure clear alignment between studies' theoretical underpinnings, and their research designs, methods, and conduct. 

  • The second technique asks researchers to examine their roles and positioning within every stage of the research process including crafting of questions, sampling choices, interaction with study participants, analysis of data, and presentation of findings. 

  • The third technique goes a step further by engaging researchers in an analysis of their own work—for example systematically reviewing the questions posed to study participants, considering how these reflect researchers' own perspectives, and how the questions may have inspired certain types of responses or precluded others.


이러한 서로 다른 기법들은 성찰적 연구reflexive research 저널에 기록될 수 있고 연구 팀 내에서 논의될 수 있다. 집합적으로, 이러한 전략은 연구자들이 데이터가 어떻게 구성되는지에 대해 세심한 주의를 기울이고 연구 목적과 맥락에 기초하여 연구 과정에 대한 조정이 보장되는지 여부를 결정하는 데 도움이 되어야 한다. 연구팀이 연구 결과를 분석 및 작성하기 위해 협력할 때, 그들은 데이터와 관련하여 어떻게 스스로를 포지셔닝하는지에 주목하면서 이러한 반사성reflexivity을 계속해야 한다.29

These different techniques can be documented in reflective research journals and discussed within research teams. Collectively, these strategies should help researchers pay close attention to how data are constructed and decide whether adjustments to research processes are warranted based on study purposes and contexts. As research teams work together to analyse and write up study findings, they must continue this reflexivity, noting how they position themselves in relation to their data.29


연구자가 연구과정에 미치는 주관적 영향을 따지는 대신, 연구자와 검토자는 다음과 같은 질문을 할 수 있다. 

  • 이 연구의 가이딩guiding 이론과 가정은 데이터 해석에 어떤 영향을 미치고 있는가? 

  • 데이터 표현에서 이론과 가정은 어떻게 표현되는가? 

  • 조사 결과 발표에서 연구자와 참여자의 목소리는 어떤 관계인가? 

  • 제시된 자료는 저자들이 만든 더 넓은 주장을 설득력 있고 예증하고 있는가?

Instead of decrying the subjective influence of researchers on the research process, researchers and reviewers can ask: 

  • How are the study's guiding theories and assumptions influencing data interpretations? 

  • How are theories and assumptions represented in data representations? 

  • What is the relationship between researchers' and participants' voices in the presentation of findings? 

  • Are the data presented convincing and illustrative of the broader arguments made by the authors?


5 결론 

5 | CONCLUSION


본질적으로 우리는 주관성을 수용하는 패러다임 내에서 일반성과 편견이 문제가 된다고 주장한다. 실제로 이러한 용어의 기원을 이해함으로써 주제론적 HPE 연구에서 엄격함을 달성하기 위한 대안적 접근법을 성찰하고 명확히 할 수 있다. 우리는 이러한 문제들을 무시하거나 사과하거나 위장하기 보다는, 우리의 선택을 드러내는 데 있어서 목적성purposiveness을 갖추기를 주장한다.27

Essentially, we argue that generalisability and bias are problematic within paradigms that embrace subjectivity. Indeed, by understanding the origins of these terms, we are able to reflect on and clarify alternative approaches to achieving rigour in subjectivist HPE research. Rather than ignoring, apologising for or camouflaging these issues, we instead argue for purposiveness in illuminating our choices.27


모든 HPE 연구에서, 연구자들은 특정 패러다임에서 그들의 연구를 뿌리내린다. 이것은 그 연구자들이 항상 같은 패러다임에서 일한다는 것을 의미하지는 않는다. 오히려 그 반대이다. 각각의 연구는 연구자들이 그들이 묻고 있는 질문의 유형, 그들이 만들고자 하는 지식의 종류, 그리고 그들이 조사하고 있는 현실의 성격을 고려하도록 요구한다. 한 연구에서 HPE 연구자는 사후 포시티브 지향 내에서 작업할 수 있으며, 다른 연구에서는 구성주의적 접근법을 채택할 수 있다. 하나의 패러다임이 다른 패러다임보다 우월한 것은 아니다. 그 대신, 그것들은 서로 다르다.

In every HPE study, researchers root their investigations in a specific paradigm. This does not mean that those researchers always work from that same paradigm. Far from it. Each study requires researchers to consider the types of questions they are asking, the kinds of knowledge they hope to build and the nature of the reality they are investigating. For one study, an HPE researcher might work from within a post-positivist orientation; for another, they may adopt a constructivist approach. One paradigm is not superior to the other; instead, they are importantly different from each other.







. 2020 Aug 11.
 doi: 10.1111/medu.14348. Online ahead of print.

The applicability of generalisability and bias to health professions education's research

Affiliations 

Affiliations

  • 1Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, MD, USA.
  • 2Department of Medicine and Center for Faculty Educators, University of California, San Francisco, CA, USA.
  • 3College of Science, Health, and Education (SHEE), Murdoch University, Murdoch, WA, Australia.
  • 4Monash Centre for Scholarship in Health Education (MCSHE), Monash University, Clayton, Vic, Australia.
  • 5Faculty of Medicine and Health, University of Syndey, Sydney, NSW, Australia.
  • 6Centre for Research in Assessment and Digital Learning, Deakin University, Melbourne, Vic., Australia.
  • 7University of Toronto, Toronto, ON, Canada.

Abstract

Context: Research in health professions education (HPE) spans an array of topics and draws from a diversity of research domains , which brings richness to our understanding of complex phenomena and challenges us to appreciate different approaches to studying them. To fully appreciate and benefit from this diversity, scholars in HPE must be savvy to the hallmarks of rigour that differ across research approaches. In the absence of such recognition, the valuable contributions of many high-quality studies risk being undermined.

Methods: In this article, we delve into two constructs---generalisability and bias--that are commonly invoked in discussions of rigour in health professions education research. We inspect the meaning and applicability of these constructs to research conducted from different paradigms (i.e., positivist and constructivist) and orientations (i.e., objectivist and subjectivist) and then describe how scholars can demonstrate rigour when these constructs do not align with the assumptions underpinning their research.

Conclusions: A one-size-fits-all approach to evaluating the rigour of HPE research disadvantages some approaches and threatens to reduce the diversity of research in our field. Generalisability and bias are two examples of problematic constructs within paradigms that embrace subjectivity; others are equally problematic. As a way forward, we encourage HPE scholars to inspect their assumptions about the nature and purpose of research-both to defend research rigour in their own studies and to ensure they apply standards of rigour that align with research they read and review.

성공적인 연구 환경으로 무엇이 중요한가? 현실주의자 합성 (Med Educ, 2018)

What really matters for successful research environments? A realist synthesis

Rola Ajjawi,1 Paul E S Crampton2,3 & Charlotte E Rees3



도입 INTRODUCTION

연구 환경은 중요하다. 견실한 연구 품질의 문화나 연구자에 대한 지원과 같은 환경적 고려는 연구 생산성의 가장 영향력 있는 예측 변수라고 생각된다.  25년 이상 전에 Bland와 Ruffin1은 1960년대 중반부터 1990년(Box 1)까지에 걸친 국제 학술 의학 문헌에서 연구하기 쉬운 환경의 12가지 특성을 확인했다.

Research environments matter. Environmental considerations such as robust cultures of research quality and support for researchers are thought to be the most influential predictors of research productivity.1,2 Over 25 years ago, Bland and Ruffin1 identified 12 characteristics of research-favourable environments in the international academic medicine literature spanning the period from the mid-1960s to 1990 (Box 1).


실제로, 기존 검토가 성공적인 연구 환경에 어떤 영향을 미치는지를 더 잘 이해하도록 돕기 시작했지만, 이 연구는 일반적으로 환경적 특성의 상황별 복잡성과 다양성을 무시하고, [연구 결과물의 양과 같은 생산성의 좁은 표지]에 초점을 맞추었다(예: ref.7).

Indeed, although existing reviews have begun to help us better understand what makes for successful research environments, this research has typically ignored the contextual complexities and multiplicity of environmental characteristics1,3–7 and has focused on narrow markers of productivity such as the quantity of research outputs (e.g. ref.7)


Box 1 성공적인 연구환경의 특성1

Box 1 Characteristics of successful research environments1


1 명확한 조직적 연구 목표

2 연구 생산성을 우선순위로 한다. 최소한 다른 활동과 동등한 우선순위로 한다.

3 연구 가치를 공유하는 견고한 연구 문화

4 긍정적인 그룹 기후

5 참여형 거버넌스 구조

6 비위계적, 분산적 구조

7 팀원들 간의 좋은 소통과 직업적으로 의미 있는 관계

8 인력, 자금, 연구 시설 및 시간과 같은 적절한 리소스

9 더 큰 그룹 규모, 적당히 확립된 팀 및 다양성

10 연구 성공에 대한 보상

11 우수 연구원 채용 및 선발

12 연구 전문지식과 기술을 갖춘 연구중심 리더

1 Clear organisational research goals

2 Research productivity as a priority and at least equal priority to other activities

3 A robust research culture with shared research values

4 A positive group climate

5 Participative governance structures

6 Non-hierarchical and decentralised structures

7 Good communication and professionally meaningful relationships between team members

8 Decent resources such as people, funding, research facilities and time

9 Larger group size, moderately established teams and diversity

10 Rewards for research success

11 Recruitment and selection of talented researchers

12 Research-oriented leaders with research expertise and skill


성공적인 연구 환경을 이해하기 위한 상황별 배경

The contextual background for understanding successful research environments


교육의 대량 생산, 연구에 대한 정부 자금 지원 감소, 고등 교육에서의 '새로운 경영자' 문화, 연구의 양과 질에 대한 조사 증가, 연구가 생산되는 연구 환경과 연구의 영향이 불가피해졌다.  실제로 전 세계 고등교육기관(HEI)에서는 개별 연구자 및 연구그룹의 주요 성과 지표의 일부로 연구 생산성이 측정되고 있다.7

Against a backdrop of the mass production of education, reduced government funding for research and ‘new managerialist’ cultures in higher education,8,9 increased scrutiny of the quantity and quality of research, the research environments in which research is produced and the impacts of research has become inevitable.10 Indeed, in higher education institutions (HEIs) globally, research productivity is being measured as part of individual researcher and research group key performance indicators.7


호주, 홍콩, 뉴질랜드, 영국 등 많은 국가에서 HEI 연구는 정부 주도의 연구 평가를 통해 국가적인 규모로 측정된다. 이러한 연구 측정은 대학의 자금 배분 및 경쟁 시장에서 대학의 차별화에 기여해 왔으며, 일부는 '연구 중심대학'으로 제도적 정체성을 확고히 하고, 다른 일부는 상대적 '연구 중심적' 지위를 강조하였다. (예: 기존의 '교육 중심적' 대학') 이러한 제도적 차별화는 '연구활동' 또는 '교육 중심' 진로를 택하도록 점점 더 장려되고 있는 대학 내 개별 학자들과도 유사하다.8,9

In many countries, such as Australia, Hong Kong, New Zealand and the UK,11 HEI research is measured on a national scale through government-led research assessments. Such research measurement has contributed to the allocation of funding to universities and differentiation of universities in the competitive marketplace, with some solidifying their institutional identities as ‘research-intensive’ and others emphasising their relative ‘newcomer-to-research’ status (e.g. previously ‘teaching-intensive’ universities).9,12,13 Such institutional differentiation also parallels that of individual academics within universities, who are increasingly encouraged to take either ‘researchactive’ or ‘education-focused’ career pathways.8,9


표 S1은 주요 용어의 정의를 제공한다.

Table S1 provides definitions of key terms.


이전 리뷰에서 확인된 연구 환경의 주요 특징

Key features of research environments identified in previous reviews


Evans는 다음과 같이 연구 환경을 정의한다: '연구 관행과 산출물을 가치 있고 가치 있고 앞선 활동으로 수용하고 인식하는 것이 중심인 공유된 가치관, 가정, 신념, 의식 및 기타 형태의 행위' 14 이전의 검토는 [연구 역량 구축과 같은 개별 연구자를 대상으로 한 개입]과 [보조금이나 출판물 수 증가와 같은 개인 수준의 결과]에 초점을 맞추는 경향이 있었다. 기존 검토는 일반적으로 연구 역량 강화 개입이 긍정적인 연구 성과로 이어진다는 결론을 내렸다.

Evans defines a research environment as including: ‘shared values, assumptions, beliefs, rituals and other forms of behaviour whose central focus is the acceptance and recognition of research practice and output as valued, worthwhile and pre-eminent activity.’14 Previous reviews have tended to focus on interventions aimed at individual researchers, such as research capacity building,4,5,7 and with individual-level outcomes, such as increased numbers of grants or publications.4,5,7 These reviews have typically concluded that research capacity-building interventions lead to positive research outcomes.4,5,7


게다가, 그 검토들은 연구에 대한 개인과 기관의 enabler를 모두 확인했다. 개인 지원자들은 연구를 수행하려는 연구자들의 내재적 동기를 포함했다. 기관적 enabler로는,

  • 료들의 지지, 격려 및 검토,

  • 멘토링 및 협업,

  • 연구 리더십,

  • 명확한 전략과 같은 연구를 지원하는 제도적 구조, 프로세스 및 시스템

  • 호되는 시간 및 재정적 지원

Furthermore, the reviews have identified both individual and institutional enablers to research. Individual enablers included researchers’ intrinsic motivation to conduct research.6,7 Institutional enablers included 

  • peer support, encouragement and review,7 

  • mentoring and collaboration,4,5 

  • research leadership,5,6 

  • institutional structures, processes and systems supporting research, such as clear strategy,5,6 

  • protected time and financial support.5


비록 이러한 검토들이 성공적인 연구 환경의 특징들을 밝히기 시작했지만, 마즈마니아어 외 연구진들은 검토에서 '...어떤 상황에서 무엇이 가장 잘 작동하는지에 대해 거의 알려져 있지 않다'고 결론지었다.

Although these reviews have begun to shed light on the features of successful research environments, Mazmanian et al.4 concluded in their review: ‘...little is known about what works best and in what situations.’


개념 체계: 현실주의 접근법

Conceptual framework: a realist approach


우리는 현실주의 합성이 복합적인 개입이 성공에 어떻게 영향을 미칠 수 있는지를 설명해줄 것이라고 생각했다. 현실주의realism는 외부 현실(실제 세계)의 존재를 전제로 하지만 인간의 감각, 의지, 언어, 문화를 통해 현실(즉, 인지, 해석, 대응)이 여과된다는 것을 전제로 한다현실주의적 접근방식은 왜 개입이 효과가 있을 수 있고 없을 수 있는지, 누구를 위해 그리고 어떤 상황에서든 이론의 개발과 시험을 가능하게 한다. 현실주의적 접근은 개입이 직접적으로 결과를 초래하지 않는다는 것을 인식함으로써 이를 수행한다. 대신, 개입에 의해 제공되는 기회에 대한 [참가자의 반응과 반응]이 결과를 유발한다.

we thought a realist synthesis would bemost likely to elucidate how multiple complex interventions can influence success. Realism assumes the existence of an external reality (a real world), but one that is filtered (i.e. perceived, interpreted and responded to) through human senses, volitions, language and culture.15 A realist approach enables the development and testing of theory for why interventions may or may not work, for whom and under what circumstances.16 It does this through recognising that interventions do not directly cause outcomes; instead, participants’ reactions and responses to the opportunities provided by the intervention trigger outcomes. 


이 접근방식은 연구자들이 개입과 그들이 일하는 상황 사이의 관계, 그들이 어떻게 작용하는지(메커니즘) 그리고 그들의 결과와 같은 복잡한 상황에서의 인과 관계를 식별할 수 있게 할 수 있다. CMO(Context-mechanism-Outcome) 접근법이 반드시 선형적인 것은 아니지만, 상황별 가변성을 우선적으로 고려한 설명을 제공하는 데 도움이 될 수 있다.

This approach can allow researchers to identify causal links in complex situations, such as those between interventions and the contexts in which they work, how they work (mechanisms) and their outcomes.17 Although the context–mechanism– outcome (CMO) approach is not necessarily linear, it can help to provide explanations that privilege contextual variability.18


성공적인 연구 환경의 특징은 무엇이며, 누구에게, 어떻게, 그리고 어떤 환경에서인가?

What are the features of successful research environments, for whom, how and in what circumstances?


방법

METHODS


우리는 (i) 범위 명확화, (ii) 증거 검색, (iii) 품질 평가, (iv) 데이터 추출, (v) 데이터 합성 등 5단계 리얼리스트 종합을 따랐다.19 우리의 방법 또한 RAMES(현실주의 및 메타해설 근거 합성: 진화하는 표준) 보고 지침을 따른다.20

We followed five stages of realist synthesis: (i) clarifying scope; (ii) searching for evidence; (iii) assessing quality; (iv) extracting data, and (v) synthesising data.19 Our methods also follow the RAMESES (realist and meta-narrative evidence synthesis: evolving standards) reporting guidelines.20


범위 명확화

Clarifying the scope


먼저 연구 우수성 프레임워크(REF) 2014년 환경 평가 기준에 근거해 관련 개입을 파악함으로써 현실주의 종합의 범위를 명확히 했다. REF는 영국 HEI가 생산하는 연구의 질, 학계를 넘어선 영향, 연구를 지원하는 환경을 평가하는 국가적 행사다. REF2014 환경 템플릿에 표시된 평가 기준에는 해당 유닛의 연구 전략, 인력(인력 전략, 인력 개발 및 연구 학생 포함), 소득, 인프라 및 시설(IIIF)과 협업의 특징이 포함되었다.21

We first clarified the scope of our realist synthesis by identifying relevant interventions based on the Research Excellence Framework (REF) 2014 environment assessment criteria. The REF is a national exercise assessing the quality of research produced by UK HEIs, its impact beyond academia, and the environment that supports research. The assessment criteria indicated in the REF2014 environment template included the unit’s research strategy, its people (including staffing strategy, staff development and research students), its income, infrastructure and facilities (IIF), as well as features of collaboration.21


(그림 1은 초기 프로그램 이론에 대한 자세한 내용을 제공한다.)

(Fig. 1 gives further details of our initial programme theory).


 


경험적 증거 검색

Searching for empirical evidence


우리는 팀으로 검색어를 고안했고 검색에 경험이 있는 보건 사서의 도움을 받아 반복적으로 이를 다듬었다. 우리는 연구 질문을 세 가지 핵심 개념으로 나누었다: (i) 연구 환경, (ii) 분야, (iii) 연구 지표(즉, 긍정적 또는 부정적)

We devised search terms as a team and refined these iteratively with the help of a health librarian experienced in searching. We split the research question into three key concepts: (i) research environment; (ii) discipline, and (iii) research indicator (i.e. positive or negative).


스터디 선택

Study selection


첫 번째 최상위 검색은 모든 데이터베이스에 걸쳐 8527개의 저널 기사를 도출했다. 중복된 결과가 제거되고 '주제'와 '최근' 연구 매개변수가 강화되면 420개의 논문이 남아 있었다. 검색 및 선택 프로세스는 체계적 검토 및 메타분석(meta-analysses)을 위해 선호되는 보고 항목으로 요약된다(그림 2).

The first top-level search elicited 8527 journal articles across all databases. Once duplicate results had been removed, and ‘topic’ and ‘recentness’ study parameters reinforced, 420 articles remained. The searching and selection process is summarised in a PRISMA (preferred reporting items for systematic reviews and meta-analyses) diagram (Fig. 2).



품질평가

Assessment of quality


우리는 저널의 관련성과 엄격함을 평가했다.20 우리는 '이론이 구축되고/또는 시험에 기여할 수 있는지'에 따라 기사의 관련성을 정의했다.20

We assessed the journal articles for relevance and rigour.20 We defined an article’s relevance according to ‘whether it can contribute to theory building and/or testing’.20


우리는 엄격함을 '특정 데이터를 생성하는 데 사용되는 방법이 신뢰할 수 있고 신뢰할 수 있는지의 여부'를 결정하는 것으로 정의했다.20 연구 품질을 평가하기 위해 두 가지 사전 검증된 도구를 사용했다: 정량적 연구의 품질을 평가하기 위해 MERSQI(Medical Education Research Study Quality Instrument)와 CASP(Critical Emissing Technology Program) 질적 연구와 혼합 연구를 위한 질적 체크리스트.

We defined rigour as determining ‘whether the method used to generate the particular piece of data is credible and trustworthy’.20 We used two prevalidated tools to assess study quality: the Medical Education Research Study Quality Instrument (MERSQI) to assess the quality of quantitative research,27,28 and the Critical Appraisal Skills Programme (CASP) qualitative checklist for qualitative and mixed-method studies.29


5편의 논문은 우리의 이론구축에 기여하지 못하거나 CMO 구성(CMO 구성)이 부족하여 제외되었다. 연구를 배제한 이유를 메모해 두고 토론을 통해 의심을 해소했다(그림 2).

Five papers were excluded as they did not contribute to our theory building or lacked CMO configurations (CMOCs). We kept notes of the reasons for excluding studies and resolved doubts through discussion (Fig. 2).


데이터 추출

Data extraction


복수의 CMOC를 포함하는 데이터가 풍부한 두 기사는 일관성을 보장하기 위해 우리 모두가 유도적으로 그리고 연역적으로 (초기 프로그램 이론에 근거하여) 코드화되었다. 그리고 나서 우리는 우리의 코딩에서 어떤 유사점과 차이점을 토론했다. 현실주의 접근법의 도전에 내재되어 있듯이, 우리는 CMOCs의 식별에서 차이를 발견했는데, 이는 종종 한 특정 구성요소(예: 시간)가 어떻게 한 순간에 결과가 되고 다음 메커니즘이 될 수 있는가와 관련이 있다.

Two data-rich articles containing multiple CMOCs were inductively and deductively (based on the initial programme theory) coded by all of us to ensure consistency. We then discussed any similarities and differences in our coding. As is inherent in the challenges of realist approaches, we found differences in our identifications of CMOCs, which often related to how one particular component (e.g. time) could be an outcome at one moment and a mechanism the next.


데이터 합성

Data synthesis


결과 RESULTS


연구의 특성

Characteristics of the studies


42개의 논문은 의학교육(n = 4, 10%; 31–34 교육(n = 18, 43%), 35–52 및 의학(n = 20, 48%)을 대표했다.53–72 질적 연구 26개(62%)와 정량 연구 11개(26%) 및 혼합 방법 연구 5개(12%)가 있었다(표 S5). 연구는 호주(n = 10, 24%), 미국(n = 7, 17%), 영국(n = 6, 14%), 캐나다(n = 4, 10%), 남아프리카공화국(n = 4, 10%), 덴마크(n = 2, 5%), 터키(n = 7, 17%) 등 전 세계 국가(e)에서 나왔다.

The 42 papers represented the following disciplines: medical education (n = 4, 10%);31–34 education (n = 18, 43%),35–52 and medicine (n = 20, 48%).53–72 There were 26 (62%) qualitative studies, 11 (26%) quantitative studies and five (12%) mixed-methods studies (Table S5). The studies were from countries across the globe, including Australia (n = 10, 24%), the USA (n = 7, 17%), the UK (n = 6, 14%), Canada (n = 4, 10%), South Africa (n = 4, 10%), Denmark (n = 2, 5%), Turkey (n = 2, 5%) and others (n = 7, 17%) (e.g. Belgium, China, Germany, New Zealand and the Philippines).


초기 프로그램 이론 확장

Extending our initial programme theory


우리의 현실주의 종합에서 중요한 발견은 [동일한 개입이 문맥에 따라 각각 긍정적이거나 부정적인 결과를 초래하는 메커니즘]을 보여주었다는 것이다. 놀랍게도, CMOC는 대부분 3개 분야(예: 의료 교육, 교육 및 의료)에 걸쳐 일관성이 있었으며, 겉으로 보기에는 지역적 맥락이 결과와 더 강하게 상호 작용하는 것처럼 보였다.

A key finding from our realist synthesis was that the same interventions fired either positive or negative mechanisms leading to positive or negative outcomes, respectively, depending on context. Surprisingly, the CMOCs were mostly consistent across the three disciplines (i.e. medical education, education and medicine) with local contexts seemingly interplaying more strongly with outcomes.


적절한 자원(시간 포함)과 연구의 가치평가valuing가 가능했을 때, 연구전략을 수립하는 것은 성공적인 연구환경을 촉진했지만, 산출물, 인센티브, 보상에 너무 좁게 초점을 맞추었을 때는 부정적인 결과를 낳았다. 

    • 사람 면에서는 개별 연구자가 내부적으로 동기부여를 받고 소속감을 가질 필요가 있었으며, 연구를 하기 위해서는 역량강화 활동에 대한 시간과 접근을 보호할 필요가 있었다. 지식, 연구자 정체성, 네트워크 및 시간 부족과 더불어 제한된 리더십 지이 부정적인 연구 결과를 초래하는 메커니즘으로 작용했다. 

    • IIF의 존재는 성공적인 연구 환경을 위해 필요한 것으로 압도적으로 지적되었고 그들의 부재는 전형적으로 해로웠다. 흥미롭게도, 몇몇 논문들은 단기 계약, 고용 안정성의 저하, 임시 하급 직원의 사용이 취약한 연구 환경으로 이어질 수 있기 때문에 외부 자금 지원이 부정적인 결과를 초래할 수 있다고 보고했다.

    • 마지막으로, 협력은 신뢰하는 존경심, 지지적인 리더십, 소속감을 통해 중재된 성공적인 연구를 위해 결정적이었다. 그러나, 부실한 의사소통경쟁 문화는 협업을 저해하고 고립과 낮은 자존감을 초래했으며, 연구 참여와 생산성의 저하를 초래했다.

Having a research strategy promoted a successful research environment when it enabled appropriate resources (including time) and valuing of research; however, it had negative consequences when it too narrowly focused on outputs, incentives and rewards. 

    • In terms of people, individual researchers needed to be internally motivated and to have a sense of belonging, and protected time and access to capacity-building activities in order to produce research. Lack of knowledge, researcher identity, networks and time, plus limited leadership support, acted as mechanisms leading to negative research outcomes. 

    • The presence of IIF was overwhelmingly indicated as necessary for successful research environments and their absence was typically detrimental. Interestingly, a few papers reported that external funding could have negative consequences because short-term contracts, reduced job security and the use of temporary junior staff can lead to weak research environments.40,67,71 

    • Finally, collaboration was crucial for successful research mediated through trusting respectful relationships, supportive leadership and belongingness. Poor communication and competitive cultures, however, worked to undermine collaboration, leading to isolation and low self-esteem, plus decreased research engagement and productivity. Table 1



주요 교차 절단 메커니즘: 시간, ID 및 관계

Key cross-cutting mechanisms: time, identity and relationships


표 1에서 알 수 있듯이, 동일한 개입도 그것이 촉발된 특정 맥락과 메커니즘에 따라 긍정적이거나 부정적인 결과를 초래할 수 있다. 이것은 언뜻 보기에 명백하게 보이는 것보다 더 큰 복잡성을 강조한다. 이러한 네 가지 개입을 교차 차단하는 것은 연구 환경의 성공(또는 그렇지 않음)에 대해 정기적으로 확인된 세 가지 메커니즘, 즉 시간, 연구자의 정체성 및 관계였다. 이제 이러한 각 cross-cutting 메커니즘에 대한 주요 결과를 제시하고 이들의 상호 관계가 어떻게 우리의 수정된 프로그램 이론으로 이어지는지에 대해 논의한다(그림 3). 우리가 읽기 쉽도록 이 세 가지 메커니즘을 분리하려고 노력했음에도 불구하고, 그것들은 종종 엉망이 되어 있었다. 표 2는 각 메커니즘이 특정 상황에서 결과를 중재하는 방법을 설명하는 인용구를 제시한다.

As Table 1 shows, the same intervention can lead to positive or negative outcomes depending on the particular contexts and mechanisms triggered. This highlights greater complexity than is evident at first glance. Cross-cutting these four interventions were three mechanisms that were regularly identified as critical to the success (or not) of a research environment: time; researcher identities, and relationships. We now present key findings for each of these cross-cutting mechanisms and discuss how their inter-relations lead to our modified programme theory (Fig. 3). Note that although we have tried to separate these three mechanisms for ease of reading, they were often messily entangled. Table 2 presents quotes illustrating the way in which each mechanism mediates outcomes within particular circumstances.



시간 Time


시간은 우리의 세 분야에 걸쳐 연구 결과를 모을 수 있는 중요한 메커니즘으로 확인되었다. 시간은 다음과 같이 구분하여 개념화되었다. 

        • 호 시간; 

        • 가용 시간에 영향을 미치는 워크로드 압력 

        • 시간의 효율적 사용 

        • 시간의 유연한 사용. 

        • 간 벌기, 경력 쌓기, 시간 벌기, 경력 쌓기. 

가장 일반적으로 고려된 두 가지 측면은 [보호된 시간]과 [업무량]이였다.

Time was identified as an important mechanism for mobilising research outcomes across our three disciplines. Time was conceptualised severally including as: 

        • protected time; 

        • workload pressures influencing time available; 

        • efficient use of time; 

        • flexible use of time; 

        • making time, and time in career. 

The two most commonly considered aspects were protected time and workload implications.


[보호 시간]의 부족이 연구자의 참여 또는 활동 부족을 초래하고 연구 생산성이 저하되는 등 다양한 맥락과 분야에 걸쳐 대체로 부정적인 측면에서 보호 시간이 언급되었다.32,35–37,41,44,47–49,61–63,67 또한 [이용 가능한 보호 시간은] 다양한 맥락과 학문에 걸쳐서, 그리고 긍정적인 메커니즘의 역할을 하면서, 연구 생산성 향상과 적극적인 연구 참여로 이어지는 것으로 밝혀졌다.

Protected time was largely talked about in the negative across a variety of contexts and disciplines, with lack of protected time leading to lack of researcher engagement or inactivity and reduced research productivity.32,35–37,41,44,47–49,61–63,67 Also across a variety of contexts and disciplines, and acting as a positive mechanism, available protected time was found to lead to increased research productivity and active research engagement.31,36,40,48,49,63,65


[업무량]과 관련하여, 과도한 다른 업무량으로 인한 연구시간의 제한은 다음을 유발했다.

      • 연구 활동 감소, 

      • 연구 생산성 저하, 

      • 질 낮은 연구

      • 연구 교육에 참석할 수 있는 기회 감소

With regard to workload, limitations on the time available for research imposed by excessive other workloads led to 

      • reduced research activity, 

      • lower research productivity, 

      • poor-quality research and reduced – opportunity to attend research training.40,41,47 49,60,67 


임상, 교수, 행정 및 리더십 역할과 같은 여러 책임을 저글링하는 것 또한 연구에 이용 가능한 시간을 단축시킴으로써 연구 생산성을 억제했다.35,40,49 다른 비연구 작업과의 연계는 시간 사용 시 효율성이 향상되어 연구 생산성이 향상되는 것으로 설명되었다. (표 2, 인용문 1)

Juggling of multiple responsibilities, such as clinical, teaching, administrative and leadership roles, also inhibited research productivity by diminishing the time available for research.35,40,49 The alignment of research with other non-research work was described as driving efficiencies in the use of time leading to greater research productivity (Table 2, quote 1).


정체성 Identity


[정체성]은 또한 우리의 세 분야에 걸친 연구 결과를 동원하기 위한 중요한 메커니즘이었다. 해석에는 개인적 정체성(예: 성별), 직업적 정체성(예: 1차 시술자 또는 1차 연구자) 및 사회적 정체성(예: 소속감)이 포함되었다. 연구자 정체성은 흔히 1차 진료자(따라서 2차 진료자)와 관련하여 언급되었다.

Identity was also an important mechanism for mobilising research outcomes across our three disciplines. Interpretations included 

      • personal identities (e.g. gender), 

      • professional identity (e.g. as a primary practitioner or a primary researcher), and 

      • social identity (e.g. sense of belongingness). 

Researcher identity was often referred to in relation to first-career practitioners (and therefore second-career researchers).


샤프 외 연구진은 이를 박사학위 연구로부터 직접가 아니라 광범위한 'first-order' 지식과 교육학적 전문지식에 기초하여 고등교육에 채용된 참가자로 정의했다. 이들은 또한 학교나 병원에서 연구를 수행하는 실무자들이었다. 정체성은 초기 연구자, 중간 연구자 또는 선임 연구자와 관련하여 언급되기도 하였다. 학회에서 일하는 학계 직원들은 그들의 만족도, 역량, 연구 활동을 증대시키기 위해 [연구자로서 정체성, 소속성, 연구에 대한 자기 만족도, 자율성] 등을 계발할 필요가 있었다.

Sharp et al.48 defined these as participants recruited into higher education not directly from doctoral study but on the basis of their extensive ‘first-order’ knowledge and pedagogical expertise. These were also practitioners conducting research in schools or hospitals. Identities were also referenced in relation to early, mid-career or senior researchers. Academic staff working in academic institutions needed to develop a sense of researcher identity, belongingness, self-efficacy for research and autonomy to increase their satisfaction, competence and research activity.39,40,44,46,51,67


first-career practitioner실무자(즉, 교사, 의사)의 경우, 동기를 부여하기 위해 연구는 [높은 관련성을 가져야 했으며, 일차적 정체성 업무와 일치]해야 했다.53,59,62,65 이러한 [정렬]은 강력한 연구-교육 넥서스를 갖는 것으로 설명되었다.40,48 이 개념과 연계된 것은 first-career practitioner는 1차적 업무(예: 환자 또는 학생 지향)와 관련하여 연구의 영향을 인식하여, 동기부여를 촉진하고, 연구자 정체성을 개발해야 한다는 것이었다.

For first-career practitioners (i.e. teachers, doctors), the research needed to be highly relevant and aligned to their primary identity work in order to motivate them.53,59,62,65 This alignment was described as having a strong research–teaching nexus.40,48 Linked to this concept was the need for first-career practitioners to see the impact of research in relation to their primary work (e.g. patient- or student-oriented) to facilitate motivation and to develop a researcher identity (Table 2, quote 2).36,37,41,49,53,54,67


연구가 일차적 정체성 작업(예: 영어 교육, 일반 실습)과 무관하다고 여겨진 경우, 연구 중단이 있었다.37,48,52,59,67

Where research was seen as irrelevant to primary identity work (e.g. English language teaching, general practice), there was research disengagement.37,48,52,59,67


관계 Relationships


긍정적인 연구 관계는 상호 신뢰와 존중에 의해 특징지어졌다, 40–43,54,66,72 반면에 다른 이들은 그것을 [발전하는데 시간이 걸리는 우정]이라고 묘사했다.51 상호 지지적 관계는 자신감, 자존감 및 연구 능력을 개발하고 정체성을 전환한다는 측면에서 ECR과 특히 관련이 있는 것처럼 보였다.35,43,48,58,67 네트워크 형태의 관계는 다원적 연구를 통해 연구의 질을 향상시키고 협업의 질을 향상시키는 것으로 고려되었다.33,60

Positive research relationships were characterised by mutual trust and respect,40–43,54,66,72 whereas others described them as friendships that take time to develop.51 Mutually supportive relationships seemed to be particularly relevant to ECRs in terms of developing confidence, self-esteem and research capacity and making identity transitions.35,43,48,58,67 Relationships in the form of networks were considered to improve the quality of research through multicentre research and improved collaboration.33,60


관계의 특정한 형태로서의 지지적 리더십은 성공적인 연구 환경을 촉진하는 중요한 메커니즘이었다. 지지적 리더는 업무량 모니터링, 비전 설정, 연구 가치에 대한 인식 제고 및 긍정적 역할 모델링을 갖춰야 했으며, 이를 통해서 생산성 향상, 연구자 정체성 제고, 연구 환경 조성을 할 수 있었다.

Supportive leadership as a particular form of relationship was an important mechanism in promoting a successful research environment. Supportive leaders needed to monitor workloads, set the vision, raise awareness of the value of research, and provide positive role-modelling, thereby leading to increased productivity, promoting researcher identities and creating thriving research environments (Table 2, quote 3).31,34,37,38,40,41,43,44,46,48,49,53,55,62


성공적인 연구 환경 내에서 시간, 정체성 및 관계 사이의 교차점

Intersections between time, identity and relationships within successful research environments


시간과 정체성

Time and identity


첫째, 시간은 연구자 정체성 개발에 필요한 enabler였다.37,38,41,48,49,54,61,61,61,63,65,67,69 

둘째, 연구자로 스스로를 정체성화한 사람들(즉, 1차 연구자 정체성 보유자)은 보호시간이 부족함에도 불구하고 연구활동 결과를 내기 위해 시간을 효율적으로 사용했다.35,43 반대로, 연구에 대한 개인적인 결정과 탄력성이 부족했고, 시간을 보호한 것이 더 나은 연구 활동으로 이어지지 않았다.43 

Firstly, time was a necessary enabler for the development of a researcher identity.37,38,41,48,49,54,59,61,63,65,67,69 Secondly, those who identified as researchers (thus holding primary researcher identities) used their time efficiently to favour research activity outcomes despite a lack of protected time.35,43 Conversely, for other professors who lacked personal determination and resilience for research, having protected time did not lead to better research activity.43 


즉 [시간만으로는 성공적인 연구 환경을 지원하기에 불충분]하며, 시간을 어떻게 활용하고, 연구자들이 우선순위를 정하는가를 강조한다(표 2, 인용 4).

This highlights the fact that time alone is insufficient to support a successful research environment, and that it is how time is utilised and prioritised by researchers that really matters (Table 2, quote 4).


정체성과 관계

Identity and relationships


연구자로 정체성 전환을 지원하는 개입으로는 공식적인 연구 교육, 44,48,52,68 멘토링, 41,48,57,65,72 논문작성 그룹, 72, 또래 및 다른 연구자들과의 협업, 관계를 포함한 여러 메커니즘을 통해 운영되는 39,41,41,43이 포함되었다. 

The interventions that supported identity transitions into research included formal research training,44,48,52,68 mentoring,41,48,57,65,72 writing groups,72 and collaboration with peers and other researchers,39,41,43 operating through multiple mechanisms including relationships. 


메커니즘에는 자존감/신뢰감 증가, 네트워크 증가, 연구자로서의 외부 인식, 소속성 및 자기 만족도가 포함되었다.35,41,43–45,52,52,572,72

The mechanisms included self-esteem/ confidence, increased networks, external recognition as a researcher, belongingness, and selfefficacy.35,41,43–45,52,57,72


게다가, 우리의 데이터는 리더십이 연구자 정체성 개발에 도움이 될 수 있다는 것을 암시한다. 특히 리더십은 연구 자율성, 인정, 권한을 부여하고 지원 멘토링 환경을 조성해 연구자 정체성 개발 및 연구 생산성을 이끌어냈다(표 2, 인용 5).34,38,46,48

Furthermore, our data suggest that leadership can be an enabler to the development of a researcher identity. In particular, leadership enabled research autonomy, recognition and empowerment, and fostered supportive mentoring environments, leading to researcher identity development and research productivity (Table 2, quote 5).34,38,46,48


시간과 관계

Time and relationships


관계는 시간이 지남에 따라 발전되고 지속되었다(표 2, 인용 6). 세 가지 분야에 걸쳐 리더(매니저, 이사, 학장 등)의 역할은 연구에 대한 인식을 높이고, 그 다음 상충하는 요구에 중 연구 시간을 우선시하여 효과적인 연구 네트워크, 화합 및 협업을 이끌어 내는 것이었다.31,34,38,43,46,48–50,53,55,70

Relationships were developed and sustained over time (Table 2, quote 6). Across the three disciplines, the role of leaders (managers, directors, deans) was to acknowledge and raise awareness of research, and then to prioritise time for research against competing demands, leading to effective research networks, cohesion and collaboration.31,34,38,43,46,48–50,53,55,70


그러나 연구 리더십은 현재의 대학 문화의 compliance와 counting의 맥락에 의해 [관계를 해치고, 동기를 잃게하며, 평가절하devalue된 감정을 불러일으켜서] 부정적인 영향을 받을 수 있다. 실제로 지도자들이 연구자의 정체성을 인식하지 못한 것은 부정적인 연구 생산성으로 이어졌다.36–38,43,46,48,49

Research leadership, however, could be influenced negatively by the context of compliance and counting in current university cultures damaging relationships, creating a loss of motivation, and raising feelings of devalue. Indeed, the failure of leaders to recognise researcher identities led to negative research productivity.36–38,43,46,48,49


(원래 학문에서 이미 강력한 지원 네트워크를 가지고 있었기 때문에) 새로운 학문의 연구자들과 관계를 맺는데 시간을 투자하지 않았던 second-career PhD 학생들은 졸업 후 연구 네트워크가 제한적이라는 것을 발견했다.48

Second-career PhD students who did not invest time in establishing relationships with researchers in their new disciplines (as they already had strong supportive networks in their original disciplines) found that they had limited research networks following graduation.48



고찰 DISCUSSION


주요 소견 요약

Summary of key findings


  • 첫째로, 우리는 주요 개입이 다양한 맥락에서 긍정적인(주관적이고 객관적인) 결과와 부정적인(주관적이고 객관적인) 결과 둘 다로 이어진다는 것을 발견했다. 흥미롭게도, 우리는 출판물의 수, 보조금 소득, h-지표와 같은 정량적 지표와 함께 오늘날 연구 성공의 두드러진 지표로 여겨지고 있음에도 불구하고, 이것들과 연구 영향과 관련된 어떠한 결과도 확인하지 않았다.21 

  • 둘째로, 우리는 [학문분야의 맥락]은 [개인, 지역, 그리고 제도적 맥락]보다 영향력이 낮은 것으로 보인다는 것을 발견했다. 

  • 마지막으로, 우리의 수정된 프로그램 이론은 성공적인 연구 환경과 실패한 연구 환경 모두를 뒷받침하는 메커니즘으로서 세 가지 cross-cutting 메커니즘(시간, 연구자 정체성 및 관계) 사이의 복잡한 상호작용을 보여준다.

Firstly, we found that key interventions led to both positive (subjective and objective) and negative (subjective and objective) outcomes in various contexts. Interestingly, we did not identify any outcomes relating to research impact despite impact nowadays being considered a prominent marker of research success, alongside quantitative metrics such as number of publications, grant income and h-indices.21 

Secondly, we found that disciplinary contexts appeared to be less influential than individual, local and institutional contexts. 

Finally, our modified programme theory demonstrates a complex interplay among three cross-cutting mechanisms (time, researcher identity and relationships) as mechanisms underpinning both successful and unsuccessful research environments.


주요 결과 및 기존 문헌과의 비교

Key findings and comparisons with the existing literature


우리의 연구는 명확한 연구 전략, 연구를 중시하는 조직, 연구 지향적 리더십, 자원(사람, 자금, 연구 시설 및 시간 등)에 대한 접근성, 그리고 의미 있는 관계를 갖는 것의 중요성에 관한 이전의 검토 1,5–7의 결과를 뒷받침한다. 그러나, 우리의 연구는 이러한 개입이 반드시 성공적인 연구 환경을 초래하는 명확한 선형 관계가 존재하지 않는다는 암시를 강화함으로써 이러한 발견을 상당히 확대한다. 예를 들어, 연구전략을 수립하는 것은 지표가 지나치게 초점이 좁거나 지나치게 결과물 지향적으로 보인다면 부정적인 영향을 미칠 수 있다.38,40,46,47,64 마찬가지로, 프로젝트성 자금으로 인해 기간제 계약에 더 많은 시간제 직원이 고용될 수 있으며, 이로 인해 불안정성, 이직성 및 연구팀의 전문지식이 부족해질 수 있다.40,671,71

Our research supports the findings of earlier reviews1,5–7 regarding the importance of having a clear research strategy, an organisation that values research, research-oriented leadership, access to resources (such as people, funding, research facilities and time), and meaningful relationships. However, our research extends these findings considerably by flagging up the indication that a clear linear relationship, whereby the presence of these interventions will necessarily result in a successful research environment, does not exist. For example, instituting a research strategy can have negative effects if the indicators are seen as overly narrow in focus or output-oriented.38,40,46,47,64 Similarly, project money can lead to the employment of more part-time staff on fixed-term contracts, which results in instability, turnover and lack of research team expertise.40,67,71


대다수의 논문에서 시간이 연구 성과에 영향을 미치는 중요한 메커니즘으로 확인되었지만, 연구자의 정체성은 시간이 부족한 상황에서도 연구 성과에 긍정적인 영향을 미쳤다. 실제로, 우리는 정체성이 개인의 동기와 탄력성을 통해 연구의 우선순위를 정하는 시간을 효율적으로 찾아냄으로써 제한된 시간을 극복할 수 있는 연구 생산성의 메커니즘으로 작용한다는 것을 발견했다.35,43 따라서 [시간은 단순히 연구를 하는 시간 이상의 것]이었지만, [연구자로서의 정체성 개발에 대한 투자]와 [시간이 지나면서의 다른 연구자들과의 관계]를 포함했다 .37,38,41,48,49,54,59,61,61,63,65,67,69

Although time was identified as an important mechanism affecting research outcomes within the majority of papers, researcher identity positively affected research outcomes even in time-poor situations. Indeed, we found that identity acted as a mechanism for research productivity that could overcome limited time through individuals efficiently finding time to prioritise research through their motivation and resilience.35,43 Time was therefore more than just time spent doing research, but also included investment in developing a researcher identity and relationships with other researchers over time.37,38,41,48,49,54,59,61,63,65,67,69


[관계 구축 개입]은 ECR과 초진료 경력이 있는 연구로 어려운 정체성 전환을 지원하는 데도 효과가 있는 것으로 나타났다. 지지적 리더십은 특정 형태의 관계로서, 보호되는 시간과 합리적인 업무량을 제공하여 연구와 연구자 정체성 형성을 위한 시간에 대한 enabler로 보일 수 있다.343,38,46,48

Relationship-building interventions were also found to be effective in supporting difficult identity transitions into research faced by ECRs and those with firstcareer practitioner backgrounds. Supportive leadership, as a particular form of relationship, could be seen as an enabler to the provision of protected time and a reasonable workload, allowing time for research and for researcher identity formation.34,38,46,48


실제로, 우리의 현실주의 종합 연구결과는 연구자 정체성의 중심적 중요성을 강조하여 연구전략, 자원(예: 시간) 및 연구의 가치평가가 존재하는 곳에서도 연구환경이 번창하지 않는 이유에 대한 참신한 설명을 제공한다.

Indeed, our realist synthesis findings highlight the central importance of researcher identity and thus offer a novel explanation for why research environments may not flourish even in the presence of a research strategy, resources (e.g. time) and valuing of research.


연구자의 정체성은 복잡하고 의사, 교사, 지도자 등의 다른 정체성과 교차한다.

Researcher identity is complex and intersects with other identities such as those of practitioner, teacher, leader and so on.


자신의 정체성을 연구자로 식별한 사람들은 자신의 작업에 우선순위를 다르게 정했다. 연구 생산성이 높은 사람들은 연구를 우선시하는 반면, 연구 생산성이 낮은 집단에 속한 사람들은 가르치는 것을 우선시했다.73

Those who identified as researchers prioritised their work differently: those who were highly productive prioritised research, whereas those in the low-productivity group prioritised teaching.73


흥미롭게도, 고도로 생산적인 연구자들은 연구를 사회적 현상으로 보는 경향이 있었고, 출판물, 발표물 및 보조금이 학문적 네트워크에서 '거래'되고 있었다. Brew 외 연구진 39는 다음과 같이 설명한다: 

'...'거래'라는 관점은 자가 생성 연구자 정체성과 관련이 있다. 연구자 정체성은 출판, 네트워크, 협업 및 동료 검토의 활동에서 개발된다. 이러한 활동들은 연구자로서 한 개인의 정체성 증명을 뒷받침한다. 그들은 또한 성과 측정과 지표에 영향을 미친다.'

Interestingly, highly productive researchers tended to view research as a social phenomenon with publications, presentations and grants being ‘traded’ in academic networks. Brew et al.39 explain that: 

‘...the trading view relates to a self-generating researcher identity. Researcher identity develops in the act of publication, networks, collaborations and peer review. These activities support a person’s identification as a researcher. They also, in turn, influence performance measures and metrics.’


방법론적 강점과 한계

Methodological strengths and limitations


교육 및 연구에 미치는 영향

Implications for education and research


성공적인 연구 환경을 촉진하기 위해 개입을 더 잘 동원하기 위해서는 시간, 정체성, 관계(리더십 포함)에 초점을 맞출 필요가 있다.

We need to focus on time, identity and relationships (including leadership) in order to better mobilise the interventions to promote successful research environments.


    • 연구자 개개인은, 단순히 연구가 외부적 동력에 의해서 추진되는 것이 아니라, 내적으로 동기가 부여될 수 있도록 연구자 정체성 개발을 위하여 [연구에 대한 개념과 연구자 정체성 개발을 위한 노력 등] 자기자신을 연구자로 identify하는 방법과 이유에 대해 성찰할 필요가 있다. 제2경력 연구자 또는 중요한 교수나 실무자 역할을 가진 사람들은 더 넓은 연구 네트워크를 구축하는 동안 그들의 실무에 연구를 맞추는 것을 모색할 수 있다.

Individuals need to reflect on how and why they identify as researchers, including their conceptions of research and their working towards the development of a researcher identity such that research is internally motivated rather than just externally driven. Those who are second-career researchers or those with significant teaching or practitioner roles could seek to align research with their practice while they establish wider research networks.


    • 연구 리더들은, 개별 연구자들이 자신의 연구자 정체성을 개발하고, 연구를 가치 있게 여기고, 연구가 시간이 걸린다는 것을 인식하고, 연구 역량 구축, 강한 관계와 협업을 촉진하는 기회에 접근할 수 있도록 지원할 것을 권고한다. 예를 들어, 리더는 경쟁적 또는 협력적 문화가 육성되는 방법에 주목하면서 연구자의 정체성을 증진하고 연구 관계를 구축하는 개입을 도입할 수 있다.

We recommend that research leaders support individuals to develop their researcher identity, be seen to value research, recognise that research takes time, and provide access to opportunities promoting research capacity building, strong relationships and collaboration. Leaders, for example, may introduce interventions that promote researcher identities and build research relationships (e.g. collaborations, networking, mentoring, research groups etc.), paying attention to the ways in which competitive or collaborative cultures are fostered.


브라운 외 연구진은 최근 정체성 전환을 촉진하기 위해 네 가지 범주에 대한 논의를 권고했다. 

    • 신에 대한 성찰 (추상, 경험 및 기대) 

    • 상황의 고려(의견, 우려) 

    • 서포트 (사용 가능한 항목 및 필요한 항목) 및 

    • 략(변화에 대응하고 번창하기 위한 개인 전략).

Browne et al.75 recently recommended discussions around four categories for promoting identity transition: 

    • reflection on self (values, experiences and expectations); 

    • consideration of the situation (circumstances, concerns); 

    • support (what is available and what is needed), and 

    • strategies (personal strategies to cope with change and thrive).


의학 교육의 전문화로, 연구 단위가 1차 및 2차 진료 연구자의 혼합을 포함할 가능성이 점점 높아지고 있으며, 우리의 리뷰는 연구 개념과 연구자 정체성에 대한 논의가 가치 있게 될 것임을 시사한다.

With the professionalisation of medical education,76 research units are increasingly likely to contain a mixture of first- and second-career researchers, and our review suggests that discussions about conceptions of research and researcher identity would be valuable.


마지막으로, 조직은 연구를 중시하고 자원 및 연구 역량 구축 활동에 대한 접근을 제공해야 한다. HEI의 관리주의 문화 내에서, compliance and counting은 이미 승진과 성공 면에서 지배적인 담론이 되었다. 따라서 정책 입안자들은 HEI가 연구 환경에 대한 정책의 완전한 영향을 결정하기 위해 모든 형태의 연구(양적, 품질 및 영향의 주관적이고 객관적인 측정 포함)를 인식하고, 인센티브를 부여하고 보상하는 방법을 고려해야 한다.

Finally, organisations need to value research and provide access to resources and research capacity-building activities. Within the managerialist cultures of HEIs, compliance and counting have already become dominant discourses in terms of promotion and success. Policymakers should therefore consider ways in which HEIs recognise, incentivise and reward research in all its forms (including subjective and objective measures of quantity, quality and impact) to determine the full effects of their policies on research environments.




Supplementary Table 1: Glossary of Terms (in alphabetical order)

Term

Definition

CMOCs

CMOCs spell out the relationship between identified features of the context-mechanism-outcome configuration. CMOCs respond to the question: “How are changes in outcomes produced by interventions introduced to modify the context and balance of mechanisms triggered?” (1)

Context

Responds to the question: “What conditions are needed for an intervention to trigger mechanism(s) to produce outcome(s)?” (1)

Demi-regularity

Semi-predictable patterns of CMOCs. They are the broad lessons for whom, in what circumstances and in what respects an intervention is more likely to succeed.

Environment

Research environment includes: ‘shared values, assumptions, beliefs, rituals and other forms of behaviour whose central focus is the acceptance and recognition of research practice and output as valued, worthwhile and pre-eminent activity’ (2)

Impact

Research impact is any effect on, change or benefit to the economy, society, culture, public policy or services, health, the environment or quality of life, beyond academia. (3)

Intervention

Based on previous work and literature reviews, possible interventions here relate to having a research strategy; people (including research capacity building activities); infrastructure, income and funding (IIF); and research collaborations. (4)

Mechanisms

A mechanism is hidden and brings about changes through the implementation of an intervention in a given context. It involves changes in individuals’ reasoning and their capacity to respond when an intervention is applied in a specific context. Therefore, mechanisms are much more than enablers or barriers to the outcomes of interventions. (5) Mechanisms respond to the question: “What is it about an intervention, which may lead it to have a particular outcome pattern in a given context?” (1)

Outcome

Outcomes respond to the question: “What are the practical effects produced by causal mechanisms being triggered in given contexts?” (1)

Outputs

Outputs are the published products of any form of research including journal articles, monographs and chapters in books, as well as outputs disseminated in other ways such as designs, performances and exhibitions. (3)

Program theory

Sets out how and why outcomes occur within an intervention. The differences between the initial and modified program theory indicate the novel findings of a particular research study. (6)

RAMESES

RAMESES stands for: Realist And Meta-narrative Evidence Syntheses: Evolving Standards. (6)

Realism

‘Realism’ agrees that there is a real world but that our knowledge of it is processed through human senses, brains, language and culture. Realism also argues that we can improve our understandings of reality but the ‘real world’ constrains the interpretations we can reasonably make of it. (7)

REF

The Research Excellence Framework (REF) is the UK’s current national system for assessing the quality of research in UK higher education institutions. (4, 8)




. 2018 Jul 24;52(9):936-950.
 doi: 10.1111/medu.13643. Online ahead of print.

What really matters for successful research environments? A realist synthesis

Affiliations 

Affiliations

  • 1Centre for Research in Assessment and Digital Learning (CRADLE), Deakin University, Geelong, Victoria, Australia.
  • 2Research Department of Medical Education, University College London, London, UK.
  • 3Monash Centre for Scholarship in Health Education (MCSHE), Faculty of Medicine, Nursing and Health Sciences, Monash University, Clayton, Victoria, Australia.
Free PMC article

Abstract

Context: Research environments, or cultures, are thought to be the most influential predictors of research productivity. Although several narrative and systematic reviews have begun to identify the characteristics of research-favourable environments, these reviews have ignored the contextual complexities and multiplicity of environmental characteristics.

Objectives: The current synthesis adopts a realist approach to explore what interventions work for whom and under what circumstances.

Methods: We conducted a realist synthesis of the international literature in medical education, education and medicine from 1992 to 2016, following five stages: (i) clarifying the scope; (ii) searching for evidence; (iii) assessing quality; (iv) extracting data, and (v) synthesising data.

Results: We identified numerous interventions relating to research strategy, people, income, infrastructure and facilities (IIF), and collaboration. These interventions resulted in positive or negative outcomes depending on the context and mechanisms fired. We identified diverse contexts at the individual and institutional levels, but found that disciplinary contexts were less influential. There were a multiplicity of positive and negative mechanisms, along with three cross-cutting mechanisms that regularly intersected: time; identity, and relationships. Outcomes varied widely and included both positive and negative outcomes across subjective (e.g. researcher identity) and objective (e.g. research quantity and quality) domains.

Conclusions: The interplay among mechanisms and contexts is central to understanding the outcomes of specific interventions, bringing novel insights to the literature. Researchers, research leaders and research organisations should prioritise the protection of time for research, enculturate researcher identities, and develop collaborative relationships to better foster successful research environments. Future research should further explore the interplay among time, identity and relationships.

응답자들은 우리가 물어보는 것에 대해서 뭘 생각하는가? 인지 인터뷰 사용하기 (J Grad Med Educ . 2013)

What Do Our Respondents Think We’re Asking? Using Cognitive Interviewing to Improve Medical Education Surveys 

Gordon B. Willis, PhD

Anthony R. Artino Jr., PhD





최근 대학원 의학 교육의 저널 2개 사설에서 4,5 저자들은 설문지 설계자들이 사용할 수 있는 6단계 의사결정 과정을 제안했다. 본 기사에서는 6가지 의사결정 단계 중 5번째 단계, 특히 "내 응답자가 내가 의도한 대로 내 항목을 해석할 것인가?"를 고려함으로써 그러한 노력을 확대한다.’’

In 2 recent Journal of Graduate Medical Education editorials,4,5 the authors proposed a 6-step decision process for questionnaire designers to use. In this article, we expand on that effort by considering the fifth of the 6 decision steps, specifically, the following question: ‘‘Will my respondents interpret my items in the manner that I intended?’’


설문지는 의학 교육 연구의 주제를 조사하기 위해 정기적으로 사용되며, 표준화된 설문 조사 질문을 대본으로 작성하는 간단한 과정으로 보일 수 있다. 그러나, 연구자들이 완벽히 명확하다고 생각되는 항목들이 종종 유의미한 오해를 받거나, 그렇지 않으면 의도된 바를 측정하지 못한다는 것을 많은 증거들이 증명한다.1.2 예를 들어, "보건전문직"과 같은 추상적인 용어들은 질문지를 만든 사람이 생각한 것을 현저하게 벗어날 수 있는 광범위한 해석을 떠올리게 하는 경향이 있다.

Questionnaires are regularly used to investigate topics in medical education research, and it may seem a straightforward process to script standardized survey questions. However, a large body of evidence demonstrates that items the researchers thought to be perfectly clear are often subject to significant misinterpretation, or otherwise fail to measure what was intended.1,2 For instance, abstract terms like ‘‘health professional’’ tend to conjure up a wide range of interpretations that may depart markedly from those the questionnaire designer had in mind.


여기서 설명하는 방법, 즉 '인지 면접' 또는 '인지 시험'조사 질문(특성, 행동 또는 본질적으로 사실)이 의도한 목적(BOX)을 달성하는지 여부를 조사하기 위해 특별히 고안된 증거 기반의 정성적 방법이다그 방법은 구체적으로 모집된 개인과의 인터뷰에 의존한다. 이들 개인에게는 설문지 최종 초안을 관리하는 것과 동일한 방식으로 설문지 질문을 제시한다. 인지면접은 품질보증 절차로서 자료수집(예측) 전, 자료수집 중 또는 조사를 실시한 후에도 실시된다.

The method we describe here, termed ‘‘cognitive interviewing’’ or ‘‘cognitive testing,’’ is an evidence-based, qualitative method specifically designed to investigate whether a survey question—whether attitudinal, behavioral, or factual in nature—fulfills its intended purpose (BOX). The method relies on interviews with individuals who are specifically recruited. These individuals are presented with survey questions in much the same way as survey respondents will be administered the final draft of the questionnaire. Cognitive interviews are conducted before data collection (pretesting), during data collection, or even after the survey has been administered, as a quality assurance procedure.


1980년대에 인지 인터뷰는 실험 심리학 분야에서 성장했다; 인지 인터뷰의 일반적인 정의는 그러한 기원과 강조를 반영한다. 예를 들어 윌리스는 '인지 인터뷰는 개인이 정신적으로 설문지를 처리하고 응답하는 방식을 경험적으로 연구하기 위한 심리학적 지향적 방법이다'라고 말한다. 그 이론적 기반 때문에 인지 인터뷰는 전통적으로 투란게우가 도입한 4단계 인지 모델에 의존해 왔다. 이 모델은 설문조사 응답 프로세스는 다음의 네 단계를 포함하는 것으로 설명한다. 

  • (1) 이해, 

  • (2) 정보의 검색, 

  • (3) 판단 또는 추정, 

  • (4) 질문에 대한 응답 선택

During the 1980s, cognitive interviewing grew out of the field of experimental psychology; common definitions of cognitive interviewing reflect those origins and emphasis. For example, Willis6 states, ‘‘Cognitive interviewing is a psychologically oriented method for empirically studying the way in which individuals mentally process and respond to survey questionnaires.’’ For its theoretical underpinning, cognitive interviewing has traditionally relied upon the 4stage cognitive model introduced by Tourangeau.7 This model describes the survey response process as involving 

  • (1) comprehension, 

  • (2) retrieval of information, 

  • (3) judgment or estimation, and 

  • (4) selection of a response to the question.


예를 들어, ''지난 해에, 정식 교육 프로그램에 몇 번이나 참여하셨습니까?''라는 질문에 대한 정신적 처리는 아마도 다음의 것이 필요할 것이다. 

  • 요한 용어와 구문을 이해하고 해석한다(예: "지난 해" 및 "교육 프로그램"). 

  • 정답을 회상하고, 정확한 숫자를 보고하기로 결정(예를 들어, 더 높은 값을 제공하는 것보다 더 높음)한다. 

  • 그런 다음, 조사 요건에 부합하는 답변을 작성한다(예: "실제"가 아닌 "5회" 보고). 

For example, mental processing of the question ‘‘In the past year, how many times have you participated in a formal educational program?’’ presumably requires a respondent 

  • to comprehend and interpret critical terms and phrases (eg, ‘‘in the past year’’ and ‘‘formal educational program’’); 

  • to recall the correct answer; to decide to report an accurate number (rather than, for example, providing a higher value); and 

  • then to produce an answer that matches the survey requirements (eg, reporting ‘‘5 times’’ rather than ‘‘frequently’’). 


가장 흔히 이해력 문제가 지배적이다. 예를 들어, '공식 교육 프로그램'이라는 용어가 다양하게 해석되고 있는 것을 발견할 수 있다. 즉, 응답자는 어떤 활동을 세어야 할지 확실하지 않을 수 있고, 나아가 어떤 유형의 참여에 대해 질문받고 있는지 모를 수 있다(예: 학생, 교사 또는 관리자로서의 참여).

Most often, comprehension problems dominate. For example, it may be found that the term ‘‘formal educational program’’ is variably interpreted. In other words, respondents may be unsure which activities to count and, furthermore, may not know what type of participation is being asked about (eg, participation as a student, teacher, or administrator).


보다 최근에 인지 인터뷰는 사회학적/인류학적 노력으로 어느 정도 재개념화되었다. 왜냐하면 조사 항목에 대한 개인주의적 정신 처리뿐만 아니라, 응답자의 삶을 의미 있게 포착하는 질문이 얼마나 잘 표현되는가에 영향을 미칠 수 있는 배경 사회적 맥락도 강조하기 때문이다. 특히 설문조사가 다양한 환경과 문화의 범위를 점점 더 반영함에 따라, 이러한 관점은 점점 더 대중화되었다. 이러한 관점에서 볼 때, 겉보기에는 '졸업후의학교육'처럼 간단해 보이는 용어의 정의 자체에는 통일성이 결여되어 있을 수 있다.

More recently, cognitive interviewing has to some extent been reconceptualized as a sociological/anthropological endeavor, in that it emphasizes not only the individualistic mental processing of survey items but also the background social context that may influence how well questions meaningfully capture the life of the respondent.8 Especially as surveys increasingly reflect a range of environments and cultures that may differ widely, this viewpoint has become increasingly popular. From this perspective, the definition of a term as seemingly simple as ‘‘graduate medical education’’ might itself lack uniformity.


인지 인터뷰(또는 인지 테스트)—조사 질문이 의도된 목적을 충족하는지 여부를 조사하기 위해 특별히 고안된 증거 기반의 정성적 방법.

Cognitive interviewing (or cognitive testing)—an evidence-based qualitative method specifically designed to investigate whether a survey question satisfies its intended purpose.


동시 탐색 - 응답자가 각 조사 항목을 소리 내어 읽고 답한 후 바로 면접관이 탐색 질문을 관리하는 구두 탐색 기법.

Concurrent probing—a verbal probing technique wherein the interviewer administers the probe question immediately after the respondent has read aloud and answered each survey item.


사전주도적 구두 탐색—잠재적인 문제를 찾기 위해 인지 면접 전에 체계적으로 제작된 구두 조사.

Proactive verbal probes—a verbal probe that is systematically fashioned before the cognitive interview in order to search for potential problems.


반응성 구두 탐색—인지 인터뷰 동안 종종 응답자의 행동에 대응하여 비표준화된 방식으로 개발된 구두 조사.

Reactive verbal probes—a verbal probe that is developed in a nonstandardized way during the cognitive interview, often in response to a respondent’s behavior.


반응성 효과—프로빙 질문에 대한 응답과 그 대답에 대한 설명과 관련된 추가적인 인지적 요구로 인해 발생하는 응답자의 행동의 불편함(대부분 조사 응답자의 일반적으로 행동보다 더 신중하게 고려한 답변을 하게 만든다).

Reactivity effects—bias in a respondent’s behavior caused by the additional cognitive demands related to answering probe questions and explaining those answers (most likely by leading to more carefully thought-out answers than a survey respondent might typically provide).


구두 조사—면접자가 일련의 조사 질문을 관리하는 인지 인터뷰 기법. 일반적으로 응답자가 제공하는 것보다 더 상세한 정보를 이끌어내기 위해 특별히 고안된 것이다.

Verbal probing—a cognitive interviewing technique wherein the interviewer administers a series of probe questions specifically designed to elicit detailed information beyond that normally provided by respondents.


후향적 조사—응답자가 전체 조사(또는 조사의 일부)를 완료한 후 면접관이 조사 질문을 관리하는 구두 조사 기법.

Retrospective probing—a verbal probing technique wherein the interviewer administers the probe questions after the respondent has completed the entire survey (or a portion of the survey).


Think-aloud 면접—조사에서 응답자들이 평가된 조사 항목에 답하려고 할 때 자신의 생각을 적극적으로 말하도록 요구하는 인지 인터뷰 기법.

Think-aloud interviewing—a cognitive interviewing technique wherein survey respondents are asked to actively verbalize their thoughts as they attempt to answer the evaluated survey items.



프로세스 개괄

Process Overview


인지면접은 2가지 주요 절차를 이용하여 실시한다.

Cognitive interviewing is conducted using 2 key procedures


첫째, 설문 응답자(종종 주제나 참여자로 개명)가 설문 질문에 답하려고 할 때 적극적으로 자신의 생각을 구두로 표현해 줄 것을 요청하는 think-aloud 방식의 인터뷰가 필요하다.9 여기서 인터뷰 진행자의 역할은 주로 피험자에게 '계속 이야기'를 하도록 요청함으로써 이러한 활동을 지원하고, 그 결과의 구두 기록, 즉 소위 인지 프로토콜이라고 불리는 것을 나중에 분석하기 위해 기록하는 것이다. 이 절차가 효과적이 되려면, 대상자의 think-aloud 스트림에는 접선적 또는 교묘한 자유 연관성이 아닌 조사 질문 기능의 평가와 관련된 진단 정보가 포함되어야 한다.

First, think-aloud interviewing requests that the survey respondents (often renamed subjects or participants) actively verbalize their thoughts as they attempt to answer the survey questions.9 Here the role of the interviewer is mainly to support this activity by asking the subject to ‘‘keep talking’’ and to record the resultant verbal record, or so-called cognitive protocol, for later analysis. For this procedure to be effective, it is necessary that the subject’s think-aloud stream contain diagnostic information relevant to the assessment of survey question function, as opposed to tangential or meandering free association.


지난 20년간 상당한 영향력을 획득한 [대안적 절차]는 구두 조사로, 인지 면접관이 일반적으로 응답자가 제공하는 것 이상의 상세한 정보를 유도하기 위해 특별히 고안된 일련의 조사 질문을 관리하는 보다 적극적인 형태의 데이터 수집이다. 일반적으로 사용되는 탐침은 TABLE 1. 

  • 잠재적인 문제를 찾기 위해 면접 전에 체계적으로 제작하거나(프로액티브 프로브) 

  • 면접 중에 대상 행동에 대응하여 비표준화된 방식으로 개발할 수 있다(리액티브 프로브). 

이와 같이 프로빙은 대개 엄격한 재료 표준화보다는 [면접관의 적응성에 크게 의존]하는 유연한 절차다.

The alternative procedure, which has gained considerable traction over the past 20 years, is verbal probing, which is a more active form of data collection in which the cognitive interviewer administers a series of probe questions specifically designed to elicit detailed information beyond that normally provided by respondents. Commonly used probes are provided in TABLE 1. 

  • Probes may be systematically fashioned before the interview, in order to search for potential problems (proactive probes), or 

  • they may be developed in a nonstandardized way during the interview, often in response to subject behavior (reactive probes). 

As such, probing is usually a flexible procedure that relies to a significant degree on interviewer adaptability rather than on strict standardization of materials.



think-aloud 절차의 장점은 면접관에 대한 요구를 훈련하는 방식에 거의 영향을 주지 않고, [반응을 편향시킬 수 있는 방식으로 지시하는 것]을 피한다는 것이다. 그렇게 말하는 것은, 큰 소리로 생각하는 것은 [피험자들에게 상당한 부담]을 주는데, 그들 중 많은 사람들은 그 과정이 부자연스럽고 어렵다고 생각한다. 게다가, 때때로 어설픈 말로 얻어지는 순전히 많은 양의 think-aloud 분석은 어려운 과제가 될 수 있다.

The advantages to a think-aloud procedure is that it presents little in the way of training demands on the interviewer and avoids being too directive in ways that could bias responses. That being said, thinking aloud places a significant burden on subjects, many of whom find the process to be unnatural and difficult. Further, analysis of think-aloud transcripts can be a daunting task because of the sheer quantity of the sometimes meandering verbalizations obtained.


반면에 구두 탐구는 면접관의 입장에서 더 많은 훈련과 생각을 필요로 하며, 주의 깊게 하지 않으면 [반응성 효과]를 일으킬 수 있다. 즉, 구두 탐구는 탐침 질문에 대답하고 그 대답을 설명하는 것과 관련된 추가적인 인지적 요구를 통해 [피험자의 행동에 편견]을 일으킬 수 있다. 예를 들어, 탐구는 설문 조사 응답자가 일반적으로 제공할 수 있는 것보다 더 세심하게 심사숙고된 답변을 이끌어 낼 수 있다. 그러나 구두 탐구는 일반적으로 효율적이며, 특정 인지 과정(예: 용어 또는 구문의 이해)을 대상으로 할 수 있으며, 피험자가 잘 수용하며, think-aloud 스트림보다 [세그먼트와 코드로 분리하기 쉬운 데이터]를 제공한다.

Verbal probing, on the other hand, requires more training and thought on the part of the interviewer and, if not done carefully, can create reactivity effects. That is, verbal probing may create bias in the subject’s behavior through the additional cognitive demands related to answering probe questions and explaining those answers. For example, probing may lead to more carefully thought-out answers than a survey respondent might typically provide. However, verbal probes are generally efficient, can be targeted toward specific cognitive processes (eg, comprehension of a termor phrase), are wellaccepted by subjects, and provide data that are easier to separate into segments and code than think-aloud streams.


표2

TABLE 2



인지면접 분석 

Analysis of Cognitive Interviews


인지면접은 정성적 절차이기 때문에 분석은 수치 데이터의 엄격한 통계적 분석이 아니라 면접 중(종종 면접자가) 또는 그 이후에(면접자나 분석가가) 취하는 서면 메모의 코딩과 해석에 의존한다.

Because cognitive interviewing is a qualitative procedure, analysis does not rely on strict statistical analysis of numeric data but rather on coding and interpretation of written notes that are taken during the interview (often by the interviewer) or after it (by either the interviewer or an analyst).


일련의 인터뷰는 일반적으로 각 평가 항목과 관련된 노트를 결합하고, 인터뷰 전체에서 취합하며, 공통의 주제를 찾고, 조사 개발자들이 원하는 해석에서 벗어나는 것을 나타낼 수 있는 주요 결과를 식별하여 분석한다. 예를 들어, 만약 "공식 교육 프로그램"의 의미에 대해 (광범위한 주제에서) 거의 일치성이 없다는 것을 발견한다면, 잠재적인 해결책은 조사에서 이 용어를 명시적으로 정의하는 것일 수 있다.

A set of interviews are typically analyzed by combining the notes pertaining to each evaluated item, aggregating across interviews, seeking common themes, and identifying key findings that may indicate departures from the interpretation desired by survey developers. For example, if one finds that there is little concurrence across a range of subjects about what is meant by ‘‘formal educational program,’’ a potential solution may be to explicitly define this term in the survey.


현실적 고려 

Practical Considerations


인지 인터뷰 프로젝트는 일반적으로 범위가 작고 총 10명에서 30명의 과목만 참여할 수 있다. 소규모 GME 프로젝트의 경우, 조사 개발자들이 매우 작은 표본의 편향 가능성에 민감하다면, 5~6명의 대상자만으로도 조사 항목 개선에 유용한 정보를 제공할 수 있다. 인지면접은 종종 반복적인 절차로 수행되는데, 이 절차에서는 소규모 면접(예: 10)이 실시된다. 조사 개발자는 자신의 결과를 분석하고 평가하고, 필요한 경우 조사 항목을 변경한 후 수정된 항목을 사용하여 추가 시험을 한다.

Cognitive interviewing projects are normally small in scope and may involve just 10 to 30 total subjects. For small-scale GME projects, as few as 5 or 6 subjects may provide useful information to improve survey items, as long as the survey developers are sensitive to the potential for bias in very small samples. Cognitive interviewing is often conducted as an iterative procedure, in which a small round of interviews is conducted (eg, 10); the survey developers analyze and assess their results, make alterations to survey items where necessary, and then conduct an additional round of testing using the modified items.


인지 면접은 면접관 주관식 및 자기 주관식 모두에 공통적으로 적용된다.

Cognitive interviewing is commonly applied to both interviewer-administered and self-administered


  • Interviewer-administration에서는, 평가된 각 질문을 소리 내어 읽고 답한 후 탐색으로 구성되는 동시 탐사에 의존하는 것이 일반적이다. 질문을 제시해 응답자가 답하게 한 다음 targeted probe를 묻는 앞뒤로의 반복 과정은 면접관 주관식 설문조사에 잘 기능하는 것으로 보이며 대부분의 사람들에게는 별 어려움이 없다.

Under interviewer administration, it is common to rely on concurrent probing, which consists of probing after each evaluated question is read aloud and answered. The back and forth process of presenting a question, having the subject answer it, and then asking targeted probes appears to function well for interviewer-administered surveys and poses little difficulty for most people.


  • Self-administration에서 interviewer는 보통 침묵하거나 부재한 상태에서 응답자가 아무런 도움 없이 설문조사를 완료하한다. 이 때는 후향적 조사 과정이 적용되는 경우가 많다. 후향적 조사에서는 응답자가 질문지를 완료한 후 인터뷰어 질문은 디브리프 세션에서 이뤄진다.

Under self-administration, where the interviewer is normally silent or absent and the respondent completes the survey unaided, the process of retrospective probing is often applied. In retrospective probing, interviewer questions are reserved for a debriefing session that occurs after the subject has completed the questionnaire.


[동시 탐색]은 그들의 생각이 최근일 때 그리고 아마도 신선할 때 탐구에 응답할 수 있도록 하는 반면, [소급 탐색]은 시간적으로 더 멀리 떨어져 있는 생각을 재방문해야 한다. 그러나 동시 탐구는 중간에 탐색질문을 던지기 때문에 interview를 방해할 수 있다.

Concurrent probing allows the subject to respond to probes when their thoughts are recent and presumably fresh, whereas retrospective probing requires revisiting thoughts that are more remote in time. However, concurrent probing can disrupt the interview through its imposition of probes in a way that retrospective probing does not.


일반적으로 인지인터뷰에서 recruitment의 목적은 [특정 유형의 통계적 표현도 달성하는 것]이 아니라 [시간과 비용의 제약이 있는 상황에서 가능한 한 광범위한 대상자를 포함하여 많은 영역을 포괄하는 것]이다. 인지 인터뷰에 사용된 데이터와 응답자는 최종 조사 연구의 일부로 사용되어서는 안 된다는 점에 유의해야 한다.

Usually the objective of recruitment is not to achieve any type of statistical representation but rather to cover the territory by including as wide a range of subjects as possible, given the constraints of time and cost. It is important to note, these data and the respondents used for the cognitive interviews should not be used as part of the final survey study.


결론 Concluding Thoughts

인지 인터뷰는 설문 조사 개발자가 설문 조사 내용에 근거한 타당성 증거와 참가자들이 설문 조사 질문에 답하면서 수행하는 사고 과정을 수집하는 데 도움이 될 수 있는 증거 기반 도구다.2,8–10

Cognitive interviewing is an evidence-based tool that can help survey developers collect validity evidence based on survey content and the thought processes that participants engage in while answering survey questions.2,8–10



4 Magee C, Byars L, Rickards G, Artino AR Jr. Tracing the steps of survey design: a graduate medical education research example. J Grad Med Educ. 2013;5(1):1–5.


5 Rickards G, Magee C, Artino AR Jr. You can’t fix by analysis what you’ve spoiled by design: developing survey instruments and collecting validity evidence. J Grad Med Educ. 2012;4(4):407–410.










. 2013 Sep;5(3):353-6.
 doi: 10.4300/JGME-D-13-00154.1.

What Do Our Respondents Think We're Asking? Using Cognitive Interviewing to Improve Medical Education Surveys

Free PMC article
No abstract available


의학모델을 넘어서: 의학교육과 의학교육연구에 대하여 다르게 생각하기(Teach Learn Med, 2020)

Beyond the Medical Model: Thinking Differently about Medical Education and Medical Education Research

Gert J. J. Biestaa,b and Marije van Braakc




도입: 의료교육과 실천과 연구의 의료모델

Introduction: medical education and the medical model of practice and research


교육 연구와 실천의 광범위한 분야에서 교육의 역학관계에 대한 특정한 이해를 '의료 모델medical model'로 지칭하는 것이 상당히 보편화되었다.1~5 이 문구는 가르치는 것이 학생들에게 학습을 불러오기 위한 개입이라는 생각을 지칭하는 데 사용된다. 어떤 공식들은 심지어 [가르치는 것을 학습의 원인]이라고 말하고 교육을 측정 가능한 '학습 결과'의 생산에 불과하다고 본다.

In the wider field of educational research and practice it has become quite common to refer to a particular understanding of the dynamics of education as the ‘medical model.’1–5 This phrase is used to refer to the idea that teaching is an intervention to bring about learning in students. Some formulations even speak about teaching as the cause of such learning and see education as nothing but the production of measurable ‘learning outcomes.’


이러한 관점을 가진 연구에서, 초점은 가르치는 것이 의도된 학습 결과를 가져올 수 있는 가장 효과적인 방법을 찾는 데 있다. 여기서의 생각은 '무엇이 효과가 있는지'를 알아내야 하고, 교사들이 그러한 증거에 근거해야 한다는 것인데, 단순히 증거가 시키는 대로 따라 하거나 최근의 연구 증거에 의해 그들의 행동이 확실히 전달되도록 함으로써 말이다. 교육 분야 내에서 그러한 접근법의 가능성과 만족도에 대한 지속적인 논의가 이루어지고 있다.4–8

In this research, the focus lies on finding the most effective ways in which teaching can bring about intended learning outcomes. The idea here is that research should find out ‘what works’ and that teachers should base their classroom practice on such evidence, either by simply following what the evidence tells them to do or by making sure that their actions are informed by the latest research evidence. Within the field of education there are ongoing discussions about the possibility and desirability of such an approach.4–8


지난 20년 동안 의료 교육 및 관련 연구 분야도 의료 모델을 채택했다. 1,2,7,9 의학교육 관행은 어떤 식으로든 가르치는 것이 학습을 유발한다는 생각에 크게 의존한다. 이 견해에서, 가르침은 [학습 결과를 산출하는 개입]으로 이해된다(예를 들어, Smith11에 근거한 Fincher와 Work, 10(p293)에서 가르침의 정의는 "학습 촉진 활동의 설계 및 실행"임을 참고하라). 여기서의 관례적인 근거는 [더 나은 가르침은 더 나은 학습을 유발]하며, 이것은 [더 나은 환자 치료]를 제공하고, 결과적으로 [환자의 결과를 향상]시킨다(예: Chen, Lui, Martinelli;12 Harden et al.9 참조).

Medical education and its related research field have, over the past two decades, also adopted the medical model.1,2,7,9 Medical educational practice relies heavily on the idea that teaching in some way causes learning. In this view, teaching is understood as an intervention that produces learning outcomes (see for example the definition of teaching as “the design and implementation of activities to promote learning” in Fincher and Work,10(p293) based on Smith11). The customary rationale here is that better teaching causes better learning, which provides for better patient care, which in turn improves patient outcomes (see for example, Chen, Lui, and Martinelli;12 Harden et al.9).


[개입으로서의 가르침]의 개념과 그 개입의 의학 교육 연구의 효과로서 그 가르침의 개념을 준수하면서, 의료 모델의 논리에 따라, 개입과 결과 사이의 상관관계를 찾는다.13 현재의 의학 교육 연구는 주로 특정 교습 관행이 '작동한다work'이라는 증거를 제공하도록 설계되어 있다. 광범위한 맥락에서 응용을 육성하기 위한 「일반적인 단순성」을 목표로 한다교육적 맥락에서 제한된 중요성으로 인해 논란이 되고 있음에도 불구하고, 무작위 통제 실험은 여전히 의학 교육 연구에서 높이 평가되고 있다. 또한 학습에 대한 교수효과 분석을 기반으로 한 메타분석이나 체계적 검토 등이 향후 교육 상황에 대한 가이드라인으로 자주 제시되고 있다.

In keeping with notions of teaching as an intervention and learning as the effect of that intervention medical educational research, following the logic of the medical model, looks for correlations between interventions and outcomes.13 Current medical education research is predominantly designed to provide proof that particular teaching practices ‘work’. It aims for “generalisable simplicity” to foster application in a wide range of contexts.13(p31) Despite being contested for their limited significance in educational contexts,4–6,8,13,14 randomized controlled trials are still held in high regard in medical education research.3,15 Building on analyses of teaching effects on learning, meta-analyses, and systematic reviews are frequently presented as guidelines for future educational situations16,17


교육을 '의료 모델'로 보는 것은 어느 정도 그럴듯해 보인다. 결국, 선생님들은 그들의 가르침에 개입하고 그들은 학생들이 배우기를 원하는 좋은 이유로 그렇게 한다. 게다가, 만약 선생님들이 그들이 하는 일의 효과를 향상시킬 수 있다면, 학생들은 분명히 이익을 얻을 것이다. 피상적인 수준에서 이것은 말이 되겠지만, 면밀한 점검은 몇 가지 문제점을 드러내기 시작한다. 이 논문에서 우리는 의료 모델의 두 가지 주요 문제를 식별하는 것을 목표로 한다.

At one level the medical model of education looks quite plausible. After all, teachers do intervene with their teaching and they do so for good reasons as they want their students to learn. Moreover, if teachers can enhance the effectiveness of what they do, students definitely are to benefit. While at a superficial level this may make sense, a closer inspection begins to reveal several problems. In this paper we aim to identify two main problems of the medical model.


교육이란 무엇인가? 그리고 그것은 무엇을 위한 것인가?

What is education? And what is it for?


의료 모델이 교육의 역동성을 너무 단순하게 표현하는 것에 해당한다고 제안하는 것은, 이러한 역동성이 실제로 무엇인지, 그 이전에 교육이 실제로 무엇인지에 대한 의문을 제기한다. 흔히 '교수학습'이라는 단어가 된 것처럼 느낄 정도로 쉽게 사용되는 현재 유비쿼터스 언어인 '교수와 학습'은 교육이 무엇에 관한 것인지 간결하고 의미 있게 요약한 것 같다.

To suggest that the medical model amounts to a too simplistic representation of the dynamics of education, raises the question of what these dynamics actually are and, before that, what education actually is. The now ubiquitous language of ‘teaching and learning’– used so easily that it often feels as if ‘teachingandlearning’ has become one word – seems to be a concise and meaningful summary of what education is about.


그러나, 가르침이 학생들의 학습을 이끌어내기 위해 그곳에 있다는 제안의 한 가지 중요한 문제는 [학습]이라는 언어가 충분히 정확하지 않다는 것이다. 결국, 학생들은 그들이 교육적인 환경에 있을 때 많은 것을 배울 수 있는 것처럼, 그러한 환경 밖에서 많은 것을 배울 수 있다.

However, one key problem with the suggestion that teaching is there to bring about student learning is that the language of learning is not sufficiently precise. After all, students can learn many things when they are in educational settings, just as they can learn many things outside of those settings.


그러나 교육의 핵심은 학생들이 무언가를 배우도록 하는 것이 아니라, 무언가를 배우고, 이유가 있어서 배우고, 누군가로부터 배우도록 하는 것이다. 그러므로 교육은 항상 [내용, 목적, 관계], 즉 어떤 의미에서 교육을 구성하는 세 가지 '요소'에 대한 의문을 제기한다. 우리가 '교육과 학습'이라는 관점에서 교육을 묘사할 때, 이러한 질문들은 종종 빠져있다.

The whole point of education, however, is not to ensure that students learn, but that they learn something, learn it for a reason, and learn it from someone. Education thus always raises questions about content, purpose, and relationships – the three ‘elements’ that in a sense constitute education. These questions are often absent when we just describe education in terms of ‘teaching and learning’,


내용, 목적, 관계에 관해서는 [목적의 문제]가 실제로 다루어져야 할 첫 번째 질문이라고 주장할 수 있다. 어떤 특정한 교육 활동과 준비가 어떤 것인지 명확하게 설명할 수 없다면, 학생들이 어떤 컨텐츠에 참여해야 하고 어떤 종류의 관계가 자신이 성취하고자 하는 것에 가장 도움이 될 것인지를 결정할 수 있는 방법이 없다.

With regard to content, purpose, and relationships it can be argued that the question of purpose is actually the first question that needs to be addressed. If one is not able to articulate what particular educational activities and arrangements are for, there is no way in which one can decide which content students should engage with and what kind of relationships will be most conducive for what one seeks to achieve.


교육을 특히 흥미롭게 하는 것은 하나의 목적이나 목적을 지향하는 것이 아니라 모든 교육이 세 가지 '목적의 영역'에 관여해야 한다는 점이다.1(예: Biesta, 18 Bruner, 19 Egan, 20, Lam21 참조).

What makes education particularly interesting is that it is not oriented toward one purpose or domain of purpose, but that all education needs to engage with three ‘domains of purpose’1 (see, e.g., Biesta,18 Bruner,19 Egan,20 and Lamm21).


교육의 목적의 첫 번째 영역은 [자격요건]이다. 자격요건은 학생들에게 '뭔가' 할 수 있는 자격요건을 갖추는 것이다. 이러한 '뭔가'는 좁을 수 있다. 예를 들어, 의학교육 분야의 핵심인 특정 직업이나 직업에 대한 자격을 얻는 경우처럼, 또는 학교가 젊은이들에게 복잡한 현대 사회에서 그들의 삶을 살아가기 위한 지식, 기술, 이해를 제공하는 데 있어 수행하는 역할과 같이, 보다 광범위하게 구상될 수 있다. 사회

The first domain of purpose for education is that of qualification, which is about providing students with knowledge, skills, and understanding that will qualify them to do ‘something.’ This ‘something’ can be narrow, such as in the case of becoming qualified for a particular job or profession – which is, of course, key in the field of medical education – or it can be conceived more widely such as the role schools play in providing young people with the knowledge, skills, and understandings for living their life in complex modern societies.


그러나 교육의 목적은 자격에 국한되지 않는다. 교육은 또한 [사회화]의 영역에서 중요한 역할을 한다. 사회화는 학생들에게 직업과 전문 영역을 포함한 특정 분야나 영역에서 오리엔테이션을 제공하는 것이다. 그것은 학생들을 특정한 사회적, 문화적, 실용적, 또는 직업적 전통의 규범과 가치인 [존재와 행동의 방식]으로 유도하는 것이다. 이는 학생들에게 그러한 전통과 관행에 대한 방향감을 주고, 또한 특정한 전통과 관행에 속하게 함으로써 정체성을 발전시키는 데 기여하기 위한 것이다. 학생들이 규칙과 규정을 준수하고 연습이나 전통의 특정한 규범과 가치를 채택하도록 하는 것이 야망인 사회화의 더 강한 형태가 있다. 여기 정체성은 규범적이다.

The purpose of education is, however, not confined to qualification. Education also has an important role to play in the domain of socialization. Socialization is about providing students with an orientation in particular fields or domains including vocational and professional domains. It is about initiating students into the ways of being and doing, the norms and values of particular social, cultural, practical, or professional traditions. This is intended to give students a sense of direction in such traditions and practices and also contributes to developing a sense of identity by becoming part of particular traditions and practices. There are stronger forms of socialization where the ambition is to make sure that students follow the rules and regulations and adopt the particular norms and values of the practice or tradition. Here identities are prescriptive.


예를 들어, 일부 의학 전문가 그룹은 [특정한 행동 방식과 존재 방식]으로 알려져 있을 수 있다. 그러나 학생들에게 방향감각을 주되, 그러한 전통과 관행 안에서 그들 자신의 역할과 위치를 찾을 기회를 주는 것을 목적으로 하는 보다 ['개방적인' 형태의 사회화]도 존재한다.

Some medical specialist groups, for example, may be known for their specific ways of doing and being . There are, however, also more ‘open’ forms of socialization aimed at giving students a sense of direction, but giving them opportunities to find their own role and position within such traditions and practices.


자격요건과 사회화는 대체로 학생들에게 '하는' 행동이라고 주장할 수 있다. 이를 성공적으로 습득했는지 평가를 통해 학생들에게 지식, 기술, 이해 등을 가르치고 확인한다. 마찬가지로, 우리는 그들에게 특정한 관행을 행하고 있는 방법을 가르치고, 학생이 그것들을 성공적으로 받아들였는지 여부를 평가한다.

It could be argued that qualification and socialization are, to a large degree, done ‘to’ students. We teach students knowledge, skills, and understanding and check through assessment whether they have acquired this successfully. Similarly, we teach them the ways of doing and being of particular practices and assess whether they have adopted these successfully.


그러나 이것이 교육의 전부는 아니다. 우리는 우리 학생들이 지식, 기술, 가치관, 규범을 가진 물건으로 끝나는 것을 원하지 않는다. 우리는 항상 [그들이 그들 자신의 권리에 따라 주체로 끝나는 것]을 목표로 한다; 그들 자신의 생각을 결정하고, 그들 자신의 결론을 도출하고, 그들의 행동에 책임을 질 수 있는 개인으로서. 이것은 [주관화 영역]에서 포착된 것으로, 우리는 우리 학생들이 그들 자신의 행동의 주체가 될 수 있도록 격려하고 지원한다. 그러므로 주관화는 행위자성, 자율성, 책임과 같은 핵심 교육 이념과 관련이 있다.2

This, however, is not all there is to education. We do not want our students to end up as objects with knowledge, skills, values, and norms. We always aim for them to end up as subjects in their own right; as individuals who can make up their own mind, draw their own conclusions, and take responsibility for their actions. This is captured in the domain of subjectification where we encourage and support our students to become subjects of their own action. Subjectification thus has to do with key educational ideas such as agency, autonomy, and responsibility.2


[목적의 3개 영역]은 일반교육과 관련이 있을 뿐만 아니라, 의료교육을 포함한 전문교육의 목적에 관하여 더 높은 정확성을 갖추도록 돕는다. 따라서 '학습'에 대한 언급보다 훨씬 더 유용하고 정확한 담론을 제공한다. 학생들이 배우고 있는지 묻기보다는 그들의 교육이 세 가지 목적의 영역을 모두 다루고 있는지 물어 볼 필요가 있다.

three domains of purpose is not only relevant for general education, but also helps to get more precision visa-vis the purposes of professional education including medical education. It thus provides a much more helpful and precise discourse than the reference to ‘learning.’ Rather than asking whether students are learning, we need to ask whether their education addresses all three domains of purpose.


여기서 간단하지만 그럼에도 불구하고 도움이 되는 통찰력은 그러한 교육의 목적이 지식, 기술, 이해의 표현과 습득에만 국한되지 않는다는 것이다

  • 전문적 자격(유능한 의사가 되는 것) 외에도 전문 분야에서 오리엔테이션을 제공하고 성취하는 전문적 사회화가 필요하다. 의학의 전문적 사회화는 의료 전문가로서의 전문적 정체성(실제로 몇몇 사람들에 의해 의료 교육의 주요 목적이라고 설명되어 왔다)을 달성하는 것과 관계가 있다.23-26 

  • 또한, 의료 전문가들은 자격을 갖추고 사회화되어야만 하는 것이 아니라, 그들 자신의 행동의 주체가 되어야 한다. 즉, 어떤 상황에서 어떤 지식, 기술, 이해력을 활용해야 하는지 판단할 수 있어야 하며, 언제 규칙을 고수해야 하는지, 언제 규칙을 따질 것인지, 특정 상황이 이를 요구할 경우 이를 굽히거나 때로는 무시하는 경우도 있다.

The simple but nonetheless helpful insight here is that the purpose of such education is not confined to the presentation and acquisition of knowledge, skills, and understanding. 

  • In addition to professional qualification (becoming a competent doctor), there is also a need for professional socialization: providing and achieving orientation in a professional field. Professional socialization in medicine has to do with achieving a professional identity as a medical professional (which actually has been described by some as the main purpose of medical education).23–26 

  • Also, medical professionals do not just need to be qualified and socialized; they also need to become a subject of their own actions. That is, they need to be able to judge which knowledge, skills, and understandings need to be utilized in which situation and also when they should stick to the rules and when to question the rules or bend or sometimes even ignore them if a particular situation calls for this.


전문직업적 주체화에 초점을 맞추는 의료 교육의 필요성이 있다.

the need for medical education to focus on professional subjectification.


우리는 이제 의학 교육이 전문적인 자격, 전문적인 사회화, 그리고 전문적인 주제화를 목표로 할 필요가 있다고 말할 수 있다. 그것은 또한 이것들이 분리된 칸으로 남아있지 않고 실제로 전문가들에 대한 지식, 행동, 그리고 존재에 통합되도록 할 필요가 있다.

we can now say that medical education needs to aim for professional qualification, professional socialization, and professional subjectification. It also needs to make sure that these do not remain separate compartments but actually become integrated in the knowing, doing, and being of professionals.


그런 다음 이는 교육 과정에서 학생들이 접하고 함께 작업해야 하는 내용과 경험인 [커리큘럼 개발을 위한 프레임워크]를 제시한다. 여기에는 학생들이 '마주쳐야만 하는' 다양한 경험이 포함되어 있다 – 예를 들어, 치료의 한계, 최초 예상치 못한 환자의 사망, 높은 위험의 치료 결정의 모호성 또는 불확실성, 최초 안락사, 저항성(환자 또는 다른 의료인으로부터)을 접하는 것의 중요성을 생각할 수 있다. 독립적으로 만족스럽게 수행된 첫 상담 등

This then suggests a framework for the development of curricula – the content and experiences that students should encounter and work with during their education. This includes a range of experiences students should ‘meet’–one can think, for example, of the importance of encountering the limits of medical treatment, a first unexpected patient death, the ambiguity or uncertainty of a high stakes treatment decision, a first euthanasia, resistance (from patients or other medical professionals) to one’s medical decision, a first consultation carried out independently and satisfactorily, etc.


커리큘럼의 틀 외에도, 제안된 교육에 대한 견해는 의료 교사들이 전문적 자격, 사회화, 주체화를 촉진하기 위해 그들의 학생들과 참여하는 방법인 교육학의 발전을 위한 틀을 제시한다.

In addition to a framework for curricula, the proposed view on education also suggests a framework for the development of pedagogy – the ways in which medical teachers engage with their students in order to promote professional qualification, socialization, and subjectification.


교육은 어떻게 이루어지는가? 그리고 어떻게 하면 성공할 수 있을까?

How does education work? And how can we make it work?


교문 문제를 아직 해결하지 못하다 결국, 우리가 성취하고자 하는 것이 무엇인지에 대해 좀 더 정제된 이해를 갖게 되면, 우리는 세 영역 각각에 대해 어떤 교육 개입이 작용하는지 알아내는 데 연구 노력을 집중해야 한다고 주장할 수 있다. 이 결론은 일반적으로 '무엇이 효과가 있는가?'-질문은 사실 별로 의미가 없다는 것을 보여줄 정도로 도움이 된다. 그보다는 [특정한 교육전략이, 어떤 특정한 목적이나 목적의 영역에, 효과가 있는지]를 물어보는 것으로 시작할 필요가 있다.

not yet resolve the question of teaching. One could, after all, still argue that once we have a more refined understanding of what it is that we seek to achieve, we should focus our research efforts on finding out which teaching interventions work for each of the three domains. This conclusion is helpful to the extent that it shows that asking the general ‘what works?’-question is actually not very meaningful. Rather, we need to begin by asking for which particular purpose or domain of purpose a particular teaching strategy may work.


목적의 세 영역은 따로 존재하는 것이 아니라, 구체적인 교육 실천에 있어서 항상 세 영역 모두 존재한다.

the three domains of purpose do not exist separately but are always all three at play in the concrete practice of education.


동기부여 면담을 가르치는 것은 그 기술을 습득하는 것(자격)만이 아니다. 그것은 또한 해당 직군에서 그 기술의 중요성에 대해 소통하고(사회화) 동시에 학생의 행위자성에 영향을 미친다: 기술을 숙달함으로써 행동을 바꿀 수는 있는데, 이것은 언제 이 기술을 활용하는 것이 적절할 지와 그렇지 않을 때(주체화)에 대한 질문을 하게 만든다.

Teaching motivational interviewing is not just about acquiring that skill (qualification). It also communicates something about the importance of the skill in the profession (socialization) and simultaneously has an impact on the agency of the student: by mastering a skill one is able to act differently, which raises the question when it is appropriate to utilize this skill and when not (subjectification).


세 영역 사이에 시너지가 있을 수 있는 반면, 긴장감과 심지어 갈등도 있을 수 있다. 예를 들어, '시험에 대한 가르침'은 학생들이 책임감 있는 실무자가 되도록 지원하는 방법으로는 거의 도움이 되지 않고(주체화), 실제로 중요한 것은 시험에 합격하는 것(사회화)이라는 메시지를 전달하는 방법이 됨을 생각해 보라. 

Whereas there can be synergy between the three domains, there can also be tensions and even conflicts. Think for example how ‘teaching to the test’ does very little in supporting students becoming responsible practitioners (subjectification) and also sends out the message that what really matters is passing the test (socialization). 


그래서 우리의 교육 전략과 보다 넓은 교육적 배치 중 [어느 것이 '효과가 있는가work' 하는 문제는 사실 그것보다 훨씬 더 복잡]하다. – '효과가 있는 것'에 대한 질문이 세 가지 질문이기 때문만이 아니라, 목적의 한 영역과 관련하여 작용하는 것이 실제로 다르게 작용하거나 목적의 다른 영역에서는 전혀 작용하지 않을 수도 있기 때문이다.

So the question which of our teaching strategies or wider educational arrangements ‘work’ is actually much more complicated than that – not just because the question of ‘working’ is a threefold question, but also because what may work in relation to one domain of purpose may actually work differently, or may not work at all in another domain of purpose.


'무엇이 효과가 있는가'에 대한 증거를 만들어내려고 하는 많은 교육적 연구는 학생들에게 영향을 미치는 요소들의 측면에서 그 야망을 충족시킨다. [가르침이란 특정한 효과를 내는 개입]이라는 가정 하에 종종 메디컬 모델을 참조한다. 의학교육을 포함한 교육에서의 중요한 문제는 이러한 이해가 교육의 역동성을 포착하기에 적합한가 하는 것이다.

Much educational research that seeks to generate evidence about ‘what works’ couches its ambitions in terms of factors that impact on students. It is here that reference is often made to the medical model on the assumption that teaching is an intervention that produces particular effects. The important question for education, including medical education, is whether this understanding is adequate for capturing the dynamics of education.


  • 이상적인 상황에서, 가르침이 원인이고 학습(또는 우리가 선호하는 언어로: 학생들의 전문성 형성)이 효과라고 가정할 수 있는가? 

  • 그리고 우리가 아직 교육적 '투입'(교육)과 교육적 '성과'(학습; 형성) 사이의 확실하고 확고한 연결고리를 확립하지 못했다는 사실이 단지 시간과 돈의 문제일까? 

  • 즉, 더 많은 연구에 대한 투자는 결국 우리에게 어떤 개입이 어떤 영향을 미칠지 말해줄 증거들로 이어질 것인가?

  • Can it be assumed that under ideal circumstances teaching is a cause and learning – or with the language we prefer: students’ professional formation27 – is the effect? 

  • And is the fact that we have not yet established certain and secure connections between educational ‘input’ (teaching) and educational ‘outcome’ (learning; formation), just a matter of time and money? 

  • That is, would investment in more research eventually lead us to the evidence that will tell us once and for all which interventions will produce which effects?


이것은 가능성이 낮다고 우리는 생각한다. 그 이유는 이러한 사고방식으로 가정되는 강한 인과관계가 실제로 [매우 한정적인 상황에서만 발생]하기 때문이다. 즉, 단방향으로 작동하는 폐쇄적이고 결정론적인 시스템을 말한다이 패러다임의 예시는 각 톱니바퀴가 다음 톱니바퀴를 움직이게 하는 시계장치를 들 수 있다. 만약 우리가 시계 장치의 초기 상황을 알고 톱니바퀴 사이의 모든 연결에 대한 완벽한 지식을 가지고 있다면, 우리는 기계가 어떻게 작동할지 100% 확신으로 예측할 수 있고, 영원할 때까지 계속 작동할 것이다. 그러나 이는 교육의 현실이 아니다.

This, we think, is unlikely. The reason for that lies in the fact that the strong causality that is assumed in this way of thinking actually only occurs in very specific situations: in closed, deterministic systems that operate in unidirectional ways. The paradigm case for this is the clockwork where each cogwheel puts the next cogwheel into motion so that, if we know the initial situation of the clockwork and have perfect knowledge of all connections between the cogwheels, we can predict with one hundred percent certainty how the machine will operate, and will continue to operate until eternity. This, however, is not the reality of education.28


  • 여기서 가장 먼저 명심해야 할 것은 교육은 비교적 [개방된 시스템]이라는 점이다. 교육의 '내부'에서 일어나는 일은 교육의 '외부'에서 일어나는 일의 영향을 크게 받는다. 학생들은 교실 밖에서 삶과 경험을 가지고 있고 따라서 그들이 받는 가르침 이상의 영향을 받는다. 교실에서 일어나는 일은 [의도적이고 의도하지 않은 영향력이 드나드는 광범위한 사회적 맥락]의 일부분이다. 

  • 둘째로, 교육은 기계론적 '밀고 당기는'의 결정론적 시스템이 아니라, 소통과 해석의 수단으로 작용하는 기호학적 시스템이다. 간단히 말해서, 학생들은 교사들이 그들에게 말하거나 그들에게 제시하는 것을 이해할 필요가 있고 이것은 해석의 문제이지, 자극과 예측 가능한 대응의 문제가 아니다. 

  • 셋째, 시계와 같은 단방향성과는 달리, 교육시스템은 재귀적이기 때문에 제도상의 '구성요소(교사와 학생)'가 스스로 생각하고 스스로 마음을 정하며, 이를 바탕으로 여러 가지 다른 방식으로 행동하기로 결정할 수 있다. 시스템이 어떻게 진화하느냐가, 다시 말해서 시스템으로 다시 공급되는 것이다.

  • The first thing to bear in mind here is that education is a relatively open system. What happens ‘inside’ education is significantly influenced by what happens ‘outside’ of it. Students have lives and experience outside of the classroom and are therefore influenced by much more than just the teaching they receive. What happens in the classroom is part of a wider social context with intended and unintended influences flowing in and out. 

  • Secondly, education is not a deterministic system of mechanistic ‘push and pull,’ but a semiotic system, that is, a system that works by means of communication and interpretation. Put simply, students need to make sense of what teachers tell them or present to them and this is a matter of interpretation, not of stimulus-and-predictable-response. 

  • Thirdly, unlike the unidirectionality of the clockwork, education systems are recursive, which means that the ‘elements’ in the system (teachers and students) can think for themselves, make up their own minds, and, based on this, can decide to act in a number of different ways. How the system evolves does, in other words, feed back into the system.


교육이 개방적이고, 기호적이며, 재귀적인 시스템이라는 것을 인정하면, 교사들이 하는 일과 학생들이 그것을 통해 얻는 것 사이의 어떤 연관성이 성립될 수 있는지, 확보될 수 있는지에 대해 교육에서 어떤 것이든 전혀 통할 수 있는지 의아하게 생각할 수 있다. 통제할 수 없는 요소들이 많고 복잡하고 개방적인 역학관계가 너무 많기 때문에, 교육은 거의 불가능해 보인다.

Acknowledging that education is an open, semiotic, and recursive system may make one wonder whether anything can work at all in education in that whether any connection between what teachers do and what students take from it can be established or secured. With so many uncontrollable factors, and so many complex, open dynamics, it seems as if education is almost impossible.


하지만 우리가 외부의 영향을 완전히 차단하고, 우리 학생들에게 교과과정을 해석할 수 있는 올바른 방법은 오직 하나뿐이고, 생각하고, 행동하고, 있을 수 있는 올바른 방법 하나라고 말함으로써 이 모든 것에 너무 많은 노력을 한다면, 우리는 갑자기 [교육을 세뇌로 바꾼 것]이다. 이것이 [자격요건]과 강한 [사회화]의 관점에서 '효과적'일지는 몰라도, 세뇌는 주체화의 영역, 즉 우리 학생들이 궁극적으로 스스로 생각하고 행동하며 이에 대한 책임을 질 수 있도록 하기 위한 우리의 야망과 정반대되는 것이다. 우리가 교육 활동에서 구조와 집중을 만드는 것은 중요하지만, 학생들을 통제 대상으로 만들지 않는 것도 중요하다.

Yet if we go too far in all this by closing off the influences from the outside completely, telling our students that there is only one correct way to interpret the curriculum, and only one right way to think, act, and be, we have suddenly turned education into indoctrination. While this may be ‘effective’ from the perspective of qualification and strong socialization, indoctrination is the very opposite of what we should achieve visa-vis the domain of subjectification, that is, our ambition to make sure that our students can ultimately think and act for themselves and take responsibility for this. While it is of crucial importance that we generate structure and focus in our educational activities, it is also important that we never turn our students into objects of our control.


흥미롭게도, 개방성, 해석성, 재귀성을 줄이는 것이 바로 교육자들이 하는 일이다

  • 우리는 학생들의 관심을 집중시키기 위해 학생들을 교실이나 지정된 공부 공간에 우선적으로 배치함으로써 외부로부터의 간섭인 개방성을 줄인다. 

  • 커리큘럼은 학생들이 무엇을 중점적으로 해야 하는지, 무엇을 해야 하는지 구체적으로 명시해 개방성을 떨어뜨리는 한 단계 더 나아가는 과정이다. 

  • 마찬가지로, 해석도 어떤 의미에서 경계가 없지만, 평가의 전체 요점은 우리 학생들이 때때로 해석의 범위를 제한하여 그들이 그것을 절대적으로 올바르게 이해하도록 하고, 때로는 그것들이 의미 있는 것의 경계 내에 있도록 하는 것이다. 

  • 셋째로, 교육자로서 우리는 또한 우리 교실에서 일어나고 있는 재귀성에 영향을 미치려고 노력하는데, 기본적으로 우리 학생들이 특정한 방식으로 생각할 수 있도록 돕는다. 의학 교육에서, 우리는 우리 학생들이 의학 전문가로서 생각하도록 격려한다. 예를 들어, 우리는 이것을 어떤 방향으로든 내버려두기 보다는 특정한 맥락(의료 실무) 안에다 '프레임'하려고 한다.

Interestingly, reducing openness, interpretation, and recursivity is exactly what educators do. 

  • We reduce openness, the interference from the outside, by putting students in classrooms or designated study spaces first and foremost in order to focus the attention of our students. 

  • The curriculum is a further step in reducing openness by specifying what students should focus on and what they should be doing. 

  • Similarly, while interpretation has, in a sense, no boundaries, the whole point of assessment is to limit the range of interpretations our students generate sometimes to make sure that they get it absolutely right, and sometimes to make sure that they remain within the boundaries of what is meaningful. 

  • Thirdly, as educators we also try to influence the recursivity that is happening in our classrooms, basically by helping our students to think in particular ways. In medical education, we encourage our students to think as medical professionals,30 for example, we try to ‘frame’ this within a particular context (medical practice) rather than let it go in any direction.


가르침과 학습 사이에 인과 관계가 있다는 잘못된 가정 그런 연줄은 단순히 교육과 같은 사회제도에는 존재하지 않는다.

the mistaken assumption that there is a causal connection between teaching and learning. Such connections simply do not exist in social systems such as education.


우리의 교육적 노력은 모두 우리가 학생들과 함께 성취하고자 하는 것에 비추어 [더 많은 방향과 구조]를 모든 과정에 제공하는데 기여한다.

our educational endeavors all contribute to giving the whole process more direction and structure in light of what we seek to achieve with our students.


그러나 우리의 요점은, 교육을 개방적이고, 기호적이며, 재귀적인 시스템으로 보는 이러한 방식으로 교육의 역동성을 이해하는 것이 실제로 상당히 도움이 된다는 것이다. 왜냐하면 그것은 그러한 시스템을 보다 예측 가능한 방식으로 작동시키기 위해 무엇을 해야 하는지를 훨씬 정확하게 나타낼 수 있기 때문이다. 여기의 모든 것은 시스템의 '자유도'를 줄이는 데 있다

  • 시스템의 개방성(외부로부터의 영향)을 줄이는 것

  • 시스템의 기호성(해석의 기회)을 줄이는 것

  • 시스템의 재귀성(즉, 시스템이 자신에게 다시 공급되는 방식)을 줄이는 것

Yet the point we wish to make is that understanding the dynamics of education in this way – that is, seeing education as an open, semiotic, and recursive system – is actually quite helpful because it allows to indicate with much precision what needs to be done to make such a system work in a more predictable way. Everything here comes to reducing the ‘degrees of freedom’ of the system: 

  • reducing the openness of the system (the influences from outside), 

  • reducing the semiotics of the system (the opportunities for interpretation), and 

  • reducing the recursivity of the system (that is, the way in which the system feeds back onto itself).


의료 교육 및 의료 교육 연구를 위한 교훈

Lessons for medical education and medical education research


위의 논의에서 의학교육 실천에 대한 한 가지 중요한 시사점은 [의학교육이 무엇을 위한 것인지에 대해 이야기할 때 훨씬 더 정제된 언어를 제공한다는 것]이다.

One important implication for medical education practice from the above discussion is that it provides a much more refined language for talking about what medical education is for


커리큘럼 설계의 경우 이 접근방식은 의료 교육 커리큘럼이 어떻게 보여야 하는지에 대한 유용한 질문을 제기한다. 의대생들의 전문자격, 전문사회화, 전문주제화를 위해 어떤 커리큘럼 콘텐츠가 필요한가? 어떻게 하면 이 콘텐츠가 통합적으로 세 가지 도메인에 모두 기여할 수 있도록 교육 활동을 설계할 수 있을까?

For curriculum design this approach raises helpful questions about what a medical education curriculum should look like. What kind of curricular content do we need to work toward the professional qualification, the professional socialization, and the professional subjectification of medical students? How can we design educational activities such that this content contributes to all three domains in an integrated fashion?


위의 논의는 단순히 학생들이 3개 영역과 관련하여 숙달해야 하는 특정 콘텐츠에 대한 문제뿐만 아니라, 의학교육 중 어떤 종류의 경험을 접해야 하는지에 대한 문제도 제기한다

    • 어떤 만남encounter이 전문적인 자격, 사회화, 주체화 측면에서 교육의 기회를 창출할 것인가? 커리큘럼 재설계는 또한 학생들의 진도를 세 가지 영역 각각에 비추어 확립하기 위한 다른 형태의 평가도 제공될 것이다. 

    • 사회화, 주체화뿐만 아니라 자격의 측면에서 발전을 다루는 방식으로 평가를 설계할 수 있는 방법은 무엇인가? 

    • 통합 평가에서 세 가지를 모두 다룰 수 있는가, 아니면 각각에 대해 별도의 평가가 필요한가?

The above discussion not just raises questions about particular content students should master in relation to the three domains, but also about what kind of experiences they should encounter during their medical education. 

    • Which encounters would create educational opportunities in terms of professional qualification, socialization, and subjectification? With curricular redesign would also come other forms of assessment to establish students’ progress in light of each of the three domains. 

    • How can we design assessment in ways that address development in terms of qualification as well as socialization and subjectification? 

    • Can we address all three in an integrated assessment or do we need separate assessments for each?


게다가, 의대 교육에 대한 학생들의 평가는 세 가지 목적 영역 모두에 더 넓은 초점을 맞출 필요가 있을 것이다. 우리는 학생들에게 그들이 성취했을지도 모르는 지식과 기술, 그리고 이해에 대해 질문할 것이 아니라, 교육이 그들의 직업적 정체성 형성에 기여한 방법과 사려 깊은 판단과 의사 결정 능력에 대해서도 물어볼 필요가 있을 것이다.

In addition, student evaluations of medical education would require a broader focus on all three domains of purpose. We would need to not just ask students about the knowledge, skills, and understanding they may have achieved, but also about ways in which the education has contributed to their professional identity formation31 and their ability for thoughtful judgment and decision making.


이 논의의 두 번째 함의는 의학교육 실무에 종사하는 교사들이 특정 교수 개입이나 방법의 효과성에 대한 연구 결과를 신중하게 고려하는 것이다. 기존 연구는 자격, 사회화, 주체화라는 세 가지 영역 각각과 관련하여 어떤 말을 해야 하는가? 또한 특정 접근방식이 한 도메인이나 도메인의 측면에 대해 작동할 수 있다는 징후가 자동적으로 다른 도메인이나 그 측면에도 적용될 수 있다는 것을 의미하지 않으며 다른 도메인(의 측면들)에 대해서도 중립적이라는 것조차 의미하지 않는다.

A second implication of this discussion is for teachers in medical education practice to carefully consider any research findings about the supposed effectiveness of particular teaching interventions or methods. What does existing research have to say in relation to each of the three domains of qualification, socialization, and subjectification? Also, any indication that a particular approach may work for one domain or aspect of a domain does not automatically mean that it will also work for the other domains or aspects of them and also not that it will be neutral with respect to (aspects of) the other domains.


또한 한 환경(즉, 한 상황의 특정한 조건 하)에서 효과가 있었다고 알려진 것은 다른 조건 하에서 다른 환경에서 전혀 아무 것도 하지 않을 수 있다는 것을 잊지 않는 것이 중요하다. 교사는 현지의 우발적인 상황을 다루면서 연구 증거를 상황과 맥락에 따라 유연하게 번역하고 적용해야 할 제안으로 접근하지 않을 수 없지만, 그 이상도 이하도 아니다

it is crucial also not to forget that what allegedly has worked in one setting – which also means: under the particular conditions of that setting – may not do anything at all in a different setting, under different conditions.1,3,13,32 Dealing with the local contingencies of teaching, teachers cannot but approach research evidence as suggestions to be translated and applied flexibly according to circumstance and context, but as nothing more than that.5


의학교육 연구의 경우, 하나의 영역에만 초점을 맞추는, 그리고 세 가지 영역의 상호작용을 탐구해야 함을 '잊어버리는' 1차원적 연구를 넘을 필요가 있다는 것이 주요 교훈이다. 종종, 더 심각한 것은, '학습'이 무엇이어야 하는지에 관해서 특정하지도 않은 채로, '학습'에 관한 '영향'을 조사하는 것이다.

For medical education research, the main lesson is the need to move beyond one-dimensional research that either focus on just one domain and ‘forget’ to explore the interactions between the three or, even worse, that continue to investigate the ‘impact’ on ‘learning’ without specifying about and for what the learning is supposed to be.


게다가 위에서 설명한 아이디어들은 의료 교육 연구에 다른 초점을 두고 있음을 시사한다. '효과적인 요인'를 식별하기 위한 상관관계를 찾는 것이 아니라, 교육적 '생태학'의 구축에 대한 철저하고 사려 깊은 탐구를 말한다. , 교육적 실천의 개방성, 반증, 재귀성 등을 정리함arrange으로써 어떻게 의미 있는 교육이 정착될 수 있는가에 대한 연구이다.

Moreover, the ideas outlined above suggest a different focus for medical education research – not a search for correlations in order to identify ‘effective factors,’ but rather a thorough and thoughtful exploration of the construction of educational ‘ecologies,’ that is, of how, through arranging the openness, semiosis, and recursivity of educational practices, meaningful education can be established.


그러한 연구는 우리에게 새로운 (또는 그 문제에 있어서 기성) 교육행위가 학생들의 성적에 영향을 미치는지 아니면 전문적 기준을 더 빨리 또는 효율적으로 충족시키는 데 도움이 될지를 알려줄 것이다(자격화). 또한 이러한 교육이 학생들이 적합한 유형의 전문가가 되고, 하고, 느끼는지(사회화), 의미 있고 책임감 있는 방식으로 행동하고 판단하는 능력에 도움이 되는지(주체화)에 있어 중요한 대한 통찰력을 줄 것이다.

Such research would not only tell us whether a new (or, for that matter, an established) practice would influence students’ grades or help them meet professional standards more quickly or efficiently (qualification). It would also give us insight into the ways that this practice helps students be, do, and feel like professionals of their sort (socialization) and is significant for their ability to act and judge in meaningful and responsible ways (subjectification).


결론 Conclusion


여기서 우리는 교육을 [폐쇄적이고 인과적인 시스템으로 이해하는 것]이 아니라 [소통과 해석 그리고 교사와 학생들의 사려 깊은 행동을 통해 작동하는 열린 시스템으로 이해하는 것]이 훨씬 더 타당하다고 제안했다. 그러한 관점에서, 교육, 커리큘럼, 평가, 평가는 더 이상 '결과'를 생산하기 위한 '요인'으로 등장하는 것이 아니라, 교육 과정을 특정한 목적을 향해 이끌기 위한 교육자들의 실천의 의미 있는 측면이 된다.

Here we have suggested that it makes much more sense not to understand education as a closed, causal system but as an open system that works through communication and interpretation and the thoughtful actions of teachers and students. In such a view, teaching, curriculum, assessment, and evaluations no longer appear as ‘factors’ to produce ‘outcomes’ but become meaningful aspects of the practice of educators to steer the educational process toward particular purposes


항상 지나친 조종은 의미 있는 교육을 문제적인 형태의 세뇌로 감소시킬 위험이 있다는 것을 명심한다.

always bearing in mind that too much steering runs the risk of reducing meaningful education to problematic forms of indoctrination.






. Aug-Sep 2020;32(4):449-456.
 doi: 10.1080/10401334.2020.1798240. Epub 2020 Aug 15.

Beyond the Medical Model: Thinking Differently about Medical Education and Medical Education Research

Affiliations 

Affiliations

  • 1Centre for Public Education and Pedagogy, Maynooth University, Co Kildare, Ireland.
  • 2Moray House School of Education and Sport, University of Edinburgh, Edinburgh, UK.
  • 3Department of General Practice, Erasmus Medical Centre, Rotterdam, The Netherlands.

Abstract

Issue: In medical education, teaching is currently viewed as an intervention that causes learning. The task of medical education research is seen as establishing which educational interventions produce the desired learning outcomes. This 'medical model' of education does not do justice to the dynamics of education as an open, semiotic, recursive system rather than a closed, causal system. Evidence: Empirical 'evidence' of 'what works' - that is, what is supposed to affect 'learning' - has become the norm for medical educational improvements, where generalized summary outcomes of research are often presented as must-follow guidelines for myriad future educational situations. Such investigations of educational processes tend to lack an explicit engagement with the purposes of medical education, which we suggest to understand in terms of qualification (the acquisition of knowledge, skills, and understanding), socialization (becoming a member of the professional group) and subjectification (becoming a thoughtful, independent, responsible professional). In addition, investigations of educational processes tend to rely on causal assumptions that are inadequate for capturing the dynamics of educational communication and interaction. Although we see an increasing acknowledgement of the context-dependency of teaching practices toward educational aims, the currently prevailing view in medical education and educational research limits understanding of what is actually going on when educators teach and students participate in medical education - a situation which seriously hinders advancements in the field. Implications: In this paper, we hope to inform discussion about the practice of medical education by proposing to view medical education in terms of three domains of purpose (professional qualification, professional socialization, and professional subjectification) and with full acknowledgement of the dynamics of educational interaction and communication. Such a view implies that curriculum design, pedagogy, assessment, and evaluation should be reoriented to include and integrate all three purposes in educational practice. It also means that medical education research findings cannot be applied in just any teaching context without carefully considering the value of the suggested courses of actions toward the particular educational aims and teaching setting. In addition, medical educational research would need to investigate all three purposes and recognize the openness, semiotic nature, and recursivity of education in offering implications for teaching practice.

Keywords: Medical education; education as open system; language of learning; medical education research; medical model.


다양한 학술통합연구: 왜 근거, 준거, 기준의 규칙이 중요한가 (Acad Med, 2015)

Varieties of Integrative Scholarship: Why Rules of Evidence, Criteria, and Standards Matter

William C. McGaghie, PhD



학계는 수십 년 동안 학술연구가 많은 형태를 띤다는 것을 인정해 왔다. 어니스트 보이어1은 1990년 단문집 '장학 재고: 교수의 우선순위'에서 장학금을 위한 활자를 제안했다. 보이어 유형학은 4가지 종류의 학문적 연구와 표현을 확인했다. 그것들은 

  • 발견 - 독창적인 연구의 발견; 

  • 통합 - 지적 종합을 수반하는 통합; 

  • 적용 - 실질적인 문제를 해결하기 위한 지식의 책임 있는 사용; 

  • 교육 - 연구산물을 다른 사람들에게 가르치고 교육하고 미래의 학자들을 유혹한다.

The academic community has acknowledged for decades that scholarship takes many forms. Ernest Boyer1 proposed a typology for scholarship in a 1990 monograph, Scholarship Reconsidered: Priorities of the Professoriate. The Boyer typology identified four varieties of scholarly work and expression. They are 

  • the scholarship of discovery or original research; 

  • integration, which involves intellectual synthesis; 

  • application, the responsible use of knowledge to address practical problems; and 

  • teaching, educating others about the products of scholarship and enticing future scholars.


이 글에서 나는 의료교육과 다른 보건직 교육에 있어서의 통합의 학술활동scholarship of integration을 다루고 증폭시킬 것이다.

In this article, I will address and amplify the scholarship of integration in medical education and education for other health professions.


방법의 복수성과 글쓰기는 실용적이고 인식론적인 이유에서 중요하다. 

  • 실용적인 이유로 우리는 의학교육이 어떻게 그리고 왜, 그 많은 형태로 작동하는지 알 필요가 있다. 

  • 인식론적 이유로 우리는 또한 우리의 지식 기반을 구체화하고 교육 실무를 알리는 증거와 증거 종합의 보완적 규칙에 대해 알 필요가 있다.

Plurality of methods and writing is important on practical and epistemological grounds. 

  • For practical reasons we need to know how and why medical education works in its many forms. 

  • For epistemic reasons we also need to know about complementary rules of evidence and evidence synthesis that embody our knowledge base and inform educational practice.


통합적 학술연구를 읽고 성찰해보면, [이러한 학문적 표현방식이 19세기 초의 오랜 역사를 가지고 있을 뿐만 아니라 서로 다른 증거, 기준, 품질 기준을 사용하는 여러 형태를 취할 수 있다는 것]을 보여준다.2

Reading and reflection about integrative scholarship reveal that this approach to academic expression not only has a long history dating from the early 19th century but also can take several forms that use different rules of evidence, criteria, and quality standards.2


학자들은 또한 하나의 연구만으로 확정적인 답을 얻을 수 없으며, 과학과 학술연구가 가지는 [진실에 대한 근사치]는 시간이 지남에 따라 누적되며, 근거의 무게와 질에 달려있다는 것을 인정해야 한다.8 과학적 발전은 이론 기반, 주제 기반, 지속적 및 누적적 검토를 포함하는 연구 프로그램에서 비롯된다.9

Scholars should also acknowledge that single publications are rarely definitive and that approximations to truth in science and scholarship rest on the weight and quality of evidence assembled and judged over time.8 Scientific advancement stems from research programs—which include integrative reviews—that are theory based, thematic, sustained, and cumulative.9


통합적 학술활동이란 무엇인가? 어니스트 보이어1은 통합적 학술활동이란 

"고립된 사실들에 의미를 부여하고, 그것들을 특정한 관점에 배치한다전문 분야를 연결하고, 전문 분야를 더 큰 맥락에 배치하며, 무언가를 드러내는revealing 방식으로 데이터를 조명하며, 비전문가를 교육에 필요한 경우도 종종 있다. 통합적 학술활동의 의미는, [해석을 위하여, 한데 모으기 위하여, 원저에서 새로운 통찰을 가져오기 위하여] 수행하는 진지하고 단련된 작업이다."

What is integrative scholarship? Ernest Boyer1 argues that integrative scholarship 

“give[s] meaning to isolated facts, putting them in perspective … making connections across the disciplines, placing the specialties in larger context, illuminating data in a revealing way, often educating nonspecialists, too…. What we mean is serious, disciplined work that seeks to interpret, draw together, and bring new insight to bear on original research.”


Harris Cooper는 다음과 같이 주장한다. "연구 합성은 경험적 연구에 초점을 맞추고, 과거의 연구를 요약하여 관련되거나 동일한 가설을 다루는 많은 개별적인 조사로부터 전반적인 결론을 이끌어내고자 한다. 연구 합성가의 목표는 관심대상들의 관계에 관한 지식의 현재 상태를 제시하고, 연구로 해결되지 않은 중요한 문제를 부각시키는 것이다." 쿠퍼는 또한 "연구 합성자들은 1차 연구자들에게 적용되는 것과 같은 엄격한 방법론적 기준을 충족시키기 위해 요구되어야 한다."고 말한다.

Harris Cooper asserts: “Research syntheses focus on empirical studies and seek to summarize past research by drawing overall conclusions from many separate investigations that address related or identical hypotheses. The research synthesist’s goal is to present the state of the knowledge concerning the relation(s) of interest and to highlight important issues that research has left unresolved.”10 Cooper also states that “research synthesists must be required to meet the same rigorous methodological standards that are applied to primary researchers.”10


통합형 또는 합성형 학술활동은 폭이 다양할 수 있다. 그것은 학문 분야 내에서 수행될 수 있고, 여러 학문에 걸쳐서도 수행될 수 있다.

Integrative or synthetic scholarship can vary in breadth. It can be conducted within academic disciplines or, after Boyer,1 across academic disciplines.


보건직 교육의 통합적 학술작업물을 발행하는 저널은 일반적으로 합법적인 합성 작업에 대한 다양하고 포괄적인 정책을 가지고 있다. 저널들은 저자에 대한 지침은 말하고 있다. 예를 들어 학술의학에서는 "일반 학술 논문… 학술 의학에 대한 폭넓은 관심사를 다루는 논문들… [어디서] 연구와 서술의 요소를 결합한 글로서, 연구가 충분히 견고하지 않거나 중심이 되어 완전한 연구 보고서를 구성하지 못하는 경우"를 구한다고 발표한다.15 비슷한 편집 정책 성명들이 다른 많은 잡지들에 의해 발표되었다.

Journals that publish integrative scholarship in health professions education typically have eclectic and inclusive policies about legitimate synthetic work. Journals’ instructions to authors are telling. Academic Medicine, for example, announces that it seeks “General scholarly articles … [that] cover topics of broad concern to academic medicine… [where] The article combines elements of research and description, where the research is not sufficiently robust or central enough to the article’s message to constitute a full-fledged research report.”15 Similar editorial policy statements have been expressed by many other journals


메시지는 분명하다. 많은 저널들이 중요한 문제를 해결하고 품질 기준에 부합하는 건강직업 교육의 통합적 학술물을 제시하는 원고를 환영하고 있다.

The message is clear. Many journals welcome manuscripts that present integrative scholarship in health professions education that addresses important issues and meets quality standards.


쿠퍼10과 쿠퍼와 코엔카25는 구조를 프레이밍하고 조직하는 연구 통합 과정의 7단계 접근법을 제안한다. 일곱 가지 단계는 다음과 같다.

Cooper10 and Cooper and Koenka25 propose a seven-step approach to frame the structure and organize the process of research integration. The seven steps are:


1. 문제를 공식화한다. 

2. 문헌을 검색한다. 

3. 연구로부터 정보를 수집한다. 

4. 연구의 품질을 평가한다. 

5. 연구의 결과를 분석하고 통합한다. 

6. 증거를 해석한다. 

7. 결과를 발표한다.

1. Formulate the problem; 

2. Search the literature; 

3. Gather information from studies; 

4. Evaluate the quality of studies; 

5. Analyze and integrate the outcomes of studies; 

6. Interpret the evidence; and 

7. Present the results.


7단계 접근법 10,25(5 × 7 = 35 cell)에서 연구 합성에 이르는 5가지 연구 검토 전통의 요약을 표 1에서 선행 주관자로 제시한다.

A summary of the five research review traditions crossed by the seven-step approach10,25 (5 × 7 = 35 cells) to research synthesis is presented as an advance organizer in Table 1.




다섯 가지 연구 검토 전통

Five Research Review Traditions


네러티브 Narrative


네러티브 리뷰는 학문 분야에 걸친 광범위하고 깊은 학문적 종합의 역사를 가지고 있다. 예로는 인문계, 행동과학 28개, 건강직업 교육 29개 등이 있다.30 최근까지 서술적 리뷰는 과학과 인문학을 아우르는 연구 통합에 대한 가장 보편적이고 영향력 있고 널리 인정된 접근 방식이었다.

Narrative reviews have a broad and deep history of scholarly synthesis across the academic disciplines. Examples include the humanities,28 behavioral sciences,29 and health professions education.30 Until recently, narrative reviews were the most common, influential, and widely endorsed approach to research integration across the sciences and humanities.


조작적으로, 서사를 수행하는 개별 작가 또는 학자 팀은 출판된 글의 영역을 "획득stake out"하고, 전문가 의견이나 판단에 기초하여 정성적으로 이멜의 31개 암묵적 3단계를 사용하여 증거를 취합한다. 이 단계에는 쿠퍼10과 쿠퍼, 코엔카25 7단계 모델이 포함된다.

Operationally, individual authors or scholarly teams who conduct narrative reviews “stake out” a domain of published writing and qualitatively, based on expert opinion or judgment, aggregate the evidence using Imel’s31 three tacit steps, which incorporate the Cooper10 and Cooper and Koenka25 seven-step model:


1. 통합적 학술작업을 제시할 원고의 경계, 내용 및 구조를 규정한다.

2. 증거의 의미에 대한 그럴듯한 주장을 만들기 위해 증거를 정성적으로 조립, 분석, 해석, 평가 및 종합한다.

3. 동료 청중에게 증거와 주장을 설득력 있게 통합한 보고서를 작성한다.

1. Define the boundaries, contents, and structure of a manuscript that presents integrative scholarship;

2. Qualitatively assemble, analyze, interpret, evaluate, and synthesize evidence to create plausible arguments about what the evidence means; and

3. Write a report that integrates evidence and argument in a convincing way to an audience of one’s peers.


내러티브 검토는 전형적으로 동일한 질적 준거와 기준을 사용하여 평가된다.32 교육연구의 검토(RER)33는 예를 들어 통합적, 이론적, 방법론적, 역사적 4가지 범주로 종합적 학술연구를 분류한다. 또한 RER33은 원고 검토자에게 저널에 게재할 원고를 평가할 때 8가지 기준과 기준을 사용하도록 지시한다.

Narrative reviews are typically judged using equally qualitative criteria and standards.32 To illustrate, the Review of Educational Research (RER)33 classifies synthetic scholarship in four categories: integrative, theoretical, methodological, and historical. RER33 also instructs manuscript reviewers to use eight standards and criteria when evaluating manuscripts for publication in the journal:


1. 문헌의 질 

2. 분석의 질 

3. 주제의 중요성 

4. 기사의 영향 

5. 현장의 선진화 

6. 스타일; 

7. 균형과 공정성 

8. 목적.

1. Quality of the literature; 

2. Quality of analysis; 

3. Significance of the topic; 

4. Impact of the article; 

5. Advancement of the field; 

6. Style; 

7. Balance and fairness; and 

8. Purpose.


8가지 RER 기준과 표준은 정교함이나 조작적 정의 없이 제시된다. 검토자는 경계와 의미를 "그들 스스로"해석해야 한다.31

The eight RER criteria and standards are given without elaboration or operational definition. Reviewers are “on their own” to interpret boundaries and meaning.31


Cooper10은 연구 통합에 대한 내러티브 접근법에 대해 매우 비판적이다. 쿠퍼는 

"전통적인 내러티브 방식으로 진행된 연구 합성은 많은 비판을 받아왔다. 전통적인 연구 합성에 반대하는 사람들은 이 방법과 그 결과적인 결론은 과정과 결과 모두에서 부정확하다고 제안했다. 특히 전통적인 내러티브 연구는 명확한 입증 기준standards of proof이 결여되어 있다. 이러한 합성의 독자와 사용자는 일련의 연구가 그 결론을 뒷받침하는지 여부를 결정하기 위해 어떤 표준의 증거를 사용했는지 모른다.34 전통적인 합성론자들이 사용하는 결합 법칙은 비록 그들이 추론을 인도하고 있는 것을 의식적으로 알고 있더라도 합성론자 자신 외에 다른 사람에게는 거의 알려져 있지 않다."10

Cooper10 is very critical of the narrative approach to research integration. Cooper asserts: 

“Research syntheses conducted in the traditional narrative manner have been much criticized. Opponents of the traditional research synthesis have suggested that this method—and its resulting conclusions—is imprecise in both process and outcome. In particular, traditional narrative research syntheses lack explicit standards of proof. Readers and users of these syntheses do not know what standard of evidence was used to decide whether a set of studies supported its conclusion.34 The combining rules used by traditional synthesists are rarely known to anyone but the synthesists themselves, if even they are consciously aware of what is guiding their inferences.”10


Cooper10은 또한 전통적인 [내러티브] 연구 합성에는 세 가지 다른 단점이 있다고 주장한다.

Cooper10 also argues that there are three other disadvantages to traditional [narrative] research synthesis:


    • 첫째, 전통적 연구 합성은 다음에 필요한 체계적인 기법이 거의 없다

⑴ 모든 관련 연구가 종합에 위치located하여 포함하는 것

⑵ 각 연구의 정보가 정확하게 수집되었는지 확인하는 것

“First, traditional research syntheses rarely involve systematic techniques to ensure that 

(a) all relevant research was located and included in the synthesis and 

(b) information from each study was gathered accurately.”


    • 둘째, 전통적인 서술형 합성은 개별 연구가 방법론적 품질의 허용 임계값을 충족하는지 여부를 결정하기 위해 사후 기준을 사용하는 경향이 있었다.

“Second, traditional narrative syntheses were prone to use post hoc criteria to decide whether individual studies met an acceptable threshold of methodological quality.”


"결국 전통적인 내러티브 합성은 본질적으로 연구 대상이 되는 관계의 전체적인 규모에 대한 진술을 이끌어내지 못한다."10

“Finally, traditional narrative syntheses, by their very nature, fail to result in statements regarding the overall magnitude of the relationship under investigation.”10


이러한 현실적이고 잠재적인 결함에도 불구하고, 내러티브 리뷰는 의학 및 보건 전문직 교육에서 통합적 학술적 문학에 중요한 기여를 하고 있으며, 지속적으로 그 역할을 하고 있다. 예를 들면 K가 지은 서술평론이다. 2004년 학술의학(Academic Medicine)에 발표된 안데르스 에릭슨(35)의 '의학과 관련 분야 전문가 성과 획득 및 유지'가 큰 영향을 미쳤다.

Despite these real and potential flaws, narrative reviews have been and continue to represent important contributions to the integrative scholarly literature in medical and health professions education. To illustrate, a narrative review authored by K. Anders Ericsson,35 “Deliberate practice and the acquisition and maintenance of expert performance in medicine and related domains,” published in Academic Medicine in 2004, has had a major impact.


체계적

Systematic


[호주] 국립보건의료연구위원회(NHMRC)는 체계적인 문헌 검토의 목적을 다음과 같이 밝히고 있다. 

"체계적인 문헌 검토의 목적은 특정 문제와 관련된 모든 가용한 연구 증거를 평가하고 해석하는 것이다. 이는 이전 작업이 설명되지만 체계적으로 식별되지 않고 품질에 대해 평가 및 종합되는 전통적인 검토와는 다르다."37 

The [Australian] National Health and Medical Research Council (NHMRC) states the aim of a systematic literature review: 

“The purpose of a systematic literature review is to evaluate and interpret all available research evidence relevant to a particular question…. This differs from a traditional review in which previous work is described but not systematically identified, assessed for quality and synthesized.”37 


NHMRC 설명은 알바네즈와 노르시니,38에 의해 증폭되었다. 체계적 검토는 

"검토 과정을 투명하게 하고 일반적으로 합의된 방법으로 증거의 규칙을 정의하기 위한 노력"이다. 미리 정해진 품질 기준에 대한 검토를 실시하는 것도 하나의 접근법이라고 말했다.

The NHMRC description is amplified by Albanese and Norcini,38 who assert that a systematic review 

“is an effort to make the review process transparent and to define the rules of evidence in generally agreed upon ways. It is also an approach that holds reviews to predetermined standards of quality.”


Lang39는 과학적 방법의 확장으로서 체계적 검토의 특성을 설명하고 그들의 행동에 대한 9단계 접근법을 제시한다. 랭의 9단계는 다음과 같다.

Lang39 describes the characteristics of systematic reviews as an extension of the scientific method and presents a nine- step approach for their conduct. Lang’s nine steps are:


1. 생물학적 또는 인간적 문제에 관심을 갖게 된다. 

2. 문제에 대해 알려진 내용을 학습한다. 

3. 문제에 대한 연구 질문을 작성한다. 

4. 질문에 대한 하나 이상의 가능한 답을 시험하기 위한 실험을 설계한다. 

5. 연구할 표본을 선택한다. 

6. 질문에 답변하는 데 필요한 데이터를 수집한다. 

7. 데이터를 분석하고 해석한다(아마도 통계적으로). 

8. 데이터에 기초하여 결론을 도출한다. 

9. 연구 결과를 발표한다.

1. Become interested in a biological or human problem; 

2. Learn what is known about the problem; 

3. Formulate a research question about the problem; 

4. Design an experiment to test one or more possible answers to the question; 

5. Select a sample to study; 

6. Collect the data needed to answer the question; 

7. Analyze and interpret the data, perhaps statistically; 

8. Derive conclusions on the basis of the data; and 

9. Publish the results of the study.


학술지의 전문 스태프들은 재현성과 연구 질문, 검색과 선택 과정, 분석, 해석의 네 가지 특징을 근거로 서술적 리뷰와 체계적 리뷰를 비교하는 비공식 자료를 만들었다.40 이러한 구분은 그림 1에 나타나 있다. 

      • 요컨대, 체계적 검토는 신중한 행동 계획을 따르고, 체계적이고, 지배되고, 그리고 (아마도) 정량적으로 된다

      • 이는 대개 [증거와 데이터 종합의 암묵적 규칙을 사용하는, 특이하고 질적인 절차에 기초하는] 내러티브 리뷰와 대비된다. 

Professional staff members for the journal Academic Medicine created an informal resource comparing narrative reviews and systematic reviews on grounds of four features: reproducibility and research question, search and selection process, analysis, and interpretation.40 These distinctions are shown in Figure 1. 

      • In short, a systematic review follows a careful plan of action, is organized, rule governed, and (perhaps) quantitative; 

      • in contrast with a narrative review, which is usually based on idiosyncratic, qualitative procedures that use tacit rules of evidence and data synthesis. 



3개의 공동 연구 그룹은 의료 및 보건 과학 교육자에게 관심에 대한 체계적인 검토를 후원하고 수행한다: 

Three collaborative research groups sponsor and conduct systematic reviews of interest to medical and health science educators: 

    • the Best Evidence Medical and Health Professional (BEME) Collaboration,41 

    • the Campbell Collaboration,42 and 

    • the Cochrane Collaboration.43


    • BEME Collaboration 체계적 검토는 의료 및 보건 직업에 대한 증거에 대한 교육을 개선하는 것을 목표로 한다. 

    • 캠벨 콜라보레이션의 체계적 리뷰는 연구 합성 대상으로 행동 과학, 공공 정책, 보건 서비스의 질문을 다룬다. 

    • Cochrane Collaboration은 건강 관리, 건강 정책, 질병 예방, 치료 및 재활에 대한 개입의 영향, 진단 테스트 정확도를 다룬다.

    • BEME Collaboration systematic reviews aim to improve evidence-informed education in medicine and the health professions. 

    • Campbell Collaboration systematic reviews address questions in the behavioral sciences, public policy, and health services as research synthesis targets. By contrast, 

    • Cochrane Collaboration systematic reviews address health care; health policy; effects of interventions for disease prevention, treatment, and rehabilitation; and diagnostic test accuracy.


BEME Collaboration, Campbell Collaboration, Cochrane Collaboration의 후원으로 수행되는 체계적인 리뷰는 엄격한 동료 검토를 거친다.

Systematic reviews performed under auspices of the BEME Collaboration, the Campbell Collaboration, and the Cochrane Collaboration undergo rigorous peer review


체계적 검토의 맥락에서 데이터 분석은 양적 또는 질적으로 이루어질 수 있다. 체계적 검토에서 정량적 데이터 분석을 메타분석이라고 하는데, 여기서 개별 연구의 데이터를 취합하여 효과 크기와 신뢰구간을 계산하고, 포레스트 플롯 등 확립된 규약에 따라 데이터 표시와 해석을 한다.48–50

Data analysis in the context of a systematic review can be either quantitative or qualitative. Quantitative data analysis in systematic reviews is called meta-analysis, where data from individual studies are aggregated, effect sizes and confidence intervals are calculated, and data presentation and interpretation are done according to established conventions such as forest plots.48–50


체계적 검토의 맥락에서 [질적 데이터 합성]은 선택된 연구의 특징들이 메타분석을 이용한 양적 합성을 배제하는 이질적인 연구 설계, 교육 개입, 결과 측정, 시간 프레임을 포함할 때 수행된다.51

Qualitative data synthesis in the context of a systematic review is performed when features of selected studies include heterogeneous research designs, educational interventions, outcome measures, and time frames that rule out quantitative synthesis using meta-analysis.51


체계적 검토를 위한 연구 보고 규약은 [통합적 연구 보고서의 요소와 그 표시 순서를 명시한 규칙]에 따른다. 랭과 세이크52는 의학 문헌에서 체계적인 검토 보고에 대한 기본적인 기대를 지적한다. Moher와 동료 53은 PRISMA 선언으로 알려진 "체계적인 검토와 메타 분석을 위해 선호되는 보고 항목"에 대한 상세한 설명을 제시한다.

Research reporting conventions for systematic reviews are governed by rules that specify the elements of an integrative research report and their order of presentation. Lang and Seic52 point out basic expectations for reporting a systematic review in the medical literature. Moher and colleagues53 present a detailed account of the “preferred reporting items for systematic reviews and meta-analyses,” known as the PRISMA Statement.


일부 비평가들은 방법론이 너무 구체적이고 엄격하기 때문에 체계적인 검토의 결과가 항상 신뢰할 수 있는 것은 아니라고 주장한다. 이들과 다른 학자들은 통합적 학술연구에 대한 체계적인 검토 접근방식은 탈맥락화acontextual 되어있다고 말한다. 즉, 그것은 원래의 연구가 수행된 조건을 설명하지 못한다따라서 데이터의 메타분석을 포함하거나 포함하지 않은 체계적인 검토는 [(원래 연구가 수행된 맥락과) 다른 설정과 환경에서] 교육 개입이 효과가 있을지(혹은 없을지)에 영향을 미치는 [복잡하고 변화무쌍한 조건으로부터 분리된 무균sterile 상태]로 간주된다

Some critics contend that results from systematic reviews are not always trustworthy because the methodology is too specific and rigid.57,58 These and other scholars argue that the systematic review approach to integrative scholarship is acontextual. It fails to account for the conditions under which the original research was performed. Thus, systematic reviews with or without meta-analysis of data are considered by some scholars to be sterile, detached from the complex, ever-changing conditions that affect the way educational interventions work (or do not work) in different settings and circumstances. 


셋째, 범위 지정, 넷째, 비판적 현실주의는 이 문제를 해결하고자 한다.

The third, scoping, and fourth, critical-realist, approaches to integrative scholarship aim to address this deficit.


범위 지정

Scoping


범위 지정scoping 연구는 통합적 학술연구 방법의 family에는 상대적으로 새로운 것이다. 범위 지정 연구의 목적은 연구 영역(범위, 한계 및 특징)에 포함된 주요 개념과 이용 가능한 증거의 주요 출처 및 유형을 매핑하는 것이다. 그 목적은 핵심 연구 문제를 다루는 현재 문헌의 범위에 대한 빠르고 서술적이며 기술적인 설명을 만드는 것이다. 범위 지정 연구에서 관련 문헌을 식별하는 데 사용되는 전략은 [폭넓은, 경계-설정boundary-setting 결과 달성]을 목표로 한다.59–61

Scoping studies are a relatively new addition to the family of integrative scholarship methods. The aim of a scoping study is to map the key concepts contained in a research domain—their breadth, limits, and features—and the primary sources and types of available evidence. The intent is to produce a quick, narrative, descriptive account of the scope of current literature addressing a key research question. The strategy used to identify relevant literature in a scoping study aims to achieve broad, boundary- setting results.59–61


Arcsey와 O'Malley62는 범위 지정 연구를 수행해야 하는 네 가지 이유를 기술한다: 

    • 구 활동의 범위, 다양성, 성격을 조사하기 위한 것, 

    • 완전한 체계적 검토full systematic review를 수행하는 것의 가치 결정, 

    • 연구 결과를 요약하고 보급하기 위한 것, 그리고 

    • 재 문헌에서 연구 격차를 식별하기 위한 것이다. 

Arksey and O’Malley62 state four reasons to perform a scoping study: 

    • to examine the extent, range, and nature of research activity; 

    • determine the value of undertaking a full systematic review; 

    • summarize and disseminate research findings; and 

    • identify research gaps in the current literature. 


범위 연구는 체계적인 검토와 같이 엄격한 방법론적 규칙(예: 특정 연구 설계, 측정 방법)에 의해 관리되지 않는다. 대신, "범위 지정 연구 방법은 [연구 설계와 상관없이 모든 관련 문헌을 식별]하는 요건에 의해 안내된다." 또한, "이 과정은 선형적이 아니라 상호작용적이어서 연구자들이 반사적으로 각 [점수 검토] 단계에 관여해야 하며, 필요한 경우 문헌이 포괄적으로 다루어지도록 하기 위한 단계를 반복해야 한다."62.

A scoping study is not governed by strict methodological rules (e.g., specific research design, measurement methods) like a systematic review. Instead, “the scoping study method is guided by a requirement to identify all relevant literature regardless of study design.” In addition, “The process is not linear but interactive, requiring researchers to engage with each [scoping review] stage in a reflexive way and, where necessary, repeat steps to ensure that the literature is covered in a comprehensive way.”62


Arcsey와 O'Malley62는 범위 지정 연구의 다섯 가지 필수 단계가 있다고 말한다.

Arksey and O’Malley62 state that there are five required stages of a scoping study:


1. 연구 질문을 확인한다. 

2. 관련 연구를 식별한다. 

3. 연구를 선택한다. 

4. 데이터를 도표로 작성한다. 

5. 결과를 취합, 요약, 보고한다.

1. Identify the research question; 

2. Identify relevant studies; 

3. Select studies; 

4. Chart the data; and 

5. Collate, summarize, and report results.


범위 지정 연구의 여섯 번째 선택적 단계는 통합 장학금에 기득권을 가진 이해관계자, 개인 및 그룹과 협의하여 그러한 작업의 가치와 영향에 대한 견해를 평가하는 것이다.

A sixth, optional stage in a scoping study is to consult with stakeholders, individuals, and groups who have a vested interest in the integrative scholarship, to assess their views about the value and impact of such work.


범위 지정 연구의 목표는 광범위하고 유연하다. 포괄적 목표는 연구 발표의 설계, 측정, 통계적 방법 또는 품질과 관계없이 잠재적으로 관련이 있는 다양한 연구를 식별하는 것이다. 역학 용어로는, [특이도가 높은 문헌 검색보다는 민감도가 높은 문헌 검색]을 실시하자는 취지다. 증거의 무게나 품질을 평가할 요건이 없고, 그 폭과 세부사항breadth and detail만 있을 뿐이다. 범위 연구 목적에 대한 개별 연구 연구의 목적적합성 또는 효용성은 일반 기준을 설정한 후 임시로 판단한다.

Scoping study goals are broad and flexible. The inclusive goal is to identify a wide variety of potentially relevant research studies without regard to design, measurement, statistical methods, or qualities of the research presentation. In epidemiological terms, the intent is to conduct a sensitive rather than a specific literature search. There is no requirement to assess the weight or quality of evidence, just its breadth and detail. The relevance or utility of individual research studies to the purpose of a scoping study is judged post hoc, after general criteria are set.


4단계(데이터 차트) 및 5단계(모으기, 요약 및 보고서 결과)는 범위 지정 연구에 특히 고유하다

Step four (chart the data) and step five (collate, summarize, and report results) are especially unique to scoping studies. 

    • 차트 작성은 검토 문제와 [관련된 문헌의 범위와 특징을 파악]하기 위해 전문가와 초기 검색 및 토론을 바탕으로 문헌 "맵"을 작성하는 것을 포함한다. "이 지도는 (지질 지도처럼) 여러 층으로 이루어져 있을 가능성이 높다. 왜냐하면, 과학과 이론적 지향이 다른 연구자들은 같은 현상을 다른 방법으로 연구했을 것으로 예상할 수 있기 때문이다."

    • 범위 보고서 작성, 5단계는 규칙이 없다. 대신 관련 문헌의 분량에 따라 원고의 구조, 내용, 길이가 결정된다. 범위 지정 연구 방법론에 대한 자세한 내용은 Levac과 동료들을 통해 확인할 수 있다.

    • Charting involves creating a literature “map” based on early searching and discussion with experts to identify the range and features of literature relevant to the review question. “The map is likely to be multi-layered (like a geological map), since researchers from different . . . sciences and with differing theoretical orientations can be expected to have studied the same phenomenon in different ways.”63 

    • Writing the scoping report, step five, is not rule governed. Instead, the structure, content, and length of the manuscript are determined by the volume of relevant literature.64 More details about scoping study methodology are available from Levac and colleagues.65


비판현실주의

Critical-realist


통합적 학문에 대한 비판적 현실주의 전통은 서술적, 체계적, 범위적 검토 방법이 혼합된 것이다. 비판적 현실주의 접근법은 [전문적인 판단과 엄격한 방법론]에 동시에 의존한다. Rycroft-Malone과 동료 66은 "현실주의 검토는 [개입이 작용하는 메커니즘을 이해하고 푸는 데 초점]을 맞추고 있으며, 따라서 개입이 어떻게 작용하는지에 대한 판단과는 달리 설명을 제공한다. 현실주의적 접근방식은 근본적으로 이론 개발과 정교함에 관련 문헌을 체계적이고 투명하게 합성하는 과정에서 [결과뿐만 아니라 맥락도 고려]한다." 더욱이 "현실주의적 접근법은 특히 복잡한 구현 개입에 대한 증거의 종합에 적합하다."

A critical-realist tradition for integrative scholarship is a hybrid of the narrative, systematic, and scoping review methods. The critical-realist approach relies simultaneously on both professional judgment and rigorous methodology. Rycroft-Malone and colleagues66 teach that “A realist review focuses on understanding and unpacking the mechanisms by which an intervention works (or fails to work), thereby providing an explanation, as opposed to a judgment about how it works. The realist approach is fundamentally concerned with theory development and refinement, accounting for context as well as outcomes in the process of systematically and transparently synthesizing relevant literature.” Moreover, “the realist approach is particularly suited to the synthesis of evidence about complex implementation interventions.”


비판적 현실주의 틀 안에서 수행되는 통합적 학술연구는 "개입은 이론(적)이다; 중재는 우리가 X를 이런 식으로 하면 결과를 가져올 것이다"라는 생각에 근거를 두고 있다. 또한, "실제론적 합성은 다른 상황적 구성 내에서 '무엇이 작용하는지'를 밝혀내는 것과 관련이 있기 때문에, 결과 모델은 결과에 초점을 맞추어야outcome focused 한다."66

Integrative scholarship performed within a critical-realist framework is grounded in the idea that “an intervention is a theory; because interventions are implemented on a hypothesis of if we do X in this way, then it will bring about an outcome.” In addition, “the resultant model must be outcome focused because a realist synthesis is concerned with uncovering ‘what works’ within differing contextual configurations.”66


비판적 현실주의 연구 합성을 수행하는 데 사용되는 방법은 계획적이고 단계적이며, 체계적 검토에 필요한 단계와 유사하지만 동일하지는 않다. 비판적 현실주의자 검토의 방법론적 절차는 4단계, 즉 Rycroft-Malone과 동료 66 및 Pawson.67에 의해 설명되는 보조 조치를 갖는 2단계와 같은 4단계와 관련이 있다.

The methods used to conduct a critical- realist research synthesis are planful and stepwise, similar but not identical to the steps needed for a systematic review. The methodological procedures for a critical- realist review involve four steps, two having subsidiary actions as articulated by Rycroft-Malone and colleagues66 and Pawson.67 The four steps are:


1. 검토의 범위 정의: 

• 질문을 식별한다. 

• 검토 목적을 명확히 한다. 

• 프로그램 이론을 찾고 명확하게 표현한다. 

1. Define the scope of the review: 

• identify the question, 

• clarify the review purpose(s), 

• find and articulate program theories; 


2. 증거를 찾고 평가한다. 

• 증거를 찾아라, 

• 시험 관련성; 

2. Search for and appraise the evidence: 

• search for evidence, 

• test relevance; 


3. 소견 추출 및 합성 

3. Extract and synthesize findings; and 


4. 서사를 전개하다.

4. Develop a narrative.


통합적 학술활동으로서, 비판적 현실주의 및 체계적 접근방식의 한 가지 중요한 차이점은 [비판적 현실주의 전통에서의 데이터 합성이 반복적이고 질적]이라는 점이다. "네 가지 차원에 관한 연구: 

    • 이론의 진실성integrity에 의문을 제기하고 

    • 경쟁하는 이론들 사이에서 판단을 내리고,

    • 동등한 환경에서 동일한 이론을 고려하거나, 

    • '공식적' 이론과 '실제' 실천을 비교하는 것

One key distinction between the critical- realist and systematic approaches to integrative scholarship is that data synthesis in the critical-realist tradition is iterative and qualitative, “focus[ing] on four dimensions: 

    • questioning the integrity of a theory, 

    • adjudicating between competing theories, 

    • considering the same theory in comparative settings, or 

    • comparing the ‘official’ theory with actual practice.”66 


비판적 현실주의 모드에서 정량적 데이터 분석은 통합적 학술연구의 특징이 아니다.

Quantitative data analysis is not a feature of integrative scholarship in the critical-realist mode.


이러한 생각들은 포슨과 동료들이 지지하는 "현실주의 검토" 전술tactic과 함께 문헌 합성에 대한 노만과 에바의 "비판적 검토" 접근법에 부합한다. Eva는 다음과 같이 말한다. 

"좋은 교육 연구 문헌 리뷰는 다양한 문헌의 중요한 종합을 제시하고, 잘 확립된 지식을 파악하며, 이해의 격차를 강조하고, 이해해야 할 부분에 대한 지침을 제공하는 것이다. 그 결과는 오래된 문제에 대한 새로운 관점을 제시해야 한다. 저자는 문학(그리고 그 안의 다양한 관점)을 공정하게 대표하려고 노력하는 도덕적 규범에 따른다는 생각을 해야 하지만, 절대적인 체계성을 가장할guise 필요는 없다." 

Pawson 등은 그 주장에 동의한다. 

"검토review 질문은 어떤 측면의 개입이 검토될 것인지 우선순위를 정할 수 있도록 주의 깊게 설명되어야 한다."

These ideas conform with Norman and Eva’s68 “critical review” approach to literature synthesis along with the “realist review” tactic espoused by Pawson and colleagues.57,67 Eva69 states: 

“A good educational research literature review … is one that presents a critical synthesis of a variety of literatures, identifies knowledge that is well established, highlights gaps in understanding, and provides some guidance regarding what remains to be understood. The result should give a new perspective of an old problem…. The author … should feel bound by a moral code to try to represent the literature (and the various perspectives therein) fairly, but need not adopt a guise of absolute systematicity.” 

Pawson et al57 agree with the assertion, 

“the review question must be carefully articulated so as to prioritise which aspects of which interventions will be examined.”


공개 피어 해설

Open peer commentary


통합적 학술연구의 수단으로서의 공개 동료 해설 형식은 보건직 교육에서 참신하다. 일반적인 접근방식은 저널 편집자(또는 편집위원)가 자극적이거나, 논란이 있거나, 학술 분야의 과학이나 연구분야를 선도하는 "표적 기사"를 요청하거나 위촉하는 것이다. 타겟 기사는 동료 검토, 아마도 수정을 거쳐 출판된다. 대상 기사는 그 방법, 내용 또는 결론을 승인, 반박, 증폭 또는 세분화할 수 있는 광범위한 공개 동료 논평(또한 비판적 검토)이 뒤따른다. 이어 대상 기사의 작성자는 반박, 요약 발언, 논평 등의 형태로 최종 발언권을 갖는다. 그 결과는 포화, 다양한 관점, 활발한 분열을 통한 통합적 학술물이다. 그것은 때로는 아이러니나 유머로 가득 찬 위대한 작업물에 기여한다.

The open peer commentary format as a means of integrative scholarship is novel in health professions education. The general approach is for a journal editor (or editorial board) to solicit or commission a “target article” that is provocative, controversial, or at the leading edge of science or scholarship in an academic field. The target article undergoes peer review, perhaps revision, and is published. The target article is followed by a wide-ranging series of open peer commentaries (also critically reviewed) that may endorse, refute, amplify, or refine its methods, substance, or conclusions. The author of the target article then has final say in the form of rebuttal, summary remarks, and comments. The result is integrative scholarship via saturation, diverse perspectives, and spirited disputation. It also contributes to great reading, sometimes spiked with irony or humor.


행동 및 뇌과학(BBS)은 다른 학술지(예: American Journal of Biothics, Sychical Bulletin)가 가끔 사용하지만 개방형 동료 논평 형식을 특징으로 가장 잘 알려진 학술지다.

Behavioral and Brain Sciences (BBS) is the scholarly journal best known for featuring the open peer commentary format, although other journals (e.g., American Journal of Bioethics, Psychological Bulletin) use it occasionally.


통합 장학금 심사

Judging Integrative Scholarship


통합 장학금 수행에 대한 다섯 가지 보완적 접근방식은 본 연구의 품질, 유용성 및 가치를 판단하는 데 사용되는 기준도 달라야 한다고 제안한다. 중점 평가 지침은 표 1의 행과 셀에 제시되어 있다.

The five complementary approaches to the conduct of integrative scholarship suggest that criteria used to judge the quality, utility, and value of this work should also vary. Focused evaluation guidelines are given in the rows and cells of Table 1.


Rows은 현대 학자들이 제안한 3개 항목에서 27개 항목으로 표현되는 통합 장학금에 대한 평가 기준과 보고 규약을 증류한 것이다. 이러한 평가 지침은 글래틱 등이 제안한 장학금 평가의 일반적 기준을 보완하지만 중복하지는 않는다.74: 명확한 목표, 적절한 준비, 적절한 방법, 중요한 결과, 효과적인 발표 및 성찰적 비평.

The rows10,25 are a distillate of evaluation criteria and reporting conventions for integrative scholarship expressed as lists ranging from 3 to 27 items proposed by contemporary scholars.31,33,39,48,53,62,66,72 These evaluation guidelines complement but do not duplicate the six generic criteria for evaluating scholarship proposed by Glassick et al74: 

  • clear goals, 

  • adequate preparation, 

  • appropriate methods, 

  • significant results, 

  • effective presentation, and 

  • reflective critique.


표 1에서 앞서 설명한 요약본은 통합적 학술물을 판단하는 것은 [체계적 검토나 비판적-현실주의 검토]의 경우처럼, 연구 종합에 대한 접근방식이 단계적이고, 규칙기반rule governed인 경우 비교적 간단하며 아마도 공식적일 수 있음을 시사한다. 이러한 검토를 위해 통합 장학금의 질과 효용성에 대한 판단은 체크리스트를 통해 원고가 선행 기준과 보고 기준을 충족하는지 여부를 판단할 수 있다. 예를 들어 PRISMA 체크리스트 또는 RAMESES의 비판적 현실주의자 합성을 위한 간행물 표준과 같은 것.

The summary advanced by Table 1 suggests that judging integrative scholarship is relatively straightforward, perhaps formulaic, when the approach to research synthesis is stepwise and rule governed, as is the case for systematic and critical-realist reviews. For these reviews, judgments about the quality and utility of integrative scholarship can be guided by checklists to gauge whether a manuscript fulfills a priori criteria and reporting standards such as the PRISMA checklist53 or the RAMESES (Realist and Meta- narrative Evidence Syntheses: Evolving Standards) publication standards for critical-realist syntheses.75


[서술형, 범위형, 개방형 동료 해설] 프레임워크를 사용하여 수행되는 통합형 학술연구의 질과 효용성에 대한 판단은 증거, 기준, 보고 표준의 규칙이 자주 불투명하기 때문에 더욱 어렵다. 평가자 또는 저널 심판은 이러한 작업을 평가할 때 전문가적 판단을 내릴 것으로 예상되며, 교육적 감식자 역할을 할 것으로 예상된다.76 이러한 상황에서 통합적 장학금에 대한 평가는 평가 대상 작업과 유사하게 특이하고 표준화되지 않을 가능성이 높다.

Judgments about the quality and utility of integrative scholarship performed using the narrative, scoping, and open peer commentary frameworks are more difficult to render because the rules of evidence, criteria, and reporting standards are frequently opaque. The evaluator or journal referee is expected to exercise expert judgment when evaluating such work, to act as an educational connoisseur.76 Evaluations of integrative scholarship under these circumstances will likely be idiosyncratic and unstandardized, similar to the work being judged.


의료 및 보건 전문직 교육의 통합적 학술연구는 고정된static "쿠키 커터" 사고방식을 사용하여 수행되어서는 안 되며, 그 퀄리티와 효용성에 대한 평가도 해서는 안 된다. 통합형 학술연구의 가치를 판단하는 것은 그 질과 효용을 평가하는 것과는 매우 다르다. 가치에 대한 판단은 개인적, 직업적, 국가적 우선 순위에 의해 좌우된다. 가치판단은 종종 암묵적이거나 묵시적이고tacit or occult, 거의 인정받지 못하더라도 항상 과학과 학문의 핵심에 있다. 학자들의 공동체로서 우리는 동료들을 초대하여 그들의 원고에 보고된 독창적이고 통합적인 장학금의 행위의 기초가 되는 가치를 표현하기를 원할 것이다.

Integrative scholarship in medical and health professions education must not be performed using a static, “cookie cutter” mentality, and neither should evaluations of its quality and utility. Judging the value of integrative scholarship is very different than evaluating its quality and utility. Judgments about value are governed by personal, professional, and national priorities. Value judgments, often tacit or occult, are always at the heart of science and scholarship even though they are rarely acknowledged. As a community of scholars we may wish to invite colleagues to express the values that underlie the conduct of original and integrative scholarship reported in their manuscripts.






. 2015 Mar;90(3):294-302.
 doi: 10.1097/ACM.0000000000000585.

Varieties of integrative scholarship: why rules of evidence, criteria, and standards matter

Affiliations 

Affiliation

  • 1Dr. McGaghie is director, Ralph P. Leischner Jr., MD Institute for Medical Education, vice chair, Department of Medical Education, and professor of medical education, Loyola University Chicago Stritch School of Medicine, Maywood, Illinois.

Abstract

Integrative scholarship involves the aggregation of data and evidence in a way that allows the research community to comprehend and value the connections and perspectives that unite isolated facts and research studies. Integrative scholarship summarizes data, enlightens and informs readers broadly, and sets the stage for subsequent research. This article describes five approaches to integrative scholarship--narrative, systematic, scoping, critical-realist, open peer commentary--and argues that each approach uses different methods and rules of evidence to combine data and report their meaning. Different forms of integrative scholarship use methods, criteria, and standards that are matched to the integrative approach and data being evaluated. There is no one best strategy to conduct or judge integrative scholarship. Researchers who perform integrative scholarship should openly express the values that underlie their work.


의학교육연구에서 복잡성 과학의 현 상태는? (Med Educ, 2019)

What is the state of complexity science in medical education research?

Sayra Cristancho,1,2,3 Emily Field1,4 & Lorelei Lingard1,3,5




도입 

INTRODUCTION


세상이 예전보다 복잡하다는 주장은 우리 포스트모던 사회에서 받아들여진 진실이 되었다. 예는 무궁무진하다. 

  • 조직의 리더십이 더 복잡함, 1–3 

  • 경제 무역은 더 복잡하고, 4–6 

  • 통신 기술은 더 복잡하다, 7,8 

  • 정부 정책은 더 복잡하다,9-11 

  • 사회관계는 더 복잡하고, 12,13 그리고 

  • 의료는 더 복잡하다.14-16 

The claim that the world is more complex than it used to be has become accepted truth in our postmodern society. The examples are endless: organisational leadership is more complex,1–3 economic trade is more complex,4–6 communication technology is more complex,7,8 government policy is more complex,9–11 social relations are more complex,12,13 and health care is more complex.14–16 


의학 교육에서 이는 [우리가 점점 더 복잡해지는 환자, 조직적, 문화적 힘의 맥락에서 유능한 전문 인력을 양성해야 하는 도전에 직면하고 있다]는 것을 의미한다.

In medical education, this means that we are faced with the challenge of developing capable professionals in the context of increasingly complex patient, organisational and cultural forces.


복잡성 과학은 시스템을 조사examine하는 방법으로 약 50년 전에 나타났다. 서로 다른 학문들이 복잡성에 대한 그들의 글에서 다른 진화의 단계에 있다. 비록 어떤 이들은 복잡성이 하나의 근원을 가지고 있는지 아닌지에 대한 문제(즉, 복잡성 대 단순성)에 대해 여전히 고심하고 있지만, 다른 이들은 복잡성의 다중성을 인식하고 수용했다. 우리 논문은 의학교육이 전자의 입장에서 후자의 입장으로 나아가는 것을 옹호할 것이다.

Complexity science emerged around five decades ago as a way to examine systems. Different disciplines are at different stages of evolution in their writings about complexity. Although some are still grappling with the question of whether complexity has a single origin or not (i.e. complexity versus simplicity), others have recognised and embraced its multiplicity. Our paper will advocate for medical education to move from the former stance to the latter.


우리 합성의 장을 마련하기 위해 우리는 다음과 같은 세 가지 학문적 개요에 대한 복잡성 과학 도면을 간략히 소개할 것이다. 

  • 멜라니 미첼의 학문에 걸친 복잡성 과학의 역사; 

  • 브라이언 카스텔라니(Brian Castellani)의 복잡성 과학의 진화에 대한 일시적 설명, 

  • 스티븐 맨슨의 복잡성 과학에 대한 많은 접근에 대한 개념화(Three main orientations)와 관련된 세 가지 주요 방향과 관련된 것이다.

To set the stage for our synthesis, we will briefly introduce complexity science drawing on three scholarly overviews: 

  • Melanie Mitchell’s history of complexity science across the disciplines; 

  • Brian Castellani’s temporal description of the evolution of complexity science, and 

  • Steven Manson’s conceptualisation of the many approaches to complexity science as pertaining to three main orientations.


미첼의 역사는 [복잡한 시스템을 지배하는 공통 원리에 대한 탐구]가 [1940년대 전통적인 환원주의적 접근법이 날씨 예측 불가능성, 살아있는 유기체의 적응성, 사회의 비선형적 행동과 같은 현상을 적절히 설명할 수 없게 되면서] 두드러지기 시작했다고 설명한다.두 명의 핵심 과학자가 이러한 시작을 알렸다. 수학자 노르베르트 비너와 생물학자 루드비히 폰 베르탈란피는 각각 사이버네틱스와 일반 시스템 이론의 학문을 발전시켰다. 이 두 가지 노력이 함께 현재 복잡성 과학으로 알려진 것의 뿌리를 형성했다.18

Mitchell’s history explains that the search for common principles governing complex systems began to take prominence in the 1940s when conventional, reductionist approaches were unable to adequately explain phenomena like the unpredictability of weather, the adaptive nature of living organisms and the non-linear behaviour of societies.17 Two key scientists marked these beginnings: the mathematician Norbert Wiener and the biologist Ludwig von Bertalanffy, who gave rise, respectively, to the disciplines of cybernetics and general systems theory. Together, these two efforts formed the roots of what is now known as complexity science.18


카스텔라니의 연대표는 이러한 뿌리에 기초하여 1940년부터 1950년대까지 복잡과학의 역사적 진화를 지도로 그리고 있다(그림 1).19 그의 지도는 복잡한 과학을 다양한 징계와 인식론적 배경의 학자들이 시너지 효과를 발휘하여 복잡한 시스템의 연구를 지도하는 이론과 개념, 방법의 진화하는 도구 키트를 만들어 내는 네트워크의 산물로 묘사하고 있다.

Castellani’s timeline builds on these roots to map the historical evolution of complexity science from 1940 to the 1950s to the present (Fig. 1).19 His map depicts complexity science as the product of a network of scholars from various disciplinary and epistemological backgrounds working synergistically to create an ever-evolving toolkit of theories, concepts and methods to guide the study of complex systems.



이러한 다양성을 고려해 볼 때, 다른 작가들은 복잡성 이론의 많은 용도에 대한 개요를 제공했다. 예를 들어 리처드슨 외 연구진 20,21은 복잡성에 대한 한 가지 사고방식은 각각 '단단한hard' 복잡성 과학, '부드러운soft' 복잡성 과학 및 그 사이의 어떤 것으로서 3개의 광범위한 사고방식에 관한 것이라고 제안했는데, 이를 '복잡성 사고'라고 한다.

Given this diversity, different authors have offered overviews of the many uses of complexity theory. For instance, Richardson et al.20,21 have suggested that one way of thinking about complexity is in terms of three broad schools of thought as, respectively, ‘hard’ complexity science, ‘soft’ complexity science and something in between, which they call ‘complexity thinking’.


본 논문의 경우, 의료 교육계의 학제간 노력에 귀중한 징계 기원에 대한 명시적인 주의를 제공하기 때문에 만슨의 프레임워크로부터 출발한다.22 만슨의 프레임워크는 [복잡성에 대한 어떤 특정한 정의도 원래 학문의 관점의 색깔에 바탕을 두게 된다]는 전제를 갖는다. 이와 같이, 그는 학문적 동기, 반복적인 정의 용어 및 인식론적 가정을 바탕으로 복잡성 과학 접근방식을 체계화한다,23.

For this paper, we draw on Manson’s framework as it offers explicit attention to disciplinary origins that will be valuable to the interdisciplinary endeavour of the medical education community.22 Manson’s framework is guided by the premise that any particular definition of complexity is coloured by the perspective of the original discipline. As such, he clusters complexity science approaches based on disciplinary motivations, recurring definitional terms and epistemological assumptions,23


Manson은 복잡성 과학에 대한 [세 가지 접근방식]을 개념화한다: 

  • 알고리즘(수학의 기원), 

  • 결정론적(물리학의 기원), 

  • 집합적(생물학의 기원).22 

세 가지 접근법 모두 시스템의 특성이 비저감적 방식으로 구성 요소를 참조하여 특성화하는 방법과 관련이 있다.

Manson conceptualises three approaches to complexity science: 

  • algorithmic (origins in mathematics); 

  • deterministic (origins in physics), and 

  • aggregate (origins in biology).22 

All three approaches are concerned with how the nature of a system may be characterised with reference to its constituent parts in a non-reductionist manner.


[알고리즘 복잡성]은 시스템의 행동을 재현할 수 있는 수학적, 계산적 문제를 해결하는 데 초점을 맞춘다. 알고리즘 복잡성은 정보를 처리하는 뇌의 용량과 같은 물리적 현상의 알고리즘적 표현을 만드는 데 유용하지만, 환경적, 기계적, 사회적 현상을 나타낼 때는 부족하다.

Algorithmic complexity focuses on solving mathematical and computational problems that can reproduce the behaviour of a system. Algorithmic complexity is useful for creating algorithmic representations of physical phenomena such as the capacity of the brain to process information, but it falls short when representing environmental, mechanical or social phenomena.


[결정론적 복잡성]환경적 또는 기계적 현상을 나타내기 위해 필요한 피드백, attractors, nesting 및 결정론적 방정식의 개념을 포함한다. 그 목표는 시스템의 정량화를 위해 방정식을 사용하여 시스템의 정체성 또는 역학을 예측하는 것이다. 따라서, 그것은 실증주의적 전통을 반영한다. 결정론적 복잡성은 작은 방정식의 몇 가지 핵심 변수들이 시스템을 설명할 수 있다는 생각에 의존한다. 예를 들어 로봇 수술의 경우 로봇의 역학을 예측하기 위해 위치, 힘 및 속도 변수가 필요하다.

Deterministic complexity incorporates the notions of feedback, attractors, nesting and deterministic equations that are necessary to represent environmental or mechanical phenomena. Its goal is to predict a system’s identity or dynamics by using equations to quantify the system; hence, it reflects a positivist tradition. Deterministic complexity relies on the idea that a few key variables in a small set of equations can describe the system. For example, in the case of robotic surgery, position, force and velocity variables are necessary to predict the robot’s dynamics.


사회현상을 결정론적 방정식을 통해서 보는 것은 (종종 인간의 행동의 예측 불가능성 때문에) 너무 단순화되기 때문에, [총체적 복잡성]은 보다 전체적인 표현을 제공하려고 시도한다. 이를 위해, [총체적 복잡성]은 또한 알고리즘 및 결정론적 복잡성과 마찬가지로 피드백과 비선형성에 의존하지만, 다음과 같은 다른 상호 관련 개념들을 추가한다. 

  • 엔티티 간의 관계 

  • 내부 구조 및 주변 환경 

  • 학습과 새로운 행동, 

  • 변화와 성장. 

As the characterising of social phenomena via deterministic equations is often too simplistic because of the unpredictability of human behaviour, aggregate complexity attempts to offer more holistic representations. To do this, aggregate complexity also relies on feedback and non-linearity as do algorithmic and deterministic complexities, but adds another set of interrelated concepts: 

relationships between entities; 

internal structure and surrounding environment; 

learning and emerging behaviour, and 

change and growth. 


총체적 복잡성은 [다양한 요소의 상호작용에 의해 시스템이 생성되는 방법]에 더 관심이 있고 변수 측정에는 관심이 더 적은 편이다. 이러한 목적을 위해, 종합적 복잡성은 부품들 간의 상호작용에서 비롯되는 결과를 적응시키고 학습하기 위한 시스템의 행동을 이해하고 설명하려고 한다. 따라서, 그것은 [구성주의적 전통]을 반영한다.

Aggregate complexity is more interested in how systems are created by interactions of the various elements and less in measuring variables. To this end, aggregate complexity seeks to understand and describe a system’s behaviours to adapt and learn that result from interactions among parts; hence, it reflects a constructivist tradition.


[총체적 복잡성]은 임상 팀과 같은 시스템을 연구하는데 적절할 것이며, 이는 [개별 구성원]과 [그들의 관계]에 의해 크게 추진된다. 예를 들어, 팀 구성원 개개인은 자신의 역할, 업무 일정, 병원 계층 내의 위치, 환자들과의 상호 작용에 의해 정의된 관계를 가지고 있다. 총체적 복잡성에서, 특히 중요한 한 가지 특징은 [자기 조직]이다. 시스템의 요소들이 시스템 전체의 구조와 행동을 더 잘 조정하여 업무를 더 잘 수행할 수 있도록 하는 방식으로 그들의 관계를 변화시킨다.

Aggregate complexity would be appropriate for studying systems like clinical teams, which are driven to a great extent by the individual members and their relationships. For example, individual team members have relationships defined by their roles, their work schedules, their place within the hospital hierarchy and their interactions with patients, to name a few. In aggregate complexity, one particularly important feature is self-organisation, in which elements of a system change their relationships in ways that enable the system as a whole to adapt its structure and behaviour to better accomplish its work.


복잡성에 대한 세 가지 방향성을 종합하면, 만손에 의해 기술된 바와 같이, 배타적인 방법이 아닌 보완적인 방법으로 복잡성 사상을 사용할 수 있는 기회를 제시한다. Manson의 방향은 복잡한 시스템을 이해하려면 접근법과 관점 사이의 삼각측정이 필요하다는 것을 암시하는 인식론적 관점의 범위를 수용한다.

Taken together, the three orientations to complexity, as described by Manson,22 present an opportunity for using complexity ideas in a complementary rather than an exclusive way. Manson’s orientations accommodate a range of epistemological perspectives which suggest that understanding complex systems requires triangulation among approaches and viewpoints.


'복잡성'은 의학 교육에서 '신(神) 용어'로 빠르게 자리 잡고 있다(그림 2). 이 논문은 의학 교육이 학문적 연구에서 어떻게 복잡한 생각을 가져왔는지 탐구하고자 한다. 우리는 복잡성 원리의 사용 패턴을 설명하고, 우리 분야에서 '복잡한' 현상에 대한 학술적 대화를 진전시키는 능력에 대해 그러한 패턴의 결과를 고려하는 것을 목표로 한다.

‘Complexity’ is fast becoming a ‘god term’ in medical education (Fig. 2). This paper seeks to explore how medical education has taken up complexity ideas in scholarly research. We aim to describe the patterns of use of complexity principles and to consider the consequences of those patterns for our ability to advance scholarly conversations about ‘complex’ phenomena in our field.



문헌을 찾아서

IN SEARCH OF THE LITERATURE


우리의 문헌 조사에는 두 가지 단계가 포함되어 있었다. 1단계에서는 보건과학과 의학교육 문헌 모두에서 14개의 검토 및 의견서를 사용하여 이러한 분야의 복잡성 과학의 외관을 지도화했다. 2단계에서는 의학 교육 연구에서 복잡성 과학의 현재 이론적 방향과 적용을 식별하기 위해 추가 문헌을 통합한다.

Our search of the literature involved two phases. In Phase 1, we used 14 review and opinion papers in both the health sciences and medical education literatures to map the appearance of complexity science in these fields. In Phase 2, we synthesised additional literature to identify the current theoretical orientations and applications of complexity science in medical education research.


우리는 만슨의 프레임워크22와 다음과 같은 질문을 사용하여 우리의 합성을 이끌었다.

We used Manson’s framework22 and the following questions to guide our synthesis:


  • 1 저자들은 복잡성을 어떻게 활용하고 있는가? 그들의 이론적 성향은 어떠한가?

  • 2 다른 저자들의 개념화와 복잡성 과학의 사용 사이에 어떤 긴장감이나 유사성이 있는가?

  • 3 저자들은 복잡성 과학의 용도를 찾기 위해 주로 누구의 작품을 인용하는가?

1 How are the authors using complexity? What are their theoretical orientations?

2 What are the tensions or similarities between different authors’ conceptualisations and uses of complexity science?

3 Whose work do the authors primarily cite to locate their use of complexity science?



보건과학과 의료교육에서 복잡성 과학이 등장한 것은 언제인가?

WHEN DID COMPLEXITY SCIENCE EMERGE IN THE HEALTH SCIENCES AND MEDICAL EDUCATION?


2001년에, BMJ는 의료 연구에 복잡성 이론을 도입하는 것을 명시적으로 목적으로 하는 특별호를 발행했다. 이 문제의 첫 번째 기사에서는 [모호한 경계, 적응, 비선형성, 예측 불가능성, 유치자 및 자기 조직]을 포함한 [복잡한 시스템을 이해하기 위한 원칙]을 간략히 설명하였다.24 특별호의 다른 기사에서는 이러한 원칙을 사용하여 임상실무, 조직적 리더십 및 교육에서 오랫동안 유지되어 온 가정에 도전하였다. 

  • 예를 들어 임상 실습에서 복잡성 이론은 질병이 단일 생리학적 시스템의 실패라는 생각에서 멀어져 질병은 여러 시스템 내부와 시스템 사이의 동적 상호작용에서 발생한다는 생각을 향한 이동을 뒷받침했다.

  • 리더십에서, 복잡성 이론은 조직을 고립된 부분들의 집합으로 생각하는 것에서 그 부분들 사이의 관계에 대한 생각으로 바꾸게 했다.

  • 교육에서 복잡성 이론은 정적 영역의 역량 강화에서 지식이 끊임없이 변화하는 영역에서 능력이나 적응을 위한 교육으로 초점을 전환하기 위해 사용되었다.

In 2001, The BMJ published a special issue with the explicit purpose of introducing complexity theory to health care research. The first article in the issue outlined the principles for understanding complex systems, including fuzzy boundaries, adaptation, non-linearity, unpredictability, attractors and self- organisation, among others.24 Other articles in the special issue used these principles to challenge long- held assumptions in clinical practice, organisational leadership and education. 

  • In clinical practice, for instance, complexity theory supported a move away from the idea that illness is a failure of a single physiological system, towards the idea that illness arises from dynamic interactions within and between multiple systems.25 

  • In leadership, complexity theory prompted a shift away from thinking of an organisation as a set of isolated parts to thinking in terms of relationships among those parts.

  • 26 In education, complexity theory was used to shift the focus from enhancing competence in static domains to educating for capability or adaptation in domains in which knowledge is everchanging.27


이번 BMJ 특집호에서는 21세기 의료 환경이 의료교육에 미치는 영향과 의사의 직업적 정체성에 대한 심도 있는 분석을 촉발했다.

  • 예를 들어, 급성 치료에서 만성 치료로 의료 관행이 변화함에 따라 병원 밖에서 더 많은 치료를 제공할 필요성이 생겨났다. 이 새로운 치료 모델은 의사가 새로운 전문적 가치(자율성/권위성/전문지식에서 상호의존성으로의 전환으로 표현됨)와 새로운 기대(의료 전문가의 가치에서 공공 전달자, 지도자, 관리자, 옹호자, 교육자, 연구자, 모두 동시에 경력 시작부터 수용하도록 요구한다.

  • 이러한 새로운 기대에 대응하여, 교수 초점의 변화도 일어났다. 여기서 '바이오메디컬 과학'의 전경은 '의료 교육'의 전경에 자리를 내주었고, 그 결과 인문학이 의료 커리큘럼에 포함되었다.

This special issue of The BMJ precipitated in-depth analyses of the influence of the complex 21st century health care environment on medical education and the professional identity of physicians.28–30 

  • For instance, the changes in medical practice from acute to chronic care have created the need to provide more care outside the hospital.31,32 This new care model requires physicians to embrace new professional values (represented by a shift from autonomy/authority/ expertise to interdependency)33 and new expectations (from that of a medical expert to those of a public communicator, leader, manager, advocate, educator, researcher, all at the same time and from the start of a career).34

  •  In response to these new expectations, a change in teaching focus also occurred, whereby the foregrounding of ‘biomedical science’ gave way to the foregrounding of ‘competency-based education’, which resulted in the inclusion of humanities in medical curricula.


2010년대 초, 의료 교육 연구에 복잡성에 관한 언어가 나타나기 시작한다.

In the early 2010s, complexity language begins to appear in medical education research.


의료 교육 연구는 복잡성 과학을 어떻게 사용하는가?

HOW DOES MEDICAL EDUCATION RESEARCH USE COMPLEXITY SCIENCE?


분석하는 동안 의료 교육 연구에서 복잡성 이론의 사용에서 네 가지 패턴을 확인했다. 

  • 째, 복잡성 원리는 다양한 방법으로 설명된다

  • 둘째, 복잡성에 대한 다중 접근방식이 단일 논문에서 결합하여 사용된다

  • 셋째로, 과학이 사용하는 복잡성의 유형은 암묵적으로 방치되는 경향이 있다. 

  • 째, 사용되는 복잡성 방향은 일차 소스 인용보다는 이차 소스 인용문을 사용하는 것이 훨씬 일반적이다.

During our analysis, we identified four patterns in the use of complexity theories in medical education research. 

Firstly, complexity principles are described in a variety of ways. 

Secondly, multiple approaches to complexity are used in combination in single papers. 

Thirdly, the type of complexity science used tends to be left implicit. 

Fourthly, the complexity orientation used is much more commonly located using secondary source citation rather than primary source citation.


우리의 분석은 의료 교육 연구에서 복잡성 아이디어가 설명되어 온 다양한 방법을 보여준다. 일부 출판물은 그것의 기본 원칙이나 개념을 전혀 언급하지 않고 복잡성 과학을 유발한다. 예를 들어, 한 연구는 주치의의 역할에 대한 사고방식으로 복잡성 과학을 제시했지만, 역할에 적용될 수 있는 복잡성의 구체적인 원리에 대한 자세한 설명은 제공하지 않았다.44

Our analysis shows a variety of ways in which complexity ideas have been described in medical education research. Some publications invoke complexity science without making any mention of its basic principles or concepts. For instance, one study offered complexity science as a way of thinking about the role of the attending physician preceptor, but provided no elaboration of the specific principles of complexity that might apply to the role.44


다른 출판물들은 원리에 대하여 구어적colloquial 설명을 사용하면서 복잡성 과학을 묘사했지만, 그것들을 라벨로 표시하지는 않았다. 예를 들어 리더십에 대한 연구에서는 자기 조직화, 출현 및 피드백에 대한 개념이 예시를 통해 효과적으로 설명되었지만, 이러한 개념을 이론적 뿌리에 고정시키기 위한 명시적인 라벨링은 제공되지 않았다.45

Other publications described complexity science by using colloquial explanations of its principles, but not labelling them. For instance, in a study on leadership, notions of self-organisation, emergence and feedback were effectively illustrated through exemplars, but no explicit labelling was provided to anchor these notions to their theoretical roots.45


다른 경우에 복잡성 원칙은 맥락을 제공하기 위하여 라벨을 붙였지만 정의는 제공되지 않았다. 예를 들어, 시뮬레이션 교육을 알리기 위한 복잡성 이론의 사용에 대한 해설에는 관련 복잡성 원리의 목록이 포함되었지만 정의를 제공함으로써 자세히 설명하지는 않았다.39

In other instances, complexity principles were labelled to provide context but no definitions were provided. For instance, a commentary on the use of complexity theory to inform simulation education included a list of the relevant complexity principles but did not elaborate by providing definitions.39


마지막으로, 일부 간행물은 어떤 복잡성 원리를 선택하고 그 정의를 사용하여 현상을 설명했지만, 더 큰 복잡성 원리는 언급하지 않았다. 예를 들어, 한 논문에서는, 보건의료에서 리더십이 제정되는 방법의 역학관계를 설명하기 위해 등장 원리가 전초적으로 제시되었지만, 자기 조직화와 같은 다른 잠재적으로 관련이 있는 원칙은 언급되지 않았다.

Finally, some publications chose some complexity principles and used their definitions to illustrate a phenomenon, but did not mention the larger constellation of complexity principles. For instance, in one paper, the principle of emergence was foregrounded to describe the dynamics of how leadership is enacted in health care,46 but other potentially relevant principles such as self-organisation were not mentioned.


비록 우리는 만손의 프레임워크의 도움으로 많은 논문의 복잡성 방향을 유추할 수 있었지만, 이것들은 대부분 암묵적이었고 종종 방향성의 조합 패턴을 반영했다. 많은 출판물은 하나 이상의 이론적 방향을 암시하는 키워드나 언어를 사용했지만, 그 방향에 명시적으로 라벨을 붙이지 않았다.

Although we were able to infer many papers’ complexity orientations with the assistance of Manson’s framework,22 these were mostly implicit and often reflected a pattern of combination of orientations. Many publications used keywords or language suggestive of one or more theoretical orientations, but did not explicitly label that orientation.


다른 출판물들은 특정한 목적을 명시하지 않고 [복수의 오리엔테이션]을 반영하는 참고문헌을 인용했다. 예를 들어, 검토 논문은 임상적 맥락의 개념을 문제화하기 위해 서로 다른 방향의 주요 출처를 인용했다.48

Other publications cited references reflective of multiple orientations without explicitly indicating their particular purpose. For instance, a review paper cited primary sources from different orientations to problematise the notion of clinical context.48


우리는 또한 복잡한 과학을 사용하는 의학 교육 논문에서 인용의 두 가지 특징에 주목했다. 첫째로, 2차 출처는 1차 출처보다 더 일반적으로 인용되었다. 데이터 집합의 몇몇 논문 41,43,49–51은 복잡성의 정의에 대한 지원으로 2001 The BMJ series24 및 2011년 의학 교육 토론과 같은 독창적인 개념을 요약하고 개작한 논문을 인용했다. 2000년 이전부터 소수의 논문만이 1차 출처를 사용했다는 사실은 1차 출처와의 불충분한 관계를 시사한다. 둘째로, 인용문은 저자들이 복잡성 과학을 사용하는 방식에 항상 적절하거나 정확한 것은 아니었다.

We also noted two features of citation in medical education papers using complexity science. Firstly, secondary sources were cited more commonly than primary sources. Several papers41,43,49–51 in our dataset cited papers that summarised and adapted original concepts, such as the 2001 The BMJ series24 and the 2011 Medical Education debate,52,53 as support for their definitions of complexity. The fact that only a few papers used primary sources from before 200048,50,54 suggests insufficient engagement with primary sources. Secondly, citations were not always appropriate or accurate for the ways in which the authors were using complexity science.


이 사용의 의미는 무엇인가?

WHAT ARE THE IMPLICATIONS OF THIS USE?


우리는 네 가지 패턴을 개별적으로 설명했지만, 그것들이 서로 얽히고 상호 지지될 수 있다고 주장할 것이다. 복잡성 과학에 대한 그들의 접근방법에 대해 명시적인 저자는 거의 없으며, 이것은 부분적으로 왜 의료 교육 연구자들이 그것을 취하는 방식에 그러한 변화가 있는지 설명할 수 있다. 더욱이, 이러한 암묵성implicitness은 인식론적 일관성이 저자나 독자에게 즉각적으로 드러나지 않고 서로 다른 접근법을 결합할 수 있다는 것을 의미한다. 더욱이, 2차 원천 인용의 우위는 복잡성 지향 간의 구분을 더욱 모호하게 하며, 암묵적, 때로는 내부적으로 일관되지 않는 접근방식을 결합하여 허용한다.

We have described the four patterns individually, but we would argue that they may be entangled and mutually supporting. Few authors are explicit about their approach to complexity science, which may in part explain why there is such variation in the ways medical education researchers are taking it up. Furthermore, this implicitness means that different approaches can be combined without epistemological incoherence becoming immediately apparent to authors or readers. Moreover, the predominance of secondary source citation further obscures distinctions between complexity orientations and allows the implicit, and sometimes internally inconsistent, combining of approaches to persist.


그 자체로 다양성이 반드시 문제가 되는 것은 아니다. 우리가 서론에서 설명했듯이, 17 카스텔라니19와 맨슨, 22개의 복잡성 과학은 다중이다. 여러 학문에서 생겨났고, 그 지속적인 진화는 교차 훈련 수정에 의해 형성되기 때문에 그것의 기원을 식별하는 것은 간단하지 않다. 따라서 우리는 의학교육학자들이 일치시키는 특정한 복잡성 과학 접근법이나 혈통에 따라 복잡성 과학의 다양한 응용을 기대할 수 있을 것이다.

Variety in and of itself is not necessarily problematic. As we explained in the introduction, drawing on Mitchell,17 Castellani19 and Manson,22 complexity science is multiple. It is not straightforward to identify its origins because it emerged from multiple disciplines and its continued evolution is shaped by cross-discipline fertilisation. Therefore, we would expect to see a variety of applications of complexity science depending on the particular complexity science approach or lineage that medical education scholars align with.


그러나 무의식적인 다양성은 문제가 있다. 본 표본의 의학교육 논문이 복잡성 과학을 한 가지 방법으로 사용하는 명백한 선택을 거의 인정하지 않았다는 사실은 다음과 같은 질문을 던진다. 

우리 분야의 학자들은 복잡성 과학에 대해서 [특정한 학문적 기원에서 파생되어, 다른 은유에 의존하고 뚜렷한 목적을 가지고 있는] 여러 가지 합법적인 지향이 있다는 것을 이해하고 있는가

However, unconscious variety is problematic. That the medical education papers in our sample rarely acknowledged an explicit choice to use complexity science in one way versus another begs the question: 

Do scholars in our field understand that there are multiple legitimate orientations to complexity science, deriving from particular disciplinary origins, drawing on different metaphors and serving distinct purposes?


복잡성 과학이 복합적이라는 의식의 부재는 우리 분야를 연달은 문제적 결과로 만든다. 

  • 첫째로, 우리는 복잡성 과학이 특이하다고 가정할 수 있다: 즉, 그것을 할 수 있는 방법은 오직 하나뿐이다. 

  • 둘째로, 복잡성 과학이 단수적이라는 가정은 우리가 우리의 방식을 '올바른' 방법으로 인식하게 하고 다른 접근법을 부당한 것으로 무시하게 할 수 있다

  • 셋째로, 부당성illegitimacy에 대한 이러한 인식은 우리의 복잡성 과학에서 영감을 받은 연구에 대해 서로 생산적인 대화를 할 수 있는 우리의 능력을 제한할 수 있다.

An absence of conscious appreciation that complexity science is multiple sets our field up for a cascade of problematic consequences. 

  • Firstly, we may assume that complexity science is singular: that is, there is only one way to do it. 

  • Secondly, the assumption that complexity science is singular may cause us to perceive our way as the ‘right’ way and to disregard other approaches as illegitimate. 

  • Thirdly, this perception of illegitimacy may limit our ability to enter into productive dialogue with one another about our complexity science-inspired research.


보건과학과 의학교육의 최근 두 토론이 그 예다. 각각의 토론은 복잡성 과학의 부당한 사용에 대한 비난에 초점을 맞췄다.

Two recent debates in the health sciences and medical education are illustrative. Each debate centred on an accusation of the illegitimate use of complexity science.


[건강과학 논쟁]에서, 팰리는 '건강관리 문헌에서 일반적으로 복잡성이 해석되는 방법은 복잡성 이론의 모든 요점을 놓치고 있다'고 주장하면서, 건강 연구자들에 의한 복잡성 과학의 '전유appropriation'를 비난했다.56 페일리는 '수학적 개념을 심리학화psychologising'하거나 '자기조직화를 다른 것으로 재해석하는' 유혹에 빠진 사람들을 바로잡을 '과격한 수정'을 요구했다. 

In the health sciences debate, Paley decried the ‘appropriation’ of complexity science by health researchers, claiming that ‘the way in which complexity is usually interpreted in the health care literature misses the whole point of complexity theory’.56 Paley called for ‘a radical amendment’ that would correct those who ‘succumb to temptation[s]’ such as ‘psychologising mathematical concepts’ and ‘reinterpret[ing] “self- organisation” [to] make it mean something else’.56


[의학 교육 논쟁]에서 노르만52는 의료 교육 현상을 묘사하기 위해 '복잡성'과 '카오스'라는 용어를 사용하는 것에 반대했다. 그는 '정확히 하는 것이 반드시 필요하다'고 주장하면서 '카오스라는 단어는 어떻게든 우리 주변의 세계에서 우리가 관찰하는 복잡성에 대한 설명을 제공해 준다는 것을 상상하는 것은 호소력이 있지만 (교육에서의 발생을 설명하는 은유로서 우리가 그것을 사용한다면) 물리적 이론으로서의 '카오스'는 매우 구체적인 조건들을 가지고 있다.' 라고 경고했다. 

In the medical education debate, Norman52 objected to the use of the terms ‘complexity’ and ‘chaos’ to describe medical education phenomena. Asserting that ‘it is imperative to get it right’, he cautioned that ‘although it is appealing to envision that chaos somehow affords an explanation for the complexities we observe in the world around us (particularly if we use it as a metaphor by which to explain occurrences in education), chaos as a physical theory has some very specific conditions’.52


Paley56과 Norman52 둘 다 복잡한 과학을 사용하는 학자들이 자신의 용어를 신중하게 정의해야 할 필요성에 주목했다. 또한, 그들은 복잡성 과학을 단수라고 보기 때문에 - Paley는 수학적 과학으로, Norman은 물리 과학으로 - 두 저자는 그러한 용어를 사용하는 단 하나의 올바른 방법을 주장하였다.

Both Paley56 and Norman52 drew attention to the need for scholars using complexity science to define their terms carefully. Further, because they viewed complexity science as singular – for Paley a mathematical science and for Norman a physical science – both authors asserted a single correct way to use those terms.


복잡한 과학을 불법적으로 사용했다는 이러한 비난에 대해 그린할그 외 연구진 57명과 레게르53은 용어의 정밀성이 중요하다는 데 동의했다. 그러나 그들은 또한 복잡성 과학 개념을 보건 서비스와 교육 환경에서 현상을 설명하기 위해 적용할 수 있고 적용되어야 한다고 주장했다.

Responding to these accusations that they had used complexity science illegitimately, Greenhalgh et al.57 and Regehr53 both agreed that precision of terms is important. However, they also insisted that complexity science concepts can and should be adapted to explain phenomena in health services and education settings.


노먼에 대한 대응에서, 52 Regehr는 '설명이란 간단해야 한다거나 의미가 있을 수 없다는 생각을 당연시하는 이분법적 방식'에 도전하는 것으로 보이는 [의학 교육에서 복잡성 과학의 인식론적 입장]이 가치 있다고 주장했다.53 그러나, 그는 또한 의료교육이 복잡하다는 걸 보여주기 위한 시도에서 '유추analogies를 지나치게 밀어붙이는 것은 위험이 있다'고 인정했다. 

In his response to Norman,52 Regehr maintained that the epistemological stance of complexity science is valuable in medical education for challenging ‘a dichotomy that appears to take for granted the idea that a description must be simple or it cannot be meaningful’.53 However, he also acknowledged that ‘there is danger in pushing analogies too far’53 in an attempt to show that medical education counts as complex.


두 토론 모두 이 토론에 익숙하지 않은 추가적인 뉘앙스를 포함하고 있다. 우리는 주로 두 가지 점을 설명하기 위해 그것들을 사용한다. 

  • 첫째로, 토론에 임하는 사람들이 [복잡성 과학이 단수인지 다중인지]라는 근본적인 전제에 대해서 동의하지 않을 때, 학문적 토론이 생산적이 되기는 어렵다(즉, 그 분야에 대한 새로운 통찰력을 도출하는 것). 이 근본적인 전제에서 합의 없이, 그리고 사실, 이 의견의 불일치가 문제의 일부로서 명백하게 제시되지 않는 한, 이러한 논쟁들은 극명하게 반대적인 어조를 띠며, 그 누구도 그 어떤 것에도 대해 납득시킬 수 있는 것은 분명하지 않다. 

  • 째로, 복잡성이 복합적이라는 것을 받아들이면, 용어의 정확한 사용은 덜 필요하기는커녕 오히려 더 필요하다.

Both debates contain additional nuances not germane to this discussion. We use them primarily to illustrate two points. 

  • Firstly, it is difficult for a scholarly debate to be productive (i.e. to result in new insights for the field) when those in the debate disagree on a fundamental premise: whether complexity science is singular or multiple. Without agreement on this fundamental premise – and in fact, without the disagreement being explicitly tabled as part of the problem– these debates take on a starkly oppositional tone and it is not clear that anyone manages to convince anyone else of anything. 

  • Secondly, if we accept that complexity is multiple (and we align with Mitchell,17 Castellani,18,19 Manson23 and others in taking this position), the precise use of terms is more, rather than less, necessary.


Kenneth Burke가 지적했듯이, '모든 보는 방법은 보지 않는 방법이다'.58 따라서, 복잡성 과학은 의학 교육 연구원들에게 많은 강력한 시각 방법을 제공한다; 그 중 하나를 선택할 때, 우리는 연구 중인 현상의 어떤 측면에 주의를 돌리고 다른 사람들로부터 주의를 돌린다. Manson과 같은 개념적 프레임워크의 가치는 [우리가 어떤 복잡성 오리엔테이션의 관점에서 어떤 교육 문제를 접근하고 있는지] 볼 수 있도록 이 과정을 가시화하는데 도움을 줄 수 있다는 것이다.

As Kenneth Burke pointed out, ‘every way of seeing is a way of not seeing’.58 Hence, complexity science offers medical education researchers many powerful ways of seeing; in choosing among them, we direct attention to some aspects of the phenomenon under study and deflect attention fromothers. The value of conceptual frameworks such as that of Manson22 is that they can help make visible this process, allowing us to see which education problems we are approaching from which complexity orientations.


우리는 의학교육 연구자들이 복잡성 과학으로부터 어떤 개념과 도구를 끌어내고 있는지, 왜 그러한 도구들이 그것들에 공명하는지, 그리고 그들이 성취한 통찰력에 대한 선택들의 함의에 대해 생각해보도록 장려할 것이다. 인용문과 키워드에 대한 우리의 분석은 우리의 표본에 있는 대부분의 논문들이 Manson의 총체적인 방향을 반영하였다는 것을 추론할 수 있게 해주었지만, 22 우리는 이 방향이 목적적이었는지 알 수 없으며, 또한 그것이 항상 바람직하다고 주장할 수도 없다. 복잡성에 대한 총체적인 접근방식은 사회현상에 영향을 주며, 확실히 많은 교육관행은 매우 사회적이다. 그러나 모든 것이 그렇지는 않다

  • 복잡성에 대한 알고리즘 접근방식은 실험실의 인지 연구와 관련이 있을 수 있으며, 

  • 복잡성에 대한 결정론적 접근방식은 특정 모의 훈련 개입을 검사하는 강력한 렌즈를 나타낼 수 있다.

We would encourage medical education researchers to think about which concepts and tools they are drawing from complexity science, why those tools resonate with them, and the implications of their choices for the insights they achieve. Although our analysis of citations and keywords allowed us to infer that most papers in our sample reflected Manson’s aggregate orientation,22 we cannot know whether this orientation was purposeful and nor would we assert that it is necessarily always preferable. Aggregate approaches to complexity lend themselves to social phenomena, and certainly many education practices are intensely social. However, not all of them are: 

  • algorithmic approaches to complexity may be relevant for studies of cognition in the laboratory, and 

  • deterministic approaches to complexity may represent powerful lenses through which to examine certain simulated training interventions.


우리는 의료교육에서 복잡성 과학의 이론적 가져오기를 현장에서 '방법론적 수입methodological importing'를 지원하기 위해 Varpio 등이 제공한 전략을 사용하여 개선할 것을 권고한다.60 그들은 [방법론의 개념과 도구가 방법론을 개발한 분야에서 방법론을 주로 알 수 없는 분야로 이전될 때] 방법론적 수입이 발생하는 것으로 기술하였다.

We recommend that the theoretical importing of complexity science in medical education could be improved using the strategies offered by Varpio et al. to support ‘methodological importing’ in the field.60 They described methodological importing as occurring when a methodology’s concepts and tools are transferred from a field in which the methodology was developed to a field in which the methodology is largely unknown.60 


그러한 수입은 도전적인 문제를 새롭고 다각적인 방법으로 탐구하는 강력한 학문적 접근법이다. 그러나, 수입의 위험은 원래 접근법의 기초적인 조건을 누락할 수 있다는 것이다. 이러한 위험에 대처하기 위해, 우리는 연구자들이 주요 출처와 관계를 맺고 개념이나 용어 사이의 긴장을 인정하려는 의식적인 노력을 포함해야 하는 상당한 [정당화 작업]에 참여해야 한다는 Varpio 외 연구원의 권고를 반영할 것이다.

Such importing is a powerful scholarly approach to exploring challenging problems in new and multifaceted ways. However, a risk of importing is that the foundational conditions of the original approach may be left behind.60 To counteract this risk, we would echo Varpio et al.’s60 recommendation that researchers engage in considerable justification work, which, we would argue, should include a conscious effort to engage with primary sources and to acknowledge tensions among concepts or terms.



35 Kuper A, D’Eon M. Rethinking the basis of medical knowledge. Med Educ 2011;


36 Norcini JJ, Banda SS. Increasing the quality and capacity of education: the challenge for the 21st century. Med Educ 2011;


43 Jorm C, Roberts C. Using complexity theory to guide medical school evaluations. Acad Med 2018; 93 (3):399–405.








. 2019 Jan;53(1):95-104.
 doi: 10.1111/medu.13651. Epub 2018 Oct 10.

What is the state of complexity science in medical education research?

Affiliations 

Affiliations

  • 1Centre for Education Research and Innovation, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.
  • 2Department of Surgery, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.
  • 3Faculty of Education, University of Western Ontario, London, Ontario, Canada.
  • 4Department of Women's Studies and Feminist Research, Faculty of Arts and Humanities, University of Western Ontario, London, Ontario, Canada.
  • 5Department of Medicine, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.

Abstract

Context: 'Complexity' is fast becoming a 'god term' in medical education, but little is known about how scholars in the field apply complexity science to the exploration of education phenomena. Complexity science presents both opportunities and challenges to those wishing to adopt its approaches in their research, and debates about its application in the field have emerged. However, these debates have tended towards a reductive characterisation of complexity versus simplicity. We argue that a more productive discussion centres on the multiplicity of complexity orientations, with their diverse disciplinary roots, concepts and terminologies. We discuss this multiplicity and use it to explore how medical education researchers have taken up complexity science in prominent journals in the field.

Methods: We synthesised the health sciences and medical education literature based on 46 papers published in the last 18 years (2000-2017) to describe the patterns of use of complexity science in medical education and to consider the consequences of those patterns for our ability to advance scholarly conversations about 'complex' phenomena in our field.

Results: We identified four patterns in the use of complexity science in medical education research. Firstly, complexity science is described in a variety of ways. Secondly, multiple approaches to complexity are used in combination in single papers. Thirdly, the type of complexity science used tends to be left implicit. Fourthly, the complexity orientation used is much more commonly located using secondary source citation rather than primary source citation.

Conclusions: The presence of these four patterns begs the question: Do medical education scholars understand that there are multiple legitimate orientations to complexity science, deriving from distinct disciplinary origins, drawing on different metaphors and serving distinct purposes? If we do not understand this, a cascade of potential consequences awaits. We may assume that complexity science is singular in that there is only one way to do it. This assumption may cause us to perceive our way as the 'right' way and to disregard other approaches as illegitimate. However, this perception of illegitimacy may limit our ability to enter into productive dialogue about our complexity science-inspired research.

아는 것 만으로는 충분하지 않다: 지식, 힘, 생성적영역(Educational Researcher, 2012)

To Know Is Not Enough: Knowledge, Power, and the Zone of Generativity

Arnetha F. Ball1



올해 연례 회의 주제인 "Non Satis Scire: '아는 것 만으로는 부족하다'는 회원들 간의 대화를 유도하고, 우리 조직의 삶과 미래에 있어 이 시점에서 특히 시의적절한 질문을 이끌어내기 위해 선택되었다.

This year’s annual meeting theme, “Non Satis Scire: To Know Is Not Enough,” was selected to invite dialogue among the membership as well as to elicit—and perhaps address—questions that are particularly timely at this juncture in the life and future of our organization.


이러한 질문에 대한 한 가지 대답은 세자르 차베스가 "모든 지식의 목적은 반드시 타인에 대한 봉사가 되어야 한다"고 결론내렸을 때 제공되었다(The WRITE Institute, 2001). 이 기사는 올해 연례 회의 주제와 관련된 문제들을 고려할 때 고려해야 할 몇 가지 관점뿐만 아니라 이러한 질문들에 대한 몇 가지 추가적인 답변을 제공한다. 이어지는 페이지에 제시된 목소리는 지식 추구를 위한 개인 및 집단적 목표뿐만 아니라 이 조직의 명시적 사명을 반영한다. 독자들이 이 글에서 대표되는 목소리와 관점에 관여하는 만큼 회원들이 '아는 것 만으로는 충분하지 못하다'는 말의 의미와 중요성에 대해 개인적으로 성찰하는 계기로 삼기를 부탁드린다.

One response to these questions was provided by Cesar Chavez when he concluded that “the end of all knowledge should surely be service to others” (The WRITE Institute, 2001). This article provides some additional responses to these questions as well as some perspectives that should be considered when contemplating issues related to this year’s Annual Meeting theme. The voices represented in the pages that follow reflect on the stated mission of this organization as well as on individual and collective goals for the pursuit of knowledge. As readers engage with the voices and perspectives represented in this article, I ask that members use this as an opportunity to personally reflect on the meaning and importance of the statement “to know is not enough.”


AERA 미션에 명시된 바와 같이, 우리 조직의 목표는

As stated in the AERA mission, the goal of our organization is to


교육에 대한 지식을 향상시키고, 교육과 관련된 학문적 연구를 장려하며, 교육을 개선하고 공익을 위해 연구 이용을 촉진한다.

advance knowledge about education, encourage scholarly inquiry related to education, and promote the use of research to improve education and serve the public good.


이 사명 선언문은 세 가지 상호 관련 부분이 있다. 본 논문은 주로 교육을 개선하고 공공의 이익을 위해 연구를 사용하는 것을 촉진하기 위해 우리 임무의 세 번째 부분에 초점을 맞추고 있다.

This mission statement has three interrelated parts. This paper focuses primarily on the third part of our mission, to promote the use of research to improve education and serve the public good.


조직의 역사 인식: 몇 가지 관찰

Situating Our Organization Historically: A Few Observations


지식-수행 격차에 관한 연구

Explanations Concerning the Knowing–Doing Gap


미국뿐만 아니라 전 세계적으로 연구-실무 또는 실행-실행 공백이 존재하는 이유에 대해 많은 설명이 제공되었다(Broekkamp & van Hout-Wolters, 2007; Fuhrman, 2001; Walters et al. 설명은 다음과 같다.

A number of explanations have been offered concerning why the research–practice or knowing–doing gap exists (Broekkamp & van Hout-Wolters, 2007; Fuhrman, 2001; Walters et al., 2009), not only in the U.S. but across the globe. Explanations include the following:


  • 1. 연구 보고서의 접근 불가능

  • 2. 전문적 규범과 실무자 및 정책 입안자가 연구 결과를 상담하고 활용할 수 있는 시간의 부족

  • 3. 교육 실무자와 정책 입안자는 연구를 거의 수행하지 않는다.

  • 4. 교육 실무자, 정책 입안자 및 연구자 간의 동등한 협력을 위한 포럼의 부재

  • 5. 수전 퍼먼이 지적한 바와 같이, "연구는 종종 정책의 새로운 방향을 정하는 것보다 이미 취해진 정치적 입장을 정당화하는 데 이용된다." 그리고 다른 사람들이 지적했듯이, 연구는 정책을 정당화하는 데 이용되기 위해서 표준적인 과학적 요구 조건을 통과시킬 필요도 없다.

1. the inaccessibility of research reports;

2. a lack of professional norms and time for practitioners and policy makers to consult and use research findings;

3. educational practitioners and policy makers very rarely carry out the research;

4. a lack of a forum for equal collaboration between educational practitioners, policy makers, and researchers; and

5. as Susan Furman has noted, “Research is often used to justify political positions already taken rather than to set a new direction for policy.” And as others have noted, research does not even need to pass standard scientific muster in order to be used to justify policies.


이러한 현실은 정책 수립의 정치적 본질을 부각시킨다. 지식-실무 격차라고도 하는 지식-실무 격차는 교육 분야만의 과제가 아니다. 다른 분야와 영역에서도 "아는 것 만으로는 충분하지 않다"고 인식하고 그들 역시 그 격차를 해소하기 위해 노력하고 있다. 피퍼와 서튼(2000년)은 재계에서 똑똑하거나 읽고, 듣고, 생각하고, 어려운 현상에 대해 글을 쓰는 것만으로는 충분하지 않다는 결론을 내렸다고 말한다. 홀푸드, 스타벅스, 나이키와 같은 가장 성공적인 사업체들은 단지 사업 관행을 연구하는 것 이상의 것을 할 필요가 있다는 것을 발견했다. 그들은 축적된 지식으로 무언가를 할 필요가 있었다. 그 깨달음은 "저스트 두 잇"이라는 유명한 구절에서 포착되었다. Pfeffer와 Sutton은 또한 "알고 있는-행위의 격차를 줄이는" 것을 중시하고 보상한 CEO들이 그것을 닫을 가능성이 더 높고 그렇게 하는데 더 성공적이라는 것을 발견했다. 

This reality highlights the political nature of policy making. The knowledge–practice gap, which I also refer to as the knowing–doing gap, is not a challenge unique to the field of education. Other disciplines and domains recognize that “to know is not enough” and they, too, are working to address the gap. Pfeffer and Sutton (2000) tell us that in the business world, they have concluded that being smart or reading, listening to, thinking, and writing about a challenging phenomenon is not enough. The most successful business firms—like Whole Foods, Starbucks, and Nike—found that they needed to do more than just research business practices. They needed to do something with the knowledge they accumulated. That realization has been captured in the well-known phrase “Just do it!” Pfeffer and Sutton also found that those CEOs who valued and rewarded “closing the knowing–doing gap” were more likely to close it and more successful in doing so. 


의학으로 간단히 돌아보면, 연구에 기반을 둔 "이중 맹목적인 임상시험" (Lechat 등, 1998)은 의료 관행에 혁명을 일으켰고, 효과적인 신약 치료법의 식별과 후속 채택으로 이어졌다는 것을 알게 된다. 최근 몇 년 동안, 또 다른 형태의 의학 연구가 등장했는데, 바로 중개연구였다. 중개연구는 연구를 실제 실행으로, 즉 새로운 치료법과 연구지식이 실제로 그들이 의도하고 올바르게 구현된 환자나 모집단에 도달하도록 보장하는 것을 말한다(Woolf, 2008). 의사와 과학자의 모자를 쓰고 다학제, 다학제, 다학제 팀의 학술 보건소에서 일하는 개인에 의해 중개연구가 점점 더 이루어지고 있다. 이러한 의사-과학자들은 지식-실무 격차에 훨씬 더 큰 영향을 미치기 위해 연구를 실험실에서 치료 지점으로 이동시킨다. 연구와 협업 문화를 수행하기 위해 개발된 새로운 구조의 결과, 의학의 분야가 변화되었다.

Turning briefly to medicine, we find that research-based “double-blind clinical trials” (Lechat et al., 1998) revolutionized medical practice and led to the identification and subsequent adoption of effective new drug therapies. In recent years, another type of medical research has emerged: translational research. Translational research refers to translating research into practice, that is, ensuring that new treatments and research knowledge actually reach the patients or populations for whom they are intended and are implemented correctly (Woolf, 2008). Increasingly, translational research is being conducted by individuals who wear the hat of both physician and scientist and who work for academic health centers in multidisciplinary, multiskilled teams. These physician-scientists move research from the laboratory to the point of care in an effort to have an even greater impact on the knowledge–practice gap. As a result of new structures that have been developed for conducting research and cultures of collaboration, the field of medicine has been transformed.


지식-수행 격차 해소 모델

Models for Addressing the Knowledge–Doing Gap


연구 문헌에는 교육에서의 지식-행위의 격차(연구-실무 격차라고도 함)를 해소하기 위해서는 연구자, 정책 입안자, 실무자 간의 더 많은 협력이 필요하다는 공감대가 있다(Broekkamp and van HoutWolters, 2007; Hallennan, 1996; Towne, Wise, 2004; Vanderline & Van Braak, 2010). 교육에서의 연구-실무 격차에 관한 문헌을 검토하면 그 격차 문제를 해결할 수 있는 방법에 대한 실무적 가정이 드러난다. 브로크캄프 및 밴 후트 월터스(2007)는 확인된 네 가지 유형의 접근방식의 모델을 제공한다. 이 네 가지 모델은 다음과 같다.

There is some consensus in the research literature that to address the knowing–doing gap (also referred to as the research–practice gap) in education, more cooperation is needed among researchers, policy makers, and practitioners (Broekkamp and van HoutWolters, 2007; Hallinan, 1996; Towne, Wise, & Winters, 2004; Vanderline & Van Braak, 2010). A review of the literature regarding the research–practice gap in education reveals working assumptions about how the gap can be addressed. Broekkamp and van Hout-Wolters (2007) provide models of four types of approaches that have been identified. Those four models are as follows:


1. 연구개발 확산모형

2. 증거 기반 실행 모델

3. 경계-교차 프랙티스 모델 및

4. 지식 커뮤니티 모델

1. The Research Development Diffusion Model

2. The Evidence-Based Practice Model

3. The Boundary-Crossing Practices Model, and

4. The Knowledge Communities Model



[연구 개발 확산 모델]은 지식 생산의 위계를 반영하고 있으며, 이는 결국 실천의 개선을 이끌 수 있다. 이 모델을 바탕으로 실무 중심의 연구자들은 이론과 보다 상류에서 기초 연구자들에 의해 생산된 탈맥락화된 연구에서 도움을 받는다. 이 모델의 핵심은 [중재자]가 연구와 실천 사이의 필수적인 연결고리라는 것이다. 이 모델에서 mediator의 기능은 연구 내용을 실무자가 맡을 수 있는 보고서, 정책, 교재, 전문 개발 프로그램으로 번역하는 것이다.

The Research Development Diffusion Model reflects a hierarchy of knowledge production that can eventually lead to improved practice. Drawing on this model, practice-oriented researchers draw on theories and decontextualized research produced by basic researchers further upstream. A key point to this model is that Mediators are the integral link between research and practice. The function of Mediators in this model is to translate research into reports, policies, teaching materials, and professional development programs that can be taken up by practitioners.


[근거 기반 실천 모델]은 그 차이를 어떻게 해결해야 하는지에 대한 교육 및 작업 가정의 연구-실무 격차에 관한 또 다른 관점을 반영한다. 이 모델은 메디케이터가 다시 한번 연구와 실무를 연결하는 중심적 역할을 한다는 점에서 이전 모델과 매우 유사하다. 이 근거 기반 실천 모델과 이전 연구 개발 확산 모델의 주요 차이점은 [연구 개발 확산 모델은 개념 체계, 서술적 연구, 학습 과제 등 다양한 연구 결과를 중요시]하는 반면, 이 [근거 기반 실천 모델은 주로 경험적 증거를 중시]한다는 것이다. 그것은 무작위화된 실험 설계의 결과물이다. 다시 말하지만, Mediators는 효과적인 연구에서 발견한 것을 실천으로 옮기는 데 중요한 역할을 한다. 이 모델 내에서, 중재자의 역할은 출판된 교육 관행과 자료를 검토하여, 교육에서 무엇이 효과적이거나 "무엇이 효과가 있는지"를 결정하는 것이다. 그런 다음 실무자들은 "효과적인 것으로 입증된" 방법을 사용한다.

The Evidence-Based Practice Model reflects another perspective regarding the research–practice gap in education and working assumptions for how the gap should be addressed. This model is very similar to the previous model in that Mediators, once again, play a central role in linking research and practice. The key difference between this Evidence-Based Practice Model and the previous Research Development Diffusion Model is that the Research Development Diffusion Model values diverse research results, such as conceptual frameworks, descriptive research, and learning tasks, whereas this Evidence-Based Practice Model primarily values empirical evidence that is a result of randomized experimental designs. Again, the Mediators serve a critical role in translating findings from effective research into practice. Within this model, the role of Mediators is to review published educational practices and materials and determine what is effective or “what works” in education. Practitioners then make use of methods that have been “proven to be effective.”


[경계-교차 관행 모델]은 그 차이를 어떻게 해결해야 하는지에 대한 교육 및 작업 가정의 연구-실무 격차에 관한 세 번째 관점을 반영한다. 이 모델과 다음 모델은 연구가 교육 관행으로 해석되도록 하는 데 있어 협동의 중요성을 강조한다. 그러나 이 경계-교차 관행 모델의 독특한 점은 [중재자의 역할이 축소]되고 연구가 연구원, 실무자, 정책 입안자의 모호한 역할을 통해 실천으로 해석된다는 점이다. 이러한 역할은 이러한 영역에 걸쳐 복수 살해된 한 사람에 의해 동시에 수행될 수 있으며, 예를 들어, 연구자는 교직에 종사할 수 있고 개업자는 연구의 설계와 수행에 종사할 수 있다.

The Boundary-Crossing Practices Model reflects a third perspective regarding the research–practice gap in education and working assumptions for how the gap should be addressed. This model and the next model emphasize the importance of collaboration in ensuring that research translates to educational practice. However, what is unique about this Boundary-Crossing Practices Model is that the role of the Mediator is diminished and research translates to practice through the blurred roles of researchers, practitioners, and policymakers. These roles can be carried out simultaneously by one person who is multiskilled across these areas or, for example, a researcher can engage in teaching and a practitioner can engage in the design and conduct of research.


[지식 공동체 모델]은 그 차이를 어떻게 해결해야 하는지에 대한 교육 및 작업 가정에서의 연구-실무 격차에 관한 네 번째 관점을 반영한다. 이 모델은 이전 모델과 마찬가지로 협업을 중시한다. 그러나, 지식 공동체 모델에서는 [연구자-실행자-정책개발자]의 역할을 모호하게 하는 대신, 다양한 행위자들이 교육적 문제를 해결하기 위하여 지식 교환의 파트너십이나 네트워크에 상호 관여함에 따라 전통적인 역할(구분)이 유지된다. 아래의 그림 1은 이 네 가지 모델을 나타낸다.

The Knowledge Communities Model reflects a fourth perspective regarding the research–practice gap in education and working assumptions for how the gap should be addressed. This model, like the previous model, values collaboration; however, instead of blurring the roles of researcher–practitioner– policymaker, in the Knowledge Communities Model, traditional roles are maintained as a diverse group of actors are mutually engaged in a partnership or network of knowledge-exchange as they work to address an educational issue. Figure 1 below provides representations of these four models.



생성적이라는 것은 무엇을 의미할까?

What Does It Mean To Be Generative?


에릭 에릭슨의 정신사회 발전 이론의 7단계에 따르면, 생성성은 우리가 우리를 지속시킬 것들을 창조하거나 육성하기 위해 노력하는 단계다; 우리는 다른 사람들에게 이익이 되는 긍정적인 변화에 기여하기 위해 노력한다. 파워power으로서의 지식은 우리가 세상을 더 나은 곳으로 만드는 데 도움이 되는 지식을 만들 때 발생한다. 그렇지 않은 사람들은 일반적으로 [침체 영역zone of stagnation]에 들어가는데, 침체는 기여할 수 있는 방법을 찾지 못한 것을 말한다.

According to the seventh stage of Erik Erikson’s theory of psychosocial development, generativity is a stage in which we strive to create or nurture things that will outlast us; we strive to contribute to positive changes that benefit others. Knowledge as power occurs when we create knowledge that serves to make the world a better place. Those who do not, generally enter a zone of stagnation, where stagnation refers to the failure to find a way to contribute.


위에서 언급한 관찰에 근거하여, 우리는 지식-행위의 차이가 존재하고 분야와 직업에 걸쳐 만연하고 있음을 알고 있다. 우리는 또한 다른 분야와 직업들이 그 격차를 해소하는데 진전을 이루었다는 것을 알고 있다. 이것을 알고있기에 우리가 교육 연구의 지식 격차를 해소할 수 있다는 것을 더욱 확신하게 한다. 그러나 문제는 여전히 남아있다: 어떻게 해소할 것인가? 먼저 간극이 존재한다는 것을 인정하고 그 다음 우리는 아는-행위의 간극을 좁히도록 선택해야 한다고 제안한다.

Based on the observations noted above, we know that the knowing–doing gap exists and that it is pervasive across fields and professions. We also know that other fields and professions have made progress in addressing that gap. Knowing this makes us more convinced that we can address the knowing–doing gap in education research as well. But the question remains: How? I propose that first we must acknowledge that the gap exists and then we must choose to close the knowing–doing gap;


[생성성 영역]은 다음의 둘 사이의 거리를 구성하는 영역 또는 영역이다. 

  • 현재 연구 수행에 의해 [결정었다고 알려진 것] 

  • 교육 연구자가 연구 수행을 통해 배운 것을 응용(또는 응용을 촉진)할 수 있는 능력을 통해 [알 수 있는 잠재력이 있는 것]. 

The Zone of Generativity is the region or area that constitutes the distance between 

  • what is currently known as determined by the conduct of research and 

  • what education researchers have the potential to know through their ability to apply (or promote the application of) what they have learned through the conduct of research. 


그들의 [연구 지식]과 [그들 자신의 개인적인 지식]을 [연구 맥락에서 얻은 지식]과 결합시킴으로써, 연구자들은 그들의 지식을 교육 향상을 위한 노력에 적용하면서 생성될 수 있다. 연구자들이 하는 것을 통해 배우면서, 그들은 자기 반복적인 변화의 과정을 통해 다른, 더 경험적인 종류의 지식을 얻는다.

By combining their research knowledge and their own personal knowledge with the knowledge they gain from the research context, researchers can become generative as they apply their knowledge in efforts to improve education. As researchers learn through doing, they gain a different, more experiential kind of knowledge through a process of self-perpetuating change.


생성성의 영역

The Zone of Generativity


생성성 영역은 현재 지식 생성 수준에서 시작되며 4단계(그림 2)

The Zone of Generativity begins at our current level of knowledge creation and has four stages (Figure 2):


1. 반성 

2. 자성

3. 비평

4. 퍼스널 보이스

1. Reflection

2. Introspection

3. Critique

4. Personal Voice



첫 번째 단계는 교육 연구자 입장에서의 사려 깊은 성찰로, 이는 인식의 증가와, 어쩌면 아는 것으로는 충분하지 않다는 깨달음으로 이어진다(그림 3). 성찰은 우리의 연구 관행의 규칙적인 부분이 되어야 한다. 이런 질문을 던져야 한다. 내가 연구한 것과 관련된 관행을 알고 있는가? 내 연구의 소비자는 누구인가, 아니면 누가 될 것인가?"

The first stage is thoughtful reflection on the part of education researchers, which leads to increased metacognitive awareness and, perhaps, to the realization that to know is not enough (Figure 3). Reflection should become a regular part of our research practice. We should ask questions such as “Is this research making a difference? Am I aware of the practice in relation to what I research? Who are or will be the consumers of my research?”


우리가 선택한 모델에 따라, 만약 아는 것과 하는 것의 차이를 교육에서 해결하기로 선택했다면, [연구 맥락에서 연구자의 개인적인 경험]이나 [연구사업]에 대하여 신중한 성찰을 함으로써, 연구자, 정책 입안자 및 실무자 간의 협력 필요성의 중요한 역할에 대한 인식 개선 동기를 부여할 수 있다. 이 성찰 단계에 engage하게 되면, 아는 것과 하는 것 사이의 차이를 해결하기 위해 서로 다른 접근법이 식별되었다는 사실에 대한 개인적 각성이 증가하게 된다. 메타인식을 촉진하기 위한 사려 깊은 성찰의 중요성은 모델의 1단계에 나타나 있다.

Depending on the model we choose to operate within, thoughtful reflection on a researcher’s personal experiences in the research context and on the research enterprise motivates increased metacognitive awareness concerning the critical role of the need for cooperation among researchers, policymakers, and practitioners if one chooses to address the knowing–doing gap in education. Engagement with this reflection stage results in an increased sense of personal awakening concerning the fact that different approaches have been identified for addressing the knowing–doing gap. The importance of thoughtful reflection to promote metacognitive awareness is represented in Phase 1 of the model.







두 번째 단계는 [자기 내면을 들여다보고 연구자로서 연구 기업 내에서 자신의 역할을 결정하도록 요구하는 자성]으로, 이는 지식 통합, 협업, 연구 결과의 번역 등의 형태로 지지도를 높여 실천과 정책 커뮤니티에 평가될 수 있도록 한다(그림 4).).

The second stage is introspection, which requires us as researchers to look within ourselves to determine our own role within the research enterprise, which leads to increased advocacy in the form of knowledge integration, collaboration, and the translation of research findings so they are assessable to the practice and policy communities (Figure 4).


우리가 내부에서 운용하기로 선택한 모델에 따라, 이 단계는 이론가, 연구자, 실천가, 혹은 위의 어떤 조합으로서의 우리의 역할을 이해할 수 있도록 자기성찰적이 될 것을 요구한다. 그리고 [우리가 자성을 통해 우리의 역할을 이해하게 될 때], 이것은 우리의 연구가 교육 관행에 어떤 영향을 미칠지에 대한 우리의 가정에 대해 더 신중하고 전략적으로 도움이 될 것이다.

Depending on the model we choose to operate within, this stage calls for us to be introspective so we can understand our role as a theorist, a researcher, a practitioner, or some combination of the above. And as we come to understand our role through introspection, this will help us to be more deliberate and strategic about our assumptions on how our work will influence educational practice.




세 번째 단계는 우리의 현재 지식 수준과 현재의 연구 관행에 대한 비판이며, 우리의 연구 지식이 정책 및 실천 공동체에 의해 접근되고 있거나 그렇지 않은 현재의 현실에 대한 비판이며, 이는 우리를 더 많은 행위자성agency으로 이끌 수 있다. 우리의 연구에서는, 우리는 존재하는 지식-수행의 격차를 고려해야 하며, 우리의 작업의 적용이 어떻게 그러한 격차를 해소할 수 있는지를 비판해야 한다(그림 5).

The third stage is critique of our current levels of knowledge and current research practices, and a critique of the current reality that our research knowledge is—or is not—being accessed by the policy and practice communities, which can lead us to increased agency. In our research, we should consider the knowledge–doing gaps that exist and critique how the application of our work can break down those gaps (Figure 5).



네 번째 단계는 개인적인 목소인데, 연구 결과가 실제 실행으로 어떻게 전환되는지에 대한 우리의 연구 결과에 대한 성찰과 지지된 가정으로부터 얻어진 것이다. 또한 자기성찰과 비평(그림 6). 개인의 목소리를 통해, 우리는 지식-행동 격차를 해소하기 위한 노력의 일환으로 취해진 개별적인 접근법을 증명할 수 있다. 개인의 목소리는 연구-실천 격차 해소를 위한 노력을 어떻게 지원할 것인가를 명확히 할 수 있는 기회일 뿐만 아니라, 지식은 우리가 "공익을 위해 봉사"하는 실천과 정책에 영향을 미치고 영향을 미치기 때문에 우리의 연구에 신뢰성을 부여할 수 있는 기회다. 개인적인 목소리의 예는 이 기사의 마지막 부분에 제시되어 있다.

The fourth stage is personal voice, gained from reflections on our work and our espoused assumptions about how research is translated into practice—as well as through introspection and critique (Figure 6). Through personal voice, we can demonstrate individual approaches taken in an effort to help address the knowing–doing gap. Personal voice is not only our opportunity to articulate how we will support efforts to address the research– practice gaps in a concerted way but will give credibility to our research—where knowledge becomes power as we use it to influence and impact practice and policy to “serve the public good”— which leads to a sense of efficacy. Examples of personal voice are presented in the final section of this article.



'생성적 영역'을 틀로 삼아 성찰, 자기성찰, 비평, 개인의 목소리를 활용해 연구기업에 대한 기여를 지속적으로 실현할 수 있다. 생성의 영역은 인식 인식, 이념화, 내면화, 사회문화적 과정에 의존한다. 그리고 그것은 교육 연구자들의 연구 생활에서 의식적으로 그리고 전략적으로 경험되고 있기 때문에 생성성이 있다(Ball, 2009).

Using the Zone of Generativity as a framework, we can utilize reflection, introspection, critique, and personal voice to continually realize our contribution to the research enterprise. The Zone of Generativity draws on the sociocultural processes of metacognitive awareness, ideological becoming, internalization, and generativity as it is consciously and strategically experienced in the research lives of education researchers (Ball, 2009). 


아래에 묘사된 모델은 Franz Fanon(1986)이 내가 진짜 도약이 발명을 존재에 도입하는 데 있다는 것을 끊임없이 상기해야 한다고 말할 때 말하는 것을 운영하기 위해, 교육을 개선하고 공공의 이익을 위해 우리의 접근방식에서 연구자들이 생성될 기회를 이용할 수 있는 과정을 보여준다. 

The model depicted below illustrates the process by which researchers can make use of opportunities to be generative in our approaches to improve education and serve the public good—to operationalize what Franz Fanon (1986) speaks of when he says I should constantly remind myself that the real leap consists in introducing invention into existence. 


우리가 연구자로서 이 네 가지 단계나 기간을 거쳐 발전함에 따라, 에릭슨이 정의한 대로 지식을 생성적인 방법으로 사용할 때 점점 더 발명을 도입하게 된다. 우리는 의식적으로 우리 자신을 넘어 견딜 수 있는 무언가를 창조하기 위해 노력한다우리는 권력을 행사하며, 권력의 정의는 [다른 사람들에게 영향을 미치고 봉사하는 능력]이다. 이렇게 해서 세상을 더 나은 곳으로 만드는 역할을 하는 연구를 수행함에 따라 지식이 강력해진다.

As we progress through these four stages or periods in our development as researchers, increasingly we introduce invention into existence when we use knowledge in generative ways as Eric Erikson defines it—we consciously work toward creating something that can endure beyond ourselves— we exercise power, defined as the ability to influence and to serve others. In this way, knowledge becomes powerful as we conduct research that serves to make the world a better place.


이러한 자기 반복적인 생성 과정의 개념을 보다 이해할 수 있도록 하기 위해, 그림 7은 각 단계와 각 발전 단계의 결과를 묘사한다.

To make this notion of a self-perpetuating process of generativity more understandable, Figure 7 depicts each stage and the results of each stage of development.



왜 생성성의 영역인가?

Why a Zone of Generativity?


또 다른 의문점은 다음과 같다. 내가 왜 '생성성 영역'을 도입하는 거지? 왜냐하면 Zone의 개념은 개인의 능력, 헌신, 자신의 옹호 수준, 현재의 아는 수준에 따라 개인들이 서로 다른 지점에서 진입할 수 있게 해주기 때문이다. ZPD와 마찬가지로 그 영역으로 들어가기에 잘못된 장소는 없다. 현재 알고 있는 수준에서 당신이 있는 생성 영역에 들어가 자신의 진척도를 측정한다. 성찰, 자기성찰, 비평, 그리고 개인의 목소리의 발전을 통해, 잠재적인 지식의 수준을 증가시키는 방향으로 성장과 발전의 가능성이 항상 존재한다.

One other question that arises is: Why am I introducing a Zone of Generativity? It’s because the concept of a zone allows individuals to enter in at different points—based on one’s ability, one’s commitment, one’s own level of advocacy, one’s level of current knowing. Like the zone of proximal development (Vygotsky, 1978), there is no wrong place to enter the zone—you enter the Zone of Generativity where you are, at your current level of knowing, and you measure your development against your own progress. Through reflection, introspection, critique, and the development of personal voice, there is always the possibility for growth and development toward increased levels of potential knowing.


교육 연구자로서 우리는 우리가 누구라고 말하는지 계속 살펴보고, 우리가 ZOG에서 어느 지역에 있는지, 그리고 우리가 어디에 있고 싶은지 결정해야 한다. AERA의 일원으로서, 우리는 스스로에게 물어봐야 한다: 혁신적이고, 창조적이며, 21세기의 교육적 도전에 대처하기 위한 강력한 방법에서 발을 내딛는 나의 공헌은 무엇인가. 내가 공익을 위해 봉사할 발명을 존재에 도입하고 있는가? 

As education researchers, we must continue to look at who we say we are, determine where we are within the Zone of Generativity (ZOG), and decide where we want to be. As members of AERA, we must ask ourselves: what are my contributions toward stepping out in innovative, generative, and powerful ways to meet 21st-century educational challenges. Am I introducing invention into existence that will serve the public good? 


나폴레옹 힐(1937년)에 따르면 "노력은, 노력을 그만두기를 거부한 후에야 그 힘을 방출한다!" 또는 "평범한 사업business as usual"에 만족하거나 안주하기를 거부한 후에야, 우리는 아는 것과 하는 것의 차이를 없앨 것이다. 

  • 우리가 실패의 문서화에 만족하는 것을 넘어섰을 때, 

  • 실패에 대한 두려움이 지식 격차를 조장한다는 것을 인식할 때, 

  • 행함으로써 아는 것이 더 깊고 심오한 수준의 지식을 발전시킨다는 현실을 경험할 때

According to Napoleon Hill (1937), “effort . . . only releases its power [its reward], after we refuse to quit!” Only after we refuse to be satisfied or complacent with “business as usual,” 

  • when we move beyond being satisfied with the documentation of failure, 

  • when we recognize that fear of failure fosters the knowing–doing gap, and 

  • when we experience the reality that knowing by doing develops a deeper and more profound level of knowledge

—then, by doing, we will eliminate the knowing–doing gap. 


그렇다면 그리고 그때서야 우리는 우리 앞에 놓여 있는 진정한 도전은 현재의 연구의 경계를 넘어 새로운, 보다 혁신적인 패러다임을 구축하는 것이라는 것을 깨닫게 될 것이다. —그것을 받아들일 사람들을 위해.

Then and only then will we realize that the real challenge that lies before us—for those who will accept it—is to push beyond the current boundaries of research—to forge new, more innovative paradigms.


지식-수행 격차 해소를 위한 과제, 비용 및 제안

A Challenge, a Charge, and Suggestions for Closing the Knowledge–Doing Gap


끝으로 우리 앞에 놓여 있는 도전을 상기시켜 드린다. 그 도전은 다음과 같은 질문을 던진다. 교육 연구자로서 우리는 어떻게 지식 격차를 해소하고 21세기 과제를 해결하기 위해 지식을 활용할 수 있을까? 우리는 이 질문에 대답해야 한다.

In closing, I remind you of the challenge that lies before us. That challenge begs the question: How can we—as education researchers—operationalize the Zone of Generativity in order to close the knowing–doing gap and further use our knowledge to address 21st-century challenges? Our response to this question is a charge.


이 혐의를 해소하기 위해서는 우선 올해 주제에서 나온 선도적 질문을 고려해야 한다. 만약 "아는 것만으로는 충분하지 않다"고 한다면, 그렇다면, 무엇이 충분한가?

To address this charge, we must first consider the leading question that emerged from this year’s theme: If “To Know Is Not Enough,” what, then, is enough?


단순화된 답변으로 응답하기 보다는, "지속적인" 것이 모든 학습자를 위한 개선된 교육을 지속적으로, 진보적으로 추구하는 것이라고 제안한다. 그리고 우리 중 누구도 혼자서는 이 일을 해낼 수 없다. 우리는 충분히 할 수 있는 길을 전진하면서 우리 집단의 힘이 필요하다. 우리의 계급 중에는 기초적인 연구자가 필요하고, 교육 관행을 개선하기 위해 일하는 사람들이 필요하다. 우리는 교육 연구를 독특하게 복잡하게 만드는 미세하고 미묘한 미묘함을 드러내는 연구가 필요하다. 그리고 우리는 개인이 사회에 영향을 미칠 수 있도록 대규모 이니셔티브를 설계하고 고안해 낼 필요가 있다. 우리는 지역, 국가, 국제 수준에 정책을 알리고 영향을 미칠 수 있는 더 많은 메커니즘이 필요하다. 충분한 것은 여행이지 목적지가 아니다. 

Rather than responding with a simplistic answer, I propose that “enough” is our continual, progressive pursuit of improved education for all learners. And no one of us can accomplish thisfeat alone. We need the strength of our collective as we progres-sively travel on the path of doing enough. Among our ranks  we need basic researchers, we need those who are working to improve educational practices, we need research that reveals the fine-grained, nuanced subtleties that make education research uniquely complex, and we need individuals to design and imple-ment large-scale initiatives so we can—in more strategic ways—impact society. We need more mechanisms to inform and influence policy on local, national, and international levels. Enough is a journey, not a destination. 


이 동적 생성 영역(Zone of Generativity)의 네 번째 단계인 개인의 목소리personal voice는, 연구자가 자신의 참여에 기반한 연구 맥락에서 얻은 연구 지식, 개인 지식 및 지식을 결합하는 능력을 통해, 지식-행동 작업 격차에 대처하기 위해 취한 개별 접근법을 입증하는 시점을 나타낸다. [반성, 자기성찰, 비평을 통하여] 연구자들은 개인의 목소리를 통해 연구-실무 간극을 해소하기 위한 노력을 어떻게 지원할 수 있는지, 그리고 이를 통해 우리가 '공익을 위해 봉사한다'는 정책, 실천에 영향을 미치고 실효성을 가진 정책에 영향을 미침으로써 우리의 연구에 신뢰성을 부여할 수 있는지를 명확히 한다. 개인의 목소리에 의지하여, 우리 회원은 단지 이야기만 하는 것이 아니라, 지식-행위의 차이를 효과적으로 해소하기 위해 취할 수 있는 제안된 조치에 대해 썼다.

The fourth stage of this dynamic Zone of Generativity, personal voice, represents the point at which researchers demonstrate individual approaches taken in an effort to help address the knowing–doing gap through an ability to combine research knowledge, personal knowledge, and knowledge gained from the research context based on their own engagement with reflection, introspection, and critique. Through personal voice, researchers articulate how we can support efforts to address the research–practice gap in a concerted way and give credibility to our research by demonstrating knowledge that becomes power as we use it to influence and impact practice and policy to “serve the public good” with a sense of efficacy. Drawing on personal voice, our membership has not only talked about but written about suggested steps that can be taken to close the knowing–doing gap with a sense of efficacy.


다음은 2012년 AERA 커미셔닝 에세이스트들의 개인적인 목소리로부터 우리가 할 수 있는 몇 가지 일들을 말해주는 몇 가지 더 많은 예들이다. 나는 이 목소리들을 Pfeffer와 Sutton의 (2000) 8가지 행동 지침에서 발견된 구성 요소들과 결합한다.

Following are a few more examples taken from the personal voices of the 2012 AERA Commissioned Essayists that tell us some things we could be doing that would be an “enough.” I combine these voices with the building blocks found in Pfeffer and Sutton’s (2000) Eight Guidelines for Action.


1. 지식-행위의 차이는 깊은 철학적 사고에 의해 추진되기 때문에 만연하고 지속적이며 중요한 문제라는 것을 기억하라. 그렇기 때문에 "지식 자체뿐만 아니라, [지식이 왜 사용되지 않는가에 대한 지식]도 충분하지 않다."(Pfeffer & Sutton, 2000, 페이지 244) 근본적으로, 아는 것과 하는 것의 차이를 좁히는 것은 우리의 근본적인 철학에 관한 것이다. 그래서 우리 주제의 제3부를 구현하려면 강력하고 생성적인 철학을 채택해야 한다. 수필가 와기드와 스마이어스는 우리를 인도할 수 있는 강력하면서도 생성적인 근본 철학으로 '우분투'를 논했다. Ubuntu는 "Action with Care"에 관한 것이고, 인간의 상호의존성에 관한 것이고, 사람들 간의 관계에 관한 것이다. 우분투와 생성적 사고를 결합함으로써 우리는 연구를 21세기 도전에 적용하고 공익에 봉사할 수 있다.

1. Remember that the knowing–doing gap is a pervasive, persisting, and important problem because it is driven by deep philosophical thinking. That is why “knowledge itself, as well as knowledge about why the knowledge is not being used, is not enough” (Pfeffer & Sutton, 2000, p. 244). Fundamentally, closing the knowing–doing gap is about our underlying philosophy. So if we want to implement the third part of our theme, we need to adopt a philosophy that is powerful and generative. The essayists Waghid and Smeyers, discussed “Ubuntu” as a powerful yet generative underlying philosophy that can guide us. Ubuntu is about “Acting with Care,” about human interdependence, and about relationships between and among persons. By combining Ubuntu with generative thinking, we can apply research to 21stcentury challenges and serve the public good.


2. 깊은 종류의 지식은 다른 사람들에게 어떻게 하는지를 가르치는 것에서 생길 수 있다. [함으로써 아는 것]은 깊고 심오한 수준의 지식을 발전시킬 수 있으며, (그 정의상) 아는 것과 행하는 것의 차이를 없앨 수 있다. 수필가 하틀렙과 칼슨에 따르면: "학원이 동료에게 봉사하는 것을 중시해야 할 때야. . . 지식 생성자(학술가)로서, 우리 연구는 지역사회와 협력하여 [인류]의 상태를 개선해야 한다. . . 더 이상 학문적으로 한 가지에만 지나치게 몰두하는 것이 받아들여지고, 인정받거나, 보상되어서는 안 된다. . . . . 학계는 봉사함으로써 리드해야 한다."

2. A deep kind of knowing can occur from doing and from teaching others how. Knowing by doing can develop a deep and profound level of knowledge and can—by definition— eliminate the knowing–doing gap. According to essayists Hartlep and Carlson: “It is high time that the academy values service to its fellow man. . . . As knowledge-generators (academicians), our scholarship should improve the condition of humanity [by working] in concert with the community. . . . No longer should academic navel gazing be accepted, appreciated, or rewarded. . . . The academy must lead by serving.”


3. 행동은 우아한 말과 계획보다 중요하다. "똑똑한 것처럼 말을 하는 것이 스마트한 행동을 하는 것을 너무 자주 대체하는 세상에서는, [계획, 의사 결정, 회의, 대화 등]이 [집행implementation]을 대신하는 경향이 있다. [너무 자주] 사람들은 행동이 아닌 말로 지위를 얻는다."(Pfeffer & Sutton, 2000, 페이지 251). 수필가 아라페에 따르면, 학습을 위한 학습이 충분하지 않다는 것을 인식하고, 공익을 향상시키기 위해 이용되는 학습에 대한 강조의 적용을 통해 교육을 재인식할 필요가 있다고 한다.

3. Action counts more than elegant words and plans. “In a world where sounding smart has too often come to substitute for doing something smart, there is a tendency to let planning, decision making, meetings, and talk come to substitute for implementation. [Too often] people achieve status through their words, not their deeds” (Pfeffer & Sutton, 2000, p. 251). According to essayist Arafeh, there is a need to reconceptualize education through the application of an emphasis on learning that is used to improve the public good, recognizing that learning for the sake of learning is not enough.


4. 모든 학습에는 약간의 실패와 실수가 수반된다는 것을 기억하라: 우리는 그것을 통해서 배우는 것이다. 논술가 이씨에게 있어서, 아는-행위의 차이를 연구와 실천 또는 정책 사이의 단순한 단절이나 의사소통 문제로 생각하는 것은 실수였다. 그녀는 교육에 영향을 미치는 다양한 요소들을 고려함으로써 교육 관행과 정책과 관련된 역동적이고 복잡하며 다층적인 문제들을 보고 다루기 위해 보다 복잡한 생태 시스템 접근방식을 사용함으로써 배울 것이 많다고 주장했다.

4. Remember that all learning involves some failure and mistakes: they are things we learn from. For essayist Lee, it has been a mistake to think about the knowing–doing gap as a simple disconnect or communication issue between research and practice or policy. She argued that there is much to be learned by using a more complex ecological systems approach for viewing—and addressing—the dynamic, complex, and multilayered issues related to educational practice and policy by taking into consideration the many different factors that influence education.


5. 두려움은 아는 것과 행하는 것의 차이를 조장하므로 두려움을 몰아낸다. 에세이스트 로빈슨은 두려워서 무언가를 하는 대신, 모든 교육 연구자들은 공공의 이익을 위해 그들의 연구를 이용할 의무가 있다고 겁 없이 말한다. 그녀는 정책 입안자와 실무자들이 현재 연구를 보다 쉽게 접근할 수 있도록 하기 위한 두려움 없는 방법을 제안했다. 

  • 연구 결과에 대한 개방적 접근. 

  • 간결한 연구 보고서 

  • 적시에 결과를 종합한다. 

  • 전문적 판단의 타당성 인정 

  • 결과가 학교에서 효과적으로 사용될 수 있는 방법에 대한 정보 제공 

  • 연구자의 윤리적 관행 검토 

  • 자신의 연구를 직접 실천가에게 가져다 준 사람들에게 보상한다

5. Fear fosters the knowing–doing gap, so drive out fear. Instead of operating out of fear, essayist Robinson fearlessly states that all education researchers (not just those in AERA) are obligated to use their research to serve the public good. She suggested fearless ways to make current research more accessible for policy makers and practitioners—including 

  • open access to research findings; 

  • concise research reports; timely synthesis of results; 

  • acknowledging the validity of professional judgment; 

  • providing information on how results can effectively be used in schools; 

  • reviewing the ethical practices of researchers; and 

  • rewarding those who bring their research to the practitioner directly.


6. 결과는 [공통의 노력, 공유된 목표, 그리고 지식을 사용하고], [각 구성원의 성공이 모두의 성공과 연관되어 있다는 것을 기억하는] 것의 산물이다. 

  • 수필가 니에토는 교육 연구자들에게 권력에 진실을 말하라고 충고했다; 결코 중립과 옹호, 연구 대 교육 연구의 활동주의 사이의 오래된 논쟁에 곁길로 빠지지 않았다. 그녀는 그 지식을 가진 사람들이 주류 지식에 도전하고 세상을 모두에게 더 공평한 곳으로 만드는 데 도움을 주기 위해 그 지식을 이용하도록 도전했다. 

  • 수필가 허들리와 웰스는 또한 접근 가능한 연구가 실습을 알려주고, 실무를 알려 주는 루프 시스템을 사용하여 교육에서 더 많은 번역적 연구를 바탕으로 더 나은 협업을 위한 사례를 만들었다.

6. Results are the product of using knowledge toward common effort, shared goals, and remembering that each member’s success is linked to the success of all. 

  • Essayist Nieto admonished education researchers to speak truth to power; never being sidetracked by the age-old argument between neutrality and advocacy, research versus activism in education research. She challenged those with knowledge to use that knowledge to challenge mainstream knowledge and help make the world a more equitable place for all. 

  • Essayists Hudley and Wells further made a case for better collaboration based on more translational research in education using a looping system in which accessible research informs practice, which informs research, which informs practice, and so on.


7. 지식을 행동으로 전환함으로써 차이점과 더 나은 미래를 만들기 위해 할 수 있는 일에 집중하라. 수필가 에이어스, 쿠마시로, 마이어스, 퀸, 스토벌은 지식을 이용하여 자신들의 공동체와 관련된 연구를 만들고 정치인들에게 책임을 묻게 했다. 현직 시카고 시장이 재선에 출마하지 않기로 결정했을 때, 이들 연구자들은 많은 후보자들이 교육에 대해 business-as-usual 로서의 입장을 공유한다는 것을 발견했다. 저자들은 지역사회와 후보자들에게 학교개혁에 대한 연구기반 정보와 새로운 학교개혁 비전을 제공하는 기구를 설립해 연구지식을 변화의 출발점으로 삼았다.

7. Focus on what can be done to create a difference and a better future by turning knowledge into action. Essayists Ayers, Kumashiro, Meiners, Quinn, and Stoval used knowledge to make research relevant to their community and to hold their politicians accountable. When a current Chicago mayor announced the decision not to run for reelection, these researchers found that many of the candidates shared a business-as-usual stance on education. The authors used their research knowledge as a starting point for change by establishing an organization that provided the community and candidates with research-based information on school reform and new visions for reforming schools.


8. 리더가 무엇을 하고, 시간을 어떻게 보내고, 자원을 어떻게 할당하느냐가 중요하다. 우리 조직이 무엇을 하고, 시간을 어떻게 보내고, 자원을 어떻게 할당하느냐가 중요하다. 우리의 일상적인 관행은 지식의 생산뿐만 아니라 그 지식의 활용을 가치 있게 여겨서 교육을 향상시키고 공공의 이익을 위해 봉사하는 문화를 정책 영역뿐만 아니라 실천 영역에서도 구현해야 한다.

8. What leaders do, how they spend their time, and how they allocate resources matters. What our organization does, how it spends its time, and how it allocates its resources matters. Our day-to-day practices must embody a culture that values not only the production of knowledge but also the use of that knowledge to improve education and serve the public good—not only in the policy arena, but in the practice arena as well.










In this 2012 American Educational Research Association (AERA) Presidential Address, the author considers this year’s conference theme—how to take what we know from research and put it to effective (policy and practice) use. The essay challenges members individually and collectively to improve the connection. She reflects on the history of AERA as an organization, why many seminal research studies fail to get relevant uptake, several models that are instructive in considering the translation process, and comments on several of the papers commissioned by AERA, in advance of the 2012 meeting, which also address different aspects of the translation challenge. The author highlights her own model of change, which she refers to as the Model of Generative Change, and explains the stages or phases of generativity that can be experienced in the research lives of education researchers.


과학: 축적되는 근거의 느린 행진(Perspect Med Educ, 2016)

Science: the slow march of accumulating evidence

Katherine Picho1 · Lauren A. Maggio1 · Anthony R. Artino Jr1


과학은 진화하고 있으며, 새로운 발견들이 끊임없이 세상이 어떻게 돌아가는지에 대한 '우리가 알고 있는 것'의 경계를 밀어내고 있다. 그러나 무작위성은 자연에 대해 관찰되는 것에 영향을 줄 수 있기 때문에, 새로운 발견이 '진짜'가 아니라 단지 잘못된 긍정에 불과할 가능성이 항상 있다.

Science is ever evolving, with new discoveries constantly pushing the boundaries of ‘what we know’ about how the world works. However, because randomness can influence what is observed about nature, there is always a chance that new findings, rather than being ‘true,’ are merely false positives.


진정한 발견은 이론적으로 복제될 수 있어야 한다. 따라서, 새로운 발견의 결과가 몇 번의 반복 실험에서 재현될 때, 그 결과는 이론[1]을 위한 다소 견고한 경험적 기초를 제공한다. 복제replication는 과학자들이 작동 이론의 핵심 원리를 시험하고 확인하거나, 새롭고 상반되는 발견을 발견할 수 있게 해주기 때문에 과학적인 성장과 이론 발전의 중심이다. 이렇게 해서 복제는 과학자들이 속담 밀(진정한 효과)을 쐐기풀(허위 양성 또는 우연한 기회에 기초한 발견)과 구분할 수 있게 한다.

True findings should, theoretically, be replicable. Thus, when results from a new discovery are reproduced in several repeated experiments, the findings provide a more or less robust empirical foundation for a theory [1]. Replication is central to scientific growth and theory development because it allows scientists to test and confirm core principles of working theories, or discover new, conflicting findings. In so doing, replication allows scientists to separate the proverbial wheat (true effects) from the chaff (false positives or findings based on chance).


과학적인 발견과 이론 발달에 그것이 중요함에도 불구하고, replication은 연구라는 enterprise에서 주변적인 역할로 밀려났으며, 이는 혁신에 상을 주는prize 출판 준비와 같은 시스템 요소에 기인할 수 있다. 또는 통계적으로 유의하지 않은 결과는 그다지 흥미롭지 않고 따라서 발표될 가능성이 낮다는, 아무도 대놓고 말하지는 않지만, 너무 실제적인 개념 때문일 수 있다. 따라서의 publish or perish의 압력은 연구자들은 출판 시스템에 내재된 규칙에 따라 행동하든, 아니면 사지로 나가 시장성이 떨어지는 복제 시도를 출판하려고 시도하든 해야 한다는 결정을 하게 만든다. 결과적으로, 복제는 종종 뒷전으로 밀리고 과학은 결국 어려움을 겪는다.

Despite its importance for scientific discovery and theory development, replication has been relegated to a peripheral role within the research enterprise, which could be attributed to systems factors such as publication arrangements that prize innovation; or the unspoken, but all-too-real notion that non statistically significant results are not very interesting and are, thus, unlikely to be published. Therefore, the pressure to publish or perish leaves researchers with the decision of having to play by the rules inherent in the publication system or go out on a limb and attempt to publish a perhaps less marketable replication attempt. As a result, replication often takes a back seat and science ultimately suffers.


복제를 통해 과학적 정당성을 입증하려는 노력이 예상보다 덜 성공했기 때문에 최근 몇 년 동안 과학 연구의 신뢰성에 대한 도전을 받고 있다[2, 3]. 예를 들어, 100개 이상의 발표된 심리학 연구를 복제하려는 재현성 프로젝트의 시도는 주요 연구 결과의 65%가 재현 불가능한 것으로 보고되었다[3].

The credibility of scientific research has been challenged in recent years as efforts to demonstrate scientific legitimacy through replication have been less successful than expected [2, 3]. For example, attempts by the Reproducibility Project to replicate over 100 published psychology studies reported that 65 % of key findings were not reproducible [3].


이전 연구에서는 바이오의학과 심리학 연구에서 복제의 문제를 부각시켰지만, 의학 교육을 포함한 다른 분야도 똑같이 잘못된 긍정의 위험에 처해 있기 때문에 이와 유사한 정밀조사가 필요하다고 본다.

Although previous work has highlighted the issue of replication in biomedical and psychology research, we believe that other fields, including medical education, are equally at risk of false positives and thus warrant similar scrutiny.


복제: 직접 대 개념

Replication: direct versus conceptual


이론을 개발하기 위해서는 발견과 복제가 필요하다. 견실한 이론은 시간의 시험을 견디며 광범위한 조건에서 반복적으로 시험했을 때 얼마나 잘 버텨내느냐에 따라 측정된다. 복제는 몇 가지 결과 중 하나를 가질 수 있다: 이론이 확인, 수정, 확장 또는 거부된다.

Theory development requires discovery and replication. Robust theories stand the test of time and are gauged by how well they hold up when repeatedly tested under a wide array of conditions. Replication can have one of several outcomes: either the theory is confirmed, revised, extended, or rejected.


복제를 고려할 때, 연구자들은 먼저 과학자가 연구의 모든 요소를 정확하게 복제하려고 노력하는 [직접 복제]를 생각할 수 있다. 직접복제는 가능한 한 실험적인 절차를 가깝게 반복함으로써 과학적 소견의 진실성을 측정하기 위한 연구를 의미한다[4]. 반면에 [개념 복제]는 특정 결과의 기초가 되는 이론을 시험하기 위한 시도다[1].

When considering replication, researchers may first think of direct replication in which a scientist endeavours to precisely replicate all elements of a study. Direct replication refers to research intended to gauge the veracity of scientific findings by repeating, as closely as possible, an experimental procedure [4]. Conceptual replication, on the other hand, is an attempt to test the theory underlying a particular result [1].


[직접 복제]는 주로 특정 연구[1]의 특정 결과를 검증하는 데 초점을 두기 때문에, 직접 복제 연구를 수행하는 과학자는 가능한 한 모든 조건을 원래 연구와 유사하게 유지하려고 시도한다.

Because direct replication focuses primarily on validating a specific finding from a particular study [1], a scientist conducting a direct replication study attempts to keep all conditions as similar to the original study as possible.


직접 복제는 우연한 결과나 위양성 [4, 6] 및 연구 결과(내적 타당도 결여)를 통제하기 때문에 유용하다[4]. 비록 가치가 있지만, 이론 개발에서 직접적인 복제의 역할은 여러 가지 이유로 제한된다. 

  • 첫째, 직접 복제는 findings을 복제하거나 사실을 확인하는 데 초점을 맞춘다[4]. 소견 복제에 대한 이러한 초점은 특정 결과의 기초가 되는 이론의 신뢰성에 대해 거의 조명하지 않으며, 결과적으로 일반성을 확립하는 데 직접적인 복제의 역할을 제한한다[1]. 

  • 둘째, 직접 복제는 원래 연구의 조건과 밀접하게 일치하는 연구 조건을 요구하기 때문에 (특정 소견에 기여했을 수 있는) 원래 연구 설계의 방법론적 또는 설계상의 결함은 특정 현상의 후속 직접 복제 연구에서 그대로일perpetuated 가능성이 높다. 

따라서, 설계 결함design flaws의 경우, 직접 복제 연구를 통해 false original finding이 확인될 수 있다[1]. 이와 같이, 원본 연구의 설계 결함이 후속 직접 복제 연구에서 영구적으로 발생할 경우 시간이 지남에 따라 스스로 교정할 수 있는 문헌의 능력은 상당한 영향을 받을 수 있다.

Direct replications are useful because they control for chance results or false positives [4, 6], and study artifacts (lack of internal validity) [4]. Although valuable, the role of direct replication in theory development is limited for a number of reasons. 

  • First, direct replications focus on replicating findings or confirming facts [4]. This focus on findings replication sheds little light on the credibility of the theory underlying a particular result, which consequently limits the role of direct replication in establishing generality [1]. 

  • Second, because direct replication requires that study conditions closely match those of the original study, any methodological or design flaws in the original study design (that might have contributed to a particular finding) will likely be perpetuated in subsequent direct replication studies of a given phenomenon. 

Therefore, in the case of design flaws, it is possible for false original findings to be confirmed through direct replication studies [1]. In this way, the ability of the literature to self-correct over time can be significantly impacted when design flaws in the original study are perpetuated in subsequent direct replication studies.


반면에 [개념적 복제]주어진 결과에 기초하는 이론의 검증에 초점을 맞춘다[4, 7]. 따라서 개념 복제는 이론 검증theory testing과 거의 비슷하. 즉, 주어진 이론이나 가설이 다양한 조건에서 유지되는지(또는 유지하지 않는지)를 결정하는 것이다. 예를 들어 위에서 언급한 시험 강화 학습 효과는 교육 심리학에 그 뿌리를 두고 있지만 의학 교육에서는 개념적으로 복제되었다. 이러한 복제 연구는 이론에 대한 확고한 증거를 구축하기 위해 다양한 설정(실험실 대 교실), 모집단(성인 대 아동 학습자) 및 내용 영역(단어 쌍 대 일반 내용 지식)에서 수행되었다.

Conceptual replications, on the other hand, focus on validating the theory underlying a given result [4, 7]. Thus, conceptual replication is much like theory testing; that is, determining whether a given theory or hypothesis holds (or not) under a variety of conditions. For example, the test-enhanced learning effect referenced above has its roots in educational psychology but has been conceptually replicated in medical education. These replication studies have been conducted in a variety of settings (laboratories vs. classrooms), populations (adult vs. child learners) and content areas (word pairs vs. general content knowledge) to build a robust body of evidence for the theory.


직접 복제와 달리, [개념 복제]의 몇 가지 요소는 주어진 이론이나 가설이 다양한 조건에서 유지되는지 여부를 측정하기 위해 다양할 수 있으며, 대개는 '필수 조건'을 일정하게 유지하는 것이다. 본질적인 조건들은 이론에 의해 지시되고 그 현상이 일어나기 위해 반드시 갖춰져야 하는 조건들을 구성한다. 개념적 복제에서는 복제 연구의 필수 조건들이 원본 [8]의 조건들과 [근접하게 일치하도록만 요구]하는 반면, 유연성이 있어서, 연구의 다른 비필수 조건들을 변화시킬 수 있다.

Unlike direct replication, several elements of conceptual replications can be, and usually are, varied to gauge whether or not a given theory or hypothesis will hold under a variety of conditions, while at the same time holding ‘essential conditions’ constant. Essential conditions are dictated by the theory and constitute those conditions that must be in place for the phenomenon to occur. Conceptual replications only require that the essential conditions of the replication study closely match those in the original [8], while allowing for flexibility to vary other non-essential conditions of a study.


예를 들어, 원래 연구와 다른 다양한 측정, 독립 변수, 방법, 컨텍스트 및 모집단을 개념 복제에 사용하여 주어진 결과에 기초하는 이론적 가정을 삼각측량할 수 있다. 앞에서 언급한 비필수적 요소를 변화시키면 개념 복제 연구를 통해 관찰된 결과가 [수요 특성, 표본 특성 또는 현상의 좁은 정의 때문일 수 있는 가능성]을 배제할 수 있다[6].

For instance, a variety of measures, independent variables, methods, contexts and populations that differ from the original study can be used in conceptual replications to triangulate theoretical postulates that underlie a given result. Varying the aforementioned nonessential elements enables conceptual replication studies to rule out the possibility that observed findings could be due to demand characteristics, sample characteristics, or narrow definitions of a phenomenon [6].


개념적 복제는 또한 반증falsification을 용이하게 한다. 성공적인 개념적 복제는 기존 이론에 신빙성을 부여하지만, 성공하지 못한 개념적 복제(예: 특정 조건 하에서 어떤 이론이 상정된 것처럼 운영되지 않는 경우)는 해당 이론의 한계에 대한 수정을 요구할 수 있다[3]. 개념적 복제는 이론에 대한 이해를 증진시키기 때문에, 우리와 다른 이들은 이론 개발과 궁극적으로는 과학적 진보에 대한 직접적인 복제 상대보다 그것들이 더 가치 있다고 믿는다[1].

Conceptual replication also facilitates falsification. Successful conceptual replications lend credence to extant theories, while unsuccessful ones (such as when a given theory does not operate as posited under certain conditions) might call for revisions to the bounds of said theory [3]. Because conceptual replications further our understanding of theory, we and others believe they are more valuable than their direct replication counterpart to theory development and, ultimately, to scientific progress [1].


개념복제에 대한 한 가지 비판은 종속변수와 독립변수의 운영방식에 유연성이 있을 뿐만 아니라 다른 방법의 수정방식에 유연성이 있기 때문에 개념복제가 성공하지 못할 때 복제 실패의 원인을 확인하기 어려운 경우가 많다[1]. 질문은 다음과 같다. 복제 실패가 우연 및/또는 아티팩트로 인한 것이었는가, 아니면 결과에 영향을 미칠 수 있는 다른 감지되지 않은 진행자 때문이었는가? 이러한 이유로, 여러 학자들은 직접 복제가 항상 개념 복제[7–9]보다 선행되어야 하며, [결과의 검증]이 [이론의 확장]보다 선행되어야 한다고 제안했다.

One criticism of conceptual replication is that because there is flexibility in how dependent and independent variables are operationalized, as well as flexibility in how other methods are modified, when conceptual replications are unsuccessful, the source of replication failure is often difficult to ascertain [1]. The question becomes: Was the failure to replicate due to chance and/or artifacts, or was it due to other undetected moderators that might have influenced the results? For this reason, several scholars have suggested that direct replications should always precede conceptual replications [7–9], as verification of findings should precede extension of theory.


  • 특정 결과를 검증하고 내부 타당성과 관련된 다른 요인뿐만 아니라, 발견 결과가 우연, 유물 또는 사기의 결과일 가능성이 낮다는 것을 확인하는 것이 목표라면 직접 복제를 선호한다. 

  • 연구자의 목표가 이론을 확장하거나 개발하는 것이라면, 강력한 이론 프레임워크를 점진적으로 테스트하고 구축하는 데 도움이 되는 일련의 임시 서열화, 계층 구조화 및 점점 더 복잡한 개념 복제 연구를 권고한다.

  • If the goal is to verify a specific finding and ascertain that findings are less likely to be a result of chance, artifacts, or fraud, as well as other factors related to internal validity, then a direct replication is preferred. 

  • If the researcher’s goal is to extend or develop theory, then a series of temporally sequenced, hierarchically structured, and increasingly complex conceptual replication studies that help to progressively test and build robust theoretical frameworks is recommended



의료 교육에서의 복제

Replication in medical education


비록 실험 연구가 우세한 인지 심리학과 같은 영역에서 유용하지만, [직접 복제는 종종 비실용적이며, 일부에서는 맥락 특수성과 관련된 요소들이 가장 지배적인 의료 교육 맥락에서 관련이 없다]고 주장할 수 있다.

Although useful in domains such as cognitive psychology where experimental research prevails, direct replication is often impractical – and some might argue, irrelevant – in medical education contexts where factors associated with context specificity reign supreme.


의학 교육에서 직접 복제를 사용할 수 있는 경우는 제한적이지만, 개념적 복제는 (지난 20년 동안 반복적으로 비판 받아온) 의학교육 연구의 질을 향상시킬 수 있는 잠재력을 가지고 있다고 생각한다[5].

Although direct replication may have limited use in medical education, we believe that conceptual replication has the potential to enhance the quality of medical education research, the methods of which have been criticized repeatedly over the past two decades [5].


실제로 다른 학자들은 연구자가 이론을 실험하고 실증적으로 뒷받침되지 않는 이론을 폐기할 수 있는 방법을 사용하여 지식의 점진적 축적과 현상에 대한 이해의 진보로서 다시 개념화함으로써 의학 교육 연구가 개선될 수 있다고 제안했다[11].

Indeed, other scholars have proposed that medical education research can be improved by re-conceptualizing research quality as progressive accumulation of knowledge and advances in understanding of phenomena using methods that allow researchers to test theories and discard those that are weak and empirically unsupported [11].


또한, 의학 교육 연구자들은 교육, 심리학, 사회학을 포함하되 이에 국한되지는 않는 다른 분야의 이론을 채택하는 경우가 많다. 그러나 의학교육 연구자들은 기초 이론이 시험한 의학교육의 구체적인 맥락에 적용되는지 여부를 검증하는 것과 관련하여 '루프 닫기'를 하지 않는 경우가 많다. 개념 복제는 의학 교육 연구자들에게 의학 교육 맥락에서 채택된 이론을 시험하고, 그 이후의 연구 결과를 사용하여 이론 개발뿐만 아니라 그 분야의 실용적인 응용에 유용한 정보를 제공할 수 있는 수단을 제공한다.

Further, medical education researchers often adopt theories from other disciplines including, but not limited to, education, psychology, and sociology. However, medical education researchers often do not ‘close the loop’ with respect to verifying whether or not the underlying theory applies to the specific context of medical education that was tested. Conceptual replication offers medical education researchers a means to test adopted theories within a medical education context and use subsequent findings to inform theory development, as well as practical applications in the field.


의학 교육 연구가 교육 실무에 중대하고 긍정적인 영향을 미치기 위해서는 연구자들이 복제의 복잡성, 특히 개념적 복제에 유창해야 한다고 생각한다.

For medical education research to have a significant, positive impact on educational practice, we believe researchers must become fluent in the intricacies of replication – in particular, conceptual replication.





. 2016 Dec;5(6):350-353.
 doi: 10.1007/s40037-016-0305-1.

Science: the slow march of accumulating evidence

Affiliations 

Affiliations

  • 1Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, MD, USA. Katherine.picho.ctr@usuhs.edu.
  • 2Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, MD, USA.
Free PMC article

Abstract

Recent crises over the credibility of research in psychology and the biomedical sciences have highlighted the need for researchers to view and treat replication research as essential to the accumulation of knowledge. In this article, the authors make the case for the utility of replication in medical education research. Specifically, the authors contend that because research in medical education often adopts theories from other disciplines, replication is necessary to gauge the applicability of those theories to the specific medical education context. This article introduces readers to the two major types of replication - direct and conceptual - and provides a primer on conceptual replication. In particular, the article presents key elements of conceptual replication and considers how it can be used to strengthen approaches to knowledge generation, theory testing, and theory development in medical education research.

Keywords: Medical education; Replication; Reproducibility.




한계에 의한 제한(Perspect Med Educ, 2019)

Limited by our limitations

Paula T. Ross · Nikki L. Bibler Zaidi



도입

Introduction


제한limitation은 연구 결과 및 결론에 영향을 미칠 수 있는 연구 내 약점을 나타낸다. 제한사항을 제시하는 목적은 독자에게 의미 있는 정보를 제공하는 것이지만, 의학교육논문의 제한사항이 단순하고 최소한으로 관련되는 주제(예: 단일 기관 연구, 자체 보고 데이터의 사용 또는 작은 표본 크기)로 간과되거나 축소되는 경우가 너무 많다 [1]. 이 문제는 의학 분야의 다른 연구 분야에서도 두드러진다. 예를 들어, 임상적 영향에도 불구하고, 의학 연구는 종종 한계가 연구 결과 및 해석에 어떻게 영향을 미칠 수 있었는지에 대해 논의하지 못한다[2]. 또한 관찰 연구는 종종 독자들에게 연구 설계에 내재된 근본적인 한계를 상기시키지 못하는데, 그것은 바로 인과 관계를 설명할 수 없는 한계이다[3].

Limitations represent weaknesses within the study that may influence outcomes and conclusions of the research. The goal of presenting limitations is to provide meaningful information to the reader; however, too often, limitations in medical education articles are overlooked or reduced to simplistic and minimally relevant themes (e.g., single institution study, use of self-reported data, or small sample size) [1]. This issue is prominent in other fields of inquiry in medicine as well. For example, despite the clinical implications, medical studies often fail to discuss how limitations could have affected the study findings and interpretations [2]. Further, observational research often fails to remind readers of the fundamental limitation inherent in the study design, which is the inability to attribute causation [3].


한계 제시 목표

Goals of presenting limitations


의학교육연구는 다음에 대한 경험적 증거를 제공해야 한다

  • 교육에 대한 우리의 지식과 이해를 심화시키고 [4, 5], [6, 7], [6, 7], 

  • 교육 실무와 과정에 정보를 주고, 

  • 다른 연구자를 교육하는 포럼의 역할한다[8]. 

Medical education scholarship should provide empirical evidence that 

  • deepens our knowledge and understanding of education [4, 5], 

  • informs educational practice and process, [6, 7]and 

  • serves as a forum for educating other researchers [8]. 


학문적 한계를 제공하는 것은 사실 이 학문적 과정의 중요한 부분이다. 이러한 조건이 없으면 연구 소비자들은 [제공된 결과와 결론에 영향을 미칠 수 있는 잠재적 배제 영역 또는 기타 편견]을 완전히 파악해야 한다[9]. 연구 제한은 독자로 하여금 현재의 연구와 현존하는 문헌에 격차를 제시함으로써 미래적 개선에 관여할 기회를 생각하도록 해야 하며, 따라서 다른 연구자들의 호기심과 흥미를 배양하여 학술적 탐구 범위를 넓히도록 해야 한다[9].

Providing study limitations is indeed an important part of this scholarly process. Without them, research consumers are pressed to fully grasp the potential exclusion areas or other biases that may affect the results and conclusions provided [9]. Study limitations should leave the reader thinking about opportunities to engage in prospective improvements [9–11] by presenting gaps in the current research and extant literature, thereby cultivating other researchers’ curiosity and interest in expanding the line of scholarly inquiry [9].


연구 한계를 제시하는 것도 과학 연구의 윤리적 요소다[12]. 연구와 연구자 모두의 투명성을 보장하며, 전이성[15]과 방법의 재현성을 제공한다. 한계를 제시하는 것은 또한 조사 결과의 적절한 해석과 타당성을 뒷받침한다[16]. 연구의 한계는 독자가 연구 결론의 신뢰성을 완전히 식별할 수 있고, 연구 결과를 적절하게 일반화할 수 있도록 연구 결과물을 적절한 맥락 안에 배치해야 한다[16].

Presenting study limitations is also an ethical element of scientific inquiry [12]. It ensures transparency of both the research and the researchers [10, 13, 14], as well as provides transferability [15] and reproducibility of methods. Presenting limitations also supports proper interpretation and validity of the findings [16]. A study’s limitations should place research findings within their proper context to ensure readers are fully able to discern the credibility of a study’s conclusion, and can generalize findings appropriately [16].


일부 저자가 한계를 제시하지 못할 수 있는 이유

Why some authors may fail to present limitations


프라이스와 무르난[8]이 주목하듯이, 연구자들이 연구의 한계를 충분히 보고하지 않는 가장 중요한 이유가 있을 수 있다. 예를 들어, 저자들은 자신의 연구 한계의 중요성과 함의를 완전히 이해하지 못하거나, 토론하지 않는 것이 출판의 가능성을 높일 수 있다고 가정할 수 있다. 저널에 의해 부과된 단어 제한은 또한 저자들이 연구의 한계에 대한 철저한 설명을 제공하는 것을 방해할 수 있다[17]. 여전히 한계를 배제하는 또 다른 가능한 이유는 일부 저자들이 저널 편집자가 한계를 식별하는 책임이 있다고 잘못 가정할 수 있는 책임의 확산이다. 이유나 의도와 상관없이 연구자들은 학계에 완전하고 정직한 연구 한계를 제시할 의무가 있다.

As Price and Murnan [8] note, there may be overriding reasons why researchers do not sufficiently report the limitations of their study. For example, authors may not fully understand the importance and implications of their study’s limitations or assume that not discussing them may increase the likelihood of publication. Word limits imposed by journals may also prevent authors fromproviding thorough descriptions of their study’s limitations [17]. Still another possible reason for excluding limitations is a diffusion of responsibility in which some authors may incorrectly assume that the journal editor is responsible for identifying limitations. Regardless of reason or intent, researchers have an obligation to the academic community to present complete and honest study limitations.


제한사항 제시 지침

A guide to presenting limitations


제한 사항 설명

Describe the limitations


한계를 설명할 때 저자는 한계를 명확하게 도입하기 위해 제한 유형을 식별하고 제한의 근원origin을 명시해야 한다.

When describing limitations authors should identify the limitation type to clearly introduce the limitation and specify the origin of the limitation.


스터디 디자인

Study design


일부 연구 제한은 연구자가 연구의 범위를 좁히기 위해 행한 의식적인 선택(구분이라고도 함)에서 비롯된다[1, 8, 18]. 예를 들어, 연구자는 특정 연령층, 성별, 인종, 민족성, 지리적으로 정의된 지역 또는 연구 결과를 일반화할 수 있는 사람에 제한되는 다른 속성에 대한 연구를 설계했을 수 있다. 그러한 구분delimitation은 연구계획의 개발 중에 이루어진 의식적인 배제 및 포함 결정을 수반하며, 이는 연구자에 의해 연구 설계나 계기에 의도적으로 도입되는 체계적 편향을 나타낼 수 있다[8]. 구분 및 제한delimitation and limitations에 대한 명확한 설명과 서술은 편집자와 검토자가 방법론적 문제를 이해하는 데 도움이 될 것이다.

Some study limitations originate from conscious choices made by the researcher (also known as delimitations) to narrow the scope of the study [1, 8, 18]. For example, the researcher may have designed the study for a particular age group, sex, race, ethnicity, geographically defined region, or some other attribute that would limit to whom the findings can be generalized. Such delimitations involve conscious exclusionary and inclusionary decisions made during the development of the study plan, which may represent a systematic bias intentionally introduced into the study design or instrument by the researcher [8]. The clear description and delineation of delimitations and limitations will assist editors and reviewers in understanding any methodological issues.


데이터 수집

Data collection


데이터 수집 중에는 연구 한계도 도입할 수 있다. 인간 주제 연구의 의도하지 않은 결과는 참여자들이 그들의 질문에 어떻게 반응하는지에 영향을 줄 수 있는 연구자의 잠재력이다. 적절한 샘플링 방법을 채택한 경우에도 일부 연구는 연구에 등록하기로 결정한 참가자로부터만 수집된 데이터를 사용함으로써 제한된다(자체 선택 편향). [11, 19]. 일부 경우에, 참여자들은 진심의 응답보다는 연구자에게 유리하다고 생각하는 질문에 응답함(사회적 만족도 편견)으로써 편향된 의견을 제공할 수 있다[20–22]. 참가자는 자신이 관찰되고 있을 때 고의로 자신의 행동을 변화시킴으로써 수집된 데이터에 영향을 미칠 수 있다(호손 효과)[23]. 연구자(관찰자 역할)는 참가자의 첫 인상이 불리한 (호른horns 효과) 또는 호의적인 (할로halo 효과)의 다른 특징의 단일 특성이나 인상에 의해 영향을 받도록 허용함으로써 수집한 데이터를 편향시킬 수도 있다[24].

Study limitations can also be introduced during data collection. An unintentional consequence of human subjects research is the potential of the researcher to influence how participants respond to their questions. Even when appropriate methods for sampling have been employed, some studies remain limited by the use of data collected only from participants who decided to enrol in the study (self-selection bias) [11, 19]. In some cases, participants may provide biased input by responding to questions they believe are favourable to the researcher rather than their authentic response (social desirability bias) [20–22]. Participants may influence the data collected by changing their behaviour when they are knowingly being observed (Hawthorne effect) [23]. Researchers—in their role as an observer—may also bias the data they collect by allowing a first impression of the participant to be influenced by a single characteristic or impression of another characteristic either unfavourably (horns effect) or favourably (halo effort) [24].


데이터 분석

Data analysis


수행된 통계 분석 유형의 결과로 연구 한계가 발생할 수 있다. 일부 연구는 대상 모집단에서 확률 표본 추출법을 채택하지 않고 편의 표본 추출(즉, 비확률 표본 추출)을 사용하는 경우 추론 통계 분석의 기본 원칙을 따르지 않을 수 있다[19]. 통계 분석 중에 발생할 수 있는 또 다른 제한사항은 초기 분석 전에 명시되지 않은 계획되지 않은 post hoc 데이터 분석을 채택할 때 발생한다 [25]. [계획되지 않은 사후 분석]은 연관성을 시사하지만 우연적 발견에 지나지 않는 통계적 관계를 초래할 수 있다[23]. 따라서 계획되지 않은 사후 분석을 수행할 때, 특히 원본 표본의 부분 집합만 조사할 때 독자가 적절한 해석과 결론을 내릴 수 있도록 이 점을 명확히 명시해야 한다[23].

Study limitations may arise as a consequence of the type of statistical analysis performed. Some studies may not follow the basic tenets of inferential statistical analyses when they use convenience sampling (i.e. non-probability sampling) rather than employing probability sampling from a target population [19]. Another limitation that can arise during statistical analyses occurs when studies employ unplanned post-hoc data analyses that were not specified before the initial analysis [25]. Unplanned posthoc analysis may lead to statistical relationships that suggest associations but are no more than coincidental findings [23]. Therefore, when unplanned posthoc analyses are conducted, this should be clearly stated to allow the reader to make proper interpretation and conclusions—especially when only a subset of the original sample is investigated [23].


연구 결과

Study results


모든 연구 연구의 제한은 결과의 유효성에 기초할 것이다. 특히 내부 또는 외부 타당성에 대한 위협이다[8]. 

      • 부 타당성연구 결과[26]의 신뢰성 또는 정확성을 참조하는 반면, 

      • 외부 타당성연구 표본에서 더 큰 목표 모집단에 이르는 결과의 일반화가능성과 관련이 있다[8].

The limitations of any research study will be rooted in the validity of its results—specifically threats to internal or external validity [8]. Internal validity refers to reliability or accuracy of the study results [26], while external validity pertains to the generalizability of results from the study’s sample to the larger, target population [8].


내부 타당성에 대한 위협의 예로는 

      • 연구 외적 사건의 영향(역사)

      • 연구된 효과 대신 시간에 따른 참여자의 변화 (성숙)

      • 연구의 특징과 관련된 참가자의 체계적인 감소(중간탈락attrition) 

      • 반복적인 측정 참여자에 의한 참가자 응답의 변화(시험 효과)

      • 계측기 수정(도구성instrumentality) 및 

      • 반복 시험에서 평균으로 회귀할 극한 점수에 기초하여 참가자 선택 (평균으로의 회귀)[27]

Examples of threats to internal validity include: 

      • effects of events external to the study (history), 

      • changes in participants due to time instead of the studied effect (maturation), 

      • systematic reduction in participants related to a feature of the study (attrition), 

      • changes in participant responses due to repeatedly measuring participants (testing effect), 

      • modifications to the instrument (instrumentality) and 

      • selecting participants based on extreme scores that will regress towards the mean in repeat tests (regression to the mean) [27].


외부 타당성에 대한 위협에는 연구의 표본에서 더 큰 대상 모집단에 대한 결과의 일반화를 억제할 수 있는 요인들이 포함된다[8, 27]. 연구의 결과가 맥락, 환경, 참여자 및 시간 측면에서 더 큰 모집단 또는 유사한 모집단에 일반화될 수 없을 때 외부 타당성에 도전한다[18]. 따라서 연구에 영향을 미쳤을 수 있거나 잠재적으로 숨겨져 있는 편견을 연구 소비자에게 알리고 연구 매개변수를 넘어 일반화를 방지하기 위해 결과에 한계를 투명하게 만들어야 한다.

Threats to external validity include factors that might inhibit generalizability of results from the study’s sample to the larger, target population [8, 27]. External validity is challenged when results from a study cannot be generalized to its larger population or to similar populations in terms of the context, setting, participants and time [18]. Therefore, limitations should be made transparent in the results to inform research consumers of any known or potentially hidden biases that may have affected the study and prevent generalization beyond the study parameters.


각 제한의 시사점 설명

Explain the implication(s) of each limitation


저자는 제한사항의 잠재적 영향(예: 가능성, 크기)[13]을 포함해야 하며, 결과 및 후속 결론의 구체적인 타당성 시사점을 다루어야 한다[16, 28]. 

    • 예를 들어, 자체 보고된 데이터는 내부 타당성을 위협하는 부정확성(예: 사회적 만족도 편견으로 인한)을 초래할 수 있다[19]. 

    • 연구자의 특성이나 결과에 대한 부적절한 귀속(예: 정형화)도 관련 없는 특성이나 결과(할로 또는 경적 효과)를 지나치게 강조(긍정적이거나 부정적으로)하여 내부 타당성에 영향을 미칠 수 있다[24]. 

    • 자신이 연구의 일부라는 참여자의 인식은 결과에도 영향을 미칠 수 있으며(호손 효과), findings의 외부 타당성을 제한할 수 있다[23]. 

    • 응답자의 참여 성향과 실질적인 연구 주제와 상관관계가 있는 경우에는 데이터가 편향되고 관심 모집단을 나타내지 못할 수 있으므로 (자기 선택 편향)  외부 타당성이 위협받을 수 있다[29]. 

이 설명을 듣는 것은 독자들이 결과를 해석하고 그 결과의 적용 가능성을 그들 자신의 설정에 일반화하는 데 도움이 된다.

Authors should include the potential impact of the limitations (e.g., likelihood, magnitude) [13] as well as address specific validity implications of the results and subsequent conclusions [16, 28]. 

    • For example, self-reported data may lead to inaccuracies (e.g. due to social desirability bias) which threatens internal validity [19]. 

    • Even a researcher’s inappropriate attribution to a characteristic or outcome (e.g., stereotyping) can overemphasize (either positively or negatively) unrelated characteristics or outcomes (halo or horns effect) and impact the internal validity [24]. 

    • Participants’ awareness that they are part of a research study can also influence outcomes (Hawthorne effect) and limit external validity of findings [23]. 

    • External validity may also be threatened should the respondents’ propensity for participation be correlated with the substantive topic of study, as data will be biased and not represent the population of interest (self-selection bias) [29]. 

Having this explanation helps readers interpret the results and generalize the applicability of the results for their own setting.


잠재적인 대안적 접근 방식 및 설명 제공

Provide potential alternative approaches and explanations


종종, 연구원들은 새로운 연구 질문을 만들고 다음 단계의 연구를 형성하는 첫 단계로 다른 연구의 한계를 사용한다. 따라서 독자들은 왜 잠재적 대안적 접근법(예: 유사한 주제를 탐구하는 다른 사람들이 취하는 접근법)이 채택되지 않았는지를 이해하는 것이 중요하다. 대안적 접근법 외에도, 저자는 자신의 연구 결과에 대한 대안적 설명도 제시할 수 있다[13]. 이 정보는 연구를 수행하면서 얻은 직접적이고 관련성 있는 경험과 통찰력 때문에 연구자에게서 얻을 수 있는 가치가 있다. 대안적 접근방식의 제시는 학계에 대한 주요한 공헌을 나타낸다.

Often, researchers use other studies’ limitations as the first step in formulating new research questions and shaping the next phase of research. Therefore, it is important for readers to understand why potential alternative approaches (e.g. approaches taken by others exploring similar topics) were not taken. In addition to alternative approaches, authors can also present alternative explanations for their own study’s findings [13]. This information is valuable coming from the researcher because of the direct, relevant experience and insight gained as they conducted the study. The presentation of alternative approaches represents a major contribution to the scholarly community.


각 한계를 최소화하기 위해 취한 조치 설명

Describe steps taken to minimize each limitation


어떤 연구 설계도 완벽하고 명시적이고 암묵적인 편견이 없는 것은 아니다. 그러나 다양한 방법을 사용하여 연구 제한의 영향을 최소화할 수 있다위에서 언급한 한계를 완화하거나 최소화하기 위한 몇 가지 제안된 단계에는 

    • 중립 질문, 무작위 응답 기법, 강제 선택 항목 또는 자체 평가 설문지를 사용하여 민감한 질문에 대답할 때 응답자들의 불편함을 줄임(사회적 만족도 편향) [21]

    • 연구자가 배석할 필요가 없는 상황에서 unobtrusive 데이터 수집 조치(예: 이차 데이터의 사용) 사용 [11, 30]

    • 명확하게 정의된 채점 지침과 함께 표준화된 고무 재질 및 객관적인 평가 양식 사용하여 연구자 편향을 최소화. 또는 평가자 성향(halo or horns effect)을 해소하기 위해 평가 점수에 대한 평가자 보정

    • 기존 데이터 또는 통제 그룹 사용(자체 변형 치우침) 

No research design is perfect and free from explicit and implicit biases; however various methods can be employed to minimize the impact of study limitations. Some suggested steps to mitigate or minimize the limitations mentioned above include 

    • using neutral questions, randomized response technique, force choice items, or self-administered questionnaires to reduce respondents’ discomfort when answering sensitive questions (social desirability bias) [21]; 

    • using unobtrusive data collection measures (e.g., use of secondary data) that do not require the researcher to be present (Hawthorne effect) [11, 30]; 

    • using standardized rubrics and objective assessment forms with clearly defined scoring instructions to minimize researcher bias, or making rater adjustments to assessment scores to account for rater tendencies (halo or horns effect) [24]; or 

    • using existing data or control groups (self-selection bias) [11, 30]. 


해당되는 경우, 연구자는 연구 설계의 일부로 한계를 완화하기 위해 취한 조치를 입증하는 충분한 증거를 제공해야 한다[13].

When appropriate, researchers should provide sufficient evidence that demonstrates the steps taken to mitigate limitations as part of their study design [13].


결론 

Conclusion


제한은 독자의 주요 발견에 초점을 맞추는 데 도움이 되므로, 대부분의 연구의 일반적인 제한사항이 아니라 특정 연구 문제와 관련된 연구의 가장 두드러진 제한사항만 다루는 것이 중요하다[17, 28]. 연구 설계나 결과의 한계를 최소화하지 않는 것이 중요하다. 오히려 그 한계를 포함한 결과는 독자들이 현재의 연구와 현존하는 문학 사이의 연관성을 끌어내는 데 도움이 되어야 한다.

Limitations help focus the reader on key findings, therefore it is important to only address the most salient limitations of the study [17, 28] related to the specific research problem, not general limitations of most studies [1]. It is important not to minimize the limitations of study design or results. Rather, results, including their limitations, must help readers draw connections between current research and the extant literature.


연구의 질과 엄격함은 주로 우리의 한계로 정의된다[31]. 사실, 리뷰어들이 의학 교육 연구 원고의 수용을 권고하는 주요 이유 중 하나는 한계와 관련이 있고, 특히 연구의 해석이 그 한계를 어떻게 설명하는지와 관련된다[32]. 따라서, 저자는 자신의 연구의 한계를 편집자나 검토자가 식별하도록 하기보다는 인정하는 것이 최선일 뿐만 아니라, 한계의 적절한 구성과 제시는 실제로 acceptance의 가능성을 높일 수 있다.

The quality and rigor of our research is largely defined by our limitations [31]. In fact, one of the top reasons reviewers report recommending acceptance of medical education research manuscripts involves limitations—specifically how the study’s interpretation accounts for its limitations [32]. Therefore, it is not only best for authors to acknowledge their study’s limitations rather than to have them identified by an editor or reviewer, but proper framing and presentation of limitations can actually increase the likelihood of acceptance.





. 2019 Aug;8(4):261-264.
 doi: 10.1007/s40037-019-00530-x.

Limited by our limitations

Affiliations 

Affiliations

  • 1Medical School, University of Michigan, Ann Arbor, MI, USA. paulat@umich.edu.
  • 2Medical School, University of Michigan, Ann Arbor, MI, USA.
Free PMC article

Abstract

Study limitations represent weaknesses within a research design that may influence outcomes and conclusions of the research. Researchers have an obligation to the academic community to present complete and honest limitations of a presented study. Too often, authors use generic descriptions to describe study limitations. Including redundant or irrelevant limitations is an ineffective use of the already limited word count. A meaningful presentation of study limitations should describe the potential limitation, explain the implication of the limitation, provide possible alternative approaches, and describe steps taken to mitigate the limitation. This includes placing research findings within their proper context to ensure readers do not overemphasize or minimize findings. A more complete presentation will enrich the readers' understanding of the study's limitations and support future investigation.

Keywords: Limitations; Research.


리뷰를 할 때 가장 적절한 지식합성 방법은 무엇인가? (BMC Med Res Methodol, 2012)

What is the most appropriate knowledge synthesis method to conduct a review? Protocol for a scoping review

Monika Kastner1*, Andrea C Tricco1, Charlene Soobiah1, Erin Lillie1, Laure Perrier1,2, Tanya Horsley3, Vivian Welch4, Elise Cogo1, Jesmin Antony1 and Sharon E Straus1,5




배경 Background

지식 합성은 건강 문제 관리에 대한 정보를 제공할 잠재력을 가지고 있으며 [1] 캐나다 인구의 건강에 필수적이다[2]. 지식 합성은 특정 문제에 관한 모든 관련 연구를 요약하고, 다양한 증거의 불일치에 대한 이해를 향상시킬 수 있으며, 미래 연구 의제를 정의할 수 있다[1,3]. 지식합성은 또한 지식번역(KT) 프로세스의 중요한 부분이며(그리고 이상적으로는 제공자와 정책입안자를 위한 KT 전략의 '기본 단위'를 형성해야 한다)이며, 임상실무 지침, 정책설명서, 의사결정 보조기구 등을 포함한 KT 제품의 증거기반을 제공하는 데 사용된다[4]. 이와 같이 지식합성은 증거의 총체성의 맥락 안에서 개별 연구의 결과를 해석하는 데 이용될 수 있다. 하나의 연구나 전문가의 의견에 근거한 실천요강과 정책결정을 하는 것이 오해를 불러일으킬 수 있다는 점을 고려할 때, 이것은 중요한 고려사항이다 [5].

Knowledge synthesis has the potential to inform the management of health problems [1] and is integral to the health of the Canadian population [2]. A knowledge synthesis summarizes all pertinent studies on a specific question, can improve the understanding of inconsistencies in diverse evidence, and can define future research agendas [1,3]. Knowledge synthesis is also an important part of the knowledge translation (KT) process (and ideally should form the ‘base unit’ of KT strategies for providers and policy makers), and be used to provide the evidence base for KT products including clinical practice guidelines, policy briefs and decision aids [4]. As such, knowledge synthesis can be used to interpret results of individual studies within the context of the totality of evidence. This is an important consideration, given that basing practice and policy decisions on a single study or expert opinion can be misleading [5].


의료 분야의 지식 종합 활동은 종종 가장 일반적으로 개입되는 방법론적으로 엄격한 코크란 검토에 초점을 맞추었다. Cochrane Collaboration에 따른 체계적 검토의 정의는 "관련 연구를 식별, 선택, 비판적으로 평가하고, 검토에 포함된 연구로부터 데이터를 수집, 분석하기 위해 체계적이고 명시적인 방법을 사용하는 명확하게 작성된 질문의 검토로서, 통계적 방법(메타 분석)은 포함된 연구의 결과를 분석하고 요약하는 데 사용될 수도 있고 아닐 수도 있다."[6]. 그러나 모든 지식 종합 질문, 특히 복잡하고 다원적인 주제를 조사하는 질문에 대한 답변에는 코크란과 같은 검토 방법이 항상 적용될 수는 없다[7,8].

Knowledge synthesis activities in healthcare have often focused on the methodologically rigorous Cochrane reviews, most commonly of interventions. The definition of a systematic review according to the Cochrane Collaboration is “A review of clearly formulated questions that uses systematic and explicit methods to identify, select, and critically appraise relevant research, and to collect and analyse data from the studies that are included in the review. Statistical methods (meta-analysis) may or may not be used to analyse and summarise the results of the included studies” [6]. However, Cochrane-like review methods may not always be applicable for answering all knowledge synthesis questions, particularly those investigating complex and multidisciplinary topics [7,8].


더욱이 Cochrane 검토와 같은 전통적인 검토는 특정 개입이 어떤 환경에서는 작동하지만 다른 환경에서는 작동하지 않는 이유를 항상 설명할 수 없다[10]. 예를 들어, Cochrane 검토 결과, 학교 급식 프로그램은 취약계층 아동의 성장과 인지 성능을 상당히 향상시켰지만 [11] 정책 입안자들이 어떤 개입을 이행해야 하고 어떤 상황에서 어떤 상황에서 시행해야 하는지를 결정할 수 있는 방향을 제시하지 못했다. Cochrane 검토와 함께 현실주의 검토[10]를 실시함으로써, 저자들은 실무와 정책 수립에서 실행할 수 있는 구체적인 권고안을 제시할 수 있었다[7]. Realist review는 어떤 조건에서 누구에 대해서 무엇이 효과가 있느냐를 이해하기 위하여 사용된다.  이러한 유형의 질문을 해결하고 환자의 요구, 선호 및 경험을 의료 제공에 적절히 통합하기 위해, 덜 전통적인 복잡한 증거 검토 방법(즉, 이질적이고, 방법론적으로 다양하며, 분류하기 어렵고, 모순됨)을 고려할 필요성이 증가하고 있다[12,13].

Furthermore, a traditional review such as a Cochrane review cannot always explain why particular interventions work in some settings but not in others [10]. For example, a Cochrane review found that school feeding programs significantly improved the growth and cognitive performance of disadvantaged children [11], but failed to provide direction for policy-makers to decide which intervention should be implemented and under what circumstances. By conducting a realist review alongside the Cochrane review (which can be used to understand ‘what works for whom and under what circumstances’ [10]), the authors were able to provide concrete recommendations that could be implemented in practice and policy making [7]. To address these types of questions and adequately incorporate the needs, preferences and experiences of patients into healthcare delivery, there is an increasing need to consider less traditional review methods of complex evidence (i.e., heterogeneous, methodologically diverse, difficult to classify, and contradictory) [12,13].


표 1은 현재 여러 분야에 걸쳐 문헌에 존재하는 지식 종합 방법의 선택을 요약한다(지식 종합 전문가 및 정성 연구자와의 협의를 통해 확인).

Table 1 summarizes a selection of knowledge synthesis methods that currently exist in the literature across multiple disciplines (identified through consultation with knowledge synthesis experts and qualitative researchers).






본 연구에 대비하여 수행한 검토의 연구자 및 최종 사용자와의 협의에서는 연구 질문에 적합한 검토 방법을 일치시키는 방법, 이러한 검토를 수행하는 데 사용되는 방법, 그리고 의사결정을 알리기 위해 검토 결과를 분석하고 제시하는 [방법에 대한 명확성이 결여]되어 있음을 알 수 있다.

Consultation with researchers and end users of reviews that we conducted in preparation for this research indicate a lack of clarity around 

  • how to match the appropriate review method to the research question, 

  • the methods used to conduct these reviews, and 

  • how to analyze and present the results from the review to inform decision making.


확인된 다른 도전 과제에는 수많은 통합 방법(특히 정성적 연구를 합성하기 위한 방법)을 찾는 것이 포함되며, 이는 문헌 내부와 많은 다른 분야와 데이터베이스에 광범위하게 분산되어 있기 때문에 문제가 많고 자원 집약적일 수 있다. 서로 다른 합성 방법을 설명하는 데 사용되는 용어는 흔히 유사하며(예: '메타신성', '메타-윤리', '메타-해석', '메타-스터디', '메타-해석'), 그 정의가 중복될 수 있다[12].

Other identified challenges involve locating the numerous synthesis methods (particularly those for synthesizing qualitative research), which can be problematic and resource-intensive since they are scattered widely within the literature and across many different disciplines and databases. The terms used to describe the different synthesis methods are often similar (e.g., ‘metasynthesis’, ‘meta-ethnography’, ‘meta-narrative’, ‘meta-study’, ‘meta-interpretation’) and their definitions can overlap [12].


Gough와 동료들에 의한 최근의 overview는 이 용어들 사이의 중요한 개념적 차이와 실제적 차이를 기술함으로써 검토 설계와 방법 사이의 차이를 개략적으로 설명하려고 시도했다[8]. 그러나 모든 다른 합성 방법(양적/질적 또는 혼합)에 대한 포괄적인 매뉴얼은 현재 존재하지 않으며, 이러한 방법론이 어떻게 관련되는지, 그리고 특정 연구 질문에 가장 적합한 방법론을 결정하는 방법을 설명한다.

A recent overview by Gough and colleagues attempted to outline the differences between review designs and methods by describing the important conceptual and practical differences amongst them [8]. However, a comprehensive manual for all of the different synthesis methods (quantitative/qualitative or mixed), outlining how they are related and how to decide which methodology is the most appropriate for a particular research question does not currently exist.


방법 Methods/Design


검색전략

Search strategy


연구 선택: 포함 기준

Study selection: inclusion criteria


스터디 선택: 선별

Study selection: screening


데이터 추상화

Data abstraction


데이터 분석

Data analysis


지식 사용자 및 KT 계획 참여

Engagement of knowledge users and KT plan


예상되는 과제

Anticipated challenges




고찰 

Discussion


제안된 범위 지정 검토는 관행과 정책에 영향을 미칠 가능성이 있으며 KT와 보건 서비스 연구 문헌에 몇 가지 기여를 할 것이다. 

The proposed scoping review has the potential to impact practice and policy and will make several contributions to the KT and health services research literature. 


첫째, 이 연구는 핵심 지식 사용자들이 자신의 연구 질문에 답하기 위해 어떤 합성 방법이 가장 적합한지에 대한 정보에 입각한 결정을 내릴 수 있는 체계적인 과정을 제공함으로써 지식 종합의 과학을 발전시킬 것이다. 이것은 또한 생산된 연구 증거의 질을 높일 수 있다. 특히 이 작품에서는 복잡하고 다요소적이며 다학제적인 건강관리 개입을 명확히 하고, 증거 기반 실천과 증거 기반 의사결정의 진전에 기여할 수 있는 참신한 지식 종합방법의 가능성을 강조할 예정이다. 

First, the work will advance the science of knowledge synthesis by providing a systematic process for key knowledge users to make informed decisions about which synthesis method is the most appropriate to answer their research questions. This may also augment the quality of the research evidence produced. In particular, the work will highlight the potential for novel knowledge synthesis methods to clarify complex, multi-component, and multi-disciplinary healthcare interventions [13], and to contribute to the advancement of evidence-based practice and evidence-based decision-making. 


둘째, 현재 이용 가능한 모든 합성 방법(양적/질적 또는 혼합)에 대한 포괄적인 매뉴얼이 없다. 본 매뉴얼을 개발하기 위해서는 이용 가능한 모든 합성 방법에 대한 분류법과 비교가 필요하다. 우리의 작업은 건강, 철학 등 여러 분야에 걸쳐 종합방법의 분류법을 개발하는 것을 목표로 하고 있다. 

Second, there is currently no comprehensive manual for all available synthesis methods (quantitative/qualitative or mixed). To develop this manual, a taxonomy and comparison of all available synthesis methods are needed. Our work aims to develop the taxonomy of synthesis methods across multiple disciplines such as health and philosophy. 


셋째, 이 scoping review는 문헌을 지도화map하고, 주요 방법의 증거가 부족하고 필요한 간극을 식별하며, 체계적인 검토가 필요한 곳을 식별하는데 도움이 될 것이다. 우리는 이 작업이 이후 여러 개의 체계적인 검토로 이어질 것으로 기대한다. 예를 들어, 한 미래 체계적 검토는 보건 서비스 연구를 위한 지식 합성 방법에 초점을 맞추고 다른 검토는 질적 데이터의 지식 합성에 초점을 맞출 수 있다. 

Third, the scoping review will help map the literature, identify gaps where primary methods evidence is lacking and needed, and where systematic reviews are required; we anticipate that this work will lead to multiple subsequent systematic reviews. For example, one future systematic review may focus on knowledge synthesis methods for health services research and another may focus on knowledge synthesis of qualitative data.


넷째, 이 작업은 CIHR(Canadian Institute of Health Research, CIHR) 개발 자원(예: 모듈)과 같은 지식 합성 기금 제공자들에게 직접적인 영향을 미칠 수 있는 잠재력을 가지고 있으며, 이는 새로운 합성 방법에 대한 인식과 복잡한 증거를 다루기 위한 관련성을 높이는 데 사용될 수 있다. 이 정보는 합성 보조금의 안전 점검을 수행하는 지식의 경우 특히 필수적이다. 

Fourth, the work has the potential to directly influence knowledge synthesis funders such as the in Canadian Institutes of Health Research (CIHR) developing resources (e.g., modules) that can be used to increase awareness of novel synthesis methods and their relevance for addressing complex evidence. This information is especially imperative for those knowledge conducting peer review of synthesis grants. 


다섯째, 이 scoping review는 출판사와 편집자가 이러한 유형의 지식 종합을 기술하는 원고의 동료 검토를 돕기 위해 사용할 수 있다. 

Fifth, the scoping review can be used by publishers and editors to assist with the peer review of manuscripts describing these types of knowledge syntheses. 


여섯째, 우리의 연구결과는 종합방법에 대한 현재의 이해를 확대함으로써 임상 역학 프로그램 내의 건강 연구 방법 커리큘럼에 영향을 미칠 수 있는 잠재력을 가지고 있다. 복잡한 개입에 대한 개발과 평가가 KT의 중요한 요소로 대두되고 있어 비전통적인 검토 방법을 수행하는 전문지식이 연구자, 교사, 학생에게 점점 중요해질 것이다. 

Sixth, our findings have the potential to influence health research methods curricula within clinical epidemiology programs, by expanding the current understanding of synthesis methods. The development and evaluation of complex interventions has emerged as an important component of KT, so expertise in conducting non-traditional review methods will become increasingly important for researchers, teachers, and students. 


마지막으로, 이 작업은 광범위한 보건 분야 전반에 걸쳐 목표가 될 것이며, 이는 이러한 분야 내의 실천요강과 정책 결정을 직접적으로 알릴 수 있는 좀 더 일반화할 수 있는 발견을 이끌어낼 기회를 제공할 것이다.

Lastly, the work will be targeted across a broad scope of health disciplines, which will provide the opportunity to elicit more generalizable findings that can directly inform practice and policy decisions within these disciplines.













. 2012 Aug 3;12:114.
 doi: 10.1186/1471-2288-12-114.

What is the most appropriate knowledge synthesis method to conduct a review? Protocol for a scoping review

Affiliations 

Affiliation

  • 1Li Ka Shing Knowledge Institute of St. Michael's hospital, 209 Victoria Street, Toronto, ON, M5B 1W8, Canada. monika.kastner@utoronto.ca
Free PMC article

Abstract

Background: A knowledge synthesis attempts to summarize all pertinent studies on a specific question, can improve the understanding of inconsistencies in diverse evidence, and can identify gaps in research evidence to define future research agendas. Knowledge synthesis activities in healthcare have largely focused on systematic reviews of interventions. However, a wider range of synthesis methods has emerged in the last decade addressing different types of questions (e.g., realist synthesis to explore mediating mechanisms and moderators of interventions). Many different knowledge synthesis methods exist in the literature across multiple disciplines, but locating these, particularly for qualitative research, present challenges. There is a need for a comprehensive manual for synthesis methods (quantitative/qualitative or mixed), outlining how these methods are related, and how to match the most appropriate knowledge synthesis method to answer a research question. The objectives of this scoping review are to: 1) conduct a systematic search of the literature for knowledge synthesis methods across multi-disciplinary fields; 2) compare and contrast the different knowledge synthesis methods; and, 3) map out the specific steps to conducting the knowledge syntheses to inform the development of a knowledge synthesis methods manual/tool.

Methods: We will search relevant electronic databases (e.g., MEDLINE, CINAHL), grey literature, and discipline-based listservs. The scoping review will consider all study designs including qualitative and quantitative methodologies (excluding economic analysis or clinical practice guideline development), and identify knowledge synthesis methods across the disciplines of health, education, sociology, and philosophy. Two reviewers will pilot-test the screening criteria and data abstraction forms, and will independently screen the literature and abstract the data. A three-step synthesis process will be used to map the literature to our objectives.

Discussion: This project represents the first attempt to broadly and systematically identify, define and classify knowledge synthesis methods (i.e., less traditional knowledge synthesis methods). We anticipate that our results will lead to an accepted taxonomy for less traditional knowledge synthesis methods, and to the development and implementation of a methods manual for these reviews which will be relevant to a wide range of knowledge users, including researchers, funders, and journal editors.


청각학 교육에서 이론과 연구: 방법론적 결정을 통한 복잡성의 이해와 제시(J Am Acad Audiol, 2013)

Theory and Research in Audiology Education: Understanding and Representing Complexity through Informed Methodological Decisions

Stella L. Ng*t




보건전문교육 연구

SCHOLARSHIP IN HEALTH PROFESSIONAL EDUCATION


우리는 적절한 교육과 훈련 없이 양질의 교육 연구를 수행하기를 기대해서는 안 된다. 이론적 관점, 방법론, 교육에 사용되는 언어는 과학 탐구 및 학술적 글쓰기의 특정한 스타일에 익숙한 우리들에게 놀랄 수 있다.

we should not expect ourselves to conduct good quality educational research without appropriate education and training. Theoretical perspectives, methodologies, and the language used in education can be surprising to those of us accustomed to a particular style of scientific inquiry and academic writing.

교육연구는 보건전문가의 교육을 수반하는 경우에도 교육이 사회현상이기 때문에 사회연구에서 비롯된다. 따라서 기초과학과 실험과학의 기법을 교육연구에 엄격히 적용하는 것은 잘못된 노력일 수 있다.

Education research, even when it involves the education of health professionals, stems from social research, since education is a social phenomenon. Thus, strictly applying the techniques of basic and experimental science to education research may be a misguided endeavor.


HPE 리서치의 풍경

The Landscape of HPE Research


HPE 연구에는 두 개의 캠프가 있는 것 같다. 

There seem to be two camps in HPE research. 


첫째, 새로운 교육 혁신을 연구하고 이러한 혁신의 효과에 대한 연구를 수행하는 캠프가 있다(Regehr, 2010). 이 캠프의 목표는 학생 학습을 향상시키고, 환자 결과를 향상시키며, 심지어 교직원의 업무량까지 줄이기 위한 보다 효과적이고 효율적인 교수 접근법의 개발이다. 이 캠프에서의 연구는 임상 연구를 반영하는 경향이 있는데, 새로운 교육적 혁신이 연구에서의 "인터벤션" 역할을 한다. HPE의 일부 학자들은 실험 연구나 임상 연구를 모방하려고 하지만 그 틀에는 전혀 들어맞지 않는 상황에서 교육 연구는 보건 분야의 학문 세계에서 낮은 지위에 처하게 될 것이라고 우려를 표명했다(Bvinniss and Kelly, 2010; Regehr, 2010).

First, there is the camp that researches new teaching innovations and conducts research on the effectiveness of these innovations (Regehr, 2010). The goal of this camp is development of more effective and efficient teaching approaches to enhance student learning, improve patient outcomes, and even reduce faculty workload. Research in this camp tends to mirror clinical research, with the novel teaching innovation serving as the "intervention" under study. Some scholars of HPE have expressed concern that in trying to emulate experimental or clinical research, yet never quite fitting the mold, education research is doomed to a low status in the academic worlds of the health professions (Bvinniss and Kelly, 2010; Regehr, 2010).


또 다른 캠프에서, 연구자들은 이론 문학의 더 큰 단체가 보건 전문 교육자들에게 정보를 제공하고 장기적으로 이 분야를 발전시키기를 희망하면서 교육 현상에 대한 더 큰 이해를 얻으려고 한다(Regehr, 2010). 현재까지 HPE에서의 짧은 경력에서, 나는 2차 캠프에 끌린다.

In the other camp of HPE research, researchers seek to gain greater understanding of educational phenomena (Regehr, 2010), with the hopes that a greater body of theoretical literature will inform health professional educators and advance the field in the long-term. In my short career in HPE to date, I find myself drawn to the second camp.


HPE 연구 이론

Theory in HPE Research


HPE의 이론은 HPE의 학자들이 지속적으로 노력하는 도전적 목표로 남아있지만, 한동안 우선순위와 목표였다(Pridaux and Spencer, 2000년). 의학 교육의 관점에서 볼 때, Rees와 Monrouxe(2010년)는 이론이 HPE 연구에서 다음과 같은 중심적 역할을 한다고 주장했다. 

Theory in HPE has been a priority and goal for some time (Prideaux and Spencer, 2000) although it remains a challenging goal for which scholars of HPE continually strive (Rees and Monrouxe, 2010). Coming from a medical education perspective, Rees and Monrouxe (2010) posited that theory plays a central role in HPE research such that 

(1) 의학 교육에 관한 모든 연구 노력에는 이러한 이론이 명시되지 않은 경우에도 그랜드 이론이 배어 있다. 

(1) all research efforts in medical education are imbued with grand theories, even when these theories are not made explicit; 


(2) 이론은 연구 과정을 촉진하고 엄격성과 신뢰성을 향상시키는데 결정적이다. 

(2) theory is crucial in facilitating the research process, improving rigor and credibility; and 


(3) 모든 의학 교육 연구자는 모든 수준의 이론에 관여해야 한다. 즉, 기초 또는 임상 과학 배경을 가진 연구자들은 그들의 연구를 뒷받침하는 원대한 이론의 이해를 촉진하고 사회 이론으로 여정을 항해하기 위해 사회 과학 배경을 가진 연구자들과 협력해야 한다.

(3) all medical education researchers should engage with theories at all levels, which means that those with basic or clinical science backgrounds should collaborate with those with social science backgrounds to facilitate understandings of the grand theories underpinning their research, and navigating journeys into social theory.


Rees와 Monrouxe(2010년)는 이론의 수준을 구분하는데, 

[대grand 이론]은 현실의 본질에 대한 우리의 개념(존재론)과 지식의 본질(인식론)을 언급하고, 

[거시 이론]은 국소 시스템을 지칭하며, 

[미시 이론]은 개인의 수준에 관한 행동과 관련된다. 

Rees and Monrouxe (2010) distinguish between levels of theory, with 

grand theories referring to our conceptions of the nature of reality (ontology) and the nature of knowledge (epistemology), 

macro theories referring to local systems, and 

micro theories relating to action on the level of the individual. 


Rees와 Monrouxe(2010년)는 위대한 이론에 대한 특정한 관심을 끌어낸다. 왜냐하면 연구자들은 [연구를 위한 그들의 guiding 패러다임을 항상 명시하지는 않지만, 그들의 연구는 의심할 여지 없이 [존재론 및 인식론]에 대한 그들의 신념에 의해 인도]되기 때문이다. 실제로, 연구 질문을 정의하는 아주 초기 단계는 이러한 믿음이 탐구되었는지 여부에 관계없이 본질적으로 온톨로지 및 인식론에 대한 신념과 연결되어 있다. 즉, 무엇이 연구할 가치가 있고 어떻게 연구되어야 하는가에 대한 우리의 근본적인 가정은 우리가 질문할 질문들을 지시한다.

Rees and Monrouxe (2010) draw specific attention to grand theories, because while researchers do not always state their guiding paradigms for research, their research is undoubtedly guided by their beliefs about ontology and epistemology. Indeed, the very early step of defining one's research question is inherently tied to one's beliefs about ontology and epistemology, regardless of whether these beliefs have been explicated. That is, our underlying assumptions about what is worth studying and how it should be studied dictate the questions we will ask.


증거의 위계질서 뒤집기

Turning the Hierarchy of Evidence Upside Down


연구에 대한 후기실증주의적 패러다임을 가진 연구자들은 객관적인 측정에 관련된 연구 질문에 초점을 맞출 가능성이 높다(Crotty, 1998). 교육에서는 경험에 대해 묻는 질문의 공간, 전통적 의미로는 가늠할 수 없는 실천과 학습의 요소를 만들 필요가 있다. 예를 들어, 청각학 학생에 의해 입증된 고객에 대한 동정심과 공감을 어떻게 측정할 것인가?

Researchers with a postpositivist paradigm of inquiry • are likely to focus on research questions pertaining to objective measurement (Crotty, 1998). In education, we need to make space for questions that ask about experiences, and elements of practice and learning that cannot be measured in the traditional sense. For example, how would we go about measuring the compassion and empathy toward clients demonstrated by an audiology student?


나는 전문 교육과 실천의 저명한 이론가 쇤(1983년; 1987년)을 소개한다. 쇤은 프로페셔널 프랙티스의 이미지를 완전히 뒤집어 생각할 것을 제안했다turn on its head(KinseUa, 2007b). 우리는 종종 무엇보다도 기술적 기술과 기초적인 과학적 지식에 초점을 맞춘다. Schön은 전문직 종사자들이 오로지 [주로 기술 및 연구 기반 지식]에만 집중하기 보다는 [실무 기반 지식, 즉 개인적이고 실용적인 경험을 통해 개발되고 입증된 지식]으로 주의를 집중시키는 것이 유익할 수 있다고 제안했다. 이 제안은 높은 수준의 연구 증거에 의해 정보를 제공받도록 하기 위해 실무자들이 그들의 논리에 의문을 제기하도록 하는 증거 기반 관행(EBP)의 시대에 불안할 수 있다. 

I introduce Schön (1983; 1987), a renowned theorist of professional education and practice. Schön proposed that we turn our image of professional practice on its head (KinseUa, 2007b). So often we focus first and foremost on technical skills and basic scientific knowledge. Schön proposed that rather than focusing solely or primarily on technical and research-based knowledge, professions could benefit from a refocusing of attention to practice-based knowledge, that is, knowledge developed and demonstrated through personal and practical experience. This proposal can be unsettling in a time of evidence-based practice (EBP), in which practitioners are asked to question their reasoning to ensure it is informed by high-level research evidence.


그러나 쇤은 연구 기반 지식과 실천 기반 지식의 이분법을 설정하지 않는다오히려 [너무 흔히 사후 사상으로 덧씌워지거나 아예 간과되는] 'practice'의 측면에 관심을 갖는다(KinseUa, 2007b). 실제로 과학적이고 실무에 기반한 지식은 임상 추론을 위한 동등하고 보완적인 출처(KinseUa, 2007a; Mantzovikas, 2007, 2008)로 볼 수 있으며, 둘 다 전문 교육 과정에서 유의미한 주의를 기울일 가치가 있다.

 However, Schön does not set up a dichotomy between research-based knowledge and practice-based knowledge. Rather, he draws attention to aspects of practice that are too often added on as afterthoughts or even completely overlooked (KinseUa, 2007b). Indeed, scientific and practice-based knowledge may be viewed as equal and complementary sources for clinical reasoning (KinseUa, 2007a; Mantzovikas, 2007, 2008), both worthy of significant attention in the professional education process.


우리의 실천 문제를 뒤집어보자는 쇤의 제안과 유사하게, 우리는 보건 전문 교육자나 학자로서 우리의 전통적인 증거 서열 체계를 뒤집어 보는 것도 고려할 수도 있다. 전통적인 증거 서열은 체계적 검토, 메타분석, 무작위 통제 재판 등을 상위에 배치한다. 계층 구조의 하단에서 사례 연구와 전문가 의견을 찾는다(Sackett 등, 2000; Palmer, 2007; Moodie 등, 2008). 다른 이들은 연구 질문에 대한 접근방식의 적절성을 반드시 고려하지 않고 연구 접근방식의 좁은 관점을 취하기 때문에 과연 모든 연구분야에 이 위계가 적용가능성한 것인지에 의문을 제기하였다(Morse et al, 2001; Greenhalgh et al, 2003; Tickle-Degnen and Bedell, 2003; Whalley Hammeu and Carpartin, 2004; Whiteford, 200).5; Bartlett 등, 2006; Plath, 2006; Greenhalgh 및 Wieringa, 2011).

Similar to Schön's proposal to turn our practice problems upside down, we as health professional educators and scholars might also consider turning our traditional hierarchy of evidence on its head. The traditional hierarchy of evidence places systematic reviews, metaanalyses, and randomized controlled trials at the top. On the bottom of the hierarchy, we find case studies and expert opinion (Sackett et al, 2000; Palmer, 2007; Moodie et al, 2008). Others have questioned this hierarchy's applicability to all research areas, because it takes a narrow view of research approaches without necessarily considering the appropriateness of an approach to the research question (Morse et al, 2001; Greenhalgh et al, 2003; Tickle-Degnen and Bedell, 2003; Whalley HammeU and Carpenter, 2004; Whiteford, 2005; Bartlett et al, 2006; Plath, 2006; Greenhalgh and Wieringa, 2011).


첫째, 방향 마이크가 소음에서 음성 인식을 개선하는지 여부를 고려한다. 이 주제에 대한 전문가 의견이나 사례 연구는 매우 낮은 수준의 증거로 간주될 수 있다. 여기서는 대규모의 무작위 통제 시험이 청각 장애가 있는 일반 대중을 위한 방향 마이크로폰의 효과를 결정하는데 실현 가능하고 유익할 수 있다는 것은 타당해 보인다.

First, consider the question of whether directional microphones improve speech perception in noise. Expert opinion or a case study on this topic would be considered a very low level of evidence. Here it seems reasonable that a large scale, randomized controlled trial could be feasible and informative in determining the effectiveness of directional microphones for the general public with hearing loss.

둘째, 다음 질문을 고려하십시오. '신생아가 난청으로 '위험하다'는 꼬리표를 달고 보편적인 신생아 청력검사 후속목록에 올려졌을 때 가족의 정서적 경험은 무엇일까?' 이 주제에 대한 정량적 연구를 수행하는 것이 합당할까? 아마도 가족들을 조사하고 고통이나 다른 부정적인 감정적 영향을 경험한 비율을 분석하는 것이 공정할까? 나는 위의 연구 질문을 다룰 수 있는 더 풍부하고 유익한 연구 방법론이 있을 수 있다고 제안한다. 구체적으로 현상학이나 근거 이론과 같은 질적 방법론을 생각해 보겠다. 

Second, consider this question: What is the emotional experience of a family when their newborn is labeled "at risk" for hearing loss and is placed on a universal newborn hearing screening follow-up list? Would it be fair to conduct a quantitative study on this topic, perhaps surveying families and analyzing the proportion that experienced distress or other negative emotional effects? I suggest that there could be a richer and more informative research methodology with which to address the research question above. Specifically, I would consider a qualitative methodology such as phenomenology or grounded theory 


이제, 우리의 증거의 서열로 돌아가면, 근거이론 연구는 어디로 떨어질까? 흥미롭게도, 그것은 연구 증거의 전통적인 계층 구조에서는 고려되지 않는 것처럼 보인다. 한편, 질적 연구는 건강 직업에서 인기를 끌고 있다(Morse et al., 2001; WhaUey HammeU and Carpeter, 2004; Bunniss and Kelly, 2010; Rees and Monruxe, 2010).

Now, returning to our hierarchy of evidence, where would a grounded theory study fall? Interestingly, it does not appear to even be considered on the traditional hierarchy of research evidence. Meanwhile, qualitative research is growing in popularity in the health professions (Morse et al, 2001; WhaUey HammeU and Carpenter, 2004; Bunniss and Kelly, 2010; Rees and Monrouxe, 2010).


이 기사는 단순히 청각학에서 발표된 연구의 대다수가 포스트 포시티브 패러다임에서 나오고 양적 방법론을 사용한다는 이유만으로 질적 접근에 초점을 맞추고 있다.

This article focuses on qualitative approaches simply because the majority of research published in audiology comes from a postpositivist paradigm and uses quantitative methodologies.


청각학 교육의 연구를 위한 방법론적 고려사항

METHODOLOGICAL CONSIDERATIONS FOR RESEARCH IN AUDIOLOGY EDUCATION


온톨로지, 인식론 및 방법론

Ontologies, Epistemologies, and Methodologies



일반적인 질적 연구, 즉 그들의 지침 패러다임을 명확히 하지 않는 연구도 존재한다. 오히려, 이러한 연구들은 데이터 수집과 분석에 질적인 방법을 사용하며, 이론적 관점 및 따라서 그들이 알게 된 방법론은 고려하지 않는다. 이러한 연구가 도움이 되지 않는 것은 아니지만, 종종 질적 방법론학자 및 HPE의 연구자들에 의해 비판을 받는다(Ponterotto, 2005; Bunniss and Kelly, 2010; Rees and Monruxe, 2010).

Generic qualitative studies exist too, that is, studies that do not articulate their guiding paradigms. Rather, these studies use qualitative methods for data collection and analysis and do not consider the theoretical perspective and thus the methodology by which they were informed. These studies are not unhelpful but often undergo critique by qualitative methodologists and researchers of HPE (Ponterotto, 2005; Bunniss and Kelly, 2010; Rees and Monrouxe, 2010).


질적 연구에서는 방법론과 방법이 뚜렷하게 기술되어 있다. 

    • [방법론]은 가정, 원칙 및 절차의 분석을 포함하여 조사가 어떻게 진행되어야 하는지에 대한 이론으로 정의된다(Schwandt, 2007). 

    • 반면에 [방법]은 데이터 수행 분석을 수집하는 데 사용되는 도구와 기술이다(Meston 및 Ng, 2012).

In qualitative research, methodologies and methods are distinctly described. 

    • Methodology is defined as theory of how inquiry should proceed, involving analysis of assumptions, principles, and procedures (Schwandt, 2007) whereas 

    • methods are the tools and tochniques that are used to gather data ana conduct analyses (Meston and Ng, 2012).


정성적 연구 접근방식에서 발견되는 [일반적인 방법]으로는 포커스 그룹, 인터뷰, 문서 검토, 관찰 등이 있다. 분석 단계에서는 catogorizing, coding, concept mapping, constant comparisation 등이 일반적으로 사용되는 방법이다.

Common methods found in qualitative research approaches include focus groups, interviews, document review, observation, and many more. In the analysis phase, catogorizing, coding, concept mapping, and constant comparison are methods commonly used.


교육연구로의 여정의 예

An Example of a Journey into Educational Research


내가 근거이론의 방법론을 선택하는 지경에 이르렀을 때, 근거이론에 관련된 방법들이 그것을 방법론으로 만들지 않는다는 것을 깨달았다. 오히려 그 근거이론을 실천하는 학파(온톨로지, 인식론 포함)가 방법론적 특성을 구성한다. 따라서, 나는 나 자신의 철학적 입장과 연구 질문에 가장 잘 부합하는지를 결정하기 위해 기초 이론의 각 학파를 탐구할 필요가 있었다.

when I reached the point of choosing the methodology of grounded theory, I realized that the methods involved in grounded theory do not make it a methodology. Rather, the school of inquiry (which includes ontology and epistemology) in which that grounded theory is practiced make up its methodological characteristics. Hence, I needed to explore each school of grounded theory to determine the best alignment with my own philosophical stance and my research question.


나의 관심 주제는 성찰적 실천이었는데, 다음과 같은 구체적인 연구 질문들이 있었다: "청각학 학생들은 어떻게 성찰을 사용하여 전문적 실무자로 발전하는 것인가?"

My topic of interest was reflective practice, with the following specific research question: "How do audiology students use reflection to develop as professional practitioners?"


방법론적으로 성찰과 성찰적 실천이 '과정'으로서 이루어진다고 생각했다. 성찰은 "어떤 신념이나 어떤 형태의 지식이든 그것을 뒷받침하는 근거와 그것이 경향하는 추가적인 결론에 비추어 적극적이고 지속적이며 신중한 고려"이다(Dewey, 1910, 페이지 9). 두 개의 하위 프로세스로 구성된다. 

Methodologically, I considered that reflection and reflective practice take place as processes. Reflection is "active, persistent and careful consideration of any belief or supposed form of knowledge in light of the grounds that support it and further conclusions to which it tends" (Dewey, 1910, p. 9). It consists of two subprocesses: 


(1) 당황, 망설임 또는 의심의 상태 및 

(1) a state of perplexity, hesitation, or doubt, and 


(2) 제시된 신념을 지지하거나 반증하기 위한 조사(Dewey, 1910).

(2) investigation to support or disprove the suggested belief (Dewey, 1910). 


[성찰적 실천]은 전문적인 실천에서 일어나는 [구체화되고 의도적이며 노골적인 형태의 실천]에 대해 이론화하는 실용적인 방법이다. [성찰적 실천]은 전문적 실천가로서 착수하는 여정이나 과정으로 볼 수 있으며, 이를 통해 실천을 개선하기 위해 지속적으로 노력할 수 있다.

Reflective practice is a practical way of theorizing about the embodied (Kinsella, 2008) and intentional, explicit forms of reflection that take place in professional practice. Reflective practice can be viewed as a journey or process that one embarks on as a professional practitioner, through which one can continuously strive to improve practice (Kinsella, 2007a; KinseUa and Jenkins, 2007).


기초 이론의 각 학파는 그 자신의 존재론적, 인식론적, 이론적 신념에 의해 뒷받침된다. 3개의 주요 학교가 고려되었다: 글레이저 학파 (Glaser and Holton, 2004; Glaser and Strauss, 1967; Glaser and Strauss, 1967), 실용주의자 (Corbin and Strauss, 2008), 그리고 건설주의자 (Charmaz, 2006). 글레이저는 원래 스트라우스와 함께 일하기 시작했지만, 스트라우스는 나중에 코빈과 함께 기초 이론의 실용주의 분과를 발전시키는 쪽으로 나아갔다는 점에 주목한다.

Each school of grounded theory is underpinned by its own ontological, epistemological and theoretical beliefs. Three major schools were considered: Glaserian (Glaser and Holton, 2004; Glaser and Strauss, 1967), pragmatist (Corbin and Strauss, 2008), and constructivist (Charmaz, 2006). Note that Glaser originally began working with Strauss, but Strauss later moved on to develop the pragmatist branch of grounded theory with Corbin.

[글레이저]자료에서 나올 수 있는 하나의 참된 현실을 믿는 것처럼 보였고, 따라서 진실을 발견하기 위해서는 편견을 피해야 한다고 믿었다. 그는 또한 기초 이론가들이 더 넓은 수준에서 실질적인 연구 결과를 일반화하기 위해 노력할 것을 권고했다(Glaser, 2007). 이것은 현실주의자, 객관주의자, 실증주의자/사후 실증주의자 관점과 일치한다. 여기서 기초 이론이 항상 질적만을 위한 접근법으로 여겨진 것은 아니라는 점을 지적하는 것이 중요하다. 글레이저와 스트라우스(1967)는 원래 근거 이론의 개발에서 양적 데이터를 고려했다.

Glaser appeared to believe in one true reality, which can emerge from the data, and thus believed that to discover the truth, one must avoid bias. He also recommended that grounded theorists strive to generalize their substantive findings at a broader level (Glaser, 2007). This aligns with a realist, objectivist, positivist/ postpositivist perspective. It is important to point out here that grounded theory was not always considered a qualitative-only approach. Glaser and Strauss (1967) originally considered quantitative data in their development of grounded theory.

[실용주의 학파]에서는 코빈과 스트라우스(2008)가 상대주의, 주관주의, 해석주의 관점에 기울어 실용주의, 상징적 상호작용론자(Blumer, 1969)의 연구에 찬성하는 것처럼 보였다. 그들은 연구가 하나의 진정한 현실을 발견할 수 있다고 믿지는 않았고 다른 관점과 맥락들이 이 현실이 될 수 있는 것에 영향을 미쳤다고 생각하지는 않았지만, 연구가 데이터와 분석에 최소한의 개인적 믿음을 부여하면서 현실의 근사치를 시도할 수 있다고 생각했다(Corbin and Strauss, 2008; Meston and Ng, 2012).

In the pragmatist school, Corbin and Strauss (2008) appeared to lean toward a relativist, subjectivist, interpretivist perspective, favoring a pragmatic, symbolic interactionist (Blumer, 1969) approach to their research. They did not believe that research could discover one true reality and considered that different perspectives and contexts influenced what this reality may be, but did think research could attempt to approximate reality, imposing minimal personal belief onto the data and analyses (Corbin and Strauss, 2008; Meston and Ng, 2012).


[구성주의 근거 이론 지지자] Charmaz(2006)는 자신이 코빈과 스트라우스와 같은 관점에 뿌리를 두고 있다고 생각했다. 그러나, Charmaz는 개인의 구성과 참여자-연구자 공동구성coconstruction이 데이터에서 제거될 수 없으며, 제거되어서는 안 된다는 것을 더욱 인정하고 존중하겠다는 목표를 밝혔다. Charmaz는 그녀의 인식론적, 이론적 견해를 일부 실용주의 뿌리가 있는 구성주의자, 해석주의자, 구성주의자라고 묘사했다(2004; 2006). Charmaz, Corbin, Strauss 사이의 이러한 역동적 견해는 종류의 진화를 반영할 수 있지만, [한 연구자의 이론적 렌즈는 맥락과 회색 영역, 퍼지 경계선 또는 다양한 이론적 위치들 사이에서서 중첩될 가능성]이 있다는 것을 반영한다고 보는 것이 더 그럴듯하다.

Constructivist grounded theory proponent Charmaz (2006) considered herself to be rooted in the same perspectives as Corbin and Strauss. However, Charmaz expressed the goal of further recognizing and respecting that individual constructions and participant-researcher coconstructions of reality cannot (and should not) be eliminated from data. Charmaz described her epistomological and theoretical views as constructionist, interpretive, and constructivist, with some pragmatist roots (2004; 2006). This dynamic nature of views among Charmaz, Corbin, and Strauss could reflect an evolution of sorts but more likely reflects the potential for one's theoretical lens to shift depending on context, and the gray zones, fuzzy borders, or overlap between various theoretical positions.


Table 2



고찰 DISCUSSION


위의 예는 교육 연구의 사회적 본성에 대한 참여를 예시하고 있다. 우리는 교육이 복잡한 사회적 과정이라는 것을 인정해야 하며, 연구 접근법은 단순화된 표현을 일반화하기보다는 복잡성을 이해하려는 방법론을 채택함으로써 이러한 복잡성을 존중해야 한다. 이를 위해 레게르(2010년)는 입증과 단순화된 일반화(물리과학에서 채택)의 필수에서 이해와 복잡성을 나타내는 필수 사항으로 교육 연구의 방향을 바꿀 것을 요구한다.

The example above illustrates engagement with the social nature of education research. We must acknowledge that education is a complex social process, and research approaches must honor this complexity by employing methodologies that seek to understand complexity rather than generalize a simplified representation. To this end, Regehr (2010) calls for a reorientation of education research from an imperative of proof and simplistic generalizability (adopted from the physical sciences) to an imperative of understanding and representing complexity.


마찬가지로, 레게르(2010년)는 새로운 교육 접근방식에 대한 [학문적 "쇼 앤 텔(show and tell)"에서 벗어나] 우리가 직면하고 있는 도전과 우리가 해야 할 고려사항에 대한 [공유되고 심화된 이해를 추구]할 것을 요구한다. "쿡북" 해결책은 교육이 실행되는 다양한 맥락에서 효과적이지 않을 것 같다. 레게르(2010년)는 "역량은 개개인에게 존재하는 것이 아니라, 무언가를 실천하는 상황에서 끊임없이 진화하는 맥락과의 상호 작용 속에 있는 것"이라고 말한다. [T]그의 교육학은 일반적인 문제에 대한 더 나은 일반화 가능한 해결책을 만들고 공유하는 것이 아니라, 우리가 직면한 문제에 대해 더 나은 사고 방식을 만들고 공유하는 것이다."(37쪽)

Likewise, Regehr (2010) calls for a move away from an academic "show and tell" of new teaching approaches toward a mutual goal of a shared, deepened understanding of the challenges we face and considerations we need to make. "Cookbook" solutions are unlikely to be effective in the varied contexts in which education is practiced. Regehr (2010) states that "competence does not exist in the individual, but in the individual's interaction with the constantly evolving context in which he or she is practicing ... [T]he science of education is not about creating and sharing better generalisable solutions to common problems, but about creating and sharing better ways of thinking about the problems we face" (p. 37)


Bunniss와 Kelly(2010)에 따르면, 사회 연구 전통을 따르는 HPE 연구는 생성적 목적generative purpose를 중요시한다. 즉, 가설을 검증하기 보다는 현상에 대한 다른 해석의 출현을 허용한다. 교육 연구를 위한 조사의 후기실증주의 패러다임을 엄격하고 배타적으로 고수하는 것은 한 가지 유형의 지식을 다른 것들보다 특권적으로 우선시하는 것이다. 이러한 현실주의적이고 객관주의적인 유형의 지식은 기초과학에 잘 맞는 지식이다교육 연구는 그 분야의 학자들에 의해 엄격하게 통제된 실험 설계와는 잘 맞지 않는 다른 종류의 과학으로 간주되고 있다(Bunniss and Kelly, 2010; Regehr, 2010). 따라서 사회과학의 방법론이 요구된다.

According to Bunniss and Kelly (2010), HPE research that follows the social research tradition serves a generative purpose; rather than testing hypotheses, it allows the emergence of different interpretations of a phenomenon. To adhere strictly and exclusively to the postpositivist paradigm of inquiry for education research would be to privilege one type of knowledge over others. This realist, objectivist type of knowledge is one that fits well in the basic sciences. Education research is considered by scholars in the field to be a different kind of science, one that is not well suited to tightly controlled experimental designs (Bunniss and Kelly, 2010; Regehr, 2010), and thus methodologies from the social sciences are required.





Review

 

. 2013 May;24(5):344-353.
 doi: 10.3766/jaaa.24.5.2.

Theory and research in audiology education: understanding and representing complexity through informed methodological decisions

Abstract

Background: The discipline of audiology has the opportunity to embark on research in education from an informed perspective, learning from professions that began this journey decades ago. The goal of this article is to position our discipline as a new member in the academic field of health professional education (HPE), with much to learn and contribute.

Purpose: In this article, I discuss the need for theory in informing HPE research. I also stress the importance of balancing our research goals by selecting appropriate methodologies for relevant research questions, to ensure that we respect the complexity of social processes inherent in HPE.

Data collection and analysis: Examples of relevant research questions are used to illustrate the need to consider alternative methodologies and to rethink the traditional hierarchy of evidence. I also provide an example of the thought processes and decisions that informed the design of an educational research study using a constructivist grounded theory methodology.

Conclusions: As audiology enters the scholarly field of HPE, we need to arm ourselves with some of the knowledge and perspective that informs the field. Thus, we need to broaden our conceptions of what we consider to be appropriate styles of academic writing, relevant research questions, and valid evidence. Also, if we are to embark on qualitative inquiry into audiology education (or other audiology topics), we need to ensure that we conduct this research with an adequate understanding of the theories and methodologies informing such approaches. We must strive to conduct high quality, rigorous qualitative research more often than uninformed, generic qualitative research. These goals are imperative to the advancement of the theoretical landscape of audiology education and evolving the place of audiology in the field of HPE.

초첨길이 가변성: 의학교육연구에서 연구질문(Acad Med, 2019)

Focal Length Fluidity: Research Questions in Medical Education Research and Scholarship

Meredith Young, PhD, Kori LaDonna, PhD, Lara Varpio, PhD, and Dorene F. Balmer, PhD




1905년 알버트 아인슈타인은 상대성 이론을 발전시켰는데, 그 중에서도 블랙홀의 존재를 예측했다.1 아인슈타인이 자신의 이론을 정리한 이후 세기에 블랙홀의 존재를 암시하는 설득력 있는 증거가 생겨났지만, 다원적 과학자 팀은 최근에야 빛이 1.2로 소용돌이치는 모습을 문서화했다. 이 이미지는 천체물리학, 컴퓨터 공학, 공학 등 다양한 분야의 수많은 사람들이 천문학적인 양의 일을 시각적으로 표현한 것이다이 이미지는 추상적 사고에서 실제 실험에 이르는 범위에 걸쳐 질문을 받고 연구를 수행하고 있는 질문의 정점을 나타낸다. 이 이미지를 포착하기 위해서는 이론적이고 실용주의적인 여러 렌즈가 필요했을 뿐만 아니라, 리터럴 렌즈도 여러 개 필요했다. 이 사진을 찍기 위해 과학자들은 기본적으로 전 행성을 카메라 렌즈로 바꾸어 8개의 국제 사이트(그린랜드에서 남극으로, 하와이에서 프랑스 알프스로 이어지는 이벤트 지평선 망원경)에 걸쳐 있는 망원경 배열 위에 올려놓았다.3 렌즈, 국제 협력, 다원적 작업의 풍부한 결합을 통해 한때 불가능해 보였던 노력이 이루어졌다. 기고 과학자들 중 한 명은 이렇게 말했다. "우리 중 누구도 혼자 할 수 없었을 것이다. 다양한 배경을 가진 다양한 사람들이 모여들었기 때문에 그렇게 된 것이다."4

In 1905, Albert Einstein developed his theory of relativity, which, among other things, predicted the existence of black holes.1 While compelling evidence has accrued suggesting the existence of black holes in the century since Einstein penned his theory, a multidisciplinary team of scientists only recently captured an image documenting light spiraling into one.2 This image is a visible representation of an astronomical amount of work by scores of people from a variety of disciplines, including astrophysics, computer science, and engineering. This image represents the culmination of questions being asked— and research being conducted—across a spectrum from abstract thinking to hands-on experimentation. Not only were multiple theoretical and pragmatic scholarly lenses needed to capture this image, but multiple literal lenses were needed as well. To take this picture, scientists essentially turned the entire planet into a camera lens—relying on arrays of telescopes across 8 international sites (the Event Horizon Telescope array from Greenland to the South Pole; from Hawaii to the French Alps).3 Through a combination of lenses, international collaborations, and a wealth of multidisciplinary work, an endeavor that once seemed impossible was achieved. One of the contributing scientists noted: “None of us could’ve done it alone. It came together because of lots of different people from many different backgrounds.”4


건강직업교육(HPE) 연구는 블랙홀 이미지화에 필요한 학제간 협업과 중요한 유사성을 공유한다. 임상의 교육을 연구하기 위해서는 학자들이 확고한 실용주의자들부터 깊은 이론적인 사람들까지 다양한 질문을 하고 복수의 이론적, 방법론적, 교육학적, 분석적 렌즈의 힘을 활용해 답할 것을 요구한다. 이러한 다양성은 HPE 연구를 강화하지만, 5–7 그것은 또한 HPE 분야를 설명하고 탐색하는 것을 어렵게 만든다. 예를 들어, 마티외 알버트는 

  • 의도된 청중(즉, 사용자 또는 생산자를 위한 연구)기반의 연구와

  • 연구 질문의 목적(즉, 서비스 기반 vs 호기심 주도형)기반의 연구를 

...특징으로 삼았다. 그들은 연속체의 양 끝이며, HPE 학자들의 연구는 전체 스펙트럼을 따라 착륙한다.

Research in health professions education (HPE) shares important similarities with the interdisciplinary collaborations required to image a black hole. Studying the education of clinicians requires scholars to ask questions ranging from the firmly pragmatic to the deeply theoretical and to answer them by harnessing the power of multiple theoretical, methodological, pedagogical, and analytical lenses. While this diversity strengthens HPE research,5–7 it also makes the HPE field difficult to describe and navigate. For instance, Mathieu Albert has characterized HPE scholarship 

  • based on the intended audience (i.e., scholarship for users or scholarship for producers)8 and 

  • based on the purpose of the research question (i.e., service based vs curiosity driven).9 

they are ends of a continuum, with the work of HPE scholars landing along the entirety of the spectrum.


그러나, HPE 학자들은 [다른 학자들에게 정보를 주기 위한 의도의 이론적 호기심 중심의 연구]나 [교육자와 학습자를 위한 실용적인 응용을 개발하는 깊이 있는 실용주의 지향적인 연구]에 종사한다는 인식이 있다. 이분법적 사고방식은 어떤 상황에서는 유용할 수 있지만, 이러한 이분법적 사고방식은 [우리 지식분야의 잠재적인 사각지대]와 [연구의 타입에 따른 위계의 인식]에 기여할 수 있다. 학자들은 특정 청중(예: 생산자 대 사용자) 또는 특정 연구 목적(예: 호기심 중심 대 서비스 지향)과 일치해야 할 의무를 느낄 수 있다.

And yet, there is a perception that HPE scholars either engage in theoretical curiosity-driven work that intends to inform other scholars or in deeply pragmatically oriented work that develops practical applications for educators and learners. While dichotomies can be useful in some circumstances, this dichotomy-based thinking can contribute to perceived hierarchies of types of work and potential blind spots in our field of knowledge. Scholars can feel obliged to align themselves with a particular audience (e.g., producers vs users) or a particular research purpose (e.g., curiosity driven vs service oriented).


만약 우리가 우리 분야에서 대표되는 렌즈의 [다양성]을 이용하지 않는다면, 우리는 임상의 교육에 관련된 복잡한 현상의 미묘한 그림을 포착하기 위해 [서로의 성과를 기반으로 하는 능력]을 잃을 위험이 있다.

if we don’t make use of the diversity of the lenses represented in our field, we risk losing the ability to build on each other’s accomplishments to capture a nuanced picture of the complex phenomena involved in the education of clinicians.


10여 년 전 보르디지는 의학 교육 연구자들에게 "이론 검증과 이론 구축을 모두 촉진하는 프로그램적 연구를 집중적으로 연구할 것"을 요구했다.10 이러한 요구에도 불구하고 좋은 질문 개발, 연구 프로그램 구축, 이론 참여에 대한 H의 경향은 여전하다.PE 연구자들은 의도된 청중(즉, 사용자를 위한 장학금이나 생산자를 위한 장학금) 또는 연구 질문의 목적(즉, 서비스 기반 또는 호기심 유발)을 바탕으로 자신의 작업에 대해 생각한다.

Over a decade ago, Bordage called for medical education researchers to “focus on the research questions asked and on building programmatic research that fosters both theory testing and theory building.”10 Despite this call to attend to developing good questions, building programs of research, and engaging with theory, there remains a tendency for HPE researchers to think about their work based on intended audience (i.e., either scholarship for users or scholarship for producers) or on the purpose of the research question (i.e., either service based or curiosity driven).


[청중이나 목적에 따라 작품을 분류]하는 이러한 배타적인 방법들은, 연구자들을 질문을 하고 HPE의 스냅사진만 제공하는 학술적인 대화를 하는 "사일로"로 이끌게 했다. 그러한 초점은 [연속적으로 작업할 수 있는 우리의 능력]과 [HPE 관행을 알리는 모든 조사, 즉 이론적, 실용적으로 지향하는 조사]을 방해한다. 다시 말해서, 우리는 블랙홀의 이미지와 같이 HPE의 더 나은 그림을 만들기 위해 모든 렌즈를 사용하는 것을 옹호한다.

These exclusive ways of categorizing work by audience or purpose have led researchers to gravitate to research silos that ask questions and hold scholarly conversations that provide only a snapshot of HPE. Such focus curtails our abilities to work across the continuum and to build off all the investigations informing HPE practices— those theoretically and pragmatically oriented. In other words, we advocate using all our lenses to create a better picture of HPE, much like the image of the black hole.


우리는 렌즈의 유추에 의존하여 연구 질문이 초점 길이가 다른 렌즈와 어떻게 유사한지를 설명한다. 즉 현미경, 돋보기, 쌍안경, 망원경으로 보이는 것은 기하급수적으로 다르다. 

  • 현미은 세포 수준에서 중요한 질문들을 묻고 답할 수 있게 해주고, 

  • 돋보기는 작은 생태계를 검사할 수 있게 해주며, 

  • 쌍안경은 우리가 환경 시스템을 가로지르는 것을 볼 수 있게 해주며, 

  • 망원은 우주 수준에서 질문을 곰곰이 생각해 볼 수 있게 도와준다.

Relying on an analogy of lenses, we describe how research questions are akin to lenses that have different focal lengths. That is, what is made visible by a microscope, magnifying glass, binoculars, and a telescope differs exponentially. 

  • Microscopes enable us to ask and answer important questions at the cellular level, 

  • magnifying glasses allow us to examine small ecosystems, 

  • binoculars empower us to see environmental systems across a landscape, and 

  • telescopes help us to ponder questions at the cosmic level.


마찬가지로, 다른 유형의 연구 질문은 다른 초점 렌즈를 가지고 있다. 

  • 어떤 질문들은 고도의 문맥화된 현상들에 초점을 맞추고 있다(우리는 이러한 미시적 수준을 지칭해 왔다), 

  • 어떤 질문들은 브리지 이론과 실제 (메소 수준), 그리고 

  • 다른 질문들은 현상의 철학적, 이론적 측면을 다루고 있다(매크로 수준).

Similarly, different types of research questions have different focal lenses: 

  • Some questions focus on highly contextualized phenomena (we have termed these microlevel), 

  • some questions bridge theory and practice (mesolevel), and 

  • other questions address philosophical and theoretical aspects of a phenomenon (macrolevel).


우리는 단지 [주어진 현상에 대한 다른 잠재적 초점 길이]를 강조하기 위한 수단으로 그것을 의도한다. 초점 길이가 다르면 다른 질문을 할 수 있고, 다른 지식이 생성될 수 있으며, 문헌에 다른 종류의 기여를 할 수 있으며, 결합하여 HPE에서 중요한 현상에 대한 훨씬 더 포괄적인 관점을 제공한다.

we intend it simply as a means to highlight the different potential focal lengths for a given phenomenon. Different focal lengths allow for different questions to be asked, different knowledge to be generated, and different kinds of contributions to the literature and, in combination, give us a much more comprehensive view of important phenomena at play in HPE.


초점 길이가 다른 연구 질문: 마이크로, 메소, 매크로

Research Questions of Different Focal Lengths: Micro, Meso, Macro


이 부록에 포함된 대부분의 논문은 현미경과 유사한 초점 길이의 렌즈를 사용한다(Baju et al11; Wendling et al12; Novak et al16; Saudek et al18; Yudkowsky et al19; Youm과 Coral20). 이러한 미시적 수준의 질문은 설계상 매우 집중적이고 실용적이며 종종 국지적으로 내재되어locally embedded 있다. 

예를 들어, 표준화된 환자 접촉 후 미국 의료 면허 검사- 스타일 환자 노트의 교수 점수에 대한 비용 효과적이고 실현 가능한 대안을 모색하면서, Yudkowsky 외 19는 "비의사 평가자들이 의료 학생의 임상추론을 신뢰성 있게 평가하기 위해 교수진별 점수 계산식이 있는 체크리스트를 사용할 수 있는가?"라고 물었다.또한, Saudek et al18은 입학 결정과 관련된 사람들에게 더 잘 알려주기 위한 노력으로 "추천문서에서 일반적으로 사용되는 문구는 어떻게 해석되는가?"라고 물었다. 

Most of the papers included in this supplement use a lens with a focal length akin to a microscope (Bajwa et al11; Wendling et al12; Novak et al16; Saudek et al18; Yudkowsky et al19; Youm and Corral20). These microlevel questions are—by design—very focused, pragmatic, and often locally embedded. 

For example, seeking a cost-effective and feasible alternative to faculty scoring of United States Medical Licensing Examination– style patient notes following standardized patient encounters, Yudkowsky et al19 asked, “Can nonclinician raters use checklists with faculty-specific scoring formulas to reliably assess medical students’ clinical reasoning?” Additionally, in an effort to better inform those involved in admissions decisions, Saudek et al18 asked, “How are phrases commonly used in letters of recommendation interpreted?” 

이는 상황 및 맥락에 얽매인 현상에 세심한 주의를 기울이면서 중요한 실용주의 지향적인 문제에 초점을 맞춘 양질의 작업이 HPE의 훈련과 평가의 질에 크게 기여할 수 있음을 보여주는 사례들이다.

These are examples of how high-quality work focused on important pragmatically oriented problems, with careful attention to situation-and context-bound phenomena, can greatly contribute to the quality of training and assessment in HPE.


부록에 포함된 다른 논문에서는 돋보기(Chua et al13; Chaudhary et al15; Bullock et al17; Ju 및 van Schaik21)와 유사한 초점 길이를 가진 렌즈를 사용한다. 이러한 [중간 수준]의 질문은 관련 이론과 주어진 연구 연구의 실용주의 사이의 균형을 이루는 질문이다. 

예를 들어 지도력 분류 이론과 실제 거주 리더십 훈련의 균형을 맞춘 주씨와 반 샤이크21은 "레지던트들은 의사를 간호사보다 더 나은 지도자로 평가하고, 남성이 여성보다 더 나은 지도자로 평가하느냐"고 물었다. 또한 Chaudhary 외 연구진들은 통합지침에 대한 이전의 이론 구축 연구를 통해 "건강시스템 지식의 통합 교육이 임상적 특징만을 위한 교육보다 더 효과적일 것인가?"라는 질문을 던지며 연구 의제를 확장했다. 

Other papers included in the supplement use a lens with a focal length similar to a magnifying glass (Chua et al13; Chaudhary et al15; Bullock et al17; Ju and van Schaik21). These mesolevel questions are those that balance a relevant theory with the pragmatics of a given research study. 

For instance, balancing leadership categorization theory with actual leadership training in residency, Ju and van Schaik21 asked, “Do residents rate physicians as better leaders than nurse practitioners, and do they rate males as better leaders than females?” Additionally, informed by their prior theory-building research on integrated instruction, Chaudhary et al15 extended their research agenda by asking, “Would integrated instruction of health systems knowledge be more effective than clinical-features-only instruction?” 

이러한 중간 수준의 논문 각각에서, 연구는 개념적 및/또는 이론적 프레임워크에 내장되어 있다. 즉, 발견finding의 설계, 구현 또는 해석에 inform하기 위하여 이론에서 도출한 것이다.

In each of these mesolevel papers, the study is embedded within a conceptual and/or theoretical framework—drawing from theory to inform the design, implementation, or interpretation of findings.


여전히 다른 사람들은 망원렌즈를 사용하여 HPE 연구와 관련된 이론적 원리에 직접 대응하거나 도출하는 거시적 수준의 질문을 한다(부르주아 로 외 22; 수이 외 al14). 

예를 들어, 문헌에 수록된 심리적 안전의 원리를 끌어냄으로써, 츠에이 외 연구진(Tsue et al14)은 의학 학습자의 심리적 안전의 개념화에 관한 풍부한 통찰력을 개발하여 향후의 의학 교육 시책에 이용될 수 있는 이론적 구조를 개발하는 것을 목표로 하였다. 그리고 의료업계가 어떻게 임상 역량에 어려움을 겪는 의사를 지원하는 업무를 개념화하는지를 탐구하는 연구에서, 부르주아-로 외 22명은 "치료 이해당사자들은 어떻게 임상 역량 문제에 대한 교정조치가 필요한 의사를 개념화하는가?"라고 물었다. 

Still others use a telescopic lens and ask macrolevel questions that respond to, or draw directly from, theoretical principles relevant to HPE scholarship (Bourgeois-Law et al22; Tsuei et al14). 

For example, by drawing on principles of psychological safety contained in the literature, Tsuei et al14 aimed to develop rich insights about medical learners’ conceptualizations of psychological safety to develop theoretical constructs that can be used in future medical education initiatives. And in a study exploring how the medical profession conceptualizes the task of supporting physicians who struggle with clinical competency, Bourgeois-Law et al22 asked, “How do remediation stakeholders conceptualize physicians requiring remediation for clinical competence issues?” 

이러한 유형의 문항은 일반적으로 HPE와 관련이 있지만, 종종 HPE분야를 넘어서는 맥락에서 이론을 테스트, 확장 또는 개발한다.

These types of questions typically test, expand, or develop theory in contexts that are relevant to HPE but often extend beyond HPE as a field.


초점 길이의 유동성

Fluidity of Focal Lengths


본 부록에 수록된 개별 작품들을 미시적, 중간적 또는 거시적 수준으로 특징지었지만, 특정 현상에 대한 학자의 관심은 단일 유형의 문제에 고정되어 있는 경우는 드물다. 마찬가지로, 단일 문항은 한 수준에서만 관련이 없으며 마이크로, 메소 또는 매크로로 명확하게 식별할 수 없는 경우도 많다.

While we have characterized individual works contained within this supplement as micro-, meso-, or macrolevel, a scholar’s interest in a particular phenomenon is rarely fixed to a single type of question. Similarly, single questions are neither relevant at only one level nor definitively identifiable as micro, meso, or macro.


[거시적인 차원]에서, 한 학자는 어떤 현상에 대해 광범위한 질문을 던지면서 특정한 문제를 이해하는 데 관심이 있을 수 있다. 예를 들어, 

학습자의 정서적 경험이 교육 궤도에 어떤 영향을 미치는가? 

여성 교직원들은 어떻게 학술 의학을 젠더화된 조직으로 경험하는가? 

On a macrolevel, a scholar might be interested in understanding a specific issue, asking broad questions about a phenomenon, such as: 

How do learners’ emotional experiences impact their educational trajectory? 

How do women faculty members experience academic medicine as a gendered organization? 

이와는 대조적으로, [미시적인 수준]에서, 학자는 어떤 현상의 보다 집중적인 측면에 관심을 가질 수 있다. 예를 들어, 운영적 차원의 질문으로,

수치심의 경험이 미국의 사립 의과대학에서 의대생들의 특별한 선택에 어떻게 영향을 미치는가?

팀 기반 학습을 통해 학습자가 전자 건강 기록을 통해 의사소통하는 소아 입원 환자 간 전문 의료 팀에서 협업할 수 있도록 어떻게 준비할 수 있는가?

In contrast, at a microlevel, a scholar might be interested in a more focused aspect of a phenomenon, asking questions at an operational level, such as: 

How does the experience of shame impact medical students’ specialty choice in American private medical schools? 

How can team-based learning be used to prepare learners to collaborate in pediatric inpatient interprofessional health care teams that communicate via an electronic health record?


환자 오너십을 두고 HPE 연구자는 초점길이에 따라 다음과 같은 질문을 할 수 있다.

Questions an HPE researcher might ask regarding patient ownership with different focal lengths include the following:

1. HPE에서 "오너십"의 의미는 무엇인가?

1. What are the implications of “ownership” in HPE?

2. 환자 소유권은 보건 전문 문헌에서 어떻게 정의되고 설명되고 있는가? 환자 소유와 관련된 태도나 행동에 영향을 미치는 개인, 체계적 또는 기타 상황적 요인은 무엇인가?

2. How is patient ownership defined and described in the health professions literature? What individual, systematic, or other contextual factors have been shown to influence attitude or behaviors tied to patient ownership?

3. 주치의는 두 가지 다른 맥락(주치의와 응급실)에서 환자의 소유권을 어떻게 가르치고 있는가?

3. How do attending physicians teach patient ownership in two different contexts (primary care and emergency room)?

1번 질문에서 3번 질문으로 넘어가면서, 연구자는 실용적이고 문맥에 특정한 수준의 지식으로 전환하고 있다. 이들을 구분하는 것은 연구 질문이 [실용적 적용]과 [추상적 개념화]에 어느 정도 관여하는가이다.

in moving from question 1 to 3, the researcher is transitioning to a pragmatic and context-specific level of knowledge. What separates them is the extent to which the research question engages with practical application and abstract conceptualizations.

[거시적 수준]의 질문을 다루는 연구를 수행하기 위해서는, 연구자는 주어진 목표된 맥락 안에서 더 좁고, 더 구체적이고, 연구해야 하는 과정인 운영화되거나 결정화될 수 있는 연구 질문을 고안해야 한다. 본질적으로, 거시적 수준의 질문은 환자 소유권 예에서 제안한 것처럼, 일련의 "어떻게 질문"들에 의해 연구가능study-able한 메소 또는 미시적인 질문으로 변형된다. 이러한 "어떻게" 질문에는 다음과 같은 것이 포함된다: 

이런 상황에서 이 이론이 어떻게 관련성을 갖도록 만들 수 있을까? 

이 이론을 어떻게 관찰하고 측정할 수 있을까?

To conduct a study that addresses a macrolevel question, the researcher must craft a research question that can be operationalized or crystallized, a process that often requires the question to be narrower, more specific, and studied within a given targeted context. In essence, a macrolevel question is transformed to a meso-or a microquestion by a series of how questions to render it study-able, as suggested by the patient ownership example. These how questions might include the following: How would this theory be made relevant in this situation? How can we observe and measure this theory at work?


[미시적 질문]을 다루는 연구를 수행하기 위해, 연구자는 한 맥락에서 나온 통찰이 다른 맥락, 다른 맥락 또는 더 넓은 맥락과 관련될 수 있는 방법을 설명해야 한다. 마이크로 레벨 질문은 다음과 같은 일련의 "왜 질문"들에 의해 중간 또는 거시적인 질문으로 변형된다. 

왜 이런 발견들이 다른 병원이나 대학에 유익할까? 

왜 이러한 발견들은 다른 집단과 관련이 있는 더 광범위한 문제에 대한 통찰력을 제공하는가?

To conduct a study that addresses a microquestion, the researcher must explain how insights from one context can be made relevant to other, different, or broader contexts. A microlevel question is transformed to a meso-or macroquestion by a series of why questions: Why are these findings informative to other hospitals or universities? Why do these findings offer insights into a broader problem that is relevant to other populations?


하나의 질문이 다른 질문들보다 더 중요하고, 더 유익하며, 더 유용하다고 제안하는 것은 지식의 몸이 성장하고 진화하기 위해서는 이 모든 질문들이 필요하다는 것을 이해하지 못하는 것이다. 

실용적인 국지적 해결책이 그것이 미시적인 수준의 질문으로 남아있게 되면 소수의 사람들에게만 유용할 뿐이다. 

추상적인 이론적 질문이 사용자의 즉각적인 요구에 대해 말할 수 없게 되면 효용성이 제한된다. 

이러한 모든 수준의 초점에 걸쳐 질문을 함으로써 비로소 우리는 진정으로 모든 목적을 위해 활용할 수 있는 견실한 지식을 만들어 낼 수 있다.

To suggest that one set of questions is more important, more informative, or more useful than the others is to fail to understand that we need all of these questions for our body of knowledge to grow and evolve. A pragmatic local solution is useful to only a small group of people if it remains a microlevel question. An abstract theoretical question has limited utility when it cannot speak to the immediate needs of a user. It is only by asking all of these questions across all levels of focus that we can truly generate robust knowledge that can be harnessed for all purposes.


HPE의 중요 질문

Important Questions in HPE


그러나, 우리의 목표는 HPE에서 수행한 작업에 대한 새로운 범주화로서 초점 길이를 제안하는 것이 아니라, 반대로, 우리는 다른 렌즈의 가치를 고려하는 수단으로 그것을 제안한다. 심지어 가장 이론적이거나 거시적인 수준의 질문도 그것의 가장 실용적이거나 미시적인 질문에서 하나 또는 두 개의 "어떻게" 질문 정도의 거리에 있을 뿐이며, 가장 실용적인 질문조차 단지 한두 개의 "왜" 질문 정도 떨어져 있을 뿐이다.

However, our goal was not to propose focal length as a new categorization for work done in HPE; to the contrary, we offer it as a means to consider the value of different lenses—even the most theoretical or macrolevel question is only 1 or 2 how questions away from its most pragmatic or microversion, and the most pragmatic is only 1 or 2 why questions away from a theory-rich abstract version.


즉, 좋은 이론은 실용적이고, 좋은 실제 연구 문제는 이론에 기여하는 것이 많다.

In other words, a good theory is practical, and a good practical research question has much to contribute to theory.


22 Bourgeois-Law G, Teunissen PW, Varpio L, Regehr G. Attitudes towards physicians requiring remediation: One-of-us or not-like-us? Acad Med. 2019;94(11 suppl): S36–S41. XXX

 





. 2019 Nov;94(11S Association of American Medical Colleges Learn Serve Lead: Proceedings of the 58th Annual Research in Medical Education Sessions):S1-S4.
 doi: 10.1097/ACM.0000000000002913.

Focal Length Fluidity: Research Questions in Medical Education Research and Scholarship

Affiliations 

Affiliation

  • 1M. Young is associate professor, Department of Medicine and Institute for Health Sciences Education, McGill University, Montreal, Quebec, Canada. K. LaDonna is assistant professor, Department of Innovation in Medical Education and Department of Medicine, University of Ottawa, Ottawa, Ontario, Canada. L. Varpio is professor, Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland. D.F. Balmer is associate professor, Department of Pediatrics, The Children's Hospital of Pennsylvania and University of Pennsylvania, Philadelphia, Pennsylvania.

Abstract

Research and scholarship in health professions education has been shaped by intended audience (i.e., producers vs users) and the purpose of research questions (i.e., curiosity driven or service oriented), but these archetypal dichotomies do not represent the breadth of scholarship in the field. Akin to an array of lenses required by scientists to capture images of a black hole, the authors propose the analogy of lenses with different focal lengths to consider how different kinds of research questions can offer insight into health professions research-a microscope, a magnifying glass, binoculars, and telescopes allow us to ask and answer different kinds of research questions. They argue for the relevance of all of the different kinds of research questions (or focal lengths); each provides important insight into a particular phenomenon and contributes to understanding that phenomenon in a different way. The authors propose that research questions can move fluidly across focal lengths. For example, a theoretical question can be made more pragmatic through asking "how" questions ("How can we observe and measure a phenomenon?"), whereas a pragmatic question can be made more theoretic by asking a series of "why" questions ("Why are these findings relevant to larger issues?"). In summary, only through the combination of lenses with different focal lengths, brought to bear through interdisciplinary work, can we fully comprehend important phenomena in health professions education and scholarship-the same way scientists managed to image a black hole.


개념적 프레임워크를 통해서 교육연구를 강화하기: 의학교육자를 위한 도전과 로드맵(Acad Pediatr, 2019)

Enhancing Educational Scholarship Through Conceptual Frameworks: A Challenge and Roadmap for Medical Educators

Matthew W. Zackoff, MD; Francis J. Real, MD, MEd; Erika L. Abramson, MD, MS; Su-Ting T. Li, MD, MPH; Melissa D. Klein, MD, MEd*; Maryellen E. Gusic, MD*




엄격한 벤치·임상·번역적 연구로 임상진료의 진척 속도는 빠르게 진전되었지만, 의학교육은 전통적으로 엄격한 연구를 통해 수집된 이론과 증거보다는 의식·문화·전통에 의해 추진되어 왔다.1,2 잠재적 연구 주제인 교육학자와 대치할 때, 다른 조사자와 마찬가지로, 조사의 초점을 정의하고, 연구 질문을 개발하거나 가설을 생성하기 위해 확립된 이론을 사용해야 하며, 조사를 적절하게 다루기 위한 방법론을 설계해야 한다.

Although the pace of progress in clinical care has advanced quickly owing to rigorous bench, clinical, and translational studies, medical education has traditionally been driven by ritual, culture, and tradition rather than theories and evidence gathered through rigorous study.1,2 When confronting a potential research topic, an educational scholar, like any investigator, must use established theories to define the focus for inquiry, develop a study question and/or generate a hypothesis, and then design the methodology to appropriately address the inquiry.


개념적 프레임워크문제에 대한 사고방식을 나타내며 교육적 또는 사회적 현상의 복잡성을 검사할 수 있는 렌즈다.3

Conceptual frameworks represent ways of thinking about a problem and are the lens through which one can examine the complexities of educational or social phenomena.3


의학 교육에서, 이러한 프레임워크는 결과에 기여하는 여러 요소들 - 교사, 학습자, 평가 및 맥락과 관련된 요인들 - 을 고려할 수 있게 해준다.5.6 개념적 프레임워크는 "그래서 어쩌라는 것인가so what"를 확립할 수 있는 기반을 제공한다. 즉, 작업의 중요성, 현상에 대한 이해에서 기존의 격차를 어떻게 메우는지, 그리고 어떻게 그것이 프로젝트의 "어떻게"로 이어질 수 있는지 등을 말한다. 이는 교육 방법, 평가 전략 및 결과의 적절한 해석의 선택에 영향을 미친다.

In medical education, these frameworks allow us to consider multiple factors that contribute to outcomes—factors related to the teacher, the learner, the assessment, and the context.5,6 Conceptual frameworks provide the foundation to establish the “so what”—the importance of the work, how it fills an existing gap in understanding the phenomenon, and how it can lead to the “how” of the project—which impacts the choice of educational methods, assessment strategy, and appropriate interpretation of outcomes.


개념적 틀의 결여가 주요 교육 학술지에 제출되는 원고의 게재거부 사유라는 점에 주목했다.7 이 연구의 후속 연구에서 쿡 외 al.8은 2003년과 2004년 사이에 발표된 의학 교육 논문의 체계적 리뷰에서 55%만이 개념적 프레임워크를 사용했다고 지적했다.

The lack of a conceptual framework was noted to have contributed to the rejection of manuscripts submitted to major educational journals 62.2%of the time.7 In a follow up to this study, Cook et al.8 noted in a systematic review of medical education papers published between 2003 and 2004 that only 55%utilized conceptual frameworks.


의학 교육 연구는 종종 비선형적인 길을 걸을 수 있지만, 본 논문에서는 의학 교육 개입과 연구의 설계를 강화하기 위한 도구로서 학술적 과정 초기에 개념 프레임워크를 사용하는 로드맵을 제공하는 것을 목표로 한다.

Although medical education research can often take a nonlinear path, in this article we aimto provide a roadmap for using conceptual frameworks early in the scholarly process as a tool to enhance the design of medical education interventions and research.


개념 프레임워크 대 모범 사례

CONCEPTUAL FRAMEWORKS VERSUS BEST PRACTICES


의료교육에 일반적으로 사용되는 개념 체계는 표에 설명되어 있다.

Commonly used conceptual frameworks in medical education are described in the Table.





[개념 체계]와 교육에서 확립된 [모범 사례]의 차이와 관계를 이해하는 것이 중요하다. 둘 다 교육자로서의 일에 있어서 귀중한 자산이다. 모범 사례는 [커리큘럼 설계에 대한 Kern의 6단계] 23, [프로그램 평가를 위한 로직 모델]24, [다단계 결과 측정을 위한 Kirkpatrick의 프레임워크]25를 예로 들 수 있다. 교육 개입의 설계와 평가에서 개념 체계와 모범 사례 접근법의 적용은 모두 교육 연구의 엄격성에 기여한다.

It is important to understand the difference and relationship between conceptual frameworks and established best practices in education. Both are valuable assets in one’s work as an educator. Best practices are accepted approaches, with noted exemplars being Kern’s 6 steps23 for curriculum design, the logic model24 for program evaluation, and Kirkpatrick’s framework25 for measuring multilevel outcomes. Both conceptual frameworks and the application of best practice approaches in the design and evaluation of educational interventions contribute to the rigor of educational scholarship.


그림 1은 개념 체계와 교육 모범 사례 모델의 통합을 보여준다. 이 예에서, Kern의 6단계 접근방식은 커리큘럼 개발을 위해 널리 받아들여지는 모범 사례를 나타낸다.

Figure 1 illustrates the integration of conceptual frameworks and a best practice model in education. In this example, Kern’s 6 steps approach represents a widely accepted best practice for curriculum development.



개념 프레임워크 선택

SELECTING A CONCEPTUAL FRAMEWORK


개념적 프레임워크를 식별하는 것은 교육 연구 연구를 설계하는 데 있어 중요한 단계다.26,27 고려해야 할 프레임워크는 학자와 학습에 대한 그들의 신념에 공명해야 한다.6 잠재적인 적용 가능한 개념 프레임워크를 식별하기 위한 철저한 문헌 검토는 프로젝트 개발의 필요한 초기 단계다.

Identifying a conceptual framework is a crucial step in designing an educational research study.26,27 Frameworks to consider should resonate with the scholar and their beliefs about learning.6 A thorough literature review to identify potential, applicable conceptual frameworks is a necessary early step in project development.


종종 [이론적 프레임워크]라는 용어가 사회과학 문헌에 활용된다. 이론적·개념적 프레임워크가 때로는 차별화되기도 하지만, 학술연구를 조직하고 강화하는 그들의 적용은 거의 동일하기 때문에 우리는 그 용어를 상호교환적으로 사용한다. 

Often, the term theoretical frameworks is utilized in social science literature. Although theoretical and conceptual frameworks are sometimes differentiated,29 their application to organizing and enhancing scholarship is much the same, so we use the terms interchangeably. 


잠재적으로 관련성이 있는 개념 프레임워크가 확인되면, 기존 문헌을 지속적으로 비판적 분석, 합성하여 연구자는 주제에 대해 이미 알려진 것을 식별하고, 프레임워크의 특정 구성요소나 대체 프레임워크의 사용이 문헌의 기존 격차를 해결하는 데 어떻게 도움이 되는지 고려할 수 있다. 그렇게 되면, 선택한 개념 프레임워크는 개입에 대한 근거를 뒷받침하고 그것이 수행될 이유와 방법을 정당화한다.

When potentially relevant conceptual frameworks have been identified, continued critical analysis and synthesis of the literature allow the investigator to identify what is already known about the topic and to consider how a specific component of the framework or the use of an alternative framework would be helpful in addressing existing gaps in the literature.30 The chosen conceptual framework then supports the rationale for the intervention and justifies why and how it will be undertaken.30


중요한 것은 하나 이상의 개념적 프레임워크가 연구 연구의 설계와 보건 과학 교육의 문제를 다루기 위한 개입에 적용될 수 있다. 각 개념체계는 독특한 질문을 만들 수 있는 다른 플랫폼을 제공하기 때문에, 조사자들은 어떤 문제를 탐구하는 데 가장 적합하다고 생각하는 프레임워크를 선택해야 한다. 개념적 프레임워크의 선택이 교육 개입과 그에 상응하는 연구 프로젝트의 설계를 안내하는 방법은 그림 2에 도해되어 있다.

Importantly, more than 1 conceptual framework may be applied to design a research study and the intervention to address an issue in health sciences education. Because each conceptual framework provides a different platform on which to build a unique question, investigators should choose the framework that they believe is most appropriate to explore an issue. The way in which the choice of conceptual framework guides the design of an educational intervention and corresponding research project is graphically illustrated in Figure 2.



예: 의사의 건강 증진을 위한 교육 개입

AN EXAMPLE: EDUCATIONAL INTERVENTION PROMOTING PHYSICIAN WELLNESS


교육자가 학습자 사이의 건강을 증진시키기 위해 취할 수 있는 수많은 접근법이 있다. 개념적 프레임워크의 선택은 개입의 설계와 개입과 관련된 연구 질문에 영향을 미친다. 

예를 들어 수사관의 신념이 다른 사람의 행동을 관찰하고 모방함으로써 사람들이 배운다는 개념에 바탕을 둔 반두라의 사회 인지 이론과 일치한다면, 이 렌즈는 조사자가 웰빙을 촉진하는 것으로 알려진 행동의 관찰과 에뮬레이션 기회를 제공하는 학습 경험을 설계하고 연구하는데 초점을 맞출 것이다.

There are numerous approaches an educator could take to attempt to promote wellness among learners. The choice of conceptual framework impacts the design of the intervention and the research question to be studied related to the intervention. 

For example, if an investigator’s beliefs align with Bandura’s social cognitive theory, which is grounded in the concept that people learn by observing and imitating other’s behavior,14 this lens would focus the investigator to design and study a learning experience that provides opportunities for observation and emulation of behaviors known to promote wellness.


조사자는 문헌을 검토한 후 사회 인지 이론이 다른 사람들에 의해 새로운 행동의 채택을 촉진하는 교육 개입을 개발하기 위해 사용되었음을 밝혀낸 후에 이 프레임워크를 선택할 수 있다. 다음 단계는 이 개념 체계(즉, 주의력, 보존, 재생산, 동기)의 구성요소가 웰빙을 촉진하는 행동의 채택에 어떻게 기여하는지를 조사하는 [연구 질문을 개발]하는 것이다. 

예를 들어, "임상 전 의대생을 위한 섀도잉 프로그램이 임상 기간 동안 보고된 감정 소모율을 감소시키는가?"와 같은 몇 가지 잠재적인 질문을 사용하여 탐구할 수 있다. 이 경우 그림자 프로그램은 웰니스 활동을 일상 업무에 통합하는 것으로 알려진 고위 임상의들을 그림자처럼 관찰할 수 있는 기회를 제공하기 위해 설계될 것이다. 학생들은 건강 증진을 위해 보여진 특정한 건강 개입에 대한 정보를 제공함으로써 이러한 관찰로부터 배울 수 있도록 준비될 것이다. 학생들은 [자신이 그림자처럼 따라다니는 의사]가 사용하는 활동의 인식된 가치에 대해 추가로 성찰하도록 유도될 것이다.

An investigator may choose this framework after a review of the literature reveals that social cognitive theory has been used by others to develop educational interventions that promote the adoption of new behaviors. The next step is to develop a research question investigating how components of this conceptual framework (ie, attention, retention, reproduction, and motivation) contribute to the adoption of behaviors that promote wellness. Several potential questions could be explored using this conceptual framework—

for example, “Does a shadowing program for preclinical medical students decrease the rate of emotional exhaustion reported during the clinical years?” The shadowing program in this case would be designed with the intention to provide opportunities to shadow senior-level clinicians who are known to incorporate wellness activities into their daily practice. The students would be primed to learn from these observations through the provision of information about specific wellness interventions that have been shown to promote wellness. Students would additionally be prompted to reflect on the perceived value of the activities used by the physicians they are shadowing.


대안적으로, 조사자는 웰니스 행동의 채택을 촉진하기 위한 교육 개입을 설계하고 연구하는 방법을 결정하기 위해 [상황 학습 이론]과 같은 다른 개념적 프레임워크를 선택할 수 있다. 이러한 개념적 틀은 학습자가 처음에는 집단에 변두리적 존재로 구성원이 되고, 실천 공동체로 환영받는 부수적 과정이 될 수 있다는 것을 전제로 한다.20 

본 예에 따르면, 학습자가 지역사회에 건강 증진을 위한 활동에 노출되고 참여할 수 있도록 하는 경험은, 주의력에 관한 레지던트의 정오 회의에 점원직을 노출시키는 것과 같은, 대안적 연구 질문으로 이어질 수 있다. 한 가지 잠재적인 질문은 "웰니스 행동을 촉진하기 위해 고안된 활동에서 가까운 동료들과 함께 하는 것이 졸업생 의대생들의 비인격화와 냉소를 감소시키는가?"이다. 이 경우 평가 전략에는 레지던트의 정오 컨퍼런스에 학생의 참여와 참여 수준을 문서화하는 조치와 접근방식의 효과를 평가하기 위한 졸업 전 비인격화 조치가 포함될 수 있다.

Alternatively, an investigator might select a different conceptual framework, such as the theory of situated learning and legitimate peripheral participation by Lave and Wenger,20 to determine how to design and study an educational intervention to promote the adoption of wellness behaviors. This conceptual framework posits that learning can be an incidental process that occurs as a learner, who at first is peripheral to the group, becomes a member, and is welcomed into a community of practice.20 

Applied to our example, an experience that allows a learner to be exposed to, and engage in, activities that promote wellness for the community, such as exposing medical students on their clerkship to resident noon conferences on mindfulness, might lead to an alternative research question. One potential question is “Does engaging with near peers in activities designed to promote wellness behaviors decrease depersonalization and cynicism in graduating medical students?” The assessment strategy in this case would include measures to document the level of engagement and participation of students in the resident noon conferences and measures of depersonalization prior to graduation to evaluate the effectiveness of the approach.


분야를 발전시키기 

ADVANCING THE FIELD


발표나 간행물에서 개념 프레임워크를 어떻게 활용했는지에 대한 명시적인 언급은 지식 진보를 위한 몇 가지 중요한 의미를 갖는다. 확립된 증거 기반 프레임워크의 사용은 평론가와 독자들이 작품이 문헌의 공백을 어떻게 메우는지를 더 잘 이해할 수 있게 하고, 개입의 개입과 연구에 사용된 방법론의 엄격성을 평가하고, 결과와 결과의 영향을 그들이 어떻게 분야를 발전시키는지에 대한 맥락에서 해석할 수 있게 한다.

In a presentation or publication, explicit mention of how one utilized a conceptual framework has several important implications for advancing knowledge. The use of an established, evidence-based framework allows reviewers and readers to better understand how the work fills a gap in the literature, to evaluate the rigor of the methodology used in the intervention and study of the intervention, and to interpret the impact of the outcomes and results in the context of how they advance the field.


추가 고려사항

ADDITIONAL CONSIDERATIONS


의료 교육 프로젝트의 성공적인 이행을 위해 몇 가지 추가적인 주요 고려사항이 있다. 초기에는 개입을 구현하고 평가하는 데 [필요한 자원에 대한 면밀한 검토]가 필요하여 [실용적이고 실현 가능한 접근방식]이 취해질 수 있도록 한다. 

문헌을 검토한 후 연구자가 [의도적 연습]의 개념적 프레임워크를 사용하여 연구 질문을 조작한다고 가정하자. 이 프레임워크에 기반한 개입은 교육 강사가 작업장에 기반한 관찰을 수행하고 피드백을 제공하며 시간 경과에 따른 학습자 성과를 재평가해야 한다.

To allow for the successful implementation of a medical education project, there are several additional key considerations. At the beginning, a careful examination of the resources needed to implement and evaluate the intervention is necessary to ensure that a practical and feasible approach is taken. 

Suppose that after a review of the literature an investigator crafts a study question using the conceptual framework of deliberate practice, An intervention based on this framework would require training instructors to do workplace-based observations, provide feedback, and reassess learner performance over time;


프로젝트가 시작될 때 적절한 준비가 흥미롭고, 참신하고, 관련성이 있는 연구 문제를 개발하는 데 중요하지만, 연구 연구의 결론에 대한 사려 깊은 성찰은 간과할 수 없다.

Although adequate preparation at the onset of a project is important to developing a study question that is interesting, novel, and relevant,37 thoughtful reflection at the conclusion of a research study cannot be overlooked.


  • 개입과 방법론이 프레임워크와 일치하였는가?

  • 개입이 계획대로 실행되지 않았는가?

  • 적절한 결과 척도를 선택하였는가?

  • 평가 접근방식이 의도된 결과를 측정하지 못하였는가?

  • 인식되지 않는 교란 요인이 있었는가?

  • 그 결과는 추가 탐구가 필요한 개념적 프레임워크에 대한 새로운 측면을 나타냈는가?

Were the intervention and methodology aligned with the framework?

Were the interventions not implemented as planned?

Were appropriate outcome measures selected?

Did the assessment approach fail to measure the intended outcomes?

Were there unrecognized confounding factors?

Did the results indicate a new aspect about the conceptual framework that requires further exploration?






Review

 

. 2019 Mar;19(2):135-141.
 doi: 10.1016/j.acap.2018.08.003. Epub 2018 Aug 20.

Enhancing Educational Scholarship Through Conceptual Frameworks: A Challenge and Roadmap for Medical Educators

Affiliations 

Affiliations

  • 1Division of Critical Care Medicine, Department of Pediatrics (MW Zackoff),. Electronic address: matthew.zackoff@cchmc.org.
  • 2Division of General and Community Pediatrics, Department of Pediatrics (FJ Real, MD Klein), Cincinnati Children's Hospital Medical Center, Cincinnati, Ohio.
  • 3Division of General Pediatrics, Department of Pediatrics, and Department of Healthcare Policy and Research, Weill Cornell Medical Center (EL Abramson), New York, NY.
  • 4Division of Pediatric Hospital Medicine, Department of Pediatrics, University of California, Davis (S-TT Li).
  • 5Department of Medical Education, University of Virginia School of Medicine (ME Gusic), Charlottesville, Va.

Abstract

Historically, health sciences education has been guided by tradition and teacher preferences rather than by the application of practices supported by rigorous evidence of effectiveness. Although often underutilized, conceptual frameworks-theories that describe the complexities of educational and social phenomenon-are essential foundations for scholarly work in education. Conceptual frameworks provide a lens through which educators can develop research questions, design research studies and educational interventions, assess outcomes, and evaluate the impact of their work. Given this vital role, conceptual frameworks should be considered at the onset of an educational initiative. Use of different conceptual frameworks to address the same topic in medical education may provide distinctive approaches. Exploration of educational issues by employing differing, theory-based approaches advances the field through the identification of the most effective educational methods. Dissemination of sound educational research based on theory is similarly essential to spark future innovation. Ultimately, this rigorous approach to medical education scholarship is necessary to allow us to establish how our educational interventions impact the health and well-being of our patients.

Keywords: conceptual framework; educational research; scholarship.

교육연구의 7대 죄악(J Grad Med Educ, 2016)

7 Deadly Sins in Educational Research

Katherine Picho, PhD

Anthony R. Artino Jr, PhD



과학 연구의 타당성에 대한 우려는 최근 몇 년간 증가해 왔으며, 생물 의학에서 발표된 대부분의 연구 결과가 거짓임을 보여주는 상당한 증거가 있다.4 의학뿐만 아니라 교육에서 연구 연구를 감염시키는 주요 결함은 종종 작은 표본, 작은 효과, 그리고 느슨하게 정의되고 구현된 연구 설계와 관련이 있다.4 많은 재조사자들이 과학 문헌이 시간이 지나면서 저절로 고쳐지길 기대하지만, 항상 그렇지는 않다.실제로 '서랍장 효과'(부정적인 결과가 있는 미발표 연구)와 [복제가 제대로 인정받지 못하고 상대적으로 흔하지 않은 작업]으로 남아 있다는 사실을 고려하면, 잘못된 결과의 자체 수정은 (규칙이라기보다는) 예외적인 일일 수 있다. 이러한 난제에 대응하여, 이 사설은 특히 양적 연구의 경우, 재검사가 오도, 과장 또는 완전히 잘못된 발견을 보고하도록 이끄는 가장 일반적인 교육 연구 관행을 강조한다.

Concerns over the validity of scientific research have grown in recent years, with considerable evidence indicating that most published research findings in the biomedical sciences are false.4 The major flaws that infect research studies—in education as well as biomedical science—often relate to small samples, small effects, and loosely defined and implemented research designs.4 While many re-searchers expect that the scientific literature self-corrects over time, this is not always the case.Indeed, considering the ‘‘file drawer effect’’ (unpublished studies with negative outcomes) and the fact that replication remains an underappreciated and relatively uncommon enterprise,5 self-correction of faulty results may be the exception, not the rule. In response to these challenges, this editorial highlights the most common educational research practices,particularly for quantitative studies, that lead re-searchers to report misleading, exaggerated, or entirely false findings.



연구 전에 저질러진 죄

Sins Committed Before Research


신 #1 : 허술한 문헌고찰의 저주

Sin #1: The Curse of the Handicapped Literature Review


경험적 연구는 이론 시험과 발전의 일차적인 수단이다. 그것은 또한 진정한 교육 환경에서 실질적인 개입을 테스트하기 위해 필수적이다. 문헌검토는 특정 분야의 기존 강점, 약점, 지식 격차 등을 파악해 이 과정의 핵심이다. 문헌 검토는 연구 과정의 주요 측면(즉, 연구 질문, 설계 및 방법)을 알려주고, 연구 결과에 대한 추론이 논의될 수 있는 범위 내에서 경계를 기술한다.

Empirical research is the primary means of theory testing and development. It is also essential for testing practical interventions in authentic educational environments. The literature review is central to this process as it identifies existing strengths, weaknesses, and knowledge gaps in a particular field. The literature review informs key aspects of the research process (ie, research questions, design, and methods) and delineates boundaries within which inferences about findings can be discussed.


불행히도, 연구자들은 종종 그들의 가설에 찬성하여 왜곡된, 부분적인 검토를 할 것이다. 더욱 흔한(더 나쁜) 것은 연구가 완료되고 결과가 알려진 후에 문헌 검토를 실시하는 관행이다. 이러한 관행은 연구자들이 기사를 선택적으로 사용하고 결과를 뒷받침하는 가설을 수정할 수 있게 한다. 이것은 과학 연구의 기대되는 부분인 무작위로 인한 변동은 상당한 수의 거짓 발견을 낳기 때문에 문제가 된다.7 결과가 알려진 후 가설을 수정하는 것은 과학적인 방법에 대한 후진적backward 접근일 뿐만 아니라, 가짜 발견에 근거한 잘못된 결론으로 연구 분야를 오염시킬 가능성을 높인다. 그러한 관행은 왜 일부 연구 결과가 반복되지 않는지를 설명할 수 있다.8

Unfortunately, researchers will often conduct partial reviews that are skewed in favor of their hypotheses. Even more common (and worse) is the practice of conducting the literature review after the study has been completed and the results are known. Such practices allow researchers to selectively use articles and revise hypotheses in support of their results. This is a problem because variation due to randomness, which is an expected part of scientific research, yields a fair number of spurious findings.7 Reformulating hypotheses after results are known is not only a backward approach to the scientific method, but it also increases the likelihood of polluting the field of study with false conclusions based on spurious findings. Such practices could explain why some study findings fail to replicate.8


신 #2: 불충분한 검정력

Sin #2: Inadequate Power


정량적 연구에서 통계적 테스트는 독립 변수나 예측 변수 및 결과 사이의 관계의 성격과 규모에 대해 추론하는 데 도움이 된다. 이러한 추론에 대한 결론이 타당하다고 간주되는 정도를 [통계적 결론 타당성]이라고 부르기도 한다.9

In quantitative studies, statistical tests help researchers make inferences about the nature and magnitude of the relationships between independent or predictor variables and outcomes. The extent to which conclusions about these inferences are deemed reasonable is sometimes referred to as statistical conclusion validity.9


모집단에는 존재하지 않는 그룹 간 차이를 허위로 발견할 수 있는 위험성이 항상 존재한다. 이를 유형 1 오류 또는 거짓 양성이라고 한다.9 유형 1 오차는 그러한 차이가 실제로 존재할 때 그룹 간에 통계적으로 유의한 차이를 발견할 확률인 검정의 통계적 검정력을 증가시킴으로써 최소화할 수 있다.10 검정력 값은 0(검정력 없음)부터 1(극히 높은 검정력)까지 다양하다. 매우 높은 값(예: 1의 검정력)으로 검정력을 증가시키는 것이 잘못된 양의 획득 가능성을 현저히 감소시키는 간단한 해결책처럼 보일 수 있지만, 이 접근방식은 잘못된 음성결과 획득 확률 또는 [유형 2 오류]의 발생 가능성을 증가시키는 의도하지 않은 결과를 초래한다.9 따라서 통계적 검정력은 유형 2의 오차를 발생시킬 위험을 크게 증가시키지 않고 진정한 그룹 차이를 탐지할 수 있을 만큼 충분히 높은 스펙트럼의 두 끝 사이에 미세한 선을 걸어야 한다. 교육 연구에서, 최적 검정력에 대한 협약은 일반적으로 0.8이다.

there is always the risk that one could falsely find group differences where they do not exist in the population. This is called a type 1 error, or a false positive.9 Type 1 errors can be minimized by increasing the statistical power of a test, which is the probability of finding a statistically significant difference among groups when such a difference actually exists.10 Statistical power values range from 0 (no power) to 1 (extremely high power). Although increasing power to extremely high values (eg, to a power of 1) might seem like a simple solution to drastically reduce the likelihood of obtaining a false positive, this approach has the unintended consequence of increasing the probability of obtaining a false negative, or a type 2 error.9 Therefore, statistical power must walk a fine line between the 2 ends of the spectrum: high enough to detect true group differences without drastically increasing the risk of making a type 2 error. In educational research, the convention for optimum power is typically 0.8.11


검정력은 표본 크기와 시험 중인 가설의 수에 의해 영향을 받는다. 한 연구는 심리학과 교육을 포함한 사회과학 분야의 대부분의 연구에서 검정력이 낮았음을 발견했다. 심리학에서 연구의 평균 검정력은 0.35였다. 의학교육에서 표본 크기가 20, 15, 심지어 10명 정도로 적은 양적 연구가 이루어지는 것은 드문 일이 아니다. 따라서, 많은 의학 교육 연구 연구가 그룹 간의 진정한 차이를 발견하기에 불충분할 가능성이 있다.

Power is affected by sample size and the number of hypotheses being tested, among other factors. One study found that most studies in the social sciences, including psychology and education,12 were underpowered. In psychology, the average power of studies was 0.35.12 In medical education, it is not uncommon for quantitative studies to be conducted with sample sizes as low as 20, 15, or even 10 participants. Therefore, it is likely that many medical education research studies are insufficiently powered to detect true differences among groups.


힘은 또한 두 그룹 간의 차이의 크기와 같이 예상되는 효과의 크기에 영향을 받는다. 따라서 주어진 연구에서 낮은 검정력은 [작은 표본]과 [작은 효과] 또는 [두 가지 모두]의 조합에서 기인할 수 있다.13 그룹 간의 실제 차이를 놓치는 것 외에도, 낮은 검정력은 통계적으로 유의한 결과가 가짜 발견이 아닌 실제 효과를 나타낼 가능성을 감소시킨다.13 이 두 가지 문제 모두 그 분야 연구의 신뢰도를 약화시킨다. 전자는 이해를 진전시킬 수 있는 가설을 섣불리 폐기하고 후자는 복제할 수 없는 허황된 발견으로 이어질 수 있다.

Power is also affected by the magnitude of the expected effect, such as the size of the differences between 2 groups. Hence, in a given study, low power may stem from small samples and small effects or a combination of both.13 In addition to missing a true difference between groups, low power also reduces the likelihood that a statistically significant result represents a true effect rather than a spurious finding.13 Both of these issues weaken the reliability of findings in a given field. The former may lead to prematurely discarding hypotheses that might advance understanding, and the latter, to spurious findings that cannot be replicated.


표본 크기를 증가시키는 것 외에도, 동일한 셀 표본 크기, 참가자 일치, 사전 공변량 측정, 후속 분석에서 공변량의 보정 등과 같은 실험 설계 효율성을 개선하여 검정력을 증가시킬 수 있다.

Besides increasing sample size, power can be increased by improving experimental design efficiency, such as through 

    • the use of equal cell sample sizes; 

    • matching participants; 

    • measuring covariates a priori; and 

    • correcting for covariates in subsequent analyses.


신 #3: 측정의 중요성 무시

Sin #3: Ignoring the Importance of Measurement


검증되지 않은 척도를 사용하거나, 심리측정적 특성이 좋지 않은 조치를 채택하는 것은 결과에 더 많은 "소음"을 더하는 역할을 할 뿐이며, 모순되거나 신뢰할 수 없는 발견으로 필드를 잠재적으로 방해할 수 있다.14

Using measures that have not been tested, or employing those that have poor psychometric properties, only serves to add more ‘‘noise’’ to the results and potentially taints the field with contradictory or implausible findings.14


측정 문제는 연구 대상이 되는 [구인]을 과소 대표하거나 과대 대표하는 측정 도구(예: 설문지)에서 발생할 수 있다. 측정 도구가 너무 좁으면(예: 단일 항목 측정의 경우), 구성의 중요한 측면을 배제하여 관심 현상의 본질을 포착하지 못할 가능성이 높다.14

Measurement problems can stem from measurement tools (eg, questionnaires) that underrepresent or overrepresent the construct under study. When a measurement tool is too narrow (eg, in the case of single-item measures), then it likely excludes important aspects of the construct and thus fails to capture the true nature of the phenomenon of interest.14


측정 문제는 또한 결과 변수(예: 시험 점수, 점원 등급)가 너무 쉬우거나 어려울 때 발생한다. 극히 쉬우거나 어려운 작업은 각각 천장과 바닥 효과로 이어져 상관성과 편향 결과를 약화시킨다.

Measurement problems also occur when the outcome variables (eg, test scores, clerkship grades) are too easy or too difficult. Tasks that are extremely easy or difficult lead to ceiling and floor effects, respectively, which weaken correlations and bias results.


연구 중에 저질러진 죄

Sins Committed During Research


Sin #4: 잘못된 통계 도구 사용

Sin #4: Using the Wrong Statistical Tool


가장 일반적인 것은 데이터가 사용 중인 통계기법의 가정을 충족하는지 여부를 점검(또는 보고)하지 않는 것이다. 아마도 가장 자주 위반되는 가정은 관찰이 독립적이라는 가정일 것이다. 이러한 특정 위반과 관련된 것은 비독립적 데이터를 독립된 것처럼 취급하는 실수(예: 3회 측정된 20명의 참가자의 데이터를 60명의 참가자의 데이터인 것처럼 취급하는 것)이다.15

The most common involve not checking (or reporting) whether the data meet assumptions of the statistical technique being used. Perhaps the most frequently violated assumption is the assumption that observations are independent. Related to this specific violation is the mistake of treating nondependent data as if they were independent (eg, treating data from 20 participants that are measured 3 times as if data are from 60 participants).15


그러한 통계적 가정을 위반하면 유형 1 오류(허위 긍정)를 인위적으로 부풀리는 효과가 있어, 이는 보증된 결과보다 통계적으로 더 유의미한 결과를 초래한다. 이 결과는 통계적으로 유의한 결과에서 도출될 수 있고 복제 실패를 초래할 수 있는 추론의 타당성을 위협한다. 이러한 함정을 피하기 위해 연구자들은 자신의 데이터가 사용하고자 하는 데이터 분석 기법의 가정을 충족하는지 검증해야 한다. 통계적 가정이 위반되면 문제를 해결하기 위한 조치를 취하거나(예: 비정규 데이터 변환) 이러한 위반에 강력한 대체 통계 기법(예: 정규 분포를 따르지 않는 연속 데이터에 대한 비모수 통계)을 사용해야 한다. 게다가, 연구 과정의 초기에 통계학자와 상담하는 것은 도움이 될 수 있다. 그러한 관행은 그 일에 적합한 통계 도구를 찾는 데 매우 중요하다.

The violation of such statistical assumptions has the effect of artificially inflating type 1 errors (false positives), which leads to more statistically significant results than warranted. This outcome threatens the validity of inferences that can be made from statistically significant results and can also result in replication failure. To avoid this pitfall, researchers should verify that their data meet the assumptions of the data analytic technique they intend to use. When statistical assumptions are violated, one should take steps to remedy the problem (eg, transforming nonnormal data) or use alternate statistical techniques that are robust to these violations (eg, nonparametric statistics for continuous data that do not follow a normal distribution). Moreover, it can be helpful to consult a statistician early in the research process; such a practice is critical to finding the right statistical tool for the job.


죄 #5: 데이터에 대한 무자비한 고문과 기타 의문스러운 분석 관행

Sin #5: Merciless Torture of Data and Other Questionable Analysis Practices


그러한 관행의 예로는 

    • 자신의 가설에 부합하는 결과만 보고(''체리피킹'), 

    • 결과에 맞게 통계적으로 유의한 임계값을 완화한

    • 단측 t 검정을 사용했지만 연구 보고서에 이를 언급하지 않음

    • 가설과 적합하도록 P 값을 위아래로 잘못 반올림(예: 실제 P 값이 .049인 경우 P ¼ 0.04 보고)한다.

Examples of such practices include 

    • reporting only results that align with one’s hypotheses (‘‘cherry picking’’), 

    • relaxing statistical significant thresholds to fit results, 

    • using 1-sided t tests but failing to mention this in the research report, and 

    • wrongly rounding P values upward or downward to fit with a hypothesis (eg, reporting P ¼ .04, when the actual P value is .049).16


또 다른 인기 있지만 의문스러운 관행은 [낚시fishing]인데, 이것은 사전 지정된 가설에서 유래하지 않은 통계적으로 유의한 발견에 대한 채굴 데이터를 말한다.9 낚시는 제1종 오류율을 증가시키고 인위적으로 통계적 유의성을 증가시킨다. 실제로, 특히 이러한 발견들은 실제적인 인구 차이의 결과보다 우연의 산물이 될 가능성이 더 높기 때문에, 어로 탐험의 발견을 중심으로 전체 연구를 재구성하는 것은 죄악이 될 것이다.

Another popular yet questionable practice is fishing, which refers to mining data for statistically significant findings that do not stem from prespecified hypotheses.9 Fishing increases type 1 error rates and artificially inflates statistical significance. Indeed, it would be a sin to restructure an entire study around findings from a fishing expedition, especially since these findings are more likely to be a product of chance than the result of actual differences in the population.


연구 후 저지른 죄

Sins Committed After Research


신 #6: P 가치에 대한 노예제도

Sin #6: Slavery to the P Value


사회과학에서 통계적 추론에 가장 일반적으로 적용되고 수용된 접근방식은 [귀무 가설 유의성 검정],17 여기서 주어진 구성물에 대한 그룹 차이에 대한 연구자의 가설을 귀무 가설과 비교하여 시험한다: 차이가 없다.18 일반적으로 통계 분석은 변수에 대한 평균 그룹 차이를 반영하는 점수를 생성하며 검정 통계량(t 비율, 카이-제곱 분석 등)과 확률 값(P 값)을 동반한다. P 값은 [데이터가 샘플링된 모집단에 차이가 존재하지 않는 경우 관측된 그룹 차이 또는 더 극단적인 결과를 얻을 확률]을 나타낸다.19

The most commonly applied and accepted approach to statistical inference in the social sciences is null hypothesis significance testing,17 where a researcher’s hypothesis about group differences on a given construct is tested against the null hypothesis: there are no differences.18 Generally, statistical analyses generate a score that reflects mean group differences for a variable, accompanied by test statistics (t ratios, chi-square analyses, etc) and a probability value (P value). P values represent the probability of obtaining the observed group difference or a more extreme result if said difference did not exist in the population from which the data were sampled.19


유용한 도구임에도 불구하고 P 값은 그다지 유용하지 않다

    • 첫째, 통계적으로 유의한 결과(즉, 귀무 가설을 기각함)가 어떤 식으로든 연구자의 가설을 확인해주는 것은 아닌데, 대부분의 경우 거짓으로 인식되고 그렇게 해석된다.20,21 

    • 두 번째, 매우 큰 표본 크기(예: 수천 개)는 소그룹 차이를 확대시킬 것이다. 그 결과는 통계적으로 유의미할 수 있다.작은 차이 때문에 실질적으로 중요하지 않다. 교육 연구에서는 큰 표본 크기가 드물지만 큰 데이터베이스를 사용할 수 있을 때(예: 전문의 보드 점수) 종종 볼 수 있다. 연구자들은 효과 크기 및 효과 크기 주변의 신뢰 구간과 같은 보다 유익하고 실용적 인 지표로 P 값 통계를 보완하는 데 초점을 맞춰야 한다.

Although a useful tool, P values are not very informative. 

    • First, a statistically significant result (ie, rejecting the null hypothesis) does not in any way confirm the researcher’s hypotheses, although most times it is falsely perceived and interpreted as such.20,21 

    • Second, extremely large sample sizes (eg, in the thousands) will magnify small group differences; the result may be statistically significant yet practically unimportant due to tiny differences. In educational research, large sample sizes are rare but occasionally are seen when large databases are available (eg, specialty board scores). Researchers should focus on supplementing P value statistics with more informative and practical metrics like effect sizes and confidence intervals around effect sizes.


Sin #7: 결과 보고 및 원시 데이터 유지에 대한 투명성 결여

Sin #7: Lack of Transparency in Reporting Results and Maintaining Raw Data


비록 저자가 단어 수 제한이나 통계적 정교함의 결여에 대한 우려는 불충분한 보고를 야기할 수 있지만, 그러한 관행은 또한 의심스러운 연구 관행을 은폐하는 역할을 한다. 예를 들어, 저자는 기술 통계량(예: 평균)에 대한 기본 정보를 포함하지만 표준 편차를 포함하지 못하는 경우가 있다.

Although author concerns about word count limits or lack of statistical sophistication may cause inadequate reporting, such practices also serve to cover up questionable research practices. For example, authors sometimes include basic information about descriptive statistics (eg, means) but fail to include standard deviations.


기사의 통계적 결과가 메타분석에서 활용되기 때문에 통계분석의 정확한 보고와 투명성이 중요하다. 따라서 일차적 수준의 연구에서 보고의 오류는 메타 분석적 소견에서도 오류와 편향으로 이어질 수 있다. 연구자들은 중요한지 여부에 관계없이 기초적인 서술적 통계량(표본 크기, 평균, 표준 편차)과 정확한 P 값에 대한 완전한 정보를 제공하기 위해 노력해야 한다. 마지막으로 중요한 것은 연구자들이 모든 통계 분석을 완전히 공개해야 한다는 것이다.

Correct reporting and transparency of statistical analyses are important because statistical results from articles are used in meta-analyses. Thus, errors of reporting in primary level studies can lead to errors and bias in meta-analytic findings as well. Researchers should strive to provide full information on basic descriptive statistics (sample sizes, means, and standard deviations) and exact P values, regardless of whether or not they are significant. Last but not least, researchers should fully disclose all of their statistical analyses.


Summary


15. Leppink J. Data analysis in medical education research: a multilevel perspective. Perspect Med Educ. 2015;4(1):14–24. XXX






Editorial

 

. 2016 Oct;8(4):483-487.
 doi: 10.4300/JGME-D-16-00332.1.

7 Deadly Sins in Educational Research

Free PMC article
No abstract available


+ Recent posts