어떻게 전문직 정체성을 기를 것인가?: 의학교육분야의 철학적 정원 가꾸기(Persepctives on Medical Education, 2023)
How to Grow a Professional Identity: Philosophical Gardening in the Field of Medical Education

MARIO VEEN 
ANNE DE LA CROIX

 

서론
Introduction

학생들은 어떻게 의학 교육 분야의 전문가로 성장하는가? 이것은 현재 우리 분야의 핵심 질문 중 하나일 수 있습니다 [1]. 이 질문에 대한 답을 고려하기 위해, 우리는 [성장]이라는 개념에 대한 [철학적 정원 가꾸기]를 할 때 여러분이 우리와 함께 깊이 파고들도록 초대합니다. 본 논문에서, 우리는 의대생들과 그들의 의사로의 발전과 관련하여 의학 교육 전문가로서의 우리의 위치를 탐구한다. 
How do students grow into professionals in the field of medical education? This might currently be one of the key questions in our field [1]. To consider answers to this question, we invite you to dig deep with us as we do some philosophical gardening around the idea of growth. In this paper, we explore our position as medical education professionals in relation to medical students and their development into doctors.

[정원 가꾸기]와 [의학 교육]은 둘 다 [성장과 발달]의 과정을 수반한다는 공통점이 있다. 정원사는 그들의 정원을 돌보고, 농작물을 재배하며, 씨앗을 심는 것부터 익히고 수확하는 것까지 모든 과정을 감독한다. 의학 교육자는 학생들을 돌보고, 커리큘럼을 개발하며, 학생들이 후배 의사로 변하는 전 과정을 감독한다. 정원 가꾸기와 의학 교육 모두 [돌봄의 형태]로 볼 수 있다[2]. 
Gardening and medical education have in common that they both involve processes of growth and development. A gardener tends to their garden, cultivates crops, and oversees the whole process from planting seeds to ripening and harvest. A medical educator cares for their students, develops a curriculum and oversees the whole process of students turning into junior doctors. Both gardening and medical education can, as such, be seen as forms of care [2].

우리 자신이 조사하고자 하는 역학의 일부이기 때문에 이 탐구는 철학적이다[3]. [철학]을 정의하는 방법은 여러 가지가 있지만, [사고방식, 존재방식, 행동방식, 일상적 실천방식 사이에 직접적인 연관성을 만드는 것]으로 볼 수 있다.

  • 당연히, 대부분의 의료 교육 연구는 유능한 의료 전문가가 되기 위한 과정에서 의료 훈련생을 가르치고, 지도하고, 평가하기 위한 [교육 방법의 효율성]에 초점을 맞추고 있다. 이것은 어떤 농사 기술, 어떤 비료, 어떤 토양 조건이 특정 작물을 재배하는 데 가장 효과적인지를 조사하는 것과 유사할 수 있다.
  • 대신, 우리는 이러한 농업 기술을 적용하고, 비료를 관리하고, 토양 상태를 최적화하는 [사람]에 초점을 맞춥니다. 연수생들이 의료 교육 분야에서 성장하고 발전할 수 있으려면, 우리는 어떤 [돌봄 관계]를 가져야 할까요?

This exploration is philosophical because we ourselves are part of the dynamic we intend to investigate [3]. There are many ways to define philosophy, but it can be seen as making a direct connection between ways of thinking, being, doing and everyday practice.

  • Understandably, most medical education research focuses on efficiency of educational methods for teaching, guiding and assessing medical trainees in their journey towards becoming competent health care professionals. This could be likened to examining which farming techniques, which fertilizers and which soil conditions are most effective for growing a certain crop.
  • Instead, we focus on the one who applies these farming techniques, administers these fertilizers and optimizing these soil conditions. Which type of care relationship should we have to our trainees so that they grow and develop in the field of medical education?

본 논문에서는 하이데거의 연구를 활용하여 의료교육 전문가인 우리가 전문적 성장과 정체성 형성 과정을 향해 취할 수 있는 태도를 탐색한다. 우리는 과도하게 이론화되었지만 실제로 자극될 수 있는 자연스러운 과정과 관련된 개념의 예로 전문적인 정체성 형성을 제안한다. 우리는 의학 교육 문헌에서 각각 환원적인 방식으로 정체성을 개념화하는 세 가지 이론적 접근법을 구별한다. 정체성에 대한 성찰 후, 우리는 전문적 정체성 형성에 대한 우리의 관점과 일치하는 기존의 교육 관행을 지적한다.
In this paper, we use Heidegger’s work to explore the attitude that we, medical education professionals, might assume towards the process of professional growth and identity formation. We propose professional identity formation as an example of a concept that is over-theorized but pertains to a natural process that can be stimulated in practice. We distinguish three theoretical approaches in medical education literature that each conceptualize identity in a reductive way. After a reflection on identity, we point to existing educational practices that align with our view of professional identity formation.

두 정원사의 이야기
A tale of two gardeners

자신의 정원을 돌보는 스타일이 다른 이 두 명의 선의의 정원사들을 고려해주세요. 

  • 첫 번째는 씨앗을 땅에 맡기고 그것을 자라게 하는 힘, 즉 햇빛과 비, 지구의 질이 그들이 통제할 수 없는 많은 부분을 차지한다는 것을 알고 있는 [구식 농부]이다. 이 접근법의 핵심 단어는 배양, 자극, 신뢰이다. 
  • 두 번째는 [현대화된 농업]의 접근법을 취한다. 이 농부는 씨앗을 땅에 맡기는 대신 최대한의 효율을 추구한다. 이 최적화를 위해서는 씨앗이 자라는 맥락의 모든 측면과 전체 성장 과정의 예측 가능성, 즉 지구의 화학적 구성, 공기 습도 등을 제어해야 한다. 이 접근법의 키워드는 제어, 신뢰성 및 효율성입니다.

Please consider these two well-intentioned gardeners (See Figure 1 and video essay https://www.youtube.com/watch?v=g7jZigyfKHI) with different styles of caring for their garden.

  • The first is an old-fashioned farmer who entrusts their seeds to the earth and watches over them, aware that the forces that make it grow – sunshine and rain, the quality of the earth – are for a large part beyond their control. Key words to this approach are cultivation, stimulation, and trust.
  • The second takes on the approach of the modernized farming industry. Instead of entrusting the seeds to the earth, this farmer aims for maximum efficiency. This optimization requires control of every aspect of the context in which the seed grows, and predictability of the entire growing process: the chemical composition of the earth, air humidity, etc. Key words to this approach are control, reliability, and efficiency.
 
Figure 1 

두 명의 선의의 정원사.
Two well-intentioned gardeners.

하이데거는 '기술 이후의 질문'에서 인간이 발달을 자극하는 두 가지 방식을 비교한다:
In The Question After Technology, Heidegger contrasts these two ways in which humans stimulate development:

'정리하다'가 여전히 '챙기다'와 '유지하다'를 의미할 때, 농부가 이전에 경작하고 순서를 정했던 밭은 그것과 다르게 나타난다 
 농부의 일은 밭의 흙에 도전하지 않는다. 그는 곡식을 파종할 때에, 그 씨앗을 자라게 하는 세력에게 맡기고, 그것이 번성하는 것을 지켜본다. 그러나 오늘날, 밭을 경작하는 것조차도 자연을 '포섭'하는 또 다른 종류의 경작의 지배하에 놓이게 되었다. 그것은 그것에 도전하는 의미에서 그것을 시작한다.
“The field that the peasant formerly cultivated and set in order appears differently than it did when ‘to set in order’ still meant ‘to take care of’ and ‘to maintain’. The work of the peasant does not challenge the soil of the field. In the sowing of the grain he entrusts the seed to the forces that make it grow and watches over its thriving. But today, even the cultivation of the field has come under the grip of another kind of cultivation, which ‘enframes’ nature. It sets upon it in the sense of challenging it forth [4].”


하이데거는 기술적인 사고와 행동 방식을 특징짓기 위해 이 예를 사용한다. 우리는 '위치 맞추기' 또는 '순서 맞추기'를 의미하는 ['엔프레이밍enframing']의 개념에 대해 계속 생각하고 싶다. Enframing[성능과 효율성에 중점]을 둔 현대의 필수 사항을 설명하며, 이는 다시 [프로세스를 제어하고 예측]할 수 있어야 한다. 하이데거는 독일어 스텔렌stellen을 사용하는데, 이는 군대에서 'standing reville'에서와 같이 'brining into position' 또는 'standing'으로 번역될 수 있다. 우리가 비행기에 탑승하기 전에 줄을 서라는 요청을 받는 방식과 유사하게, [스텔렌]의 본질은 [군인이나 승객들]이 [기술적인 업무(인원수를 세는 것; 비행기에 효율적으로 탑승하는 것)를 가능한 한 효율적으로 수행]할 수 있는 방식으로 그들 자신을 배치하는 것이다. 스텔렌은 'presenting as'로 번역할 수 있습니다: 군인들과 승객들은 [그들 자신을 무언가로 나타내야] 한다.
Heidegger uses this example to characterize technological ways of thinking and acting. We would like to linger on the concept of ‘enframing’ which means ‘positioning’ or ‘putting in order’. Enframing describes an imperative of our modern age in which there is an emphasis on performance and efficiency, which in turn requires processes to be controllable and predictable. Heidegger uses the German word stellen, which can be translated as ‘bringing into position’ or ‘standing’ as in ‘standing reveille’ in the military. Similar to the way we are called upon to stand in line before boarding an airplane, the essence of stellen is that the soldiers or passengers position themselves in a way that makes the technical task (doing a headcount; boarding the plane efficiently) able to be performed as efficiently as possible. We can translate stellen as ‘presenting as’: the soldiers and passengers have to present themselves as something.

[Enframing 자체]는 긍정적이거나 부정적인 것이 아니라, 하이데거가 "세계 그림의 시대"라고 부르는 우리 시대에, 우리를 둘러싼 세계에 대한 근본적인 관계에 대한 진단일 뿐이다[5]. 의료 교육에서, 우리는 메트릭스[6]를 통해 학습에 접근한다. 이는 모든 것을 '그림 속'으로 얻고자 하는 과정이다. 예를 들어, 훈련생이 기술을 수행하는 데 얼마나 유능한지, 또는 얼마나 전문적이거나 위탁할 수 있는지 등이 있다. 하이데거는 이 은유를 사용하여 [모든 것을 수행의 관점에서 다루려는 경향performance]을 가리키는데, 이는 농작물이든, 사람이든, 의학 수련생이든 간에 [관리 대상이 보여지기be seen(be represented) 위해서는, 특정한 방식으로 나타나도록show up 요구하는 태도]이다.
Enframing itself is not positive or negative, but simply a diagnosis of our fundamental relationship to the world around us in our age, which Heidegger calls “the age of the world picture” [5]. In medical education, we approach learning through metrics [6]. as a process in which we want to get everything ‘in the picture’: how competent a trainee is at performing a skill, or how professional or entrustable they are, for example. Heidegger uses this metaphor to point to the tendency to treat everything in terms of performance, an attitude that requires the subjects of care – whether crops, people or medical trainees – to ‘show up’ in a certain way in order to be seen (be represented) at all.

우리는 의학 교육을 지배하고 의학 교육의 어떤 문제에 대한 우리의 기본적인 접근 방식을 형성하는 것이 이 대표적인 모델이라고 느낀다. [표현주의representationalism]의 단점은 [자신이 누구인지를 보여주기 위해서]는 [특정한 방식]으로 [자신을 제시]해야 한다는 것인데이는 정의상 [자신이 아닌 것]이다(즉, 기술적인 의미에서의 비진실성inauthenticity [7]). 이 발표와 원하는 자질의 징후를 보여주는 초점은 훈련생들을 [이중적인 곤경]에 빠뜨린다. 그 핵심은 의료교육의 사회적 계약을 사회와 함께 이행할 의지와 능력이 있는 유능한 전문가로 성장할 수 있도록 하는 것을 목적으로 [의사라는 씨앗을 '미발달 상태로in the bud'에 뿌리는 분야]다.
We feel that it is in this representational model that dominates medical education and shapes our basic approach to any issue in medical education that the problem lies. The catch-22 in representationalism is that in order to be seen as who you are, you are required to present yourself in a certain way, which by definition is something you are not (i.e., inauthenticity in the technical sense [7]). This presenting as and the focus of showing signs of desired qualities places trainees in a double bind. At its core, medical education is a field in which we sow seeds of physicians ‘in the bud’, with the purpose of letting them grow into competent professionals that are willing and able to fulfill medical education’s social contract with society.

하이데거의 [구식 농부]와 유사한 의학 교육의 오래된 [견습 모델]은 [땅과 가까운 것]이 특징이었다. 이러한 보살핌의 방식은 [새로운 기술적인 농업 방식]에 의해 제거 되었다. 하지만 우리는 [결코 향수를 느끼고 싶지 않다]. 새로운 농업 방식이 [더 효율적이고 책임감 있는 훈련 방법(의사의 역할이 역량 프레임워크에서 '골라진' 것, 즉 견습 모델이 제공할 수 없었던 것)]을 제공하기 때문이다. 하지만 우리는 의료 전문가들을 훈련시키기 위한 지속 가능한 윤리를 지원하는 연수생들과의 관계에서, 이 [두 가지 관리 방식을 어떻게 결합할 것]인지 자문해 볼 수 있습니다.
The old apprenticeship model of medical education, analogous to Heidegger’s old-fashioned farmer, was characterized by a closeness to the land. This way of caring has been made sterile by newer technological ways of farming. By no means do we wish to be nostalgic though, as the newer ways of farming offer more efficient and accountable ways of training – in which the role of the doctor is ‘enframed’ in a competency framework, something that the apprenticeship model was unable to offer. But we can ask ourselves how to combine these two modes of care in a relationship to our trainees that supports a sustainable ethic for training medical professionals.

정체성 문제: 우리는 무엇을 성장시키고 있는가?
Identity issues: what are we growing?

[의사가 되는 것]"의사의 "일을 하는" 것뿐만 아니라 "존재"에 대한 강조를 향한 의학 교육의 변화를 포함하는 "역량을 넘어선 여정"으로 간주된다[8]. 그러나 ['존재'와 '존재됨']의 문제는 수천 년 동안 인류의 탐구 주제였다. 플라톤은 이미 존재가 되는 것becoming이 새로운 것으로 성장하는 과정인지, 아니면 당신이 진정으로 누구인지에 대한 기억인지 궁금해했다. 의학 교육에서, 의사가 되는 것becoming은 일반적으로 "비전문가에서 의사로 변화하는 동안 경험하는 근본적인 과정"을 의미하는 '전문직 정체성 형성'이라는 이름 하에 논의된다. 이것은 "전문적 가치, 행동 및 포부의 개발을 포함하며 의학 교육의 중심"이다. 이 용어를 사용하는 것은, 우리가 의학 교육 분야에 복잡한 개념인 [정체성]을 도입했다는 것을 의미한다.
Becoming a physician is considered a “journey beyond competence” [8] that involves a “shift in medical education toward emphasis on the “being” as well as “doing the work” of a physician” [9]. But the question of ‘being’ and ‘becoming’ has been a topic of human inquiry for millennia. Plato already wondered if becoming is a process of growing into something new, or a remembrance of who you truly are. In medical education, becoming is usually discussed under the header of professional identity formation, “the foundational process one experiences during the transformation from lay person to physician” [10], which “involves the development of professional values, actions and aspirations and is central to medical education [11].” Using this term means we have introduced a complex concept into the field of medical education: identity.

아이덴티티라는 용어의 보편적인 사용은 우리가 아이덴티티가 무엇인지, 아이덴티티를 전문적으로 만드는 것이 무엇인지, 아이덴티티가 어떻게 형성되는지, 그리고 그 형성을 지원하기 위해 우리가 무엇을 할 수 있는지 알고 있다고 믿게 할 수 있다. 그러나 철학적인 관점에서 우리는 이것이 사실이라고 믿지 않는다. 정체성은 전혀 잘 이해된 개념이 아니다. 사실, 정체성은 [정의와 측정]을 거부하며, [답answer]이라기 보다 [열린 질문]으로 보아야 한다. 우리의 정체성 개념은 인종차별, 성별 다양성, 그리고 일반적으로 어떤 정체성 유형이 중요하고 그렇지 않은 사회 문화적 문제와 관련이 있다 [12, 13, 14, 15]. 정체성은 단지 [농작물]에만 관한 것이 아니며, 심지어는 단지 [농부와 농작물 사이의 관계]에만 관한 것도 아니고, 그들이 [자라는 토양]의 질, 즉 [사회 문화적 맥락]에 관한 것이기도 하다.
The ubiquitous use of the term identity may lead us to believe that we know what identity is, what makes an identity professional, how identities form and what we can do to support their formation. From a philosophical perspective, however, we do not believe this to be the case. Identity is not a well-understood concept at all. In fact, it resists definition, measurement and should be seen as an open question rather than an answer. Our conception of identity is bound up with sociocultural issues of racism, gender diversity, and in general which types of identities matter and which do not [12, 13, 14, 15]. Identity is not just about the crops, or even about the relationship between the farmer and the crops, but also about the quality of the soil – the sociocultural context – in which they grow.

먼저 우리가 '정체성'을 어떻게 개념화하고 그것을 어떻게 성장시키는지 살펴봄으로써 한 걸음 물러설 것이다. 의학 교육에서, 우리는 정체성을 개념화하는 세 가지 상호 연관된 방법을 인식한다:

  • 개인의 심리적 특성,
  • 행동의 집합, 그리고
  • 개인이 전문적인 공동체와 관계를 맺는 방법.

이러한 각각의 개념화는 나름대로 문제가 있지만, 모두 정체성의 표현 모델의 사례이다. 
Let us take a step back by first looking at how we conceptualize ‘identity’ and how we grow it. In medical education, we recognise three interrelated ways to conceptualize identity:

  • as an individual psychological trait,
  • as a set of behaviors, and
  • as the way in which an individual relates to the professional community.

Each of these conceptualisations is problematic in its own way, but they are all instances of the representational model of identity.

개인 특성으로서의 정체성
Identity as individual trait

[전문직 정체성]에 대한 한 가지 견해는 그것을 [개인의 특성]으로 보는 것이다. 정체성은 훈련생 [내부에 위치한 것]으로 보이며, 훈련생은 [식별 가능한 행동]으로 정체성을 표현할 수 있다. [여러분이 누구인지는 여러분 안의 '진실']이며, [교육자가 직면한 도전은 정체성을 채굴하거나 발굴하는 것]입니다. [타인의 내면세계]에 [직접적으로 접근하는 것]은 근본적으로 불가능하기 때문에, 개인의 [공적 수행(다른 사람들이 관찰할 수 있는 부분)]은 그들의 내면적 정체성을 나타내는 것으로 [간주]된다. 즉, [전문적 정체성이 발달한 사람]은 [전문적으로 보이는 행동을 한다]는 것이다. 전문적 정체성은 [시간을 엄수]하고, [특정한 방식으로 말]하고, [특정한 태도를 투영]하는 것과 같은 ["행동 목록"으로 환원]되며, 이는 ['개발된' 정체성의 존재를 "지시indicative"하는 것]으로 간주된다:

  • 한편으로 정체성은 사람이 말하고 행동하는 것을 넘어서는 것으로 보여지지만,
  • 다른 한편으로 사람이 말하고 행동하는 것은 이 정체성의 표현으로 보여진다. 

One view of professional identity is to see it as an individual trait. Identity is seen as located inside the trainee and that can express itself in identifiable behavior. Who you are is a ‘truth’ inside you and our challenge as educators is to mine or excavate it. Since it is fundamentally impossible to directly access another’s inner world, an individual’s public performance (the part of them that others can observe) is seen as a representation of their inner identity. Someone who has a developed professional identity acts out the behavior that is seen as professional. Professional identity is reduced to a “list of behaviors”, such as being punctual, speaking in a certain way, and projecting a certain attitude, which are taken to be “indicative” of the presence of a ‘developed’ identity:

  • on the one hand, identity is seen as something beyond what a person says and does,
  • but on the other hand, what a person says and does is seen as an expression of this identity.

"행동은 […] 전문직 정체성의 유무를 나타내며, 결과적으로 대리인으로 사용될 수 있다[16]." 즉, [농작물의 상태]는 [생김새]에 따라 평가되는데, 이는 [얼마나 영양가가 높은지]를 나타내는 표시로 받아들여진다.

“Behaviors are […] indicative of the presence or absence of a professional identity and consequently can be used as surrogates [16].” In other words, the state of the crops is assessed by how they look, and this is taken as a sign of how nutritious they are.

행동으로서의 정체성
Identity as behavior

본질주의적인 문제를 다루는 한 가지 방법은 [정체성을 일련의 행동으로 환원하는 것]이다. 이러한 [행동주의적 접근법]에서, [행동]은 [당신이 누구인지에 대한 표현]이 아니라(개개의 특성이 아니다), [당신이 누구인지]는 [당신이 어떻게 행동하는지에 불과]하다. 예를 들어, 성찰의 경우, 행동에 지나치게 집중하는 것은 '성찰 좀비("실제로 반성하지 않고 반성의 모든 외부적 특성을 보여주는 사람들[17].")'로 이어질 수 있다. [성찰 좀비]는 행동이 요구되는 자질에 맞는다고 판단하는 평가 기준의 관점에서 [실제로 성찰하는 학생]과 [구별할 수 없다]. [바람직하고 '좋은' 성찰(보통 측정 가능한 행동으로 표현,되며, 정의되고, 조작화된다)]에 초점을 맞추면 학생들은 [실제로 배우거나 성찰하지 않고], [해당 행동만 보여줄 수] 있다. One way in which this essentialist problem is dealt with, is to reduce identity to a set of behaviors. In this behaviorist approach, behavior is not an expression of who you are (not an individual trait), but who you are is nothing but how you behave. For instance, in the case of reflection an overfocus on behavior can lead to ‘reflective zombies’: “someone who displays all the outer traits of reflection, without having actually reflected [17].” A reflective zombie is indistinguishable from a student that actually reflects from the perspective of assessment criteria that determine behavior fits the required quality. A focus on desired, ‘good’ reflection (which is represented, defined and operationalised in measurable behaviors) will lead students to show only that behavior, possibly without actually learning or reflecting.

만약 우리가 [행동]을 [내적 자질의 표현]으로 보고, 이러한 [내적 자질]을 [행동]으로 환원한다면, 우리는 학생들에게 [특정한 행동]을 요구한다. 이것은 [시스템 게임game the system]으로 학생을 초대한다. "평가되는 바로 그 순간에만 행동을 바꾸는 것"이다. 전문직업성도 마찬가지이다. 전문직업성을 계량화하는 것은 '전공의 과정의 또 다른 장애물'로 만든다. 공감도 마찬가지이다. 학생들이 그 당시에 실제로 느끼지 못하는 행동을 묘사해야 할 때 '공감적 불협화음'을 경험한다. 시스템 게임은 엔프레이밍Enframing의 완벽한 예이다: [시스템 게임]은 [학생들의 나쁜 의도의 결과]가 아니라, [행동에 초점을 둠]으로써 [행동이 원래 대표해야 하는 것]보다 [기대되는 행동 그 자체의 모방]에 집중하는 것이 더 보람을 느끼게 하기 때문이다. 간단히 말해서, [표현]이 중요한 상황이라면, [표준에 맞춰서 행동하는 것]이 더 합리적입니다. 그러나, 그것은 단지 행동[17]을 모방하고, 내적 동기[19]를 약화시키고, 학생들로 하여금 압박감과 단절감을 느끼게 할 수 있다[21].

If we see behavior as a representation of inner qualities, and then reduce these inner qualities to behavior, we require a certain behavior of students. This invites students to game the system, meaning “changing behavior the moment it is assessed” [18]. This is also the case for professionalism, where quantifying professionalism make it into “just another hurdle to residency” [19], or empathy where students experience “empathic dissonance” [20] when they are required to portray behavior they do not actually feel at that time. Gaming the system is a perfect illustration of enframing: it is not a result of students’ bad intentions, but due to the focus on behavior making it more rewarding to focus on emulating the behavior that is expected rather than what it is supposed to represent. In short, it simply makes more sense to perform according to the standards, because the representation is all that matters. However, it can lead to just emulating the behavior [17], sapping internal motivation [19] and making students feel pressured and disconnected [21].

[행동주의적 접근]은, [정체성]을 [행동을 통해 표현되는 애초의 본질]로 취급하지 않고, 오히려 [행동을 정체성과 동일시]하는 방식으로 [접근성access의 문제]를 해결하는 것으로 보인다. 그러나 전문적 정체성 형성과 관련된 내적 경험의 관련성을 부정하는 것은 [메뉴]를 [음식]으로 착각하는 것이고, 이는 다른 문제로 이어지는데, 이는 [정체성이 단지 퍼포먼스로 간주된다는 것]이다.
The behaviorist approach appears to solve the problem of access because it does not treat identity as a pre-existing essence that is expressed through behavior, but rather equates the behavior with identity. But denying the relevance of an inner experience related to professional identity formation mistakes the menu for the food and leads to the next problem, which is that identity is seen as just a performance.

사회화 과정으로서의 정체성
Identity as a socialization process

정체성은 또한 [사회화의 과정]으로 볼 수 있다: 당신이 누구인지는 당신이 공동체에서 어떻게 위치하는가이다. [전문직 정체성 형성]은 [내적 자질에 관한 것]이 아니라, [직업 문화에 사회화되는 과정]이다. 이것은 학생들이 미래의 직업 문화가 ['바람직한 실천']이라고 생각하는 방식으로 행동하는 것을 배운다는 것을 의미한다. 사회화를 위한 널리 받아들여지는 모델은 [실천공동체 모델]로, 특정 분야의 초보자들은 [합법적인 주변부 참여]에서 "주로 사회적 상호작용을 통한 [완전한 참여]"로 이동한다. 많은 경우, [전문직 정체성 형성]은 [개인의 정체성을 형성한 정도]가 정확히 [언제 지역사회의 규범과 지침에서 벗어나야 하는지 판단할 수 있는 정도]인 [해방적emancipatory 과정]으로 간주된다. 이것의 주요 측면은 정체성이 아니라 [순응conformance]인 것처럼 보인다. 이러한 관점에서 정체성은 [내적 특질]이나 [객관적인 행동의 집합]으로 보지 않고, 오히려 [사회적 역할]로 본다. 여기서 정체성은 [배우가 연극에서 역할을 수행한다]는 의미에서 [공연performance]이 된다. 연극에 따라, 정체성은 바뀔 수 있고, 의상과 관습의 변화 이상의 것을 요구하지 않는다.

Identity can also be seen as a process of socialization: who you are is how you are positioned in the community. Professional identity formation is then not about an inner quality, but a process of socializing into the professional culture. This means that students learn to act in the way that their future professional culture considers ‘good practice’. A widely accepted model for socialization is the Communities of Practice model, in which novices to a field move from legitimate peripheral participation to “full participation, primarily through social interaction [21, 22].” In many cases, professional identity formation is seen as an emancipatory process in which the degree to which one has formed an individual identity is precisely the degree to which one can judge when to divert from the norms and guidelines of the community. The main aspect of this does not seem to be identity, but conformance. In this perspective, identity is not seen as an inner quality or an objectifiable set of behavior, but rather as a social role. Here, identity becomes a performance in the sense that an actor performs a role in theatre. Depending on the play, identity can change and requires little more than a change of costume and custom.

훈련생이 현 상황status quo에 적응할 수 있을까요? 그들은 우리가 가지고 있는 의사의 이미지로 자신을 표현할 수 있을까요? 연습생이 그 분야의 지배적인 규범과 문화에 맞게 말하는 방식을 형성할 수 있는가? 실천공동체 모델에서, [적응하고 순응해야 할 필요성]이 [진정성에 대한 감각]을 완전히 대체하는 것처럼 보인다: 당신이 당신의 [역할을 진정으로 수행하는지 아닌지]는 중요하지 않다. 직업 정체성에 대한 이러한 관점은 학생들이 [그들만의 방식으로 발전하도록 허용한다]는 생각과 상충되며, 학생들이 [진정한 학생이 될 수 없도록] 할 수도 있다[23, 24]. 일부 연구자들[25]은 심지어 이것이 [소수 민족 학생들]이 [임상실습에서 낮은 점수를 받는 이유]라고 제안했다. (이 관점에서) 소수집단 학생들은 실천 공동체의 기존 규범에 맞지 않기 때문이다. 교육과정의 탈식민지화[26]와 의학교육에서 '백인'[12]이 어떻게 표준이 되었는지에 대한 질문에 대한 현재의 논쟁은, [공동체가 정한 기준]이 결코 중립적이지 않다는 것을 고통스럽게 보여준다. 이런 의미에서 [전문직 정체성 형성]은 단순히 [사회화]에 관한 것이 아니라, ['전문적 주체화'와 '진정성']에 관한 것이다. 
Can a trainee adapt to the status quo? Can they present themselves as the image we have of a doctor? Can the trainee shape their way of talking and being to fit the dominant norms and culture of the field? In the Communities of Practice model, the need to adapt and conform seems to supersede any sense of authenticity: it does not matter if you act out your role authentically or not. This view of professional identity clashes with the idea of letting students develop in their own way, and might disallow students to be authentic [23, 24]. Some researchers [25] have even suggested that this is why students with an ethnic minority get lower grades in their clinical clerkships: they do not fit the existing norm of the community of practice. Current debates about decolonizing the curriculum [26] and questioning how ‘whiteness’ [12] has been the norm in medical education painfully illustrates that the standard that the community sets is never neutral. In this sense, professional identity formation is not just about socialization, but just as much about “professional subjectification” [23] and “authenticity” [7].

근본적인 문제: 표현주의
The underlying issue: representationalism

이 세 가지 이론적 방향을 [각각의 결점]이 있는 분야를 수정하는 서로 다른 방법으로 보고, 모든 장점과 단점을 포함하지 않는 [네 번째 이론]인 더 나은 비료를 마련할 필요가 있다고 결론내리는 것은 유혹적이다. 그러나 그 문제는 더 근본적인, 즉 철학적인 것이다. 이 모든 경우에, 정체성은 [표현의 렌즈]를 통해 보여진다:

  • [내부 세계의 표현]으로서의 퍼포먼스,
  • [이상적인 행동 세트의 표현]으로서의 퍼포먼스
  • [공동체 기준의 표현]으로서의 퍼포먼스

It is tempting to see these three theoretical orientations as different ways of fertilizing the field that each have their flaws, and to conclude that we need to come up with a better fertilizer, a fourth theory that includes all the benefits and none of the shortcomings. But the issue is more fundamental, that is, philosophical. In all these cases, identity is seen through the lens of representation:

  • performance
    • as representation of an inner world,
    • as representation of an ideal set of behaviors, or
    • as representation of the community standard.

각각의 이론적 접근은 정체성의 다른 측면을 희생시키면서 특정 측면을 강조한다. 그러나, 그렇게 함으로써, 그것은 또한 [그 유형의 현상]으로 정체성을 환원시킨다 [27]. [이론]은 [우리가 세상을 보는 렌즈]입니다. [심리적 상태]로서의 정체성, [행동의 집합]으로서의 정체성, [사회적 역할]로서의 정체성. 문제는 '~로서의as'를 '~이다is'라고 말할 때 생긴다. 예를 들면, '정체성은 심리적 상태이다(다른 것은 아무것도 아니다)'라고 말하는 것이다. 이것이 문제가 되는 이유는, [정체성이 심리적, 행동적, 사회적 과정으로 환원]된다면, [그러한 유형의 연구가 정체성에 대해 알아야 할 모든 것을 '그림 속'에 가질 수 있다는 착각]만들기 때문이다. 이것은 우리가 [전문직 정체성 형성에 대한 이론]이 [무엇을 하는지] 생각할 때 문자 그대로가 된다: 그것들은 모델, [즉 '정체성이 어떻게 작동하는지'에 대한 그림], 을 제시한다.
Each theoretical approach emphasizes certain aspects of identity at the expense of others. However, in doing so it also reduces identity to that type of phenomenon [27]. A theory is a lens through which we can look at the world: identity as psychological state, as set of behaviors, as social role. The problem arises when as becomes is: when we say, identity is a psychological state (and nothing else) [28]. This is problematic because if identity is reduced to a psychological, behavioral or social process, the illusion arises that this type of research can have everything there is to know about identity ‘in the picture’. This becomes literal when we think of what theories on professional identity formation do: they present models, i.e., pictures of ‘how identity works’.

이러한 [환원주의적 접근]과는 대조적으로, 우리는 [전문직 정체성 형성]이 ['전문직이 된다는 것은 어떤 것인가'라는 현상학적 경험과 관련이 있다]고 반박한다. 그래서 정체성과 관련된 ['내면의 경험']이 있다. 하지만 [누군가가 전문직인지 아닌지]는 [단지 개인의 선택이나 경험이 아니다]. 왜냐하면 그들은 [숙련된 실무자들의 공동체 안]에서 전문가이기 때문이다. [전문직 정체성 형성]은 이 과정에 관한 아주 좋은 이름이다. 그러나, 여러분(연수생)이 의사가 되는 것과 관련하여, 우리(의료 교육 전문가)는 스스로에게 다음과 같이 물어봐야 합니다:
In contrast with this reductionist approach, we counter that professional identity formation has to do with the phenomenological experience of ‘what it is like’ to be a professional. So, there is an ‘inner experience’ that is relevant to identity. But whether someone is a professional or not is not just an individual choice or experience, because they are a professional in a community of skilled practitioners. Professional identity formation is a great name for this process. However, in relation to becoming the doctor that you (the trainee) are, we (the medical education professional) should ask ourselves:

  • 우리(의학교육전문가)가 의사로서 [당신의 진짜 정체]를 알 수 있을까요?
  • 우리(의학교육전문가)가 여러분에게 [어떻게 여러분이 될 수 있는지]에 대한 모델이나 길을 보여줄 수 있을까요?
  • [지금의 당신이 되는 과정]에서 우리(의학교육전문가)가 당신을 지원할 수 있을까요?
  • – Can we ever claim to know who you really are, as a (trainee) doctor?
  • – Can we show you a model or a pathway for how to become who you are?
  • – Can we support you in the process of becoming who you are?

생태다양성
Ecological diversity

[정체성에 대한 이론적 접근]은 우리가 정체성이 무엇인지 알고 있고 심지어 그것을 '관리'할 수 있다는 편안한 느낌을 줄 수 있다. 그러나 우리는 [지속 가능한 농업 접근법의 통합]과 [현대적 접근법의 효율성과 성과]로부터 무언가를 배울 수 있다.
Theoretical approaches to identity can give us the comforting feeling that we know what identity is and that we can even ‘manage’ it. But we can learn something from the integration of sustainable farming approaches and the efficiency and performance of modern approaches.

[균일성, 예측가능성, 적합성]은 [생물다양성의 상실]로 이어지는 반면, [생태적으로 다양한 성장]은 토양을 가꾸면서 [생물다양성을 증가]시킨다. 모든 접근 방식에 적합한 하나의 방법이 있다보다는, 한 가지 접근 방식에 순응할 필요 없이, [서로 교차 수정하는 소규모 실험]을 자극해야 한다. 이것은 또한 [상세한 계획을 제시한 후 실행하는 것]이 아니라, 프로세스에서 [무엇이 작동하는지를 즉흥적으로 파악하는 것]을 의미한다.
Uniformity, predictability and conformity lead to loss of biodiversity, while ecologically diverse growing increases biodiversity while taking care of the soil. Rather than a one size fits all approach, we should stimulate small-scale experiments that cross-fertilize each other without having to conform to one approach. This also means improvising and figuring out what works in the process, rather than presenting a detailed plan and then executing it (which is a requirement from the perspective of enframing).

[두 번째 교훈]은 [내부 동기의 상실, 진정한 성찰 또는 연결감을 해결하기 위해 우리가 '할 수 있는' 것이 무엇인지]를 묻는 대신, 최근의 연구가 시사하는 바와 같이, 열대림은 내버려 둘 때 가장 효과적으로 재생될 수 있다는 것이다[29]이것은 우리가 반드시 [정체성, 전문성, 반성, 공감 등을 무시해야 한다는 것]을 의미하지는 않는다. 오히려, 우리는 연습생들에게 [자신의 경험과 관점을 성찰할 시간과 다른 관점을 탐구할 기회]를 위해 [더 많은 공간을 줄 수 있는 방법]을 생각해 보아야 한다.

The second lesson is that instead asking what we can ‘do’ to remedy loss of internal motivation, authentic reflection or the feeling of connection, is that as a recent study suggests, tropical forests may regrow most effectively when left alone [29]. This does not necessarily mean that we should ignore identity, professionalism, reflection, empathy and so on. Rather, we can consider how we can give trainees more space with time to reflect on their own experience and perspective, and opportunity to explore other perspectives. 

우리도 명확한 답을 가지고 있는 것은 아니나, 우리는 [PIF를 지속 가능한 방식으로 커리큘럼의 일부로 만들기 위해 필요한 몇 가지 요소들]이 있을 수 있다고 생각한다.

  • 첫 번째는 [학생의 자율성을 존중하는 것]입니다. 학생들은 다를 수 있고, 복잡한 개념이 그들에게 무엇을 의미하는지 생각하도록 초대받는다. 그들은 그들 자신의 선택에 책임이 있고, 개인으로 보여진다.
  • 두 번째 요소는 [학생들을 기존의 방식에서 벗어나게 하는 것]이다. 종종 말 그대로 다른 장소로 데려가는 것을 의미한다. 완전히 다른 토양으로 데려가는 것이다. 이것은 쿠마가이 & 위어가 '낯설게 만들기'(핵심 철학적 실천)라고 부르는 것의 대표적인 예로, '자신의 가정, 관점 및 행동 방식을 파괴하고 방해하도록 만들어서, 자신, 타인, 세상을 새롭게 보는' 것을 의미한다[32]. '낯설게 만들기' 이니셔티브의 다른 예로는 학생들이 [공감에 대한 사랑과 이별 편지를 쓰게 하는 것], [공감에 대해 배우기 위해 해리포터 이야기를 사용하는 것], 그리고 [극장에 의해 권한을 부여받는 의학 교육(MEET)]은 관객(즉, 학생)이 등장인물의 태도, 행동 또는 성격을 조절할 수 있는 [연극을 사용하는 것] 등이 있다. 
  • 세 번째 요소는 [의료 훈련에서 인간 접촉을 조직하는 것]이다. 결국, 개인적인 성장과 발전은 개인적인 접근을 필요로 한다. [멘토링]은 교육자와 학생의 접촉에 관한 한 좋은 예이다: 멘토가 학생들을 정말로 알아가야 한다. 또 다른 하나는 학생들에게 "환자의 표현" 대신에 의학 교육과정에서 환자들과 초기에 상호작용할 수 있는 기회를 제공하는 것이다.

While we do not have definite answers – if we did, we would ourselves cotradict our proposed approach – we do feel that there might be some necessary ingredients to make PIF part of the curriculum in a sustainable way.

  • The first is respecting autonomy of the student. Students are allowed to be different, and are invited to think about what complex concepts mean to them. They are held responsible for their own choices, and are seen as individuals.
  • The second ingredient is to take step away from the modus operandi– sometimes literally taking students to a different location – and show them different feeding ground. This is a prime example of what Kumagai & Wear call ‘making strange’ [30] (a core philosophical practice [31]), to help disrupting and disturbing ‘one’s assumptions, perspectives, and ways of acting so that one sees the self, others, and the world anew’ [32]. Other examples of ‘making strange’ initiatives are letting students write love and break up letters to empathy [33], using Harry Potter stories to learn about empathy [34], and Medical Education Empowered by Theatre (MEET) uses theatre in which the audience (i.e. the students) can modulate the characters’ attitudes, behaviors, or personalities [35].
  • The third ingredient of best practice initiatives is organizing human contact in medical training. After all, personal growth and development require a personal approach. Mentoring is a good example when it comes to educator-student contact: it requires the mentor to really get to know students. Another one is to provide students with opportunities to interact with patients early on in the medical curriculum, instead of “representations of patients” [3236].

이러한 모든 모범 사례의 가장 중요한 결과는 [의미 있는 경험을 설계하고, 학습의 가이드과 촉진을 맞춤화하는 데 시간을 투자한다는 것]입니다. 위의 바람직한 실천에서는 학생들을 시험하고 점수를 매기는 것에 덜 집중한다 - 그것들은 표현주의 정신을 불러일으키는 경향이 있는 활동들이다. 그들은 [측정하는 것]보다 [성장을 자극하는 것]을 우선시한다.
An overarching result from all these good practices is that they invest time in the design of meaningful experiences, and in tailoring guidance and facilitation of learning. They focus less (or not at all) on testing and grading students – which are activities prone to evoke a spirit of representationalism. They prioritize stimulating growth over measuring it.

우리 분야의 성장
Growing our field

우리는 연습생들과의 관계에 대해 철학적인 접근을 시도해 왔다. 우리는 훈련생의 정체성을 개념화하는 방법이 훈련생과의 관계를 형성하기 때문에 [전문직 정체성 형성]을 중점적으로 선택했다. 그러나 [전문직 정체성 형성 현상]은 우리와 너무 가깝기 때문에 [임계 거리critical distance]에서 설명할 수 없다. 결국, 우리는 또한 의료 교육 공동체의 일원으로서, 교사 훈련과 이와 같은 저널에서 우리의 직업적 정체성을 연구하고 있다. 우리는 [어떤 시점에서도 전문적인 성장으로 이해되는 것을 결정하는 문화적, 역사적, 직업적 맥락의 바깥]에서 [중립적이거나 객관적인 유리한 지점을 차지할 수 없다]. 전문적 성장에 대한 이론적 설명은 우리가 이론화하고자 하는 현상의 속성보다는 우리 자신의 접근 방식의 거울인 우리 자신의 가치의 수행으로 볼 수 있다. 
We have attempted to take a philosophical approach to our relationship to our trainees. We chose professional identity formation as a focus because how we conceptualize the identity of our trainees shapes our relationship to them. But we cannot describe the phenomenon of professional identity formation from a critical distance because it is too close to us. After all, we are also working on our professional identity as members of the medical education community, in teacher training and in journals such as this one. We cannot occupy a neutral or objective vantage point outside of the cultural, historical and professional context that determines what is understood by professional growth at any given time. Any theoretical description of professional growth might be seen as a performance of our own values which, as we know, are a mirror of our own approach rather than a property of the phenomenon we aim to theorize.

하이데거의 'enframing'에 대한 에세이에서,

  • [구식 농부]는 (작물에게) 매 순간 그들이 필요로 하는 것을 제공하고, 그들의 완전한 잠재력으로 성장하는 장벽을 제거하는 데 초점을 맞추고 있다.
  • [현대 농부]작물이 [일단 자라면 어떤 모습이어야 하는지에 대한 모델(사진)]에 따라 작물을 어떻게 행동하게 만드는지에 초점을 맞춘다.

어느 것이 더 나을까요? 현실은, 우리에게 선택권이 없다는 것이다. 우리는 견습 모델로 돌아갈 수 없으며(그리고 다시 돌아가고 싶지 않아야 한다), 우리는 우리의 현대적인 접근 방식의 이점을 유지하고 싶다.

  • The old-fashioned farmer in Heidegger’s essay about ‘enframing’ [4] focuses on providing them with what they require at every moment, and taking away barriers to growing into their full potential.
  • The modern farmer, instead, focuses on how to make the crops behave according to a model (picture) of what the crops should look like once they are grown.

Which is better? The reality is, we do not have this choice. We cannot (and should not want to) return to the apprenticeship model, and we want to maintain the benefits of our modern approach.

기후 위기의 맥락에서 농사를 짓는 것과 마찬가지로, 우리는 성장과 효율성에 초점을 맞추는 것이 지속 가능하지 않다는 것을 깨닫지만, 동시에 세계 인구를 먹여 살리기 위해서는(또는 의료 전문가를 전 세계에 제공하려면), 과거의 농사 방식으로는 현대 사회의 요구를 충족시킬 수 없음을 안다. 그래서, 우리는 성장이 필요하지만, 그 의미는 달라야 한다. [전문적 정체성 형성에 대한 현재의 개념]은 더 이상 [현대 의학 교육의 요구]를 충족시키지 못한다.
Just like farming in the context of the climate crisis, we realize that a focus on growth and efficiency is not sustainable, but at the same time to feed the world’s population (or provide it with health care professionals), the old ways of farming are unable to provide what contemporary society requires. So, we do need growth, but in another sense. Current concepts of professional identity formation no longer meet the needs of contemporary medical education.

본 논문에서는 [연습생과의 관계를 형성하는 핵심개념]으로서의 정체성에 초점을 맞추었다. 그러나 의학 교육은 최근 우리가 매일 사용하는 다른 복잡한 개념을 근본적으로 심문하는 계획을 목격했다: 성찰[37], 전문성[38][15], 돌봄[2], 과학[39], 기술[40] 및 숙련도[41]. 이러한 개념 중 많은 것은 측정 기준과 기술적 사고가 적절한 위치를 차지하는 우리 분야와 [의식적인 관계를 만드는 방법]이다. 니먼은 이 딜레마를 "[의사의 휴머니즘 의식을 유지하려는 열망]과 [의학적 전문성의 기술화technification를 촉진하는 우리의 교육 과정] 사이의 긴장"으로 표현했다. 니먼이 말한 '기술화'라는 개념은 '표현주의representationalism'의 한 측면으로 보인다: "환자에 대한 데이터를 수집하고 환자의 어떤 측면에서 치료가 필요한지 결정하기 위해 설계된 [절차적 또는 진단적 기술로 기능]하기 위해 [인간 사회 활동의 용도를 변경하는 것]". 하지만 우리 스스로가 [의학 교육을 기술화]한다면, 어떻게 학생들과 수련생들이 [의료 행위의 인간적인 측면의 기술화에 저항할 것]이라고 기대할 수 있을까?
In this paper, we have focused on identity as a core concept that shapes our relationship with trainees. But medical education has recently seen initiatives that fundamentally interrogate other complex concepts that that we use every day: reflection [37], professionalism [38][15], care [2], science [39], technology [40], and skillification [41]. Many of these concepts are ways to create a conscious relationship to our field, within which metrics and technical thinking have their proper place. Nimmon formulated this dilemma as “the tension between our desire to maintain a sense of humanism among our practitioners and our teaching processes that promote the technification of medical expertise” [42]. Her concept of technification can be seen as an aspect of representationalism: “the repurposing of human social activity to function as a procedural or diagnostic skill designed to gather data about the patient and determine what aspect of the patient requires curing.” [42] But how can we expect students and trainees to resist technification of the humane side of medical practice if we ourselves technify medical education?


우리는 연습생과의 관계를 형성하기 위해 사용하는 개념을 발전시키는 의미에서 성장이 필요합니다. 이 개념들은 너무 경직되지 않고 정확해야 한다. 이를 위한 방법은 교실과 거주지의 현실에 의해 지속적으로 날카로워질 수 있는 실천과의 대화를 유지하는 동시에 설계 방법에 대한 안내와 함께 교육적 실천을 제공하는 것이다. 실천, 이론, 그리고 개념들 사이의 이러한 상호작용은 우리가 철학적 정원 가꾸기라고 부르는 것입니다. 생각하면서 일하고, 일하면서 생각하는 것.
We need growth in the sense of the development of the concepts that we use to shape our relationship to our trainees. These concepts need to be precise, without being too rigid. The way to do this is to keep them in a dialogue with practice, in which they can continue to be sharpened by the reality of the classroom and residency, while also providing educational practice with guidance on how to design it. This interplay between practice, theory and concepts is what we call philosophical gardening: working while thinking, thinking while working.


Abstract

In this philosophical reflection, we – following the philosopher Heidegger - introduce two farmers who represent different ways in which one can develop growth (see https://www.youtube.com/watch?v=g7jZigyfKHI for instructional video). One is a traditional farmer who entrusts the seeds to the soil and cultivates them with care and trust. The other is a modern farmer who takes an industrialized approach and positions the seeds and ‘challenges-forth’ the crops to show themselves in a certain way. We use these farmers as an analogy for the ways in which we as medical educators can and should relate to those we ‘care’ for: medical students and trainees.

Taking a philosophical stance, and accounting for our own positionality and involvement in the analysis, we focus on ‘Professional Identity Formation’ and its operationalization in the field of medical education. We identify three main approaches medical education has taken to identity: as an individual trait, as a set of behaviors, and as a socialization process. All these approaches have at their root a similar assumption, namely that all inner processes can be made visible. We challenge this representational paradigm and use ‘philosophical gardening’ to raise awareness of what can and cannot be measured and controlled.

Finally, we suggest educational approaches that leave space for diversity in students’ experiences, learning approaches, and growth. We share good practices of brave teachers and curriculum designers whose interventions are characterized by less control and fewer measurements of personal growth, but more trust and free spaces for authentic learning.

 

주관적 평가를 측정할 때 동의-비동의 문항 사용의 재고(Res Social Adm Pharm. 2022)
Towards a reconsideration of the use of agree-disagree questions in measuring subjective evaluations
Jennifer Dykema a,b,*, Nora Cate Schaeffer a,b, Dana Garbarski c, Nadia Assad a, Steven Blixt d

서론
Introduction

태도 측정에 대한 그의 중요한 연구에서 렌시스 리커트의 공로를 인정받아, 동의-불일치(AD) 또는 리커트 질문은 태도와 의견을 평가하기 위해 가장 자주 사용되는 응답 형식 중 하나이며, 수많은 연구와 많은 국가 및 연방 조사에서 나타난다. 다음 질문에서 알 수 있듯이 [AD 질문]은 응답자에게 진술을 제공하고 동의 수준을 평가하도록 요청합니다: 

  • 의학 연구원들은 참가자들의 정보를 비공개로 하고 안전하게 유지하기 위해 매우 열심히 일한다. 당신은 강하게 동의하는가, 동의하는가, 동의하지 않거나 동의하지 않는가, 동의하지 않는가, 아니면 강하게 반대하는가?

Credited to Rensis Likert in his seminal research on attitude measurement, agree-disagree (AD) or Likert questions are among the most frequently used response formats to assess attitudes and opinions, appearing in numerous studies and many national and federal surveys.1, 2, 3 As illustrated by the following question, AD questions present respondents with statements and ask them to rate their level of agreement: 

  • Medical researchers work extremely hard to make sure they keep information from participants private and secure. Do you strongly agree, agree, neither agree nor disagree, disagree, or strongly disagree?4

연구자들이 AD 질문의 긍정적인 심리학적 특성에 대해 썼지만, 이러한 항목의 보편성은 사용의 용이성 때문일 가능성이 높다. AD 질문으로 구성된 척도는 진술의 내용이나 복잡성에 관계없이 각 진술에 대해 [동일한 응답 범주]를 사용할 수 있고, 자체 관리 설문지의 경우 연구자가 그리드에서 여러 AD 질문을 [경제적으로 포맷]할 수 있기 때문에 실질적으로 매력적이다.  
While researchers have written about the positive psychometric properties of AD questions,
5 the ubiquity of these items is also likely due to their ease of use. Scales comprised of AD questions are practically appealing because the same response categories can be used for each statement regardless of the content or complexity of the statements, and for self-administered questionnaires, researchers can format multiple AD questions economically in a grid.6,7

그러나 이러한 긍정적인 기능은 [응답자의 부담 증가]로 상쇄될 수 있으며, 이는 [데이터 품질을 저하]시킬 수 있으며, 설문지 설계자들이 [항목별(IS) 질문을 옹호]하도록 만들었다. [IS 질문]은 응답 차원에 맞게 조정된 응답 범주를 사용하여 질문의 기본 응답 차원에 대해 직접 질문하기 위해 작성됩니다. 예를 들어 IS 버전의 예제 질문은 열심히 일하는 강도를 평가하는 응답 범주를 사용하여 의료 연구자가 열심히 일하는 방법의 기본 응답 차원을 측정하기 위해 작성된다: 

  • 의학 연구자들은 참가자들의 정보를 비공개로 하고 안전하게 하기 위해 얼마나 열심히 일할까요? 전혀 열심히 하지 않음, 조금 열심히 하지 않음, 다소 열심히 함, 매우 열심히 함, 극도로 열심히 함?

These positive features, however, may be offset by increased burden for respondents, which may reduce data quality, and has led questionnaire designers to advocate for item-specific (IS) questions.6, 7, 8, 9 IS questions are written to directly ask about a question's underlying response dimension with response categories tailored to match the response dimension.6,7,9 For example, an IS version of the example question would be written to measure the underlying response dimension of how hard medical researchers work using response categories that assess the intensity of working hard: 

  • How hard do medical researchers work to make sure they keep information from participants private and secure: not at all hard, a little hard, somewhat hard, very hard, or extremely hard?

다음 섹션에서는 다음을 수행합니다. 

  • 1) AD 및 IS 질문에 대한 데이터 품질을 비교하는 실험 연구를 검토한다; 
  • 2) AD 및 IS 질문에 대한 응답자의 인지 처리에 관한 연구의 개념적 모델을 제시하고 검토한다; 
  • 3) AD 및 IS 질문 간에 자주 다르고 응답자의 인지 처리 및 데이터 품질에 영향을 미칠 수 있는 질문 특성에 대한 개요를 제공한다 
  • 4) AD 및 IS 질문의 사용 및 연구에 대한 최종 의견과 권고사항을 제공합니다.

In the following sections we:

  • 1) review experimental studies comparing data quality for AD and IS questions;
  • 2) present conceptual models of and review research concerning respondents' cognitive processing of AD and IS questions;
  • 3) provide an overview of question characteristics that frequently differ between AD and IS questions and may affect respondents’ cognitive processing and data quality; and
  • 4) offer concluding comments and recommendations regarding the use and study of AD and IS questions.

AD 대 IS 질문이 데이터 품질에 미치는 영향
Effects of AD versus IS questions on data quality

AD와 IS 질문을 직접 비교하고 데이터 품질 또는 인지 처리 결과를 기반으로 차이를 평가하는 20개의 실험 연구를 식별했다. 여러 연구는 유효성과 신뢰성의 바람직한 데이터 품질 지표를 조사한다. 전반적으로 IS 질문이 더 높은 타당성과 신뢰성과 관련이 있다는 연구 결과가 많다. 예를 들어,

  • 6개의 연구가 AD 질문과 IS 질문 사이에 일관된 차이가 없다고 보고한 반면, 3개의 연구는 IS 질문에 대해 더 높은 유효성을 보여주었고, AD 질문에 대해 더 높은 [타당성]을 보고한 연구는 없었다.
  • [신뢰성]IS 질문에 대해 5개 연구가 더 높은 신뢰성을, AD 질문에 대해 2개 연구가 더 높은 신뢰성을 보여주었고, 2개 연구는 차이가 없다고 보고했다.

We identified 20 experimental studies that directly compare AD and IS questions and evaluate differences based on data quality or cognitive processing outcomes. Several studies examine the desirable data quality indicators of validity and reliability. Overall, a larger number of studies find IS questions are associated with higher validity and reliability. For example, while six studies reported no consistent difference between AD and IS questions,3,4,10, 11, 12, 13 three studies demonstrated validity was higher for IS questions,8,14,15 and no studies reported higher validity for AD questions. For reliability, five studies demonstrated higher reliability for IS questions,8,11,12,15,16 two for AD questions,4,13 and two studies reported no difference.3,17

연구는 또한 다음과 같은 바람직하지 않은 데이터 품질 지표를 조사했다

  • 묵인 (내용에 관계없이 질문에 동의함), 
  • 우선순위로 인한 반응 효과 (첫 번째 범주의 체계적 선택), 
  • 최신성 (마지막 범주의 체계적 선택)
  • 극단적 대응 (첫 번째 범주와 마지막 범주의 체계적 선택), 
  • 직선 (질문 모음의 항목에 대해 유사한 답변을 제공하는 경우), 
  • 항목 무응답 및 
  • 온라인 설문 조사에서 속도와 중단. 

Studies have also examined undesirable data quality indicators including

  • acquiescence (tendency to agree with a question regardless of its content),18 
  • response effects due to primacy (systematic selection of the first category),
  • recency (systematic selection of the last category), and
  • extreme responding (systematic selection of the first and last categories),
  • straightlining (tendency to give similar answers to items in a battery of questions),19 
  • item nonresponse, and
  • speeding and break-offs in online surveys.

일반적으로 더 많은 연구에서 [AD 질문]이 이러한 부정적인 결과와 관련이 있다는 것을 발견했지만, 많은 연구에서 차이를 발견하지 못했으며, 일부 연구에서는 IS 질문에 대해 더 높은 수준의 바람직하지 않은 결과를 발견했다.

  • 예를 들어, 4개의 연구가 묵인을 위한 AD 질문과 IS 질문 사이의 차이가 없거나 일관성이 없다고 보고한 반면, 4개의 연구는 AD 질문이 묵인에 더 취약하다고 보고했다.

다른 반응 효과와 직선에 대한 결과는 더 다양합니다.

  • 세 가지 연구는 AD 질문에 대한 우선순위, 극단적 응답 및 척도 방향 효과를 밝혀냈다;
  • 한 연구는 IS 질문에 대한 최근 영향을 보고했다; 그리고 최종 연구는 AD와 IS 형식 모두에서 극단적인 반응이 있었다고 보고했다. 
  • 직선화의 경우, 두 연구에서 AD 척도에서 직선화가 더 많이 보고되었고, 하나는 IS 척도에서 보고되었으며, 두 연구에서는 차이가 없다고 보고되었다. 
  • 3개의 연구는 AD와 IS 질문에 대한 항목 누락 응답에서 일관된 패턴이 없다고 보고한 반면, 한 연구는 IS 질문에 대한 더 높은 수준을 보고했다. 
  • 마지막으로, 3개의 연구가 AD 형식의 질문 중에서 더 높은 수준의 속도 향상을 보고했지만, AD 또는 IS 형식은 온라인 설문 조사에서 중단 가능성에 더 큰 영향을 미치지 않았다. 

In general, more studies find AD questions are associated with these negative outcomes, but a number of studies find no differences, and a few studies find higher levels of undesirable outcomes for IS questions.

  • For example, while four studies reported no or inconsistent differences between AD and IS questions for acquiescence,13,16,2080 four studies reported AD questions were more susceptible to acquiescence.10,11,14,17 

Findings for other response effects and straightlining are more mixed.

  • Three studies uncovered primacy,21 extreme responding,22 and scale direction23 effects for AD questions;
  • one study reported recency effects4 for IS questions; and a final study reported extreme responding was present for both AD and IS formats.2 
  • For straightlining, two studies reported more straightlining in AD scales,10,12 one in IS scales,22 and two studies reported no differences.21,23 
  • While three studies reported no consistent pattern in item-missing responses for AD and IS questions,16,21,22 one study reported higher levels for IS questions.4 
  • Finally, while three studies reported higher levels of speeding among questions with AD formats,212223 neither an AD or IS format was more likely to affect the likelihood of break-offs in online surveys.22,23

AD 및 IS 질문의 인지 처리
Cognitive processing of AD and IS questions

설문지 설계자들은 AD 질문이 IS 질문보다 인지적으로 부담이 크기 때문에 데이터 품질을 낮출 가능성이 높다고 주장한다. [AD 질문의 복잡성]에 기여하는 한 가지 특징은 [질문의 "제공된" 응답 차원]과 ["기본적인" 응답 차원] 사이의 [불일치]를 응답자에게 자주 제시한다는 것이다. 응답 차원은 질문이 응답자에게 답변을 구성할 때 고려하도록 요청하는 연속체입니다. 평가 척도를 사용한 평가 및 판단에 대한 질문의 경우, 응답 차원은 다음을 설정할 수 있다 

  • 원자가(대상 물체의 평가가 긍정적이든 부정적이든, 예를 들어 "찬성 또는 동의하지 않음"), 
  • 강도(예: "전혀… 극단적이지 않다"), 
  • 수량(예: "대단히 … 많은 양"), 또는 
  • 대상 개체의 상대 빈도(예: "never … always"). 

Questionnaire designers argue that AD questions are more likely to lower data quality because they are more cognitively burdensome than IS questions.6, 7, 8,24 A characteristic that contributes to the complexity of AD questions is that they often present respondents with a mismatch between the question's “offered” and “underlying” response dimensions. A response dimension is the continuum a question asks the respondent to consider when constructing their answer.6,9,25 For questions about evaluations and judgments using rating scales, response dimensions can establish 

  • valence (whether the evaluation of a target object is positive or negative; e.g., “agree or disagree”), 
  • intensity (degree to which the evaluation is held; e.g., “not at all … extremely”), 
  • quantity (amount of the evaluation held; e.g., “none … a great deal”), or 
  • relative frequency of the target object (e.g., “never … always”).

표 1.4의 AD 질문을 고려합니다. 반응 범주가 제시하는 반응 차원은 [일치의 강도]입니다. 이는 진술서에 제시된 [열심히 일하는 강도]의 [근본적인 반응 차원]과 상충된다. 이러한 불일치는 응답자들이 진술에 대한 [자연적으로 발생하는 반응]을 [AD 반응 범주]에 "매핑"하기 위해 복잡한 인지 처리 단계를 수행하도록 강요한다.
Consider the AD question in Table 1.4 The offered response dimension presented by the response categories is the intensity of agreement. This conflicts with the underlying response dimension of the intensity of working hard presented in the statement. These mismatches force respondents to undertake complicated cognitive processing steps in order to “map” their naturally occurring responses to the statement onto the AD response categories.

Tourangeau 등은 응답자가 설문조사 질문에 대한 답변을 구성하는 4단계를 설명한다: 

  • 이해, 
  • 기억에서 관련 정보 검색, 
  • 판단을 위한 검색된 정보 사용, 
  • 답변 선택 및 보고. 

다른 것들은 이 모델을 확장하여 AD 질문에 응답하는 데 관련된 인지 단계를 추가했으며, 표 1에서 AD 및 IS 질문에 대답하기 위해 수행되는 인지 처리 단계의 개념적 모델을 제시한다.
Tourangeau et al.26 describe four stages through which respondents construct answers to survey questions:

  • comprehension,
  • retrieval of relevant information from memory,
  • use of retrieved information to make judgments, and
  • selection and reporting of an answer.

Others have expanded on this model, adding cognitive steps involved in responding to AD questions specifically,6,8,23,27,28 and in Table 1, we present conceptual models of the cognitive processing steps undertaken to answer AD and IS questions. 

AD 질문에 대한 인지 처리 단계의 개념 모델
Conceptual model of cognitive processing steps for AD questions

첫 번째 단계는 응답자가 이해해야 하는 [이해]입니다 

  • 성명서의 문자 그대로의 의미(예: "의료 연구자들은 참가자들의 정보를 비공개로 하고 안전하게 유지하기 위해 매우 열심히 노력한다") 
  • 구성 요소(예: "의료 연구원", "열심히 일한다[열심히 한다] 등). 

The first step is Comprehension in which the respondent must comprehend

  • the literal meaning of the statement (e.g., “Medical researchers work extremely hard to make sure they keep information from participants private and secure”) as well as
  • its component parts (e.g., “medical researchers,” “work [extremely] hard,” etc.).

다음으로, 식별하는 동안, 응답자는 질문의 [기본적인 응답 차원을 식별]합니다. 이는 문장의 의미를 이해하고 임계값 단어(포함된 경우)에 주의를 기울임으로써 달성됩니다. [임계값 단어]는 척도 옵션의 전체 범위를 제시하지 않고 기본 응답 차원에서 임계값을 설정하는 AD 문에 종종 포함되는 인텐시파이어(예: "매우"), 정량자(예: "가장") 또는 빈도 마커(예: "거의")입니다.

  • 예를 들어, AD 질문에는 "극도로"라는 [임계값 단어]가 포함되는데, 이는 "열심히 일한다"를 수정함으로써, 근본적인 응답 차원으로서 열심히 일하는 강도를 강화하는 역할을 한다. 

Next, during Identification, the respondent identifies the question's underlying response dimension, which is accomplished by understanding the meaning of the statement as well as attending to threshold words, if included. Threshold words are intensifiers (e.g., “very”), quantifiers (e.g., “most”), or frequency markers (e.g., “rarely”) often included in AD statements that establish a threshold on the underlying response dimension without presenting the full range of scale options.

  • For example, the AD question includes the threshold word “extremely,” which, by modifying “work hard,” serves to reinforce the intensity of working hard as the underlying response dimension.

기본 반응 차원을 식별한 후, 응답자는 차원(생성)에 대해 자신의 내부 값(반응)을 생성해야 합니다. 

  • 현재 질문의 경우, 응답자는 "상당히 열심히"에 관한 내부 값을 생성합니다. 

After identifying the underlying response dimension, the respondent must generate their own internal value (response) on the dimension (Generation).

  • For the current question, the respondent generates an internal value of “pretty hard.”

이어지는 단계는 일련의 복잡한 인지 과정을 포함한다, 

  • 응답자가 자신의 내부 값인 "상당히 열심히"과 임계값인 "극단적으로 열심히" 사이의 거리를 평가한다(임계값 평가).
  • 그런 다음 내부 값과 임계값 사이의 거리가 "동의", "동의하지 않음" 또는 "중립성"을 나타내는지 확인합니다(극성 평가)

Ensuing steps encompass a set of complicated cognitive processes in which the respondent

  • evaluates the distance between their internal value of “pretty hard” and the threshold value of “extremely hard” (Threshold evaluation), and
  • then determines whether the distance between their internal value and the threshold value indicates “agreement,” “disagreement,” or “neutrality” (Polarity evaluation).

마지막으로, [극성에 대한 평가]에 따라, 응답자는 [제안된 범주 중 하나(매핑)를 사용]하여 제안된 응답 차원에 내부 가치를 매핑해야 합니다.

  • 예를 들어, 응답자는 자신의 내부 값 "매우 엄격"이 임계값 "극히 엄격"에 가깝기 때문에 "동의하지 않음"을 선택하거나, "매우 엄격"이 "극히 엄격"보다 덜 심각하기 때문에 "동의하지 않음"을 선택할 수 있다

Finally, guided by their evaluation of polarity, the respondent must map their internal value onto the offered response dimension using one of the offered categories (Mapping).

  • For example, the respondent might select “agree” because their internal value “pretty hard” is close to the threshold value “extremely hard,” or the respondent could select “disagree” because “pretty hard” is less intense than “extremely hard.”

IS 질문에 대한 인지 처리 단계의 개념 모델
Conceptual model of cognitive processing steps for IS questions

비교 가능한 IS 질문에 답하기 위해 수행되는 인지 처리 단계는 단순화되고 부담이 적을 것으로 예측된다.

  • 첫째, 응답자는 질문의 문자 그대로의 의미와 그 구성요소(Comprehension)를 이해해야 합니다. 
  • 식별 단계에서, 응답자는 질문 방식과 응답 범주의 레이블링 및 순서(예: "전혀 딱딱하지 않음", "약간 딱딱함" 등)에 의해 강화되는 기본 응답 차원을 결정합니다. 
  • 다음으로, 응답자는 "상당히 어려운" 내부 값을 생성한다(생성). 그러나 이 값의 배치는 제공된 범주 중 하나(매핑)에 매핑하여 직접 수행되므로 임계값 및 극성 평가를 우회할 수 있습니다. 
  • 현재 질문의 경우, 응답자는 부사어와 인텐시파이어의 스케일을 조정하는 연구를 바탕으로 "상당히"가 "다소"와 "매우" 사이에 있기 때문에 "다소" 또는 "매우 어렵다"를 선택할 수 있다. 

The cognitive processing steps undertaken to answer a comparable IS question are simplified and predicted to be less burdensome.

  • First, the respondent must comprehend the literal meaning of the question and its component parts (Comprehension).
  • During Identification, the respondent determines the underlying response dimension, which is reinforced by the manner of questioning and the labeling and ordering of the response categories (e.g., “not at all hard,” “a little hard,” etc.).
  • Next, the respondent generates an internal value of “pretty hard” (Generation), but placement of this value is done directly by mapping it to one of the offered categories (Mapping), thereby circumventing Threshold and Polarity evaluation.
  • For the current question, the respondent could select “somewhat hard” or “very hard” because “pretty” lies between “somewhat” and “very” based on studies that scale adverbial phrases and intensifiers.29,30

AD 및 IS 질문을 단독으로 배터리로 처리할 때 응답자의 인지 노력
Respondents’ cognitive effort when processing AD and IS questions alone and in batteries

응답자의 인지적 노력 처리 AD 및 IS 질문을 조사한 연구는 질문이 단독으로 나타나는지 또는 배터리의 일부로 나타나는지, 그리고 IS 응답 범주가 질문에 따라 달라지는 정도라는 두 가지 질문 특성을 중간 정도의 노력으로 나타낸다. 표 1의 모델은 단독으로 제시된 단일 AD 질문이 더 높은 수준의 인지 처리를 필요로 할 것으로 예상하지만, 대부분의 AD 질문은 진술이 다양하지만 응답 범주가 일정하게 유지되는 배터리에서 나타난다. 이 프레젠테이션을 통해 응답자들은 질문과 범주의 패턴을 기억할 수 있으며, 생각이 덜한 답변 과정을 장려할 수 있다. 대조적으로, 여러 IS 질문이 함께 그룹화될 때, 응답자들이 가변 응답 범주를 처리하기 위해 더 많은 노력을 기울이는 것을 요구하기 때문에, 그들은 (자주, 그러나 항상 그렇지는 않다) 서로 다른 응답 차원과 응답 범주를 사용한다. 
Studies examining respondents’ cognitive effort processing AD and IS questions indicate two question characteristics moderate effort: whether questions appear alone or as part of a battery; and the extent to which IS response categories vary across questions.23,28,31 While the model in Table 1 anticipates that a single AD question presented in isolation will require a higher level of cognitive processing, most AD questions appear in batteries in which the statements vary but the response categories remain constant. This presentation allows respondents to memorize the pattern of questioning and categories and may encourage a less thoughtful process of answering.32 By contrast, when multiple IS questions are grouped together, they (often, but not always) use different response dimensions and response categories, requiring respondents exert more effort to process the variable response categories.23

[응답자가 질문을 처리하고 답변하는 데 걸리는 시간의 변화]를 조사하는 연구는 이러한 제안을 크게 뒷받침한다. 응답 지연 시간(RL)은 면접관의 질문 읽기가 끝날 때부터 응답자의 답변까지 걸리는 시간을 측정합니다. 연구자들은 신뢰와 정치적 유효성에 대한 질문에 대해 RLs의 시간을 측정했는데, 이 질문의 범주는 IS 항목에 따라 다르지만 AD 항목에 대해서는 변함이 없었다. 두 연구 모두에서, 배터리의 [첫 번째 질문]에 대한 RL은 AD 항목에 대해 상당히(또는 약간 그렇게) 길었고, AD 응답 형식이 인지적으로 더 부담스러운 응답 작업을 부과했다는 일부 증거를 제공했다. 그룹으로 평가된 RLs는 신뢰에 대한 IS 질문에 대해 더 길었지만 정치적 효과는 아니었다.
Research examining variation in the time respondents spend processing and answering questions largely support these propositions. Response latencies (RLs) measure time spanning the end of an interviewer's question reading to the respondent's answer.33 Researchers timed RLs for questions about trust4 and political efficacy11 in which categories varied across IS items, but were invariant across AD items. In both studies, RLs for the first question in the battery were significantly (or marginally so) longer for the AD item, providing some evidence that AD response formats imposed a more cognitively burdensome response task. Evaluated as a group, RLs were longer for the IS questions about trust, but not political efficacy.

연구자들은 또한 AD 항목에 대해서는 응답 범주가 동일하지만 IS 항목에 대해서는 다양한 독립형 항목으로 제시된 질문에 대한 응답 시간(RT; 읽기 및 답변에 소요된 총 시간)을 조사했다. 조사결과는 카테고리의 수나 순서, PC나 스마트폰에서 질문에 대한 답변 여부와 관계없이 IS 질문의 경우 RT가 더 긴 것으로 나타났다. 대조적으로, AD 및 IS 질문 모두에 대해 응답 범주가 일정하게 유지된 그리드에서 제시된 AD 및 IS 질문에 대한 RT의 차이는 없었다.23 RT에 대한 연구를 종합하면, IS 범주의 changing nature는 응답자들이 지출하는 인지 노력의 양을 증가시킬 수 있다는 것을 보여준다.
Researchers have also examined response times (RTs; total time spent reading and answering) for questions presented as stand-alone items in which response categories were the same for AD items but varied for IS items.21, 22, 23 Findings indicated RTs were longer for IS questions, regardless of the number or ordering of categories or whether the questions were answered on PCs or smartphones. By contrast, there were no differences in RTs for AD and IS questions presented in grids in which the response categories were held constant for both the AD and IS questions.23 Taken together, studies of RTs indicate the changing nature of IS categories may increase the amount of cognitive effort respondents expend. 

다른 방법론은 [그룹화된 IS 질문]의 [다양한 응답 범주]가 [더 많은 인지 노력을 필요]로 하는 반면, [그룹화된 AD 질문]의 [반복적인 질문 패턴]은 [더 피상적인 처리]를 장려한다는 증거를 제공한다. 인터뷰어가 관리하는 연구에서, 연구자들은 IS 응답 범주가 참가자들이 기억하기 어려웠기 때문에 IS 질문이 응답 난이도의 더 높은 수준의 행동 지표와 연관되어 있다고 보고했다. 질문(쇼카드 없이 11개 질문)과 항목의 음성 프레젠테이션. 연구자들은 눈 추적 기술을 사용하여 AD 항목의 경우 동일하지만 IS 질문의 경우 다양한 질문 줄기 대 응답 범주에 대해 응답자의 눈 움직임을 별도로 기록함으로써 인지 노력을 조사했다. 조사 결과는 질문 줄기에 대한 눈의 움직임에 차이가 없는 것으로 나타났지만, 응답자들은 IS 응답 범주를 더 집중적으로 처리하였으며, 더 많은 시간 동안 더 많이 보았다.

Other methodologies also provide evidence that the varying response categories of grouped IS questions require more cognitive effort while the repeated questioning pattern of grouped AD questions encourage more superficial processing. In an interviewer-administered study, researchers4 reported that IS questions were associated with higher levels of behavioral indicators of response difficulty (e.g., higher levels of uncodable answers and answers with qualifications) because the IS response categories were harder for participants to remember, an issue exacerbated by the number of questions (11 questions were asked without show cards) and aural presentation of items. Using eye-tracking technology, researchers28,34 examined cognitive effort by recording respondents’ eye movements separately for question stems versus response categories, which were the same for the AD items, but varied for the IS questions. While findings indicated no differences in eye movements for the question stems, respondents processed IS response categories more intensively, viewing them more and for longer times.

응답자의 AD 및 IS 질문에 대한 인지 노력을 조사한 연구 결과는 IS 질문에 대한 노력을 증가시키는 요인을 이해하기 위해 더 많은 연구가 필요하며, 가장 중요한 것은 그 노력이 데이터 품질과 관련이 있는지 여부이다. 응답 시간만으로는 해석하기 어려울 수 있습니다: "[응답이 지연delay된다는 것]은 질문을 처리하기 어렵거나(일반적으로 나쁜 신호), 질문이 사려 깊은 응답을 장려한다는 것을 의미할 수 있습니다(일반적으로 좋은 신호)(p. 297)." 더 긴 시간은 덜 정확한 답과 관련이 있지만, 자기 관리 기구를 사용한 실험 연구는 [시간과 정확도 사이의 관계]가 [더 길거나 더 짧은 시간일 때 덜 정확]한 곡선관계 일 수 있음을 시사했다.  


Results from studies examining respondents’ cognitive effort answering AD and IS questions suggest more research is needed to understand factors that lead to increased effort for IS questions and most importantly, whether that effort is associated with data quality. Response times alone can be difficult to interpret: “delays in responding could mean that a question is difficult to process (usually a bad sign) or that the question encourages thoughtful responding (typically a good sign) (p. 297).”7 While longer times have been associated with less accurate answers,35 an experimental study with a self-administered instrument suggested the relationship between time and accuracy may be curvilinear with longer and shorter times being less accurate.36

AD 및 IS 질문 간에 다른 질문 특성 개요
Overview of question characteristics that differ between AD and IS questions

실험에서 평가되는 AD-IS 질문 쌍은 종종 인지 처리 및 데이터 품질에 영향을 미칠 수 있는 여러 질문 특성에 따라 다르다. 예를 들어, 제공된 응답 차원(AD 질문에 대한 강도 및 IS 질문에 대한 빈도)과 응답 범주의 방향([높은 것부터 낮은 것]까지 일치 대 [낮은 것부터 높은 것]까지)은 다음 AD-IS 쌍에 따라 다릅니다: 

  • "의사들은 환자들로부터 모든 진실을 숨기는 경우가 거의 없다: 강하게 동의하고 강하게 반대한다." 그리고
  • "의사들은 환자들로부터 모든 진실을 지킨다: 절대로… 항상."  

In experiments, the AD-IS question pairs being evaluated often vary on multiple question characteristics that can affect cognitive processing and data quality. For example, both the offered response dimension (intensity for the AD question and frequency for the IS question) and direction of the response categories (high to low agreement versus low to high frequency) vary for following AD-IS pair:

  • “Doctors rarely keep the whole truth from their patients: agree strongly … disagree strongly” and
  • “Doctors keep the whole truth from their patients: never … always.”8 

응답 차원과 같은 일부 특성은 실험적으로 제어되지 않는 방식으로 AD와 IS 질문을 비교하는 연구에서 종종 공변화되어 특성의 고유하거나 조절하는 효과를 분리하는 것이 불가능하다. 반응 범주에 대한 언어 레이블의 수와 사용과 같은 다른 특성은 일반적으로 AD-IS 실험 내에서 일정하게 유지되지만, 이러한 특성은 연구에 따라 달라 결과를 일반화하는 작업을 복잡하게 만든다. AD-IS 실험에 포함된 질문을 컴파일하고 AD-IS 질문 쌍 간에 다른 주요 특성을 식별하기 위해 특징을 체계적으로 코딩했다(표 2에 요약). 우리는 이러한 특성이 AD-IS 실험 내에서 그리고 AD-IS 실험 전반에 걸쳐 어떻게 변화하는지 설명하고, 선택된 특성의 경우 데이터 품질과 관련된 결과를 간략하게 요약한다. 
Some characteristics, such as response dimensions, often co-vary in studies comparing AD and IS questions in ways that are not controlled experimentally, making it impossible to isolate unique or moderating effects of the characteristics. Other characteristics, such as the number and use of verbal labels for response categories, are usually held constant within an AD-IS experiment; but these features vary across studies, complicating the task of generalizing findings. We compiled questions included in AD-IS experiments and systematically coded their features to identify key characteristics that differ between AD-IS question pairs (summarized in Table 2). We describe how these characteristics vary within and across AD-IS experiments, and for select characteristics, we briefly summarize findings regarding data quality.9,25

 

질문 방식
Manner of questioning

평가할 내용이 포함된 문장이 [문장]이나 [질문]으로 구성되어 있는지 여부를 묻는 방식은 AD와 IS 항목을 구별하는 것의 본질에 기본적이며 AD-IS 비교에 따라 항상 다르다. 연구자들은 AD 항목의 간접 질문 구조를 회피하는 이유로 꼽고 있으며, 6과 실험 연구의 결과는 이러한 권고를 뒷받침한다. 시선 추적 연구의 피험자들은 AD 및 IS 질문 줄기를 처리하는 동등한 인지 노력을 발휘하는 것으로 나타났지만, 실험실 환경의 피험자들은 질문에 대한 주장으로 작성되었을 때 항목의 내용을 덜 깊이 처리했다. 
Questioning manner – whether the sentence with the content to be evaluated is structured as a statement or question -- is fundamental to the nature of what distinguishes AD and IS items and always differs across AD-IS comparisons. Researchers cite the indirect question structure of AD items as a reason to avoid them,6 and findings from experimental studies support these recommendations. While subjects in eye-tracking studies appeared to exert equivalent cognitive effort processing AD and IS question stems,28,34 subjects in a laboratory setting processed the content of items less deeply when they were written as assertions versus interrogatives.37

묵인
Acquiescence

연구에 따르면 제안된 응답 차원의 합의는 특히 낮은 수준의 교육을 받은 응답자들 사이에서 AD 질문이 묵인에 더 취약할 수 있는 반면, IS 응답 차원은 이를 훨씬 덜 우려하게 한다. AD 질문에 대한 묵인은 아마도 공손함, 존경심 또는 대화 관행 때문에 [반대할 이유가 없는 한 "동의"할 수 있는 사전 성향]을 가지고 있기 때문에 발생할 수 있다. AD 진술이 복잡하거나 반복적이거나 응답자에게 두드러지지 않는 항목의 대규모 그룹의 일부인 경우 그러한 경향은 악화될 수 있다. 또한, 응답 차원의 "동의" 또는 긍정적인 보기가 [일반적으로 먼저 제공]되며, 더 많은 처리를 받거나 더 호의적으로 인식될 수 있으므로 선택될 가능성이 더 높다.
Research indicates the offered response dimension of agreement may cause AD questions to be more vulnerable to acquiescence, particularly among respondents with lower levels of education,18,38,39 whereas IS response dimensions make this much less of a concern. Acquiescence for AD questions could arise because listeners have a pre-disposition to “agree” unless they have a reason to disagree, perhaps due to politeness, deference, or because of conversational practices.18,40 Such tendencies might be exacerbated if AD statements are complex or part of a large group of items that are repetitious or not salient to the respondent. In addition, the “agree” or positive end of the response dimension is usually offered first,18 and may receive more processing or be perceived more favorably, and thus more likely to be selected.31

임계값 단어
Threshold words

일반적으로 [임의적인 임계값 단어의 선택]은 내부 값을 AD 응답 범주에 매핑하려는 응답자의 노력을 복잡하게 만들 수 있으며, 궁극적으로 [단조로운 동등성의 원칙]을 위반하는 답변으로 이어질 수 있다. 문항이 [단조로운 동등성]을 갖는다는 것은 [측정되는 구조의 [기본 척도]에서 [답변에 대한 값]을 증가(또는 감소)하는 것과 상관관계가 있는 경우]이다.

Threshold words, the selection of which is typically arbitrary,8 may complicate respondents' efforts to map internal values onto AD response categories, and ultimately lead to answers that violate the principle of monotonic equivalence.7 An item possesses monotonic equivalence when increasing (or decreasing) values for the answers correlate with increasing (or decreasing) values on the underlying scale of the construct being measured.

예를 들어, 환자의 약물 비부착 non-adherence사유를 측정하기 위해 설계된 "비부착성non-adherence은 대부분 사람들의 부주의로 인한 것"이라는 문구를 고려한다. 진술이 암시하는 근본적인 반응 차원은 [부주의로 인한 비고착성이 얼마나 큰가]하는 것이다.

  • 한 응답자는 불응성이 부주의로 인해 "전혀" 발생하지 않는다고 생각하기 때문에 "반대"라고 대답할 수 있고,
  • 다른 응답자는 불응성이 부주의로 인해 "매우" 발생한다고 느끼기 때문에 "반대"라고 대답할 수 있습니

For example, consider the statement “non-adherence is mostly due to people being careless,” designed to measure patients' reasons for medication non-adherence.41 The underlying response dimension implied by the statement is how much non-adherence is due to carelessness.

  • However, one respondent could answer “disagree” because they believe non-adherence is “not at all” due to carelessness
  • while another could “disagree” because they feel non-adherence is due to carelessness “a great deal.”

두 응답자 모두 "동의하지 않음"의 값을 보고하지만, 첫 번째 응답자의 "전혀 그렇지 않음"의 내부 값은 "매우 그러함"보다 근본적인 반응 차원에서 훨씬 더 낮다. 이 항목의 [IS 버전]이 질문을 하는 직접적인 방법을 제공하며 응답자들이 응답 연속체에서 자신을 정확하게 주문하도록 보다 쉽게 보장한다:

  • "사람들의 부주의로 인한 비고착성은 어느 정도인가요? 전혀, 조금, 다소, 꽤 많은 것인가요?"

While both respondents report a value of “disagree,” the first respondent's internal value of “not at all” is clearly much lower on the underlying response dimension than “a great deal.” An IS version of this item provides a direct method of asking this question and more readily ensures that respondents order themselves accurately on the response continuum:

  • “How much is non-adherence due to people being careless: not at all, a little, somewhat, quite a bit, or a great deal?”

측정에는 [단조로운 동등성]이 필요하기 때문에, [AD 질문에 대한 반응]이 [반응 연속체의 양쪽 끝에 있는 임계값을 포함하는 경우]에만 해석할 수 있다고 주장하는 사람도 있습니다. 빈도와 같은 일부 응답 차원의 경우 극단값은 명백할 수 있다(예: "절대" 또는 "항상"). "얼마나how much"를 사용하는 양과 같은 다른 반응 차원의 경우 극단적인 양의 값이 무엇인지는 절대적으로 명확하지 않습니다. "great deal"은 "얼마나" 척도에서 가장 높은 긍정적 가치인가요? 또한, 문헌은 임계값을 전혀 포함하지 않는 AD 질문을 사용하는 도구의 예로 가득 차 있어 응답자들이 자신의 해석을 중첩할 수 있다.
Because measurement requires monotonic equivalence, some argue that responses to AD questions are only interpretable if they include threshold values at either end of the response continuum.42 For some response dimensions, such as frequency, extreme values may be obvious (e.g., “never” or “always”). For other response dimensions, such as quantity using “how much,” it is not absolutely clear what the extreme positive value should be. Is “a great deal” the highest positive value on a “how much” scale? Further, the literature is replete with examples of instruments using AD questions that fail to include a threshold value at all, allowing respondents to superimpose their own interpretations.

극성
Polarity

[AD 항목]은 거의 항상 쌍극이며, 반응 차원의 극 또는 끝을 모두 나타낸다(예: "강력히 동의한다…강력히 동의하지 않는다"). [IS 항목]은 양극성(예: "극도로 만족하지 않고 극도로 만족한다")일 수 있지만, [일반적으로 단극성](예: "전혀 만족하지 않고…극도로 만족하지 않는다" 또는 "전혀 만족하지 않고…극도로 만족하지 않는다")이다. 
AD items are almost always bipolar and present both poles or ends of the response dimension (e.g., “agree strongly … disagree strongly”). While IS items can be bipolar (e.g., “extremely dissatisfied … extremely satisfied”), they are usually unipolar, presenting only one possible pole (e.g., “not at all satisfied … extremely satisfied” or “not at all satisfied … extremely dissatisfied”).

AD 질문의 기본 응답 차원이 [수량] 또는 [빈도]일 때, 해당 IS 질문은 [항상 단극]입니다. 왜냐하면 [수량]에는 "없음" 또는 "전혀 없음"보다 작은 값이 포함되지 않으며, [빈도]에는 "없음"보다 낮은 값이 포함되지 않기 때문입니다. 오직 [강도 반응 차원]만이 양극성일 수 있고, 음의 극값(예: "중요하지 않음")이 양의 극값과 동일한지 여부가 불분명한 일부 차원(예: "중요하지 않음")이 있다.
Whenever the underlying response dimension for an AD question is quantity or frequency, the corresponding IS question will always be unipolar because quantities do not contain values less than “none” or “not at all” and frequencies do not possess values lower than “never.” Only intensity response dimensions can be bipolar and there are some dimensions (e.g., “important”) where it is unclear whether the negative polar-value (e.g., “unimportant”) is equivalent to the positive polar-value.

AD 문항이 다수 포함된 GSS(General Social Survey) 항목에 대한 측정 오차 분석에서, 단극 문항이 양극 문항보다 신뢰도가 높은 것으로 나타났다. 극성의 차이만으로도 한계 분포의 차이가 발생할 가능성이 높아 항목 간의 최대 상관관계가 제한됩니다. IS 항목은 일부에서 권장하는 대로 다양한 긍정 및 부정 응답 차원을 사용할 수 있는 가능성을 제공하며, 항목은 AD 항목보다 상관 관계가 있는 방법 분산이 낮을 수 있습니다. [양극성 AD 항목]과 비교하여, [단극성 IS 항목]은 또한 응답 차원의 특정 측면에서 [더 많은 차별화 점을 제공]하고 [척도 점수의 변동을 증가]시킬 수 있습니다. 
In an analysis of measurement error for items from the General Social Survey (GSS), which included a number of AD questions, results indicated unipolar questions were more reliable than bipolar questions.43 Differences in polarity alone are also likely to generate differences in the marginal distributions,44 which limit the maximum correlations among the items. IS items offer the possibility of using a variety of positive and negative response dimensions as recommended by some;45,46 and the items may have lower correlated method variance than AD items. Compared to bipolar AD items, unipolar IS items also offer more points of differentiation on a particular side of the response dimension and may increase variation for scale scores.12

반응 범주
Response categories

반응 범주는 숫자, 레이블링 및 방향에 따라 다릅니다. 연구 내 범주의 수와 레이블링은 AD-IS 쌍 간에 거의 항상 일정하게 유지되지만, 이러한 특성은 연구에 따라 상당히 다르다. 대조적으로, 범주의 값이 증가하든 감소하든 범주의 방향은 때때로 동일한 연구에서 AD-IS 쌍에 따라 달라집니다. AD-IS 실험에서 [AD 질문]에 대한 범주는 더 자주 [가치value가 감소]하는 반면(예: "동의 … 동의하지 않음"), [IS 질문]에 대한 범주는 더 자주 [증가]한다(예: "절대 … 항상"). 일부 연구에 따르면 AD 및 IS 항목의 데이터 품질은 다섯 가지 범주를 사용하여 최적화되고 단어로 완전히 레이블이 지정되며 순서가 증가할 수 있습니다. 다른 연구에서, 응답자들은 ["강력히 동의하지 않는다"와 "동의하지 않는다"를 구별하는 데 어려움]을 겪었다 "강력하게"는 잠재적으로 응답자의 [평가의 극단성]과 [확실성]을 혼동하기 때문에 수식어로서 문제가 될 수 있다.  
Response categories differ in terms of their number, labeling, and direction. While the number and labeling of categories within a study is almost always held constant between AD-IS pairs, these characteristics vary considerably across studies. By contrast, category direction – whether the categories increase or decrease in value – sometimes varies across AD-IS pairs in the same study. In AD-IS experiments, categories for AD questions more often decrease in value (e.g., “agree … disagree”), while categories for IS questions more often increase (e.g., “never … always”). Some research indicates data quality for both AD and IS items may be optimized using five categories, fully labeled with words, and presented in increasing order.9,22,47 In other research, respondents had difficulty distinguishing between “strongly disagree” and “disagree.”17 “Strongly” may be problematic as a modifier because it potentially conflates the extremity of a respondent's evaluation with their certainty.48

중간 범주
Middle category

단극 IS 항목과 대조적으로, [AD 질문]은 종종 명확한 개념적 중간 범주(예: "동의하지도 동의하지도 않는다")를 포함한다. 양극성 질문에 대한 중간 범주를 포함하기 위해 데이터 품질을 평가하는 실험은 엇갈린 결과를 얻었지만, 연구에 따르면 응답자들은 원하지 않는 방식으로 AD 질문에 대답할 때 중간 범주를 사용한다. 예를 들어, 조사했을 때, 응답자들은 그 문제에 대한 [의견이 없기 때문에 중간 범주를 선택]하는 것을 압도적으로 보고했다. 연구에 따르면 응답자들은 [불확실성]을 나타내거나, [지식의 부족]을 다루거나 [양면성을 표현]하기 위해 AD의 중간 "동의하지도 동의하지도 않는다" 범주를 사용할 수 있다. 측정의 관점에서, 응답자들이 중간 범주를 사용하는 것은 문제가 있다: 응답자들은 이 옵션을 신뢰성 있게 선택할 수 있지만, 그들의 응답은 평가되는 구조에 대한 유효한 척도가 아니다. 연구자들은 [AD 중간 범주의 해석]에 문제가 있음을 지적했으며, 종종 이 범주를 중간 값이 아닌 별도로 사용하여 반응을 분석할 것을 제안합니다.
In contrast to unipolar IS items, AD questions often include a clear conceptual middle category (e.g., “neither agree nor disagree”). While experiments evaluating data quality for the inclusion of middle categories for bipolar questions have had mixed results,7,49, 50, 51 studies indicate respondents use the middle category when answering AD questions in unwanted ways. For example, when probed, respondents overwhelmingly reported selecting the middle category because they did not have an opinion on the issue.52,53 Research indicates respondents may use the AD's middle “neither agree nor disagree” category to indicate uncertainty or deal with a lack of knowledge and express ambivalence.4,54,55 From a measurement perspective, respondents use of the “neither/nor” middle category is problematic: while respondents may reliably select this option, their response is not a valid measure of the construct being assessed. Researchers have noted problems with the interpretation of an AD middle category and often suggest analyzing responses using this category separately and not as a middle value.5

배터리
Battery

인지 처리에 관한 섹션에서 설명한 바와 같이, AD 질문이 배터리에 나타날 때 반복적인 응답 범주가 있는 가변 진술로서 그들의 프레젠테이션은 응답자들이 [질문 패턴과 응답 범주를 기억]할 수 있다. 대조적으로, 여러 IS 질문이 함께 그룹화될 때, 그들은 (종종 있지만 항상 그렇지는 않다) 서로 다른 응답 차원과 응답 범주를 사용한다. 배터리 배치, 배터리에 포함된 질문의 수, IS 질문에 대한 질문에 대한 응답 범주가 다양한 정도는 응답자의 인지 노력에 영향을 미치고, 데이터 품질에 영향을 미칠 가능성이 있다. 면접관이 시행하는 설문도구에서 배터리의 항목은 낮은 신뢰성과 관련이 있다. 자기기입식 도구에서 여러 질문이 그리드에 표시될 때, 더 빨리 대답하고 직선에 더 취약하며 더 높은 상관관계를 가질 수 있다. 그리드 표시에서 [상관 관계가 높을수록 공유 오류 분산으로 인한 측정 오류가 더 높다]는 신호를 보낼 수 있습니다.

As described in the section on cognitive processing, when AD questions appear in batteries their presentation as variable statements with repeated response categories allows respondents to memorize the questioning pattern and response categories.32 By contrast, when multiple IS questions are grouped together, they (often, but not always) use different response dimensions and response categories. Placement in a battery, the number of questions contained in the battery, and the extent to which the response categories vary across questions for IS questions are likely to impact respondents’ cognitive effort and affect data quality. In interviewer-administered instruments, items in batteries are associated with lower reliability.56 When multiple questions are presented in a grid in self-administered instruments, they may be answered more quickly, more vulnerable to straightlining,19 and more highly correlated.57 Higher correlations in a grid presentation may signal higher measurement error due to shared error variance.9

발란스 및 정렬
Valence and alignment

구조를 유효하고 안정적으로 측정하기 위해 연구자들은 응답자들의 답변을 결합하여 단일 값을 만드는 [다중 항목 척도]를 사용한다. [구조물의 원자가, 질문에서 평가할 대상의 원자가, 구조물과 질문 사이의 정렬 사이의 관계]는 측정 오류에 대한 암시와 함께 복잡한 관계를 발생시킨다.
In order to measure constructs validly and reliably, researchers use multi-item scales that combine respondents' answers to create a single value.58 Relationships among a construct's valence, the valence of the objects to be evaluated in the questions, and the alignment between the construct and questions gives rise to a complicated set of relationships with implications for measurement error.

[원자가]는 본질적으로 [긍정적, 부정적, 중립적] 또는 [모호한 구조와 질문에서 질문한 대상]을 의미한다. 예를 들어, [신뢰]와 같은 구성 요소는 본질적으로 더 긍정적으로 평가되는 반면, [인종적 분노]와 같은 구성 요소는 더 부정적으로 평가됩니다. 원자가는 척도 내에서 질문에 따라 다르다. [정치적 유효성]을 측정하는 척도의 경우, 공무원들이 사람들이 생각하는 것에 대해 [얼마나 신경을 쓰는지] 묻는 질문은 긍정적으로 평가되고, [정치와 정부가 얼마나 복잡해 보이는지]에 대한 질문은 부정적으로 평가된다. 
Valence refers to the inherently positive, negative, neutral, or ambiguous nature of the construct and the objects asked about in the questions. For example, a construct like trust is inherently more positively valenced, while a construct like racial resentment is more negatively valenced. Valence also varies across questions within a scale. For a scale measuring political efficacy,2 a question asking “(how much) public officials care about what people think” is positively valenced, while a question about “(how often) politics and governments seem so complicated people can't really tell what's going on” is negatively valenced.

[정렬]은 반응 범주가 구조의 더 낮은 값을 나타내는지 또는 더 높은 값을 나타내는지 여부를 나타냅니다. [포지티브 정렬] 항목은 [더 높은 값의 범주(예: AD 질문에 대해 "강력하게 동의"하고 IS 질문에 대해 "대단히 동의")가 측정되는 구조의 더 높은 수준]을 나타내는 항목이며, [네거티브 정렬] 항목은 [더 높은 값의 범주가 더 낮은 수준]을 나타내는 항목이다. 예를 들어, 가장 값이 높은 범주("강력하게 동의한다"와 "대단히 동의한다")가 가장 높은 수준의 정치적 효과를 나타내기 때문에 [사람들이 무엇을 생각하는지에 대한 공무원들의 관심에 대한 질문]은 긍정적으로 일치한다. 대조적으로, 가장 높은 값의 범주는 가장 낮은 수준의 정치적 효능을 나타내기 때문에 [정치와 정부에 대한 질문]은 부정적으로 일치할 것이다.
Alignment refers to whether lower- or higher-valued response categories indicate lower or higher values of the construct. Positively aligned items are those for which a higher-valued category (e.g., “strongly agree” for an AD question and “a great deal” for an IS question) indicate higher levels of the construct being measured and negatively aligned items are those for which a higher-valued category indicates lower levels of the construct. For example, the question about public officials caring what people think would be positively aligned because the highest-valued categories (“strongly agree” and “a great deal”) indicate the highest level of political efficacy. By contrast, the question about politics and governments would be negatively aligned because the highest-valued categories indicate the lowest level of political efficacy.

AD 질문의 경우 질문의 값은 [묵인]으로 인해 원하지 않는 응답 효과를 초래할 수 있습니다. [긍정적으로 평가된 구조와 질문]의 경우, 묵인은 반응과 구조를 실제보다 더 긍정적으로 보이게 할 수 있다; [긍정적으로 평가된 구조와 부정적으로 단어가 쓰인 질문]에 대해, 묵인은 반응과 구조를 더 부정적으로 보이게 만들 수 있다. [우울증]과 같이 [부정적으로 평가된 구조]의 경우, 구조에 대한 더 높은 값을 나타내기 위해 정렬된 항목(예: "나는 슬프고 우울했다")에 동의하는 경향은 구조에 대한 과대평가를 초래할 수 있다. 항목의 점수를 매기는 방법에 따라, 묵인은 다음을 유발할 수 있다: 평균 점수 추정치 부풀리기, 신뢰도 추정치의 인위적 인플레이션/디플레이션(특히 같은 방향으로 단어가 표시된 항목의 경우), 그리고 AD 측정과 기준 측정 사이에 [자극적으로 높은 상관관계]를 만든다. 
For AD questions, a question's valence can lead to undesired response effects due to acquiescence.

  • For positively valenced constructs and questions, acquiescence can make responses and constructs appear more positive than they are in reality;
  • for positively valenced constructs and negatively worded questions, acquiescence can make responses and constructs appear more negative.

For more negatively valenced constructs like depression, a tendency to agree with items that are aligned to indicate higher values for the construct (e.g., “I have felt sad and blue”), can lead to overestimates of the construct. Depending on how items are scored, acquiescence can inflate estimates of mean scores, artificially inflate or deflate reliability estimates (particularly for items worded in the same direction), and create spuriously high correlations between AD measures and criterion measures.59, 60, 61

[묵인(그리고 부주의)으로 인한 효과]를 줄이기 위해 연구자들은 종종 [긍정적으로 정렬된 항목]과 [부정적으로 정렬된 항목]("항목 반전" 및 역어 질문이라고도 함)을 모두 포함하는 척도를 만들 것을 권장한다. 이 접근법의 이면에 있는 논리는 묵인하는 사람들을 반응 분포의 중간에 배치함으로써 척도 평균의 편향을 줄일 것이라는 것이다. 그러나 연구에 따르면 이 접근법에는 몇 가지 문제가 있다. 

  • 첫째, 모든 응답자에게 동일한 의미를 전달하는 부정적인 단어의 질문을 작성하는 것은 어려울 수 있다 (예: "흥미롭다"의 반대를 측정하기 위해 연구자는 "흥미없다", "흥미없다", "흥미없다" 또는 "흥미없다"를 사용할 수 있지만, 이들이 응답자들 사이에서 동일한 의미를 가질 가능성은 낮다. 그리고 반대로 단어가 쓰인 항목을 포함하는 것은 응답자가 해당 항목에 대해 반대로 쓰지 않은 경우만큼 극단적으로 대답하는 경우에만 편향을 줄일 것이다.). 
  • 둘째, "아니다", "un-", "non-", "-less"와 같은 부정의 사용은 이해성과 데이터 품질을 저하시킬 수 있다. 이것은 진술서에 부정을 포함하는 것(예: "내 성별은 다른 사람들이 나를 대하는 방식에 영향을 미치지 않는다")이 진술서의 내용을 거부하기 위해 [이중 부정]을 처리해야 하는 AD 항목에서 특히 문제가 될 수 있다. 
  • 셋째, 척도의 균형을 맞추려는 시도는 척도의 타당성과 내부 일관성을 낮추고, 부정적으로 정렬된 항목에 대해 예기치 않은 요인 구조를 만들어 [방법 효과method effect]를 추가하는 등 방법론적 문제를 야기할 수 있다.

In order to reduce effects due to acquiescence (and inattention), researchers often recommend creating scales that include both (and often an equal number of) positively and negatively aligned items62, 63, 64 (also called “item reversals”64 and reverse-worded questions65). The logic behind this approach is that it will reduce bias in scale means by placing those who acquiesce in the middle of the response distribution. However, research indicates several problems with this approach.

  • First, writing negatively worded questions that convey the same meaning across all respondents can be difficult (e.g., to measure the opposite of “interesting,” a researcher could use “not interesting,” “uninteresting,” or “boring,” but it is unlikely these have the same meaning across respondents and including oppositely worded items will only reduce bias if respondents answer those items as extremely as they would their counterparts66).
  • Second, the use of negations like “not,” “un-,” “non-,” and “-less” may decrease comprehensibility and data quality.67,68 This may be particularly problematic for AD items where the inclusion of a negation in the statement (e.g., “My gender does not affect the way others treat me”) requires processing a double negative in order to reject the statement's contents (e.g., by selecting “disagree”).69,70 
  • Third, attempts at balancing scales may create methodological problems including lowering the validity and internal consistency of the measures and adding a method effect by creating an unexpected factor structure for the negatively-aligned items.71727374

의견, 권장 사항 및 향후 방향에 대한 마무리
Concluding comments, recommendations, and future directions

AD 질문과 IS 질문을 비교한 실험 연구의 한계
Limitations of experimental studies comparing AD and IS questions

전반적으로 IS 질문은 바람직한 데이터 품질 결과(유효성, 신뢰성)와 관련이 있으며 AD 질문은 바람직하지 않은 결과(인수, 대응 효과 등)와 관련이 있다는 연구 결과가 더 많다. 그러나 많은 연구에서 질문 유형 간의 차이를 발견하지 못했으며, 일부 연구에서는 IS 질문에 대해 더 높은 수준의 바람직하지 않은 결과를 발견했다. 이러한 비교 연구의 몇 가지 한계는 일관성이 없거나 무효인 결과를 설명할 수 있다.

  • 첫째, AD와 IS 문제를 비교하는 실험 연구의 수가 상대적으로 적다. 우리의 리뷰는 20개의 연구를 확인했다. 
  • 둘째, 질문 특성에 대한 논의에서 강조된 바와 같이 AD-IS 질문 쌍은 대개 제어되지 않는 여러 특성에 걸쳐 종종 달라지며, 이는 결과를 혼란스럽게 할 수 있다. 
  • 셋째, 연구는 제한된 수의 주제를 탐구하며 AD 및 IS 질문의 효과는 주제별로 다를 수 있다.

Overall, more studies find IS questions are associated with desirable data quality outcomes (validity, reliability) and AD questions are associated with undesirable outcomes (acquiescence, response effects, etc.). A number of studies, however, find no differences between the question types, and a few studies find higher levels of undesirable outcomes for IS questions. Several limitations of these comparative studies may account for inconsistent or null findings.

  • First, the number of experimental studies comparing AD and IS questions is relatively small. Our review identified twenty studies.
  • Second, highlighted in our discussion of question characteristics, AD-IS question pairs often vary across a number of characteristics that are usually not controlled for, which may confound the results.
  • Third, studies explore a limited number of topics and the effects of AD and IS questions may vary by topic.

넷째, 연구는 타당성, 신뢰성, 묵인, 직선화 등 다양한 데이터 품질 결과를 조사한다. 이러한 결과는 강도와 조작화 측면에서 다양합니다. 타당도와 신뢰도의 추정치는 잠재적으로 데이터 품질에 대한 보다 직접적인 측정치를 제공하지만, 연구는 품질에 따라 달라지는 [신뢰도와 타당도의 다양한 측정치]를 평가한다. 예를 들어, [Cronbach 알파]와 같은 척도의 항목 신뢰도 추정치에는 상관된 오차 분산이 포함되어 있으며 개별 항목에 대한 값을 제공하지 않습니다. 일반적으로 사용되는 짧은 간격 동안 추정된 [시험 재시험 신뢰도]은 강력한 기준을 제공하기 위해 [기억 효과] 또는 [신뢰할 수 있는 방법 효과]에 의해 지나치게 손상될 수 있다. 묵인, 응답 범주의 반복 및 배터리의 항목 표시의 조합은 AD 항목 집합 간의 상관 방법 분산을 증가시킬 수 있으며, 이는 [단순한 상관 관계가 근본적으로 데이터 품질의 모호한 지표임]을 상기시킨다. [방법분산method variance]은 AD와 IS 항목의 상대적 품질을 평가하는 데 중심이 되므로, 방법분산을 파악할 수 있는 신뢰성 추정 및 구성타당성을 위한 방법이 필요하다.  
Fourth, studies examine many different data quality outcomes: validity, reliability, acquiescence, straightlining, etc. These outcomes vary in terms of their strength and operationalizations. While estimates of validity and reliability potentially offer more direct measures of data quality, studies evaluate different measures of reliability and validity that vary in their quality. For example, estimates of reliability of items in a scale, such as from Cronbach's alpha, include correlated error variance and do not provide values for individual items. Estimated test-retest reliabilities, over the short intervals that are commonly used, may be too compromised by memory or reliable method effects to provide a strong criterion.56 It is plausible that a combination of acquiescence, the repetition of the response categories, and the presentation of items in a battery increases correlated method variance among a set of AD items, a reminder that simple correlations are fundamentally an ambiguous indicator of data quality. Because method variance is central to evaluating the relative quality of AD and IS items, methods for estimating reliability and construct validity that can identify method variance are needed.14

질문 특성에 대한 개요를 통해 알 수 있는 내용
What the overview of question characteristics tells us

AD-IS 실험에 포함된 AD-IS 질문 간에 달라지는 핵심 질문 특성에 대한 분석은 이러한 실험에서 비교되는 질문이 종종 여러 특성에 따라 달라져 결론을 도출하는 능력을 복잡하게 만든다는 사실을 강조한다. 한 연구에서 연구자들은 신뢰도를 측정하는 AD-IS 쌍이 다음에 따라 차이가 있다고 지적했습니다:

  • 제공된 응답 차원 (IS 질문에 대한 응답 치수가 설계 및 측정된 강도, 빈도 및 양에 따라 문항특이적인 반면, AD 질문은 강도를 측정했다.); 
  • 응답 범주의 방향성 (AD 대응 범주는 높은 순서에서 낮은 순서로 정렬 – "강력히 동의"에서 "강력히 반대"로 정렬 – IS 범주는 "전혀"에서 "매우"로, "절대"에서 "항상"으로 정렬됨); 
  • 극성 (AD 질문은 양극성, IS 질문은 단극성). 

Our analysis of the key question characteristics that vary between AD-IS questions included in AD-IS experiments highlights the fact that in these experiments, the questions being compared often vary on a number of characteristics, complicating our ability to draw conclusions. In one study,4 researchers noted their AD-IS pairs measuring trust varied based on:

  • offered response dimensions (the AD questions measured intensity while the response dimensions for the IS questions were item-specific by design and measured intensity, frequency, and quantity);
  • the direction of the response categories (the AD response categories were ordered from high to low – “strongly agree” to “strongly disagree” – while the IS categories were ordered from low to high – “not at all” to “a great deal,” “never” to “always”);
  • polarity (the AD questions were bipolar; the IS questions were unipolar).

이 두 응답 형식 사이의 구조적 차이는 응답자의 인지 처리와 데이터 품질에 중요한 결과를 초래한다. 현재까지 이러한 특성의 모든 고유 효과 또는 결합 효과를 추정할 수 있는 설계를 특징으로 하는 연구는 없습니다. 실제로, 응답 범주의 수 또는 척도 방향과 같이 데이터 품질에 중요할 가능성이 있는 다른 특성에서 체계적인 변화가 있는 AD-IS 응답 형식의 사용을 건너는 실험은 소수에 불과하다. 이러한 연구의 결과는 궁극적으로 AD-IS 응답 형식과 다른 질문 특성 사이의 체계적인 상호 작용을 밝혀낼 수 있다.
The structural differences between these two response formats have important consequences for respondents’ cognitive processing and data quality. To date, no studies feature a design that allows for estimation of all the unique or joint effects of these characteristics. Indeed, only a handful of experiments cross the use of an AD-IS response format with systematic variation in other characteristics that are likely to be important for data quality, such as the number of response categories or scale direction. Findings from such studies may ultimately uncover systematic interactions between AD-IS response formats and other question characteristics.

AD 질문을 IS 질문으로 변환할 때의 과제
Challenges of translating AD questions to IS questions

새로운 연구를 위한 주관적 평가를 측정하기 위한 질문을 작성할 때, 여기에 제시된 문제는 IS 질문을 사용하는 것을 권장합니다. 그러나 많은 연구는 이전에 관리된 설문지의 항목을 사용하는 것을 목표로 하며 AD 형식에서 IS 형식으로 번역하는 것은 여러 가지 과제를 제기할 수 있다. AD 문은 상대적으로 작성하기 쉽기 때문에 동시에 평가해야 할 여러 요소(예: 여러 대상 객체 및 조건문)를 포함하는 경우가 많습니다. GSS의 다음 AD 질문을 고려해 보십시오:

"과거의 차별 때문에, 고용주들은 자격 있는 여성들을 고용하고 홍보하기 위해 특별한 노력을 해야 합니다." 

이 질문은 몇 가지 사항에 대해 묻는다:

  • 차별의 원인(예: 성별)과 대리인(예: 고용주)에 대한 믿음,
  • 과거의 차별에 대한 보상을 해야 하는 고용주의 책임,
  • 자격을 갖춘 여성을 고용하고 승진시키는 것이 과거의 행동을 바로잡는지 여부.

When writing questions to measure subjective evaluations for a new study, the issues presented here recommend using IS questions. Many studies, however, aim to use items from previously administered questionnaires and translating from an AD to IS format can pose a number of challenges. Because AD statements are relatively easy to write, they often include several elements – such as multiple target objects and conditional statements -- to be evaluated simultaneously.42 Consider, the following AD question from the GSS:

“Because of past discrimination, employers should make special efforts to hire and promote qualified women.”

This question asks about several things:

  • beliefs about the causes (e.g., gender) and agents of discrimination (e.g., employers),
  • the responsibility of employers to make amends for past discrimination, and
  • whether hiring and promoting qualified women rectifies past behavior.

이 진술에 대한 [동의 또는 동의하지 않는 것]은 이러한 [구성요소 또는 이들의 조합에 대한 믿음]에 기초할 수 있다. 이 질문을 IS 형식으로 변환하면 기본 응답 차원에 대해 내려야 하는 항목과 결정의 복잡성이 강조됩니다: 강도(얼마나 특별한 노력이 필요한가), 양(얼마나 많은 노력이 필요한가), 빈도(얼마나 자주 노력이 필요한가)에 대한 질문인가?
Agreement or disagreement with this statement could be based on beliefs about any of these components or combinations of them. Translating this question into an IS format underscores the complexity of the item and decisions that must be made about the underlying response dimension: is the question asking about intensity (how special efforts should be), quantity (how much effort should be made), or frequency (how often efforts should be made)?

데이터 품질 저하의 원인이 될 수 있는 AD 질문과 관련된 문제는 기본 응답 차원이 모호하거나 여러 해석에 열려 있는 방식으로 작성되는 경우가 많다는 것이다. GSS에서 추출하여 정치적 효과를 측정하도록 설계된 척도에 포함된 표 3의 AD 질문을 고려해 보십시오. 임계값 단어 "most"가 수량 응답 차원을 의미하는 반면 AD 문은 강도, 수량 또는 빈도 차원을 사용하여 IS 질문으로 쉽게 번역될 수 있으며, 실제로 가능한 두 가지 수량 차원인 "얼마나"와 "얼마나 많은"가 가능합니다.
A related problem with AD questions that likely contributes to their lower data quality is that they are often written in way that leaves their underlying response dimension ambiguous or open to multiple interpretations.6 Consider the AD question in Table 3, taken from the GSS and included in a scale designed to measure political efficacy. While the threshold word “most” implies a quantity response dimension, the AD statement can easily be translated into IS questions using intensity, quantity, or frequency dimensions, and indeed, two possible quantity dimensions – “how much” and “how many” are possible.

AD 질문은 항목이 완전히 다른 주제에 대해 질문하는 경우에도 동일한 응답 범주를 사용하여 많은 항목을 배터리로 결합할 수 있기 때문에 널리 사용됩니다. 자체 관리를 위해 AD 질문을 그리드 형식으로 지정하여 공간을 최소화할 수 있습니다. 그러나 IS 질문은 질문의 기본 응답 차원과 일치하는 응답 범주를 사용하기 때문에 AD에서 IS로 항목 집합을 변환하면 문항이 동일한 기본 응답 차원을 공유하지 않는 경우가 많습니다. 예를 들어 표 4의 6개 AD 항목은 그리드에 압축된 동일한 응답 범주를 사용하는 반면, IS 대응 항목은 강도, 양 및 빈도에 대한 응답 차원을 사용하고 해당 차원과 관련된 응답 범주를 요구합니다. IS 항목을 결합하면 그리드가 약간 더 길어집니다. 시각적으로 긴 그리드는 응답자들에게 더 부담스러운 것으로 인식될 수 있지만, 더 명확하게 작성되고 이해하기 쉽기 때문에 IS 질문은 덜 부담스러울 가능성이 높다. AD 및 IS 질문에 답하면서 응답자의 인지적 노력을 측정하고 노력 척도를 데이터 품질과 직접 연결하는 연구가 더 필요하다. 
AD questions are widely used because many items can be combined into a battery using the same response categories, even if the items ask about completely different topics. For self-administration, AD questions can be formatted in a grid to minimize space. However, because IS questions use response categories that match the questions' underlying response dimensions, translating a set of items from AD to IS often reveals that the items do not share the same underlying response dimension. For example, while the six AD items in Table 4 use the same response categories, compactly formatted in the grid,11 their IS counterparts use response dimensions for intensity, quantity, and frequency and require response categories relevant for those dimensions. When combined, the IS items result in a slightly longer grid. While a visually longer grid may be perceived by respondents as more burdensome, because they are more clearly written and easier to understand, the IS questions are likely less burdensome. More research measuring respondents’ cognitive effort while answering AD and IS questions and directly linking effort measures to data quality is needed.

질문 작성자는 종종 [개정과 복제의 균형]을 맞춰야 한다. AD 질문의 광범위한 사용을 고려할 때, 연구자들은 시계열 데이터의 추세 손실을 포함하여 [이전에 시행된 질문이나 "검증된" AD 척도를 사용하지 않는 것에 대한 단점]과 [데이터 품질의 잠재적인 이점]을 비교하여 IS 측정을 변환하는 것을 고려해야 할 수 있다. 검증된 계측기 개발과 관련된 많은 문제가 이 검토의 범위를 벗어나지만, 우리는 척도의 타당화는 이분법적 결과가 아니라 프로세스임을 독자들에게 상기시키고자 한다. 특정 목적을 위해 특정 모집단에 대해 검증된 도구는 증거 없이 다른 모집단이나 목적으로 확장되지 않을 것이다. 또한, 많은 "타당화된" 계측기는 [표준화된 측정을 위한 질문 작성]에 [근거-기반 표준에 미달하는 질문]을 사용한다.
Question writers often need to balance revision against replication.69 Given the wide-spread use of AD questions, researchers may need to weigh disadvantages of not using previously administered questions or “validated” AD scales, including losing trends from time-series data, versus potential gains in data quality to converting IS measures. While many issues related to developing a validated instrument75,76 are beyond the scope of this review, we remind readers that instrument validation is not a binary outcome, but a process.77 An instrument validated for a specific population for a specific purpose would not – without evidence – extend to a different population or purpose. Further, many “validated” instruments use questions that fall short of evidenced-based standards for writing questions for standardized measurement.9

미래연구
Future research


AD와 IS 응답 형식을 직접 비교하는 실험 연구는 약간의 혼합된 결과를 산출하지만, IS 형식을 지지하는 강력한 이론적 뒷받침과 이용 가능한 증거를 고려할 때, 우리는 대부분의 목적으로 AD 질문보다 IS 질문을 추천한다. 우리의 검토는 또한 다양한 실질적 주제에 걸쳐 AD와 IS 질문을 비교하고 데이터 품질을 평가하기 위한 강력한 기준을 포함하는 설계가 더 많은 실험적 연구의 필요성을 지적한다. 향후 작업은 다음 사항을 우선시해야 합니다: 
Although experimental studies directly comparing AD and IS response formats yield some mixed results, given the strong theoretical underpinning and available evidence in support of the IS format, we recommend IS questions over AD questions for most purposes. Our review also points to the need for more experimental research comparing AD and IS questions across a range of substantive topics and with designs that incorporate strong criteria to evaluate data quality. Future work should prioritize the following: 

1) 특정 특성을 가진 일부 구문 또는 질문은 AD 질문으로 더 잘 측정됩니까? 
1) Are some constructs or questions with specific characteristics better measured with AD questions?

Dykema 등은 [의학 연구자에 대한 신뢰]와 같은 비특이적 구성에 대해 질문할 때, 빈도-기반 응답 차원을 사용하는 질문을 할 때, 특히 외부에 초점을 맞춘 행위자들(예: "의학 연구자들은 연구 참가자들의 안전을 보장하기 위해 얼마나 열심히 일하고 있는가")에 대해 질문할 때, 응답자들은 [평가를 위한 것]이 아니라, [대상 물체에 대한 지식을 묻는 것]처럼 들렸기 때문에 응답자들에게 어려웠다. 리커트가 초기 연구에서 사용한 진술과 유사하게, [동의-비동의 보기]는 "해야 한다"(예: "성인 자녀는 부모가 나이가 들면 부모를 돌봐야 한다")를 사용하는 [가치 진술]에도 적용하기 쉬울 수 있다.  
Dykema et al.4 noted that when asking about a non-salient construct like trust in medical researchers, questions using frequency-based response dimensions, especially when asking about externally-focused actors (e.g., “how hard do medical researchers work to ensure participants in their studies are safe”), were difficult for respondents because they sounded like they were asking respondents about their knowledge of the target object and not for an evaluation.78 Similar to the statements Likert used in his early work, an agreement response dimension may also be easy to apply to statements of values using “should” (e.g., “Adult children should take care of their parents when the parents become old”). 

2) 어떤 특성 조합이 최상의 데이터 결과를 제공합니까? 
2) What combinations of characteristics yield the best data outcomes?

우리는 어떤 조합이 최고 품질의 데이터를 산출하는지 결정하기 위해 연구자들에게 특정 질문 특성과 특성 조합의 효과를 추정할 수 있는 능력을 제공할 수 있는 다요인 설계를 사용한 향후 작업을 권장한다. 
We encourage future work using multifactorial designs that can provide researchers with the ability to estimate the effects of particular question characteristics and combinations of characteristics in order to determine which combinations yield the highest quality data.

3) AD 및 IS 질문의 측정 특성은 교육, 언어 구어 및 연령과 같은 사회 인구 통계적 특성에 따라 그룹마다 어느 정도 차이가 있습니까? 많은 연구들은 묵인과 같은 원치 않는 반응 효과가 낮은 교육을 받은 응답자들 사이에서 더 높다는 것을 보여주지만, AD 또는 IS 형식이 그러한 효과로부터 더 보호할 가능성이 있는지를 조사하는 연구는 거의 없다.  
3) To what extent do the measurement properties of AD and IS questions vary across groups based on socio-demographic characteristics such as education, language spoken, and age? Many studies demonstrate that unwanted response effects like acquiescence are higher among respondents with lower education,38,39 but few studies examine whether an AD or IS format is more likely to protect against such effects.

4) AD 및 IS 응답 형식은 관리 모드와 어떻게 상호 작용하며, 어떤 형식이 어떤 모드에 최적이며, 모드 내에서 어떤 구현 기능이 측정에 영향을 미칩니까? 인터뷰어-설문진행의 한계는 응답자가 응답 범주를 인코딩하고 호출해야 한다는 것입니다. 대면 인터뷰 중 IS 아이템에 대한 쇼케이스를 제공하면 응답자의 인지 부담을 줄일 수 있지만, IS아이템 솔루션은 전화 인터뷰에 쉽게 적용되지 않으며, 다양한 응답 범주를 가진 많은 항목을 포함하는 IS 척도는 응답자에게 어려울 수 있다.  

4) How do AD and IS response formats interact with the mode of administration, which format is optimal for which modes, and which features of implementation within mode have consequences for measurement? A limitation of interviewer-administration is that respondents must encode and recall response categories. While providing showcards for IS items during in-person interviews may reduce respondents’ cognitive burden, this solution is not easily applicable to phone interviews and IS scales that include many items with variable response categories may be difficult for respondents.

또한, 그리드를 독립형 질문으로 대체하여 수평 스크롤을 제한하는 응답성 설계를 사용하는 모바일 장치에서 설문 조사가 완료되어 그리드의 이점이 무효화된다. 모드와 관련된 문제는 모드를 혼합하는 조사가 증가하고 연구자들이 모드 효과를 측정하고 줄이는 방법을 계속 탐구함에 따라 더 많은 정밀 조사를 받게 될 것이다. 권장 사항은 점점 더 강력한 연구가 가능해지면 변경될 수 있지만, 현재 우리가 가지고 있는 가장 강력한 증거는 IS 아이템이 더 높은 품질의 데이터를 산출하고 연구자들에게 설계에 있어 상당한 유연성을 제공할 것임을 시사한다.

Further, an increasing share of surveys are completed on mobile devices which usually use a responsive design that limits horizontal scrolling by replacing grids with stand-alone questions, rendering any advantages of grids null. Issues related to mode are likely to receive increased scrutiny as surveys that mix modes grow and researchers continue to explore methods to measure and reduce mode effects.79, 80 Although recommendations may change when more and stronger research becomes available, the strongest evidence we currently have suggests that IS items will yield higher quality data and offer researchers considerable flexibility in design.

 


Res Social Adm Pharm. 2022 Feb;18(2):2335-2344. doi: 10.1016/j.sapharm.2021.06.014. Epub 2021 Jun 24.

Towards a reconsideration of the use of agree-disagree questions in measuring subjective evaluations

Affiliations expand

PMID: 34253471

PMCID: PMC8692311 (available on 2023-02-01)

DOI: 10.1016/j.sapharm.2021.06.014

Abstract

Agree-disagree (AD) or Likert questions (e.g., "I am extremely satisfied: strongly agree … strongly disagree") are among the most frequently used response formats to measure attitudes and opinions in the social and medical sciences. This review and research synthesis focuses on the measurement properties and potential limitations of AD questions. The research leads us to advocate for an alternative questioning strategy in which items are written to directly ask about their underlying response dimensions using response categories tailored to match the response dimension, which we refer to as item-specific (IS) (e.g., "How satisfied are you: not at all … extremely"). In this review we: 1) synthesize past research comparing data quality for AD and IS questions; 2) present conceptual models of and review research supporting respondents' cognitive processing of AD and IS questions; and 3) provide an overview of question characteristics that frequently differ between AD and IS questions and may affect respondents' cognitive processing and data quality. Although experimental studies directly comparing AD and IS questions yield some mixed results, more studies find IS questions are associated with desirable data quality outcomes (e.g., validity and reliability) and AD questions are associated with undesirable outcomes (e.g., acquiescence, response effects, etc.). Based on available research, models of cognitive processing, and a review of question characteristics, we recommended IS questions over AD questions for most purposes. For researchers considering the use of previously administered AD questions and instruments, issues surrounding the challenges of translating questions from AD to IS response formats are discussed.

설문에서 최대한을 얻어내기: 응답 동기부여 최적화하기(J Grad Med Educ. 2022)
Getting the Most Out of Surveys: Optimizing Respondent Motivation
Anthony R. Artino Jr , PhD
Quentin R. Youmans , MD, MSc
Matthew G. Tuck , MD, MEd, FACP

대학원 의학교육(GME)을 연구하는 사람들을 포함한 보건 전문 교육 연구자들은 설문 조사와 오랜 연애를 한다. 이러한 호감의 증거는 의학 교육 저널(Journal of Graduate Medical Education, JGME)에 게재된 최근 기사를 검토함으로써 찾을 수 있다. 우리가 집계한 바로는 2021년에 발간된 Original Research and Brief Report 기사 중 56%가 설문조사를 이용했다시간, 돈, 방법론적 전문지식의 한계를 포함하여 많은 GME 학자들이 직면한 제약을 고려할 때 이 큰 비율은 놀라운 일이 아니다. 결과적으로, 설문조사는 종종 GME 조사자들이 가장 접근하기 쉬운 연구 방법이다. 또한 설문조사는 일반적으로 GME 교육자들이 훈련생 평가와 프로그램 평가를 위해 사용한다. 이러한 이유로, 설문조사는 상당히 적응 가능하며, 신념, 가치, 태도, 인식 및 의견과 같이 측정하기 어려운 심리적 구조를 평가하는 효율적인 방법이 될 수 있다.  
Health professions education researchers, including those who study graduate medical education (GME), have a long-standing love affair with surveys. Evidence of this fondness can be found by reviewing recent articles published in the Journal of Graduate Medical Education (JGME). By our count, 56% of Original Research and Brief Report articles published in 2021 used a survey. This large proportion is not surprising, considering the constraints that many GME scholars face, including limitations of time, money, and methodological expertise. Consequently, surveys are often the most accessible research method for GME investigators. In addition, surveys are commonly used by GME educators for trainee assessment and program evaluation. For these reasons, surveys are quite adaptable and can be an efficient way to assess hard-to-measure psychological constructs like beliefs, values, attitudes, perceptions, and opinions.1 

광범위한 사용과 방법론적 유연성에도 불구하고 설문조사에는 [몇 가지 고유한 약점]이 있다. 여론조사, 사회학, 심리학과 같은 분야에서 수십 년 동안의 경험적 증거에 의해 뒷받침되는 한 가지 약점은 [낮은 수준의 응답자 동기가 질 낮은 데이터로 이어질 수 있다]는 것이다.  GME에서 문제는 훨씬 더 심각할 수 있다. 전공의는 업무 외의 삶뿐만 아니라 임상 및 교육 책임을 포함하여 많은 경쟁적 시간 제약을 가지고 있기 때문이다. 이러한 제약 및 기타 제약 조건은 특정 GME 연구 또는 평가 노력의 장점에 관계없이 설문 조사를 우선해서 답하기 어렵게 만든다.
Notwithstanding their widespread use and methodological flexibility, surveys come with several inherent weaknesses. One weakness, supported by decades of empirical evidence in fields like public opinion polling, sociology, and psychology, is that low levels of respondent motivation can lead to poor-quality data.2  In GME the problem may be even more acute, as resident physicians have many competing time constraints, including clinical and educational responsibilities, as well as life beyond work. These and other constraints make prioritizing surveys difficult, regardless of the merit of any particular GME study or evaluation effort.

이러한 상황을 염두에 두고, 우리는 이 사설에서 [응답자의 동기 부여 문제]에 초점을 맞춘다. 동기 부여를 해결하기 위해 먼저 인식에 대해 논의하고 설문 조사를 완료할 때 참가자가 일반적으로 고려하는 사항을 강조합니다. 다음으로, 동기가 낮을 때 발생할 수 있는 몇 가지 응답 행동을 설명하여 낮은 품질의 설문 조사 데이터를 생성한다. 우리는 연구원이 응답자의 동기를 최적화하고 궁극적으로 더 정확하고 해석 가능한 설문 조사 데이터로 이어질 수 있는 설계 및 구현 전략으로 결론을 내린다. 
With this landscape in mind, we focus on the issue of respondent motivation in this Editorial. To address motivation, we first discuss cognition and highlight what participants typically consider when completing a survey. Next, we describe several response behaviors that can occur when motivation is low, thereby resulting in low-quality survey data. We conclude with design and implementation strategies that can help researchers optimize respondent motivation and ultimately lead to more precise, accurate, and interpretable survey data.

설문조사 응답 프로세스
Survey Response Process

응답자의 동기를 이해하기 위해서는 먼저 [설문 응답의 심리]를 살펴보는 것이 도움이 된다. 설문 조사를 수행하는 인지 작업을 설명하는 데 사용되는 고전적인 프레임워크는 Tourangeau와 동료들의 응답 프로세스 모델이다(그림 참조).  그것은 응답자들이 설문조사를 할 때 4가지 인지 과정을 거치는 것을 제안한다.

  • 첫째, 설문 항목을 이해하고 페이지에 있는 [단어의 의미를 해석]해야 한다(자체 조사에서).
  • 다음으로, 그들은 장기 기억에서 항목에 대응하는 데 필요한 [관련 정보를 검색]해야 한다. 이 정보에는 과거 활동에 대한 구체적인 날짜나 주제에 대한 태도나 의견이 포함될 수 있습니다. 일반적으로 메모리에서 검색해야 합니다.
  • 다음으로, 의견제출자들은 그 [정보를 판단에 통합하고, 경우에 따라서는 추정]할 필요가 있다. 예를 들어, 한 응답자는 작년에 얼마나 자주 헌혈을 했는지 보고할 것을 요청했고, 따라서 얼마나 자주 헌혈을 하는지에 따라 그 숫자를 추정할 필요가 있다. 만약 헌혈이 분기별로 실시된다면, 응답자는 작년에 헌혈한 횟수로 "4"를 추정할 수 있다.
  • 마지막으로, 응답자들이 답변을 염두에 둔 후에는 [해당 답변을 설문조사에 보고하고 제공된 옵션에 따라 답변을 조정]해야 합니다. 위의 예에서 헌혈 빈도에 대한 응답 옵션이 "가끔" 또는 "자주"로 제시된 경우, 응답자는 자신의 대답 "4"를 가장 적절한 응답 범주로 변환해야 한다.

To understand respondent motivation, it is helpful to first examine the psychology of survey response. A classic framework used to describe the cognitive work of taking a survey is Tourangeau and colleagues' response process model (see Figure).3  It proposes that respondents move through 4 cognitive processes when taking a survey.

  • First, they need to comprehend the survey item and interpret the meaning of the words on the page (in a self-administered survey).
  • Next, they need to retrieve from their long-term memory the relevant information needed to respond to the item. That information could include specific dates for activities in the past, or an attitude or opinion about a topic. Generally, something must be retrieved from memory.
  • Next, respondents need to integrate that information into a judgment and, in some cases, make an estimation. For example, a respondent asked to report how often they gave blood last year might not remember all instances and therefore would need to estimate the number based on how often blood drives are held. If blood drives are conducted quarterly, then the respondent might estimate “4” as the number of times they gave blood last year.
  • Finally, once respondents have an answer in mind, they must report that answer on the survey and adapt their response based on the options provided. In the example above, if the response options for the frequency of blood donations are presented as “sometimes” or “often,” then a respondent would need to convert their answer “4” into what they believe is the most appropriate response category.
Components of the Survey Response Process // a a Survey response process is adapted from Tourangeau et al.3

설문조사 응답 프로세스의 구성요소 

응답자들이 네 가지 인지 과정을 작업하는 동안, 이리저리 뛰어다니고, [심지어 단계를 건너뛸 수 있다]는 것을 주목하는 것이 중요하다. 예를 들어, 한 사람이 작년에 의사를 얼마나 자주 봤는지 보고해 달라고 요청했는데, 기억에서 그 정보를 찾기 시작할 수도 있지만 물리치료사에게 가는 것이 고려되어야 하는지에 대해 궁금해했다. 그리고 나서 그들은 이해 단계로 돌아가서 단서를 찾기 위해 질문을 다시 읽을 수도 있다. 그런 다음 응답자는 제공된 응답 옵션에 기초하여 의사 방문 횟수가 적정한지에 대한 다른 단서를 찾기 위해 응답 단계로 점프할 수 있다. 이러한 방식으로, 설문 응답 프로세스는 비선형적입니다. 응답자들은 개별 설문 조사 질문을 탐색하고 응답하는 데 도움이 되도록 설문 조사에서 제공하는 상황별 단서를 사용합니다.

It is important to note that respondents may jump around, and even skip steps, while working through the 4 cognitive processes. For instance, a person asked to report how often they saw a physician last year might begin retrieving that information from memory but wonder if going to the physical therapist should be counted. They might then jump back to the comprehension step and reread the question to look for clues. The respondent might then jump forward to the response step to look for other clues about what a reasonable number of physician visits might be, based on the response options provided. In this way, the survey response process is nonlinear; respondents hop around and use contextual clues provided by the survey to help navigate and respond to individual survey questions.

이 네 가지 인지 단계에 대한 또 다른 중요한 점은, 과정 중에 어떤 지점에서 [마주치는 어려움이 오류를 발생]시킬 수 있다는 것이다. 예를 들어, 응답자들은 혼란스러운 문구나 전형적인 시각적 배치 때문에 질문을 오해하거나, 관련 정보를 잊어버려서 검색할 수 없거나, 정보에 입각한 답변을 하는 데 필요한 정보가 없기 때문에 정확한 판단을 할 수 없을 수 있다. 각 예제에서 [응답 오류]가 발생할 수 있으며 제공된 답변은 [부정밀하고, 부정확하며 조사 연구자가 해석하기 어려울 가능성]이 더 높습니다. 게다가, 응답자들은 설문 조사를 통해 일하는 동안 [인지적 지름길]을 취할 수 있고 종종 그렇게 한다. 즉, 응답자는 응답 프로세스(이해, 검색, 판단 및 추정 또는 보고)의 모든 단계에서 설문 응답 프로세스를 최적화할 수 없습니다. 대신에, 응답자들은 [정신적 에너지와 만족감을 보존하는 것]을 선택할지도 모른다.
Another important point about these 4 cognitive steps is that difficulties encountered at any point along the process can produce errors. For example, respondents might misunderstand a question because of confusing wording or atypical visual layout, not be able to retrieve the relevant information because they have forgotten it, or not be able make an accurate judgment because they do not have the necessary information to give an informed answer. In each example, response errors may occur, and the answers provided are more likely to be imprecise, inaccurate, and difficult for survey researchers to interpret. Furthermore, respondents can and often do take cognitive shortcuts while working through a survey. That is, at any step in the response process—comprehension, retrieval, judgment and estimation, or reporting—respondents may not optimize the survey response process. Instead, they may choose to conserve their mental energy and satisfice.4 

동기 부여 및 Satisficing
Motivation and Satisficing

응답자의 동기부여에 대한 우려는 설문조사 설계 문헌에 오랫동안 설명되어 왔다. 20여 년 전, 크로스닉는 "단 하나의 질문에도 최적의 답을 생성하기 위해서는 많은 인지 작업이 필요하다"고 언급했다 이와 같이, 양질의 답변은 에너지를 소비하고 설문 조사 응답 프로세스를 최적화하도록 동기를 부여하는 응답자에게서 나오는 경향이 있다. 응답자들은 자기 표현에 대한 욕구, 지적 도전, 도움이 되고 싶은 욕구를 포함한 많은 요소들에 의해 동기 부여를 받는다. GME에서 주민들은 의무감과 전문성에서 설문에 참여하려는 동기부여를 받는다고 보고한다.  반면에, 개인적인 경험과 수십 년에 걸친 경험적 연구는 응답자들이 종종 설문 질문에 고품질의 답변을 제공할 동기가 없음을 말해준다. 크로스닉은 이 흔한 상황을 satisficing이라고 지칭한다.
Concerns about respondent motivation have long been described in the survey design literature. More than 2 decades ago, Krosnick4  noted that “a great deal of cognitive work is required to generate an optimal answer to even a single question.” As such, high-quality answers tend to come from respondents who are motivated to expend that energy and optimize the survey response process. Respondents are motivated by numerous factors, including their desire for self-expression, intellectual challenge, and a desire to be helpful. In GME, residents report being motivated to participate in surveys out of a sense of duty and professionalism.5  On the other hand, personal experience and decades of empirical research tell us that respondents are often unmotivated to provide high-quality answers to survey questions. Krosnick calls this common situation satisficing.4 

Satisficing은 응답자들이 "기준을 타협하여, 에너지를 덜 소비하려고 하는 정도"이다.  즉, 응답자들은 [최적의 답변을 도출하기 위해 필요한 노력을 기울이기]보다는, 예를 들어 질문의 의미에 대해 [덜 생각]하고, 기억을 [덜 철저하게 검색]하고, 검색된 정보를 [부주의하게 통합]하고, 또는 응답을 [부정확하게 선택함]으로써 "적당히 좋은" 답변을 제공한다. 따라서, 가장 정확하고 최고의 답변(즉, 프로세스 최적화)을 생성하기 위해 응답 프로세스의 네 가지 인지 단계를 신중하게 수행하는 대신, 만족하는 응답자는 정신 에너지를 보존하고 만족스러운 답변만 제공하는 것에 만족한다. 경험적 증거는 제한적이지만, 우리는 GME 훈련생들의 고유한 시간과 맥락 제약을 고려할 때 Satisficing이 특히 널리 퍼질 수 있다고 의심한다.
Satisficing is the degree to which respondents “compromise their standards and expend less energy.”4  That is, rather than devote the necessary effort to generate optimal answers, respondents often give “good enough” answers by, for example, being less thoughtful about a question's meaning, searching their memory less thoroughly, integrating retrieved information carelessly, and/or selecting a response imprecisely. Thus, instead of carefully working their way through the 4 cognitive steps of the response process to generate the best, most precise answers (ie, optimizing the process), respondents who satisfice conserve their mental energy and settle for giving just satisfactory answers.4  Although empirical evidence is limited,5  we suspect that satisficing may be particularly prevalent for GME trainees given their unique time and context constraints.

실제로 Satisficing을 하면, 낮은 품질의 설문 조사 데이터로 이어지는 [여러 가지 응답 행동]이 발생합니다. 여기에는 다음이 포함됩니다 

  • (1) 서둘러 설문 조사를 통과하는 것; 
  • (2) 제일 처음 나오는 그럴듯한 답변을 선택합니다; 
  • (3) 평가에 제시된 모든 진술에 동의한다; 
  • (4) 동일한 옵션을 직선(일명 직선)으로 반복적으로 선택합니다; 
  • (5) 질문에 대해 실제로 생각하지 않고 "모름" 또는 "해당 없음"을 선택합니다 
  • (6) 설문 조사의 항목 또는 전체 섹션을 건너뜁니다.

Satisficing 는 중서부의 한 대규모 학술 의료 센터에서 설문 조사 행동에 대한 질문을 받은 주민의 말을 인용함으로써 전형적으로 나타난다: "대부분의 경우… 저는 정말로 기여할 것이 없고 단지 그것을 극복하고 싶기 때문에 중간을 끝까지 클릭할 것입니다."  이 진술이 시사하는 바와 같이, [응답 프로세스를 최적화하지 않는 응답자의 답변]은 suboptimal하며, 신뢰하기 어렵고, 의도한 용도에 타당할 가능성이 낮은 품질의 데이터를 초래한다.
In practice, satisficing results in a number of response behaviors that lead to low-quality survey data: these include

  • (1) rushing through a survey;
  • (2) selecting the first reasonable answer;
  • (3) agreeing with all statements presented on the survey;
  • (4) selecting the same options repeatedly, in a straight line (so-called straightlining);
  • (5) selecting “don't know” or “not applicable” without actually thinking about the question being asked; and
  • (6) skipping items or entire sections of a survey.2  

Satisficing is epitomized by this quote from a resident at a large Midwestern academic medical center who was asked about their survey behaviors: “A lot of the time… I'll just click the middle all the way through, because I have nothing really to contribute and I just want to get through it.”5  As this statement implies, answers from respondents who are not optimizing the response process are suboptimal and result in poor-quality data that are unlikely to be trustworthy, credible, or valid for their intended use.

Satisficing 완화 및 사려 깊은 응답 장려
Mitigating Satisficing and Encouraging Thoughtful Responses

만족스러운 결과로 발생하는 문제에 비추어 볼 때, GME 교육자와 연구자는 현상을 이해하고 데이터 품질에 대한 해를 완화하는 솔루션을 구현하기 위해 노력하는 것이 중요하다. 크로스닉은 [Satisficing 을 촉진하는 세 가지 조건]을 설명했다: 

  • (1) [과제]가 어려운 경우
  • (2) [응답자의 능력] 또는 교육 수준이 낮은 경우
  • (3) 응답에 대한 참가자의 [동기 부여]가 낮은 경우

대부분의 경우 [응답자의 능력과 교육 수준이 고정]되어 있습니다. 다행히도, GME 연구원들은 종종 고등학생들보다 [교육을 잘 받았기 때문]에 Satisficing할 가능성이 낮은 고능력 참가자들을 조사하고 있다. [과제의 난이도]와 [응답자의 동기 부여]에 관해서는, 조사 설계자는 사려 깊은 설계와 구현 관행을 통해 이러한 요인에 영향을 미칠 수 있으며 Satisficing을 상당히 완화시킬 수 있다.
In light of the problems that result from satisficing, it is important for GME educators and researchers to understand the phenomenon and work to implement solutions that mitigate harms to data quality. Krosnick4  described 3 conditions that promote satisficing:

  • (1) greater task difficulty;
  • (2) lower respondent ability or education level; and
  • (3) lower participant motivation to respond.

In most cases, respondent ability and education level are fixed. Fortunately, GME researchers often are surveying high-ability participants who are well educated and thus less likely to satisfice than, for example, a high school student. As for task difficulty and respondent motivation, survey designers can influence these factors—and appreciably mitigate satisficing—through thoughtful design and implementation practices.6 

과제 난이도를 완화하는 것은 Satisficing을 완화하는 가장 중요한 방법이다. 설문조사의 경우, 설문조사를 완료하는 것이 과제입니다. 조사 설계자가 작업을 더 쉽게 하기 위한 최선의 접근법은 [근거에 입각한 모범 사례]를 따르는 것이다. 4가지 인지적 대응 과정을 통해 응답자가 자신의 길을 갈 수 있도록 지원하는 [양질의 설문지를 설계]하는 것이 목표다. 이러한 설계 관행이 다른 곳에서 자세히 설명되었지만, 우리는 표 1에서 GME 조사 설계자가 조사 완료 작업을 단순화하기 위해 사용할 수 있는 많은 [고수익high-yield 관행]을 강조한다.
Easing task difficulty is the most important way to mitigate satisficing. In the case of a survey, the task is completing the survey. The best approach for survey designers, to make the task easier, is to follow evidence-informed best practices. The goal is to design a high-quality survey that supports respondents as they work their way through the 4 cognitive response processes. Although these design practices have been articulated in detail elsewhere,1,7-9  we highlight in Table 1 a number of high-yield practices that GME survey designers can use to simplify the task of survey completion.

마지막으로, 설계자는 설문조사 요청을 [사회적 교환]으로 간주하여 응답자의 동기, 즉 [설문조사 초대를 수락하고, 설문조사를 시작하고, 응답 프로세스를 최적화하는 동기]를 직접 다룰 수 있습니다. 딜먼 등이 설명한 바와 같이,  "사람들이 다른 사람의 요청을 따르는 것에 대한 [보상]이 결국에는 그 요청을 따르는 [비용]을 초과할 것이라고 믿고 신뢰한다면, 그들은 다른 사람의 요청을 따를 가능성이 더 높습니다." 즉, 잠재적 응답자들은 종종 [세 가지 주요 요인]을 고려합니다: 

  • 보상(이 설문 조사에 참여함으로써 얻을 수 있는 이점은 무엇입니까?), 
  • 비용(시간이 얼마나 걸립니까?) 
  • 신뢰(초대 소스 및 제안된 데이터 사용을 신뢰합니까?). 

표 2는 설계자가 보상을 확대하고 비용을 절감하며 신뢰를 강화하기 위해 사용할 수 있는 몇 가지 관행을 포함한다.

Finally, designers can directly address respondent motivation—the motivation to accept a survey invitation, start the survey, and optimize the response process—by viewing a survey request as a social exchange. As described by Dillman et al,8  “people are more likely to comply with a request from someone else if they believe and trust that the rewards for complying with that request will eventually exceed the costs of complying.” In other words, potential respondents often consider 3 primary factors: 

  • rewards (What will I gain by taking this survey?), 
  • costs (How much time will it take?), and 
  • trust (Do I trust the invitation source and the proposed data use?).

Table 2 includes several practices that designers can employ to magnify rewards, decrease costs, and fortify trust.

 

요약
Summary

고품질 설문 조사 결과는 응답 프로세스를 최적화하려는 동기를 가진 참가자들로부터 얻어집니다. 불행하게도, 많은 응답자들은 [동기가 없고], 그들의 [정신적 에너지를 보존하고], [satisfice하는 경향]이 있어서 "충분히 좋은" 대답에 만족한다. 설문조사를 통해 응답자의 생각을 이해하는 데 유용한 모델은 응답 프로세스 모델로, 다음과 같은 4가지 인지 단계를 설명합니다: 이해, 검색, 판단 및 추정, 대응. 이 모델을 사용함으로써 설문조사 개발자는 응답자의 [인지 작업을 예측]하고, [응답자의 satisfice하려는 성향을 완화]시킬 수 있다. 응답자의 동기 부여는 설문조사 완료에 따른 비용, 보상 및 신뢰를 고려함으로써 더욱 강화될 수 있습니다. 이러한 전략을 채택함으로써 연구자와 교육자는 응답자의 동기를 최적화하고 더 나은 품질의 설문조사 데이터를 수집할 수 있습니다. 또한, 우리는 조사자들이 조사 데이터 품질을 최적화하기 위해 거주자, 직원 및 교직원의 고유한 GME 인구를 위해 설계된 GME별 조사 전략을 연구할 것을 권장한다.

High-quality survey results come from participants who are motivated to optimize the response process. Unfortunately, many respondents are unmotivated and tend to conserve their mental energy and satisfice, thereby settling for “good enough” answers. A useful model for understanding how respondents think through a survey is the response process model, which describes 4 cognitive steps: comprehension, retrieval, judgement and estimation, and response. By using this model, survey developers can anticipate the cognitive work of respondents and mitigate respondents' tendencies to satisfice. Respondent motivation can be further bolstered by considering the costs, rewards, and trust involved in survey completion. By employing these strategies, researchers and educators can optimize respondent motivation and collect better-quality survey data. In addition, we encourage investigators to study GME-specific survey strategies, designed for the unique GME population of residents, staff, and faculty, to optimize survey data quality.


J Grad Med Educ. 2022 Dec;14(6):629-633. doi: 10.4300/JGME-D-22-00722.1.

Getting the Most Out of Surveys: Optimizing Respondent Motivation

Affiliations collapse

1is a Professor of Health and Human Function, and Associate Dean for Evaluation and Educational Research, The George Washington University School of Medicine and Health Sciences, and Deputy Editor, Journal of Graduate Medical Education (JGME).

2is an Advanced Fellow, Division of Cardiology, Northwestern University Feinberg School of Medicine, and Resident Editor, JGME.

3is a Residency Site Program Director, Washington DC VA Medical Center, Associate Professor of Medicine, The George Washington University School of Medicine and Health Sciences, Associate Clinical Professor of Medicine, Uniformed Services University of the Health Sciences, and Associate Editor, JGME.

PMID: 36591428

PMCID: PMC9765912 (available on 2023-12-01)

DOI: 10.4300/JGME-D-22-00722.1

아이들은 문제 없다: 교육자의 새로운 세대 (Med Sci Educ. 2022)
The Kids Are Alright: a New Generation of Educators
Gal Barak1,2 · Matthew Ryan Carroll3 · Andrea Dean1,2

배경
Background

Y세대, 즉 순세대, 즉 나세대로도 알려진 밀레니얼 세대베이비붐 세대 이후 가장 큰 세대다. [1981년에서 1996년 사이]에 태어난 개인인 밀레니얼 세대는 현재 미국 인구의 20%가 넘는 7200만 명의 미국 거주자를 구성하고 있다[1]. 이 세대는 기술과 인터넷 붐과 평행하게 성장했다; 가장 어린 밀레니얼 세대는 인터넷 이전의 시간을 기억하지 못할 수도 있고, 그들은 그들의 손끝에 있는 인간 지식을 가진 삶을 경험했다. 게다가, 그들의 [초기 발달 동안의 자녀 양육 경향]은 이 세대를 [젊음으로부터 보호하고, 검증하며], [과외 활동과 팀 기반 활동에 몰입]시키는 것을 포함한다. 9월 11일 테러 공격, 학교 총격 사건의 증가, 경제 불황, 재앙적인 기상 재해를 포함한 역사적 사건들이 이 세대를 형성했다[2].
The millennial generation, also known as Generation Y, the net generation, or Generation Me, is the biggest generation since the Baby Boomers. Millennials, individuals born between 1981 and 1996, currently make up 72 million US residents which is more than 20% of the US population [1]. This generation has grown up parallel to the technology and internet boom; the youngest millennials may not remember a time prior to the internet, and they have experienced life with the whole of human knowledge at their fingertips. In addition, child-rearing trends during their early development included protecting and validating this generation from youth and immersing them in extracurricular and team-based activities. Landmark events have shaped this generation including the September 11 terrorist attacks, the rise in school shootings, economic recessions, and catastrophic weather disasters [2].

[세대 이론]에 따르면, 이러한 일련의 [삶을 바꾸는, 세계적인 사건들을 경험]하는 것은 밀레니얼 세대들에게 다른 세대들과 비교하여 공유된 관점, 가치, 특성들을 제공한다[3, 4]. 따라서, 개인의 변화는 여전히 존재하지만, 세대 이론은 주어진 환경에서 개인이 어떻게 행동하는지를 예측하는 데 도움이 된다. 예를 들어,

  • [진보된 기술]은 밀레니얼 세대의 제2의 천성이며,
  • [언급된 자녀 양육 경향]은 팀 기반 활동에 대한 타고난 적성으로 이어졌다.
  • 반면에, 이러한 [양육 경향]은 이 세대가 [자신은 자격이 있다entitled]는 부정적인 인식으로 이어졌고, 실제로 밀레니얼 세대는 그들의 [성취에 대해 더 많은 외부적인 검증]을 원한다.

According to generational theory, experiencing this set of life-altering, world-wide events gives millennials a shared set perspectives, values, and traits compared to other generations [3, 4]. Thus, while individual variation still exists, generational theory helps predict how individuals behave in a given setting. For example,

  • advanced technology is second nature to millennials and
  • child-rearing trends mentioned have led to a natural aptitude for team-based activities.
  • On the other hand, the same child-rearing trends have led to the negative perception that this generation is entitled and, indeed, millennials do desire more external validation for their achievements.

학생으로서 밀레니얼 세대의 학습 선호도에 관한 강력한 증거가 있다. 연구는 [대화형 및 그룹 기반 학습, 교육 도구로서의 기술의 능숙한 통합, 명확하게 구조화된 지침 및 기대의 중요성]을 강화했다. 이러한 연구는 또한 [자기 수행능력에 대한 과대한 자신감]을 포함하여 학습자로서 이 세대에 대한 잠재적인 우려와 가치관과 우선순위의 차이로 인한 오해로 인한 [전문직업성의 상실을 인식할 수 있는 잠재적인 가능성]을 강조했다. [시기적절한 행동 기반 피드백과 긴밀한 멘토링 관계]는 이 세대에서 인식되는 약점의 일부를 해결하기 위한 수단으로 강조되어 왔다[7]. 궁극적으로, 이러한 연구들은 의학 교육자들이 밀레니얼 세대를 가르칠 수 있게 해주었다.
There is strong evidence regarding learning preferences of millennials as students. Studies have reinforced the importance of interactive and group-based learning, savvy integration of technology as an educational tool, and clearly structured instructions and expectations [5, 6]. These studies have also highlighted some potential concerns about this generation as learners including a sense of overconfidence with regard to performance, as well as potential for perceived lapses in professionalism due to misunderstandings as a result of differences in values and priorities [7, 8]. Timely, behavior-based feedback and close mentoring relationships have been highlighted as a means to address some of the perceived deficits in this generation [7]. Ultimately, these studies have enabled medical educators to teach millennials.

의학 외에도, 연구는 밀레니얼 세대를 노동력에 포함하도록 확장되었다. 2018년 퓨 연구에 따르면 미국 노동력 참여자의 35%가 밀레니얼 세대이며, 밀레니얼 세대는 2016년까지 베이비붐 세대와 X세대를 제치고 노동력의 주요 기여자가 되었다[10]. 이러한 비의료 분야에서 밀레니얼 세대는 세대 차이로 인해 많은 비판을 받아왔지만, 이러한 차이는 기회로도 볼 수 있다. 예를 들어, [일과 삶의 균형에 대한 밀레니얼 세대의 욕구]는 게으름으로 인식될 수 있지만, 웰빙을 지원하는 데 있어 변화를 주도할 수도 있습니다 [11].
Outside of medicine, research has expanded to include millennials in the workforce [9]. According to a 2018 Pew study, 35% of American labor force participants are millennials, and millennials surpassed both Baby Boomers and Gen Xers as the dominant contributor to the labor force by 2016 [10]. In these non-medical fields, millennials have been widely criticized for their generational differences, yet these differences can also be seen as opportunities. For example, millennials’ desire for a work-life balance can be perceived as laziness, but can also drive change in supporting wellness [11].

그러나, 훈련이 의사의 30대까지 잘 지속되는 의학에서, 밀레니얼 세대의 첫 번째 코호트는 이제 겨우 의대 교수로서 직장에서 자리를 잡고 있다. 임상 교사 및 학술 지도자로서의 역할에서 공유 세대 특성의 발현은 알려져 있지 않다. 새로운 증거는 [밀레니얼 중등 교육 교사들]이 [밀레니얼 세대가 아닌 동료들]과 의사소통의 장벽을 가지고 있고, 승진에 대한 비현실적인 기대를 가지고 있다는 것을 시사한다. 밀레니얼 세대가 학술 의학 분야에서 이에 못지 않게 파괴적일 것이며, 밀레니얼 세대가 교사로서의 역할에서 어떻게 행동하고 궁극적으로 이 분야를 형성할 지도자가 될 수 있는지 이해하는 것이 중요하다.
However, in medicine where training lasts well into a physician’s 30 s, the first cohort of millennials is only now establishing itself in the workforce as faculty physicians. The manifestation of shared generation traits in their roles as clinical teachers and academic leaders is unknown. Emerging evidence suggests millennial secondary-education teachers have communication barriers with non-millennials colleagues and have unrealistic expectations of promotion [12]. It is likely that millennials will be no less disruptive in the field of academic medicine and it is important to understand how millennials might behave in their roles as teachers and, ultimately, becomes leaders in the field who will shape the field.

[우수한 의료 교육자의 특성과 특징]을 요약한 여러 연구가 발표되었습니다[13,14,15]. 역량 기반 의료 교육이 증가함에 따라 교육자들은 [투명성, 빈번한 피드백 및 개별화된 학습] 속에서 더 잘 성장하는 밀레니얼 세대와 특히 관련이 있는 [교육 표준을 정의하고 충족]해야 하는 과제를 안고 있다[16]. 2011년, Srinivasan 등은 임상 교육자가 "효과적인 교수 및 학습 문화"를 촉진하기 위해 ACMGE 역량을 프레임워크로 사용하는 [6가지 핵심 역량]을 확인했다[13]. 이러한 역량은 임상의-교육자를 위한 전문적인 개발을 안내하는 데 사용되어 왔다. 여기서 우리는 세대 이론의 렌즈를 통해 이러한 각각의 역량을 고려하여 밀레니얼 세대가 임상 환경에서 교사와 교육 리더의 역할로 이동하면서 어떻게 그들의 타고난 특성을 활용하고 잠재적인 도전을 예측할 수 있는지 예측한다.
Several studies have been published outlining the traits and features of excellent medical educators [13,14,15]. With the rise of competency-based medical education, educators have also been challenged to define and meet standards for teaching, which is of particular relevance to the millennial generation who thrive on transparency, frequent feedback, and individualized learning [16]. In 2011, Srinivasan et al. identified six core competencies, using ACMGE competencies as a framework, for clinician educators to promote a “culture of effective teaching and learning” [13]. These competencies have been used to guide professional development for clinician-educators [17, 18]. Here, we consider each of these competencies through the lens of generational theory to predict how millennials can leverage their innate traits and anticipate potential challenges as they move into the role of teacher and educational leaders in the clinical setting.

의료 내용 및 지식
Medical Content and Knowledge

Srinivasan et al.이 제안한 첫 번째 역량은 교사가 학습자에게 주입하고 각 학습자의 능력을 평가하기 위해 [견고한 기초 지식]을 가져야 한다고 명시하고 있다[13]. 이 역량은 아마도 밀레니얼 교사들의 타고난 기술이 이전 세대의 교육자들과 그들을 구분하는 곳일 것이다. 밀레니얼 세대는 무한한 정보를 손끝에 쥐고 성장하고 훈련한 첫 번째 세대의 의사들이다. 결과적으로, 그들의 지식은 [덜 백과사전적]이며, 대신에, [필요한 순간에 가장 최신이고 포괄적인 정보]를 얻는 것을 강조한다. 결과적으로 밀레니얼 임상의들은 [정보를 내재화하지 않기 때문]에, [동일한 수준의 임상 전문 지식을 개발하지 않았을 수] 있으며, 이는 [학습자들의 눈에 의심을 심어줄] 수 있다. 더 가능성이 있다는 것은 [밀레니얼 임상의의 지식]은, 더 나아가서 [그들이 사용하는 교육자료]는, 그들이 정확하게 접근하고 해석할 수 있는 모든 것으로만 구성되어 있기보다, 한계가 없다는 것을 의미한다.
The first competency proposed by Srinivasan et al. states that teachers must have a solid foundation knowledge to instill into their learners and assess each learner’s abilities [13]. This competency is perhaps where millennial teachers’ natural skills separate them from the prior generation of educators. Millennials are the first generation of physicians who grew up and trained with an endless supply of information at their fingertips. Consequently, they are less encyclopedic in their knowledge and, instead, emphasize acquiring the most up-to-date and comprehensive information at the moment it is needed [19]. Arguably, as a result, millennial clinicians may not have developed the same level of clinical expertise since they are not internalizing the information, which may instill doubt in the eyes of their learners. More likely, it means that millennial clinician’s knowledge, and hence, teaching material, is not limited, instead consisting of everything that they can accurately access and interpret.

또한, 이 세대는 변화하는 증거에 대해 최신 상태를 유지할 수 있는 자연스러운 능력을 가지고 있으며 그들에게 [정보 수집 과정은 역동적]이다. ["I-will-find-it-now" 시대]의 일원으로서 밀레니얼 세대는 엄격하게 정보를 가르치는 경향이 있지만 업데이트된 지침과 리소스를 참조하는 방법뿐만 아니라, 임상 질문에 답하기 위해 증거를 해석하는 방법을 포함한 지식 습득 기술을 가르치는 경향이 있다[20]. 밀레니얼 세대의 교육자들은, 적어도 이 능력에서는 뛰어나고 현대 의학의 급속한 발전에 보조를 맞출 수 있는 의사 세대로 이어질 수 있는 잠재력을 가지고 있다.
Additionally, this generation has a natural ability to stay current on changing evidence and the process of information acquisition is dynamic for them. As members of the “I-will-find-it-now era”, millennials, in turn, tend to teach not strictly information, but knowledge acquisition skills including how to reference updated guidelines and resources as well as how to interpret evidence to answer clinical questions [20]. Millennial educators, in at least this competency, excel and have the potential to lead to a generation of physicians that can keep pace with the rapid evolution of modern medicine.

학습자 중심성
Learner Centeredness

Srinivas 등은 두 번째 교육자 역량으로서 [학습자의 복지와 성장에 대한 헌신]을 확인한다[13]. 이러한 ["학습자 중심성"]은 [학습자에 대한 존중과 투자]뿐만 아니라, [긍정적인 학습 환경을 조성할 수 있는 능력]을 포함한다. 이것은 또한 밀레니얼 교육자들이 뛰어나기를 기대하는 역량이다. "바람직함Desired" 세대인 그들은 일관된 칭찬과 검증을 받으며 성장했습니다[8]. 결과적으로, 그들은 [안전하고 긍정적인 학습 환경]을 갖는 것을 중요시합니다. 그들은 또한 이전 세대보다 더 다양하기 때문에 [다양성의 가치에 대한 인식과 존중]을 가지고 자랐다[2]. 그들에게 있어 [문화적 역량과 겸손]을 강조하는 것은 그들의 전임자들보다 더 선천적인 것이며, 이것은 학습자 중심성의 핵심적인 측면이다. 게다가, 그들은 개성에 중점을 두고 성장한 결과로 [직장 밖의 삶을 중요시]한다. 대규모 불경기 동안 노동력에 들어가는 것은 그들이 "직업"을 어떻게 인식하는지에 영향을 줄 뿐만 아니라 그들이 롤모델을 하고 다른 사람들에게 건강에 대해 교육할 수 있는 기회를 만든다. 이는 학습자의 안녕과 학습 환경에 중요합니다.
Srinivasan et al. identify the commitment to learners’ well-being and growth as the second educator competency [13]. This “learner centeredness” includes respect for and investment in the learner, as well as the ability to create a positive learning environment. This is also a competency where we expect millennial educators to excel. Being the “desired” generation, they grew up with consistent praise and validation [8]; as a result, they value having a safe and positive learning climate. They are also more diverse than the generations before them and thus grew up with an awareness and respect for the value of diversity [2]. An emphasis on cultural competency and humility is more innate for them than their predecessors, which is a key aspect of learner centeredness. In addition, they value life outside of work as a result of growing up with an emphasis on individuality. Entering the labor force during a major recession not only impacts how they perceive their “jobs” but also creates an opportunity for them to role model and educate others about wellness. This is important for learner well-being and learning climate.

잠재적인 도전 중 하나는 어린 시절 자주 긍정하는 경험으로 인해, [(고용주뿐만 아니라) 잠재적으로 학습자]도 [밀레니얼 세대의 교사]들이 [자기 중심적이고 자기 몰입적]이라고 느낄 수 있다는 것이다. 또한, [긍정적인 학습 환경을 우선시]하기 때문에, 밀레니얼 교육자들은 [학습자의 신뢰를 해칠 우려]처럼 [의미 있는 형성적 평가를 제공하는 것]을 더 어려워 할 수 있다[21]. 마찬가지로, 그들은 학습자들에게 충분한 도전을 제공하지 않을 수도 있다. 그러나 학습자들은 교육적 도전과 의미 있는 평가보다 포용과 긍정적인 학습 환경을 중요시하는 경향이 있으며, 이는 밀레니얼 교사들이 학습자들에게 잘 인식되고 있음을 의미한다[22]. 그럼에도 불구하고, 밀레니얼 교육자들은 그들 자신의 편안한 영역을 적극적으로 벗어나 효과적인 교육자들의 기술을 연습하기 위해 그들의 세대적 특성에 의해 제기되는 잠재적인 한계를 인식하는 것이 중요할 것이다.
One potential challenge is that due to their experience with frequent affirmation during childhood, others may find millennial teachers self-centered and self-absorbed, including not only employers, but potentially their learners. In addition, due to prioritizing a positive learning climate, millennial educators may be more susceptible to barriers to providing meaningful formative assessments [21], such as fear of hurting a learner’s confidence. Similarly, they may not provide sufficient challenges for their learners. However, learners tend to value inclusion and a positive learning climate over educational challenges and meaningful assessments, which will mean millennial teachers are well perceived by learners [22]. Regardless, it will be important for millennial educators to recognize the potential limitations posed by their generational traits in order to actively step outside their own comfort zone and practice techniques of effective educators.

대인관계 및 의사소통 기술
Interpersonal and Communication Skills

임상 교육자는 학습을 가장 잘 촉진할 수 있도록 [교육 및 커뮤니케이션 스타일을 개인화]해야 합니다[13]. 여기에는 의사소통과 기대를 공유하는 방법, 교육 전략, 교육을 지도하기 위한 기본 학습자 지식의 평가, 피드백 제공, 전문적이고 대인관계적인 갈등 처리 등이 포함된다. 밀레니얼 세대는 이메일, 문자, 인스턴트 메시징을 통해 [지속적인 연결]의 시대에 성장했다. 이와 같이 [개방적이고 접근 가능한 경향]이 있으며, 이는 [학습자에게 많은 도움이 될 것]이다[23]. 왜냐하면 보통 학습자들은 스트레스가 높은 의료 훈련 중에 지원과 가이드를 얻고자 하며, 이런 개방성과 접근가능성이 학습자가 임상 환경에서 편안하게 도움을 구하도록 보장하기 때문이다.
Clinical educators are expected to personalize their teaching and communication styles to best facilitate learning [13]. This includes how communications and expectations are shared, educational strategies, assessment of baseline learner knowledge to guide teaching, giving feedback, and handling professional and interpersonal conflicts. The millennial generation grew up in an era of constant connectedness, via email, texts, and instant messaging. As such, they tend to be open and accessible [23], which will serve their learners well as they seek support and guidance during high-stress medical training and will ensure learners will feel comfortable seeking help in the clinical setting.

"트로피 세대"로서, 그들은 외부 검증[2]을 추구하며, 소셜 미디어와 전자 커뮤니케이션을 통해 [실시간 반응과 피드백에 익숙]합니다. 또한 밀레니얼 세대는 [명확한 기대]가 있을 때 더 잘 하는 것으로 나타났으며, [불확실한 기대]는 밀레니얼 세대로 하여금 비판적인 피드백과 평가에 저항하게 할 수 있다. 따라서, 교육자로서, 그들은 교사들에게 필수적인 의사소통 기술인 학습자들에게 명확한 기대를 설정하고 지속적으로 피드백을 제공하는 것을 염두에 둘 것이다.
As the “trophy generation,” they seek external validation [2] and, by way of social media and e-communication, they are accustomed to real-time reactions and feedback. In addition, millennials have been shown to thrive with clear expectations and unclear expectations can lead millennials to resist critical feedback and evaluations. Therefore, as educators, they will likely be mindful of setting clear expectations for and consistently providing feedback to learners which are essential communication skills for teachers.

반면에, 그들의 [전자 통신에 대한 경험]이 항상 [대면 또는 심지어 전화 소통 기술]로 번역되는 것은 아니다. 실제로 밀레니얼 세대는 [불편하고 비효율적이라고 인식하는 전화]보다 [문자나 인스턴트 메시지를 선호]하는 것으로 나타났다[24]. 이는 아마도 밀레니얼 교사들이 학습자에게 어려운 피드백을 제공하거나 자신의 가르침에 대한 피드백을 받는 등 [불편할 수 있는 대면 토론에 어려움을 겪을 수 있음]을 시사한다. 밀레니얼 세대는 일반적으로 "심리적 안전"에 대한 헌신을 보여주지 않는 개인들의 비판에 저항하기 때문에, 어느 방향으로든 대립이나 피드백의 어려움은 "코들링"되는 밀레니얼 세대의 인식에 의해 더욱 악화될 수 있다.
On the other hand, their experience with e-communication does not always translate into face-to-face or even telephone communication skills. Millennials, in fact, have been shown to prefer texts or instant messages rather than phone calls, which they perceive as uncomfortable and ineffective [24]. This suggests that perhaps millennial teachers may struggle with face-to-face discussions that may be uncomfortable, including providing difficult feedback to a learner or receiving feedback on their own teaching. Difficulty with confrontation or feedback in either direction may be compounded by the millennial perception of being “coddled,” as millennials generally resist criticism from individuals who do not demonstrate a commitment to “psychological safety.” [21].

전문직업성 및 역할 모델링
Professionalism and Role Modeling

Srinivasan 등이 요약한 또 다른 핵심 교육자 역량은 [전문직업성과 역할 모델링]입니다[13]. 이것은 [연민과 성실함을 보여주는 것, 교육자로서의 자신의 행동에 대한 책임감, 그리고 직업적인 행동을 모델링하는 것]을 포함한다. 밀레니얼 세대는 소셜 미디어 사용[25], 문신 비율의 증가[26], 그리고 일반적인 전문가 복장에 대한 강조가 거의 없기 때문에 이전에 비전문가적이라고 비판을 받아왔다. 이는 무의식적이고 시대에 뒤떨어진 편견의 결과이다[27]. 전문성에 대한 세대의 정의는 다르고, [외모에 대한 강조]는 [그들의 기술과 관련이 없다]고 생각하기 때문에, 밀레니얼 세대에 의해 그렇게 중요하게 여겨지지 않는다. 대신, 그들은 전문성의 주요 특징으로 [연민과 성실함]을 우선시할 수 있다. 이를 통해 긍정적인 업무 및 학습 환경에 의미 있게 기여할 가능성이 높은 전문직업성의 측면을 [모델링]함으로써 보다 효과적인 교사가 될 수 있다[22]. 기성 세대는 이들을 부정적으로 볼 수 있지만, 젊은 학습자들은 전문성에 대한 전통적인 정의에 대한 투자를 공유하지 않을 것이다. 대신, [이전 세대보다 더 다양성을 가지고 자란 밀레니얼 세대]는 궁극적으로 이 분야의 성장을 이끌 [더 넓은 범위의 의료 연수생을 포용하는 전문직업성]에 대한 [더 나은 작업 정의working definition를 옹호]할 수 있다.
Another key educator competency outlined by Srinivasan et al. is professionalism and role modeling [13]. This includes displaying compassion and integrity, accountability for one’s actions as an educator, and role modeling professional behaviors. Millennials have previously been criticized as unprofessional due to social media use [25], higher rates of tattoos [26], and overall less emphasis on typical professional dress, which are views held as result of unconscious and antiquated bias [27]. Generational definitions of professionalism differ, and an emphasis on physical appearance is not as valued by millennials because they think it doesn’t have a bearing on their skills. Instead, they can prioritize compassion and integrity as key features of professionalism. This allows them to be more effective teachers by modeling the facets of professionalism that are more likely to meaningfully contribute to a positive work and learning environment [22]. While older generations may view them negatively, younger learners are unlikely to share this investment in traditional definitions of professionalism. Instead, millennials, who grew up with greater diversity than the generations before them, can advocate for a better working definition of professionalism that embraces a wider scope of medical trainees who will ultimately lead to growth in the field.

밀레니얼 교육자들은 [경계를 설정]하고, [일과 삶의 균형을 유지하는 것]을 우선시하는 경향이 있기 때문에 역할 모델로서, 밀레니얼 교육자들이 가치를 가질 수 있는 한 가지 독특한 영역은 [웰빙 분야]이다. 밀레니얼 세대는 또한 그들의 고용주에 대한 [노동자의 충성심이나 맹목적인 생산성]으로 [전문직업성을 정의하지 않는다]. 이로 인해 밀레니얼 세대의 학습자와 다양한 직업의 직원들에 대한 비판이 제기되었지만, 번아웃의 유병률과 원인에 대한 데이터가 등장함에 따라 밀레니얼 세대의 건강 강조는 점점 더 중요해지고 있다. 역사적으로, 의료 훈련은, 항상 개인을 중요시하지 않는 시스템에서 운영되며, 번아웃은 유행병 수준이다. 이러한 방식으로 밀레니얼 교육자들은 기술을 가르치고 미래 세대의 소진을 방지하고 결과적으로 의료 분야의 지속 가능한 인력으로 이어지는 문화를 홍보할 수 있는 독특한 기회를 가지고 있다.
As role models, one unique area where millennial educators can be valuable is in the field of wellness, as they tend to prioritize setting boundaries and maintaining a work-life balance. Millennials also do not define professionalism by worker loyalty or blind productivity for their employer. While this has led to criticism of millennial learners and employees in a range of professions, as data emerges about the prevalence and causes of burnout, millennials’ emphasis on wellness is increasingly important. Historically, medical trainees operate in a system that doesn’t always value the individual, and levels of burnout are at epidemic proportion. In this way, millennial educators have the unique opportunity to teach skills and promote a culture that help prevent burnout in future generations and, as a result, lead to a sustainable workforce in medicine.

실천 기반 반영 및 개선
Practice-Based Reflection and Improvement

실천기반 성찰과 개선역량은 교육자로서 향상시키기 위한 [교육자의 자기평가 추구]이며, 따라서 교육자는 [지속적으로 성찰에 참여하고, 여러 출처로부터 의견을 구하며, 피드백에 대응하여 교수기법을 조정]할 것을 요구한다. 밀레니얼 세대는 [자기 성찰]을 [마음챙김의 도구]로 중요시하며, [자기 계발을 촉진]하는 [멘토십의 형태]로, [외부의 검증과 인정을 추구]하는 [자기 성찰의 사이클]에 지속적으로 참여한다[8]. 그러나 위에서 논의한 바와 같이, 성장기에 비판적 피드백에 대한 노출이 부족했기 때문에, 밀레니얼 세대가 자신의 정체성에 대한 도전을 느끼는 피드백을 통합하고 대응하는 것이 어려워할 수 있다.
The practice-based reflection and improvement competency is the educator’s pursuit of self-assessment to improve as educators, and thus requires educators to consistently engage in reflection, seek input from multiple sources, and adjust their teaching techniques in response to feedback [13]. Millennials value self-reflection as a tool for mindfulness, and consistently engage in a cycle of introspection followed by seeking external validation and recognition in the form of mentorship that often promotes self-improvement [8]. However, as discussed above, their lack of exposure to critical feedback growing up can make it challenging for millennials to incorporate and respond to feedback that they feel challenges their sense of identity.

또한, 테크놀로지 전문가로서, 이 세대는 [테크놀로지]를 [혁신적인 방식으로 자기 계발을 위한 도구로 사용할 준비]가 되어 있습니다[28]. 그들은 디지털 분석을 사용하여 개인 및 시스템 메트릭을 수집할 수 있을 뿐만 아니라, [의료 교육 학술활동]을 실시하고 분야를 개선하는 데 도움을 줄 수 있으며, 이는 임상 정보학이 학문으로 부상하는 데서 볼 수 있다. 비즈니스 세계에서 밀레니얼 세대는 기업의 혁신과 성장에 도전하는 기술 파괴자로 확인되었습니다[29]. COVID 팬데믹은 의료 교육자들이 가상 학습에 대한 오랜 믿음을 재평가하도록 유도했으며, 밀레니얼 세대는 학습자 만족도를 향상시키기 위한 교육에 기술을 효과적으로 사용하는 데 도움을 주었다. 
In addition, as technology experts, this generation is ready to use technology as a tool for self-improvement in innovative ways [28]. Not only can they use digital analytics to collect personal and system metrics, they can also use it to conduct medical education scholarship and help improve the field, which can be seen in the rise of clinical informatics as a discipline. In the business world, millennials have been identified as technology disruptors, challenging corporations to innovate and grow [29]. The COVID pandemic pushed medical educators to reassess long-held beliefs about virtual learning, with millennials helping to advance the effective use of technology for education to improve learner satisfaction [30, 31].

이 역량에서 탁월함에 대한 잠재적인 장벽은 교육자로서의 밀레니얼 세대의 동기에서 비롯됩니다. 일반적으로, 그들은 기관의 성공보다 자신의 행복을 중요시한다[19]. 이것은 그들이 [교육자로서 그들 자신에게 투자]하도록 동기를 부여할 수 있다는 것을 의미하지만, 그들은 [조직의 성장과 개선]에는 투자하지 않을 수도 있다. 따라서, 그들은 [개별 교육자]로서 우수할 수 있지만, [교육 리더]로서의 자신의 역할은 한정시킬 수 있고, 잠재적으로 그들이 그들의 기관에서 미래의 학습자들에게 미칠 수 있는 영향을 억제할 수 있다. 그러나, 그들이 더 자주 직업을 바꾼다는 비판에 직면했지만[2], 증거는 그들이 X세대가 그 나이였을 때와 비슷한 수준으로 직업과 함께 시간을 보낸다는 것을 시사한다[32]. 세계가 더 상호 연결되어 있음에도 불구하고, 직업 이동성은 덜 경직되고, 주니어 교수진은 국가 또는 심지어 국제 수준에서 새로운 기회를 찾는 것에 대해 보상을 받을 수 있다.
A potential barrier to excelling in this competency stems from millennials’ motivations as educators. In general, they value their own well-being over the success of their institution [19]. While this means they may be motivated to invest in themselves as educators, they may not be as invested in the growth and improvement of their organization. Hence, as individual educators they may excel, but they may limit their role as educational leaders and potentially hold back impacts they might otherwise have on future learners at their institution. However, although they’ve faced criticism for jumping between jobs more frequently [2], the evidence suggests that they spend just as much time with their jobs as Generation X did at the same age [32]. Regardless as the world grows more interconnected, job mobility becomes less rigid, and junior faculty may be rewarded for seeking new opportunities at the national or even international level.

시스템 기반 작업 방식
Systems-Based Practice

밀레니얼 교사를 논의할 때, 의료 교육자의 최종 역량인 [시스템 기반 실천]은 첫 번째 역량, 의료 내용 및 지식과 밀접한 관련이 있다. 최적의 교육을 제공하기 위해 의료 및 교육 시스템 내의 자원을 활용하는 능력으로 정의된다[13]. 기술과 인터넷의 급속한 확장과 함께 성장하면서, 이 세대는 변화에 빠르게 적응할 수 있고, 따라서 이 유연성을 쉽게 가르치고 역할 모델을 만든다. 그들은 [인터넷을 사용]하고, 그들의 [교육에 테크놀로지를 통합]하는 데 능숙하다. 이러한 유연성은 또한 훈련생 일정과 기대의 변화를 포함하여 임상 서비스 또는 팀 내의 변화에 자연스럽게 적응할 수 있도록 한다.
When discussing millennial teachers, the final competency of medical educators, systems-based practice, relates closely to the first competency, medical content, and knowledge. It is defined as the ability to utilize resources within the medical and education system to provide optimal teaching [13]. Growing up with the rapid expansion of technology and the internet, this generation can rapidly adjust to change and, therefore teach and role model this flexibility easily. They are adept at using the internet and incorporating technology into their teaching. This flexibility also allows them to naturally adjust to changes within their clinical services or teams, including changes in trainee schedules and expectations.

이 역량은 또한 "교육이 발생하는 시스템"에 대한 이해에 의존한다. [13] 그들의 양육과 시사에 의해, 이 세대는 변화를 촉진하기 위해 [시스템에 대한 깊은 이해를 추구]하는데, 이것은 스리니바산 외 연구진이 제시한 이 역량의 또 다른 핵심 측면이다. 불황, 최저 주택 보유율, 정치적 불안정 등 [자신들 세대를 망쳐둔 사회경제적 시스템]에서 성장한 결과, 밀레니얼 세대는 [현재 시스템의 단층fault lines을 보고 더 나은 단층을 만들려는 의욕]을 갖게 된다. 다양성에 대한 그들의 더 큰 노출은 또한 학습자들에게 긍정적인 영향을 미치는 것으로 나타난 학습 환경에 대한 포함을 촉진하도록 준비하는 데 도움이 된다. 궁극적으로, 관용과 포용[2]을 촉진하는 직장을 가치있게 여기며, 의학 내에서 [체계적인 변화를 옹호]할 뿐만, 아니라 의학 교육 내에서 이 중요한 학문 분야를 개발하는 데도 도움이 될 수 있다. 밀레니얼 세대는 임상 학습 환경과 커리큘럼 개발을 통해 [불평등을 인식하고 뒤집기 위해 문화를 전환하는 교육 리더]가 될 준비가 되어 있다.
This competency also relies on having an understanding of the “system in which education occurs.” [13] Shaped by their upbringing and primed by current events, this generation seeks out a deep understanding of the system to promote change, which is another key aspect of this competency laid out by Srinivasan et al. As a consequence of growing up in a socioeconomic system that has failed their generation, including recessions, lowest home owner rates, and political instability [33], millennials see the fault lines in the current system and are motivated to create a better one. Their greater exposure to diversity also helps prepare them to promote inclusion in the learning environment, which has been shown to have positive effects on learners [34]. Ultimately, they themselves value workplaces that promote tolerance and inclusion [2] and can help not only advocate for systematic change within medicine, but also help develop this crucial field of scholarship within medical education. Millennials are primed to be educational leaders that shift the culture to recognize and reverse inequity in the clinical learning environment and through curricular development.

결론들
Conclusions

세대이론의 관점에서 보면, 밀레니얼 세대의 특성과 가치는 Srinivasan et al. (표 1)이 제시한 의료교육자의 6가지 역량과 긍정적으로 일치한다. 밀레니얼 세대의 학습자들은 [개개인성individuality과 피드백을 중요시함]으로써, 역사적으로 교육 이론가들에 의해 [모범 사례로 추천된 행동]을 교사들로부터 기대한다고 제안되었다[35]. 따라서 밀레니얼 세대가 교육자와 동일한 모범 사례 행동을 선천적으로 보여줄 것으로 기대할 수 있습니다. 밀레니얼 세대의 사회 정의 및 기술과의 긴밀한 관계는 그들이 변화에 적응할 준비가 되어 있고 양심적이고 혁신적인 학습자의 개발을 촉진하기 위해 의학 교육의 현재 기준에 도전할 준비가 되어 있다. 번아웃과 사회적 불평등이 만연한 가운데, 그들은 [개인의 건강과 사회적 책임을 우선시하는 전문직업성]이라는 [독특한 브랜드의 역할 모델 역할]을 하기에 매우 적합하다.
Viewed through the lens of generational theory, the traits and values of the millennial generation align positively with the six competencies of a medical educator as posed by Srinivasan et al. (Table 1). It has been suggested that the millennial learners, by valuing individuality and feedback, expect behaviors from their teachers which have historically been recommended as best practice by educational theorists [35]. Therefore, we can expect millennials to innately exhibit these same best practice behaviors as educators. Millennials’ close ties with social justice and technology make them ready to adapt to change and poised to challenge current standards in medical education to promote development of conscientious and innovative learners. In the midst of an epidemic of burnout and social inequity, they are well suited to serve as role models of a unique brand of professionalism — one that prioritizes personal wellness and social accountability.

[외부 검증]를 강조하는 것은 [피드백의 사용을 촉진]하는 데 도움이 되지만, [존중과 심리적 안전에 대한 근본적인 기대]는 [어려운 피드백을 주거나 받는 능력]을 제한시킬 수 있다. 이것은 또한 결과적으로 [대면 상호작용에 대한 불편함]으로 인해 더 복잡해질 수 있다. 마지막으로, 교육자로서의 그들의 강점은 [전문직업성과 의학적 전문성]에 대한 그들의 전통적인 정의를 지나쳐 보려고 애쓰는 기성 세대들에 의해 간과될 수도 있다.
While their emphasis on external validation helps to promote the use of feedback, an underlying expectation of respect and psychological safety may challenge their ability to give or receive difficult feedback. This can also be compounded by discomfort with face-to-face interactions as a consequence. Finally, their strengths as educators may be overlooked by older generations who struggle to look past their own traditional definitions of professionalism and medical expertise.

물론 세대 이론에는 몇 가지 한계가 있다. 세대 이론은 인구 내의 추세를 이해하는 데 도움이 되지만, 개인 수준으로 추정하는 것은 잘못될 수 있다. 세대 이론이 부정적인 고정관념을 지지하기 위해 사용될 때, 그리고 "밀레니얼 교수자"과 같은 라벨을 사용하면 권력 차이를 강화하고 집단에 대한 신화를 전파하며 개성을 최소화할 수 있다. 세대 이론에 기초한 교육 권장 사항을 만드는 것은 제한된 데이터에서 광범위한 결론을 도출할 위험이 있다는 것을 인식하지만, 이 논문은 교육자 세대에 대한 더 큰 개념을 탐구하는 역할을 한다. 새로운 교육자 세트를 위한 표적 개입을 개발하는 데 도움이 되도록 이전 세대의 의사 교육자와 비교하여 차기 의사 교육자 간의 차이를 더 잘 평가하기 위해 추가 연구를 수행할 수 있다.
There are of course several limitations of generational theory. While generational theory helps understand trends within a population, extrapolating to the individual level can be misguided. Misconceptions occur when generational theory is used to support negative stereotypes and using labels such as “millennial teacher” can reinforce power differences, propagate myths about a cohort, and minimize individuality [36]. While we recognize that making educational recommendations based on generational theory risks drawing broad conclusions from limited data, this paper serves to explore larger concepts about a generation of educators. Further research can be done to better evaluate the differences between incoming physician educators compared to those of prior generations, to help develop targeted interventions for this new set of educators.

전반적인 세대 이론은 밀레니얼 교육자의 평가에 대한 기대를 형성할 뿐만 아니라 밀레니얼 교육자의 미래 교수진 개발 커리큘럼을 안내하는 데 도움이 될 수 있는 기회가 될 수 있다.
Overall generational theory can be an opportunity to help guide future faculty development curricula for millennial educators as well as shape the expectations for evaluation of millennial educators. As we see our first big group of millennial educators, not only will they be able to bring their own strengths with regard to teaching modern medicine, but they will fundamentally change it.


 

Med Sci Educ. 2022 Sep 3;32(5):1189-1194. doi: 10.1007/s40670-022-01618-6. eCollection 2022 Oct.

 

The Kids Are Alright: a New Generation of Educators

 

1Department of Pediatrics, Baylor College of Medicine, Houston, USA.

2Texas Children's Hospital, 1102 Bates Ave, Houston, TX FC1860 USA.

3Department of Obstetrics and Gynecology, Baylor College of Medicine, Houston, USA.

PMID: 36276772

PMCID: PMC9583974 (available on 2023-10-01)

DOI: 10.1007/s40670-022-01618-6

Generational theory states that as a result of experiencing the same life-altering, world-wide events at key developmental ages, individuals of a given generation share unique perspectives, values, and traits compared to other generations as reported by Johnson and Romanello (Nurse Educ. 30(5):212-216, 2005) and Howe and Strauss 2000. Thus, while individual variation still exists, generational theory can be used as a tool to predict individual behavior and capitalize on shared traits in the workplace or educational setting. The millennial generation, born between 1981 and 1996, has previously been negatively perceived; however, application of generational theory can allow for a reshaping of public perception. For example, there now exists ample research, both within and outside of medical education, on how to take advantage of typical traits of the millennial student to maximize their learning, such as Twenge (Med Educ. 43(5):398-405, 2009), Eckleberry-Hunt and Tucciarone (J Grad Med Educ. 3(4):458-461, 2011), and Nicholas (Int J Learn Annu Rev. 15(6):27-34, 2008). As the cohort ages, the focus has shifted to helping millennials reach their full potential as employees. However, due to intensive and lengthy training required, medicine is only now seeing the first cohort of millennials entering the workforce as faculty physicians. As such, academic medicine is seeing millennials move from the learner role into that of the teacher. Thus far, the influence of the shared generational characteristics on their success and challenges as clinician educators and educational leaders is novel and has not been explored in the literature. By overlaying generational theory on Srinivasan et al.'s (Acad Med. 86(10):1211-1220, 2011) proposed six competencies for medical educators, we predict the strengths and challenges of millennial medical educators and hypothesize on the impact this generation may have on academic medicine.

세대적 상황성: 보건의료전문직에서 세대적 고정관념에 도전하기 (Med Teach, 2022)
Generational situatedness: Challenging generational stereotypes in health professions education
Rachel Conrad Brackena, Mary E. Fredricksonb , L. Austin Fredricksona and Michael Applemana

 

서론
Introduction

[세대 이론]은 [개인의 신념과 가치가 그들이 태어난 시기에 따라 결정될 수 있다]는 생각에 뿌리를 두고 있으며, 보건 전문 교육(HPE)을 포함한 고등 교육 전반에 걸쳐 지도 및 평가에 대한 그것의 사용이 널리 퍼져 있다. 그러나 최근 몇 년 동안 학자, 교육자, 주류 문화 평론가들은 세대 이론의 방법과 적용이 [환원적으로 연령차별적]이고, [본질적]이며, [백인, 상류층 및 중산층 학생들을 과대 대표적]이라고 비판해왔다. 실제로, 일부 전문가들은 세대 코호트에 대해 도출된 결론이 너무 문제가 있다고 생각하여 세대 분석을 완전히 피하고 세대 '이론'이 이론적으로 타당하지 않으며 고정관념에 불과하다고 주장한다. 2020년, 자우레귀와 동료들은 HPE 문헌 내에서 세대 이론에 대한 비판적인 리뷰를 발표했는데, ['밀레니얼 학습자'의 '신화']는 [전체 세대의 학생에 대한 근거 없는 환원된 일반화를 영구화]할 뿐만 아니라, [학습자의 개별적인 요구를 최소화한다]는 결론을 내렸다. 그들은 HPE 교육자들이 그것의 기원과 가정을 검토하지 않고 세대 이론에 기초한 교육을 변경하기 전에 주의를 기울이거나, 그렇지 않으면 HPE 학생들에 대한 필수주의자와 다른 고정관념을 불필요하게 전파할 위험을 감수해야 한다고 제안한다.  
Generation theory is rooted in the idea that an individual’s beliefs and values can be determined based on the time period in which they were born, and its use in guiding instruction and assessment across higher education–including health professions education (HPE)–is pervasive (Jauregui 2020). In recent years, however, scholars, educators, and mainstream cultural commentators have critiqued the methods and application of generation theory as reductively ageist, essentializing, and overly representative of white, upper- and middle-class students (Twenge 2017; Menand 2021). Indeed, some experts find the conclusions drawn about generational cohorts so problematic they suggest avoiding generational analysis altogether, asserting generation ‘theory’ is not theoretically sound and amounts to little more than stereotyping (Hoover 2007, 2009; Singham 2009; Rudolph 2021). In 2020, Jauregui and colleagues published a critical review of generation theory within HPE literature, concluding that the ‘myth’ of the ‘millennial learner’ not only perpetuates unfounded, reductive generalizations about an entire generation of students, but also minimizes the individual needs of learners. They ‘suggest that HPE educators apply caution before making alterations to instruction based on generation theory without examining its origins and assumptions, or otherwise risk unnecessarily propagating essentialist and othering stereotypes’ of HPE students (Jauregui 2020).

고등 교육 연구, 특히 HPE에서 상당한 문헌이 [세대 이론이 무시적이고 본질적인 고정관념에 대한 문제적 의존성을 상세히 기술하고 있음] 불구하고, 보건 직업 교육 프로그램의 세대 구성이 다시 바뀌고 [Z세대('Z세대')]가 교실에서 [밀레니얼 세대]를 대체함에 따라, [Z세대의 요구를 충족]시키기 위해 보건 직업 교육자를 준비하는 것을 목표로 하는 출판물의 수가 부수적으로 증가했다. 이러한 연구에서 'Gen Z'(1995년에서 2012년 사이에 태어난 사람들로 정의됨)는 이전 세대보다 겉보기에 '어려서younger', '어른됨adulting(예: 고등학교 또는 대학 재학 중에 일하거나, 청구서를 지불하거나, 운전면허를 취득하거나, 독립적으로 거주하거나, 가정을 관리하거나,)'을 경험할 가능성이 적고, 그리고 그들의 부모에게 더 의존적인 것으로 묘사된다
Yet, as the generational composition of health professions educational programs shifts again and Generation Z (‘Gen Z’) replaces Millennial students in the classroom, there has been an attendant growth in the number of publications aimed at preparing health professions educators to meet the needs of this cohort, despite a substantial body of literature in higher education research—and HPE, specifically—detailing generation theory’s problematic reliance on dismissive and essentializing stereotypes (Jauregui 2020; Rudolph 2021). Within these studies, ‘Gen Z’ (defined as those born between 1995 and 2012) is described as seemingly ‘younger’ than previous generations, less likely to have experience ‘adulting’ (e.g. working while in high school or college, paying bills, obtaining a driver’s license, living independently, or managing a household,) and more dependent on their parents (Twenge 2017; Selingo 2018).

다른 세대 연구와 마찬가지로, 이러한 패턴이 코호트, 연령 및/또는 기간 영향을 반영하는지는 명확하지 않으며, [운전면허를 가진 18세의 수]와 같이 이러한 '세대' 특성 중 [일부는 정량화]할 수 있지만, (진정으로 대표적인 샘플에서 수집했다고 치뎌라도) 이 인구통계학적 데이터가 의미하는 바의 해석은 열려있다. 더욱이, 사회학적 데이터의 일반적인 추세는 [한 연령 집단 내의 엄청나게 다양한 경험]을 모호하게 할 수 있다. [우리 세대에게 강요되는 종종 매우 부정확한 고정관념과 예측]에 놀라기도 하고, 두려워하기도 하는, 자주 비방받는 [밀레니얼 세대의 구성원들]로서, 우리는 우리의 교육학 내에서 'Z세대'의 환원적 일반화를 불러오는 것을 주저한다; 이러한 추측은 제한적이며, 이전 세대의 특성화와 마찬가지로, [Z세대가 미국 역사상 가장 인종적, 인종적으로 다양]함에도 불구하고, [백인 중산층의 경험을 표준으로 증폭시킬 가능성]이 높다. 게다가, HPE 학생들의 다가오는 집단은 이전보다 더 많은 1세대 및 저소득층 학생, 여성, 인종 또는 소수 민족을 포함할 것이다. 이는 소위 'Z세대' 학습자들에 대해 만들어진 일반화의 타당성을 더욱 훼손하는 사실이다.
As with any generational study, it is not clear whether these patterns reflect cohort, age and/or period effects and while some of these purported ‘generational’ characteristics may be quantifiable, such as the number of 18-year-olds with a driver’s license, what this demographic data means—provided it is gathered from a truly representative sample—is open for interpretation (Rudolph 2021). Moreover, general trends in sociological data can obscure the tremendous variety of experiences within an age cohort (Rudolph 2021). As members of the frequently maligned Millennial Generation, both amused and horrified at the often wildly inaccurate stereotypes and predictions foisted upon our own generation, we hesitate to invoke reductive generalizations of ‘Gen Z’ within our pedagogy (Howe and Strauss 2000; Hoover 2009); such conjectures are limited and, like previous generational characterizations, likely amplify the experiences of white, middle-class people as the norm, even while Gen Z is the most ethnically and racially diverse in US history (Vaidhyanathan 2008; Hoover 2009). Moreover, incoming cohorts of HPE students will include more first-generation and low-income students, women, and racial or ethnic minorities than ever before—facts that further compromise the validity of generalizations made about these so-called ‘Gen Z’ learners (Selingo 2018; ‘Profile of pharmacy students fall 2020’ 2020; ‘FACTS: applicants and matriculation data’ 2021).

이 기사는 특히 세대 이론과 Z세대 학생들에 초점을 맞춘 HPE 출판물의 주제 분석을 사용하여,

  • Jauregui 등에 의해 식별된 세대 필수화 및 타자화의 문제 패턴이 Z세대에 대한 문헌에서 얼마나 지속되는지,
  • 그리고 만약 지속되고 있다면, 요즘에 세대 이론을 HPE 연구에서 호출하는 것이 어떻게 세대 프레임워크의 현재 비판에 귀를 기울이는지 조사하고자 한다.

우리의 목표는 세대 이론에 대한 비판을 재탕하거나 만회하는 것이 아니다. 오히려 [실질적인 비판]에도 불구하고, [보건 직업 교육에서 세대 이론의 지속되는 매력]을 조사하는 것이다. 그리고 자우레귀 등으로부터 배운 교훈을 바탕으로, 현재의 대화를 [보건 전문직 교육에 다가오는 'Z세대' 학생집단이 참여할 수 있는 생산적인 수단]으로 유도한다. 따라서 본 연구의 목적은 두 가지이다. 

  • 첫째, HPE의 출판된 문헌의 주제 분석을 통해 Z세대 보건 전문가 교육의 맥락에서 세대 이론이 어떻게 적용되는지 설명한다  
  • 둘째, 21세기 의료 및 고등 교육을 형성하는 광범위한 문화, 경제 및 사회 정치적 맥락에 주목함으로써, [보건 전문가와 관련된 구조 및 제도적 변화를 중심]으로 하는, [HPE 내의 진화에 접근하는 보다 생산적인 프레임워크를 제안]한다.

By employing thematic analysis of HPE publications focused specifically on generation theory and Gen Z students, this article investigates

  • the extent to which the problematic patterns of generational essentializing and othering identified by Jauregui and colleagues persist in the literature on Gen Z and
  • how, if at all, current invocations of generation theory in HPE research attend to the extant critiques of generational frameworks (Jauregui 2020).

Our goal is neither to rehash critiques of generation theory nor to redeem it, but rather to investigate the persistent allure of generation theory in health professions education despite substantial criticism, and, based on the lessons learned from Jauregui et al., direct the current conversation toward more productive means of engaging incoming cohorts of ‘Gen Z’ health professions students. Thus, the objectives of this research are two-fold:

  • first, to explicate how generation theory is applied in the context of Generation Z health professions education via thematic analysis of the published literature in HPE and
  • second, to propose a more productive framework for approaching evolutions within HPE that, by attending to the broader cultural, economic, and sociopolitical contexts shaping healthcare and higher education in the 21st century, centers structural and institutional changes relevant to the health professions.

방법
Methods

'세대 이론이 Z세대 보건 직업 학생들의 연구에 어떻게 적용되었는가?'라는 질문에서 출발하여, 우리의 주제 분석은 브라운과 클라크의 6단계 프레임워크에 의해 알려졌습니다:

  • (1) 데이터 숙지, (2) 초기 코드 생성, (3) 테마 검색, (4) 테마 검토, (5) 테마 정의 및 이름 지정, (6) 쓰기 완료. 

관련 HPE 출판물을 식별하기 위해 2021년 11월 문헌 검색이 수행되었다. 4개의 전자 데이터베이스(PubMed, Medline CINAHL, PsycINFO)가 날짜 제한이 적용되지 않은 영어로 출판된 연구를 검색했다. 검색 전략에 의해 확인된 기사들은 중복을 제거한 후, 제목과 추상적인 검토로 구성된 저자들에 의해 수행된 2단계 심사 과정을 거쳐 포함을 위한 전문적인 검토를 거쳤다. 기사는 대학원 과정(예: 전공의)에서 Z세대 학생들을 참조하거나, Z세대 보건 전공 학생들에게 직접 초점을 맞추지 않은 경우 제외되었다. 포함된 연구의 참조는 추가 관련 연구를 위해 선별되었다. 자세한 검색 전략은 부록 1에서 확인할 수 있으며, 샘플에 포함된 기사에 대한 전체 서지 정보는 부록 2에서 확인할 수 있습니다.  
Starting from the question, ‘How has generation theory been applied to studies of Generation Z health professions students?’, our thematic analysis was informed by Braun and Clarke’s six step framework:

  • (1) familiarizing with data, (2) generating initial codes, (3) searching for themes, (4) reviewing themes, (5) defining and naming themes, and (6) completing write-up (Maguie and Delahunt 2017).

To identify relevant HPE publications, a literature search was conducted in November 2021. Four electronic databases (PubMed, Medline CINAHL, PsycINFO) were searched for studies published in English with no date restrictions applied. After removing duplicates, the articles identified by the search strategy underwent a two-stage screening process conducted by the authors that consisted of title and abstract review followed by full-text review for inclusion. Articles were excluded if they referenced Gen Z students in post-graduate programs (ex. medical residencies) or did not directly focus on Gen Z health professions students. References of included studies were screened for additional relevant studies. A detailed search strategy is available in Supplementary Appendix 1 and full bibliographic information for articles included in our sample is provided in Supplementary Appendix 2.

어떤 테마가 Z세대의 HPE 연구에 고유하고 세대에 걸쳐 지속되는지 강조하기 위해 [연역 및 귀납의 혼합적 코딩 체계]를 통해 샘플의 반복적인 주제 분석이 수행되었다. 우리는 [무작위로 선택된 15개의 기사]의 하위 샘플을 연역적이고 귀납적으로 코딩하는 것으로 시작했다. 이 코드 생성 분석 단계에서 각각의 기사는 연구팀의 두 명의 구성원에 의해 읽고 분석되었다. 연역적 코딩은 [Jauergui 등이 개발한 주제 프레임워크]를 적용하여 세 가지 선험적 주제의 증거를 드러냈는데, 우리는 이를 [본질주의, 세대적 타성, 세대적 겸손]이라고 정의했다. [동시 귀납적 코딩]은 팀이 협업적으로 군집화하고 증류한 새로운 주제를 식별했다. 다음으로 연구팀의 각 구성원은 샘플의 각 출판물을 특징짓는 두 개의 중요한 주제뿐만 아니라 [세 개의 선험적]이고 [두 개의 귀납적]으로 생성된 주제의 증거를 위해 샘플의 모든 기사를 독립적으로 분석했다. 일관성을 보장하기 위해 3단계 분석에서 합의에 도달할 때까지 검토자 간에 발생한 불일치를 논의했다. 선험적으로 생성된 테마와 유도적으로 생성된 테마는 표 1에 정의되어 있습니다(그림 1).
Iterative thematic analysis of our sample was conducted through a mixed deductive and inductive coding scheme to highlight which themes are unique to HPE studies of Gen Z and which persist across generations. We began by deductively and inductively coding a sub-sample of 15 randomly selected articles; each of these articles was read and analyzed by two members of the research team during this code-generating stage of analysis. Deductive coding applied the thematic framework developed by Jauergui et al. to reveal evidence of three a priori themes, which we defined as essentialism, generational othering, and generational humility. Simultaneous inductive coding identified novel themes that the team then collaboratively clustered and distilled. Each member of the research team next independently analyzed all articles in the sample for evidence of three a priori and two inductively-generated themes, as well as two overarching themes characterizing each publication in our sample. To ensure consistency, discrepancies that arose between reviewers were discussed until a consensus was reached in the third stage of analysis. A priori and inductively-generated themes are named and defined in Table 1 (Figure 1).

 

결과.
Results

개요
Overview

총 479건의 연구가 이루어졌고, 199건의 중복이 제거되었다. 280개 연구의 제목과 요약본을 심사하였으며, Z세대 HPE학생들에 대한 세대이론 적용에 명확하게 초점을 맞추지 못한 246개 연구는 기각되었다. 총 34개의 연구가 이 분석에 포함되었다. 포함된 연구는 2016년과 2021년 사이에 발표되었다. 우리의 표본 중 16개의 출판물은 간호 교육, 7개의 의학 교육, 4개의 약학 교육, 2개의 치과 교육, 5개에서 2개 이상의 보건 전문 교육 코호트와 관련이 있었다. 포함된 연구 목록은 부록 2에서 확인할 수 있다. 연역 부호화는 자우레귀와 동료들, [본질주의, 세대적 타성, 세대적 겸손]의 세 가지 선험적 주제와 귀납적으로 생성된 두 가지 새로운 주제, [변위 및 세대적 위치]의 증거를 보여주었다. 연구팀은 또한 두 가지 중요한 주제인 [대인관계 중심과 구조적 변화]를 확인했는데, 이 주제는 우리의 샘플에 포함된 기사의 범위를 지정하는 것이다.

A total of 479 studies were obtained, and 199 duplicates were removed. The titles and abstracts of 280 studies were screened and 246 studies that did not clearly focus on the application of generation theory to Gen Z HPE students were rejected. In total, 34 studies were included in this analysis. Included studies were published between 2016 and 2021. Among our sample, 16 publications pertained to nursing education; seven to medical education; four to pharmacy education; two to dental education; and five to two or more health professions education cohorts. The list of included studies is available in Supplementary Appendix 2. Deductive coding revealed evidence of three a priori themes adapted from Jauregui and colleagues, essentialismgenerational othering, and generational humility, and two novel, inductively-generated themes, displacement and generational situatedness. The research team also identified two overarching themes—interpersonal focus and structural changes—which designate the scope of the articles included within our sample.

기술 통계는 주제 빈도를 정량화하는 데 사용되었으며 표 1에 요약되어 있다. 확인된 주제의 빈도는 포함된 연구의 총 수를 분모로 사용하여 계산되었다. 식별된 주요 테마와 관련하여 선험적으로 생성된 테마의 빈도도 결정되었다. 이것은 분모로서 지배적 주제를 포함하는 총 기사 수와 지배적 주제를 포함하는 기사 수와 분자로서 선행 유도적으로 생성된 주제를 포함하는 기사 수를 사용함으로써 달성되었다. 이러한 서술적 통계는 샘플의 해당 기사에만 적용되지만, 이들이 설명하는 패턴은 HPE 내에서 생성 이론을 적용하는 것에 비해 더 광범위하게 일반화할 수 있다.
Descriptive statistics were used to quantify the frequency of themes and are summarized in Table 1. Frequencies of identified themes were calculated using the total number of included studies as the denominator. The frequencies of a priori and inductively-generated themes relative to identified overarching themes were also determined. This was accomplished by using the total number of articles containing the overarching theme as the denominator and the number of articles containing overarching theme and the a priori or inductively-generated theme as the numerator. Although these descriptive statistics hold only for those articles in our sample, the patterns they elucidate are more widely generalizable vis-à-vis the application of generation theory within HPE.

선험적 테마
A priori themes

HPE에서 밀레니얼 세대 이론에 대한 Jauregui와 동료들의 분석과 일관되게, 우리의 샘플에 포함된 기사의 주제 분석은 최근 HPE 문헌에서 [본질주의]와 [세대적 타자화]의 흔적을 모두 드러냈으며, 그들의 연구에서 옹호된 [세대적 겸손]의 희미한 흔적을 드러냈다. 우리 샘플 내의 [본질주의의 증거]는 [Z세대 학습자에 대한 광범위한 일반화 및 Z세대를 균일하고 균일한 개체로 나타내는 경향]에서 나타났다. 예를 들어, 'Z세대'는 '긴 대화에 참여하지 않고 짧은 조각으로 소통하는 진정한 디지털 네이티브'이다. …그들이 선호하는 커뮤니케이션 방법은 문자, 트위터, 스냅챗'이다와 같은 것이 있다. [본질주의화된 고정관념]의 흔한 것으로는 표본의 주제분석을 통해 드러났는데, Z세대 학생들은 [사회적 상호작용 기술이 감소]하고, [주의력이 짧으며], [전문성과 시간 관리에 어려움]을 겪는 것으로 특징지어진다.
Consistent with Jauregui and colleagues’ analysis of Millennial generation theory in HPE, thematic analysis of the articles included in our sample revealed traces of both essentialism and generational othering in recent HPE literature, as well as glimmers of the generational humility advocated for in their study. Evidence of essentialism within our sample emerged in sweeping generalizations about Gen Z learners—for example, ‘Gen Zer’s are “true digital natives”’ (Seibert, 2021, p. 86) who ‘do not engage in long conversations, communicating instead in short bits and pieces. …Their preferred communication method is texting, Twitter, and Snapchat’ (Williams 2019, p. 60)—and the tendency to represent Gen Z as a uniform, homogeneous entity. Common essentializing stereotypes surfaced through thematic analysis of the sample, which characterized Generation Z students as having decreased social interaction skills, short attention spans, and difficulties with professionalism and time management.

우리의 분석은 또한 [세대적 타자화]가 빈번한 일어남을 발견했다; 이러한 예들은 [단순히 반복적인 일반화]를 넘어, Z세대가 이전 세대의 학습자들보다 떨어지지는 않더라도 [최소한 교육자들에게 더 도전적이라는 것을 암시]한다. 즉, 더 필요하고, 더 자격이 있고, 전문 학교에 대한 준비가 덜 되어 있고, 위험을 회피하며, 강의와 같은 전통적인 교육 모드에 참여할 수 없거나 참여하지 않으려 한다는 것이다. 이를 위해 샘플의 기사는 이 세대의 인식된 결함에서 비롯된 [Z세대 HPE 학생들에게 적응하기 위한 제안]을 제안한다: 'Z세대는 온 디맨드 방식으로 정보를 얻는 데 익숙하기 때문에 과제를 완료하기 위해 마지막 순간까지 미루고 강사가 24시간 내내 질문을 받을 수 있기를 기대할 수 있습니다.'
Our analysis also uncovered frequent incidences of generational othering; these examples go beyond simply repeating generalizations to imply that Gen Z is, if not inferior to previous generations of learners, at least more challenging for educators: needier, more entitled, less prepared for professional school, risk-averse, and unable or unwilling to engage in traditional modes of instruction, such as lecture (Twenge 2017; Selingo 2018; Supiano 2019). To this end, the articles in our sample propose suggestions for adapting to Gen Z HPE students stemming from this generation’s perceived flaws: ‘Because Generation Z is accustomed to getting information on demand, they may procrastinate until the last minute to complete assignments and expect instructors to be available 24/7 for questions’ (Eckleberry-Hunt 2018, p. 379).

우리의 샘플 내에서 제시된 [세대적 겸손]의 예는 전형적인 일반화의 한계에 대한 인식을 보여준다. 예를 들면, '모든 Z세대가 이러한 사회적 고정관념과 일치해야 하는 것은 아니다'. 교육자들이 '유연성을 보여주고, 이 세대에 참여하기 위해 [기본적인 가정]과 [실제 수행]을 조정해야 한다'는 필요성도 있습니다. 따라서 [세대적 겸손]은 [세대적 타자화]와는 대조적으로 나타났으며, 이는 Z세대 보건 직업 학생들을 [본질주의화 하려는 고정관념을 복잡하게 만드는 것]과 [세대 간의 차별에 대항하는 것]을 모두 시사한다. 비록 이러한 세대적 겸손의 희미한 빛은 역설적으로 [본질주의]와 [세대적 타자화]의 증거와 함께 공존한다(각각 100%(16/16)와 94%(15/16)에서). 실제로, ['모든 세대 Z가 그런 것은 아니다']라는 표현조차도 고정관념적 규범으로부터의 편차가 측정될 수 있는 ['전형적인' Z세대 학생이 존재한다]를 가정하여 [연령 코호트에 대한 본질주의적 일반화를 암시적으로 강화]한다.
Examples of generational humility presented within our sample demonstrate an awareness of the limitations of stereotypical generalizations—e.g. ‘not all Generation Z has to be aligned with these social stereotypes’ (Vizcaya-Moreno and Pérez-Cañaveras 2020, p. 8)—and the need for educators ‘to demonstrate flexibility, adjusting our underlying assumptions and actual performance in order to engage (with) this generation’ (Cretu, Grigore, and Scripcariu 2020, p. 284). Generational humility thus emerged in contrast to generational othering, suggesting both a willingness to complicate essentializing stereotypes of Gen Z health professions students and to counter generational othering, though these glimmers of generational humility paradoxically coexist alongside evidence of essentialism and generational othering in 100% (16/16) and 94% (15/16) of this sub-sample of articles, respectively. Indeed, even the phrasing ‘not all Generation Z’ presumes a ‘typical’ Gen Z student against which deviation from a stereotypical norm may be gauged, thereby implicitly reinforcing essentializing generalizations about an age cohort.

귀납적으로 생성된 테마
Inductively-generated themes

우리의 샘플에서 반복되는 두 가지 귀납적으로 생성된 주제는 HPE의 Z세대 학습자에 초점을 맞춘 출판된 문헌에서 생성 이론이 어떻게 적용되는지를 보여준다. 첫째, 주제 분석은 우리 샘플의 47%(16/34)에서 생성 이론이 모든 것을 설명하는 역할을 하는 [변위displacement 패턴]을 드러냈다. [변위displacement]는 [학생의 disengagement를 Z세대의 소셜 미디어에 대한 '집착'의 결과]로 설명하는 것과 같은 [본질주의적 고정관념에 의존]하지만, 우리의 샘플에서 뚜렷한 주제, 즉 [교육학적 도전을 세대 차이 및 마찰에서 기인하는 것으로 돌리는 경향]으로 나타났다. 예로는 [Z세대 학생들의 인구집단의 변화]가 있으므로 [입학 이전에 학생 불만 패턴은 이미 존재하였다]고 설명하기 위해 사용하고, [보편적으로 건전한 교육 기법]을 [Z세대에게 고유한 베스트 프랙티스]로 리프레이밍하는 것이 포함된다. 여기에는 예를 들면, 적시에 평가 결과를 돌려주고, 학습 목표, 마감일 및 학생에 대한 기대 사항을 명확하게 설명하는 것 등이 있다.
Two inductively-generated themes recurring across our sample illuminate how generation theory is applied in the published literature focusing on Gen Z learners in HPE. First, thematic analysis revealed a pattern of displacement, whereby generation theory functions as an explanatory catchall, in 47% (16/34) of our sample. Displacement relies on essentialist stereotypes, such as explaining student disengagement as the result of Gen Z’s ‘obsession’ with social media, but emerged as a distinct theme in our sample, namely the tendency to attribute any number of pedagogical challenges to generational differences and/or friction. Examples include using generational shifts in the student population to explain patterns of student dissatisfaction that predate the matriculation of Gen Z students and reframing universally sound pedagogical techniques—e.g. returning assessments in a timely manner, clearly articulating learning objectives, deadlines, and expectations for students—as best practices unique to Gen Z learners (Selingo 2018; Eckleberry-Hunt 2018; Vizcaya-Moreno and Pérez-Cañaveras 2020; Cretu 2020; Lerchenfeldt 2020; Baier 2020; Hampton 2020; Attardi 2021; Chunta 2021).

둘째, 우리 표본의 41%(14/34)의 논문은 전통적인 세대 이론의 본질화 및 다른 충동에 대해 자우레귀와 동료들의 [세대적 겸손에 대한 정의를 초과하는 방식]으로 저항했다; 우리는 이것을 [세대적 위치성generational situatedness]으로 식별했다. 한 세대로 뭉친 [각 학생들의 특이성]에 관심을 기울이고, 이 [독특성을 포착하기 위한 세대 고정관념의 무능력을 인정]하는 것을 넘어(세대별 겸손), [세대적 위치성]은 이러한 학생들이 배우는 [사회 문화, 정치, 경제적 시대 내의 모든 세대의 학생들의 요구를 맥락화]한다. 예를 들어, '세대와 사회가 진화함에 따라 [HPE] 학생들도 진화할 것이다.' 따라서 '[변화하는 학생 집단]과 동시에 이뤄지는 [기술 발전]은 교실과 경험적 환경 내에서 교육학적 접근법의 평가와 잠재적 수정을 위한 자극이 되어야 한다.' 따라서 [21세기 보건직업교육이 교육, 학습, 실천의 요구에 어떻게 대응해야 하는지]를 평가할 때 세대적 위치성은 '입학생뿐만 아니라 더 많은 전체적 기대global expectation를 검토한다'는 것을 의미한다.
Second, 41% (14/34) of the articles in our sample resisted the essentializing and othering impulses of traditional generational theory in ways that exceeded Jauregui and colleagues’ definition of generational humility; we identified this as generational situatedness. Beyond attending to the singularity of each student lumped into a single generation and acknowledging the inability of generational stereotypes to capture this uniqueness (per generational humility), generational situatedness contextualizes the needs of any generation of students within the sociocultural, political, and/or economic era in which these students learn. For example, ‘As generations and society evolve, so too will [HPE] student[s],’ therefore, ‘the changing student population and simultaneous technological advances should be a stimulus for evaluation and potential modification of pedagogical approaches within the classroom and experiential settings’ (Isaacs 2020, p. 1387). Thus, generational situatedness entails ‘examining more global expectations as well as those present in students enrolling’ (Ford 2020, p. 698) when evaluating how health professions education ought to respond to the demands of teaching, learning, and practice in the 21st century.

아우르는 테마
Overarching themes

귀납적 분석은 샘플에 포함된 각 기사를 구성하는 [대인 관계 초점] 및 [구조적 변화]를 추가로 보여주었다.

  • [대인 관계 초점]을 채택한 논문은 [가정된 세대적 특성을 기반]으로 Z세대 학생들에게 [동기를 부여하고 참여시키기 위한 교육 전략 또는 모범 사례]에 초점을 맞추었다. 예를 들어, '교육 양식을 그들의 세대에 가장 적합하게 바꿈으로써 Z세대 학생들의 특정 요구를 이해하고 대응하는 것이 필수적이다.
  • 대안적으로, 보건의료전문직 및 HPE의 [구조적 변화]에 초점을 맞춘 논문들은, '21세기에 학생들이 실천할 수 있도록 [커리큘럼과 교육 방법을 업데이트]하는 것'을 주시하면서, '기술의 시대와 빠르게 변화하는 사회를 따라가기 위해, 간호사 교육자들은 [전통적인 교육학적 방법을 업데이트]할 필요가 있을지도 모른다.' 라고 권고한다.

Inductive analysis further revealed the interpersonal focus and/or structural changes that framed each of the articles included in our sample.

> Articles adopting an interpersonal focus demonstrated a focus on teaching strategies or best practices to motivate and engage Gen Z students based on their assumed generational characteristics, for example, ‘it is essential to understand and respond to the specific needs of Generation Z students by altering teaching modalities to best suit their needs’ (Edwards-Maddox et al. 2021, p. 543).
> Alternatively, articles focused on structural changes centered the changing nature of the health professions, and thus HPE, with an eye to updating curricula and teaching methods to better prepare students to practice in the 21st century, including recommendations that, ‘to keep up with the era of technology and the fast-paced society, nurse educators may need to update their traditional pedagogical methods’ (Oducado 2019, p. 80).

우리의 분석은 62%에서 배타적으로 대인 관계에 초점을 맞추고 26%에서 구조적 변화에 초점을 맞췄다. 그러나 이러한 중요한 주제는 상호 배타적이지 않으며, 12%에서는 두 가지 모두의 흔적이 감지되었다. 이 두 가지 중요한 주제와 관련하여 선험적으로 생성된 주제의 빈도를 분석한 결과 HPE에서 세대 이론의 적용에 대한 통찰력이 추가되었습니다. 상대적인 빈도수는 표 2에 요약되어 있습니다. 특히, 우리는 구조적으로 초점이 맞춰진 조각에서 displacement의 빈도가 크거나 크지만, 이러한 기사에서 어느 정도 구조적 초점을 보여주는 세대 겸손과 세대적 위치의 더 큰 발생률의 증거를 발견한다.

Our analysis surfaced an exclusively interpersonal focus in 62% and a focus on structural change in 26% of our sample; these overarching themes are not mutually exclusive, however, and traces of both were detected in 12% of the articles in our sample. Analyzing the frequency of a priori and inductively generated themes relative to these two overarching themes revealed added insight into the application of generation theory in HPE; relative frequencies are summarized in Table 2. Notably, we find evidence of a greater incidence of generational humility and generational situatedness within those articles demonstrating some degree of structural focus, though the incidence of displacement is as great, or greater, in structurally focused pieces.

논의
Discussion

세대주의와 세대학습자의 개념
Generationalism and the concept of the generational learner

우리의 표본에 걸친 [본질주의]와 [세대적 타자화]의 편재성[세대적 학습자라는 개념이 지속되고 있다]는 증거이며, 자우레귀와 동료들의 밀레니얼 고정관념에 대한 연구로 설명된 [세대 이론의 한계]를 더욱 드러낸다. 또한 자우레귀와 동료들이 [본질주의와 타자화]라는 문제적 패턴에 대한 대안으로 제시하는 [세대적 겸손]의 발생은 고무적이다. 더 많은 [환원주의적 주제(본질주의 및 세대적 타자화)]와 공존하는 것은 [세대 학습자와 세대 이론의 문제적 고정관념]에 대한 [사회적으로 구성된 신화를 완전히 제거할 수 없다]는 것을 의미한다.
The ubiquity of essentialism and generational othering across our sample is evidence of the enduring concept of the generational learner and further reveals the limitations of generation theory explicated by Jauregui and colleagues’ study of Millennial stereotypes. Furthermore, while the incidence of generational humility, which Jauregui and colleagues present as an alternative to problematic patterns of essentialism and othering, in our sample is encouraging, its coexistence with more reductionist themes (essentialism and generational othering) implies its inability to fully debunk the socially constructed myth of the generational learner and generation theory’s reliance on problematic stereotypes.

[본질주의적 사고]는 [권력 불균형을 구체화]하고 ['연령 코호트의 지각된 차이를 고착화']하기 위해 [세대 고정관념을 발동함]으로써, [세대 이론]의 뉘앙스를 납작하게 만들어서, [인종주의, 성차별주의 또는 능력주의와 유사한 인지적 편향]인 ['세대주의']로 변화시킨다. 특히 HPE 내에서 [세대주의]는 [학습자 집단을 참여]시키기 위해 [입증되지 않은 '베스트 프랙티스'의 채택]을 장려하지만, 이것은 [건전한 교육학적 연구]보다는 [본질주의적 고정관념에 뿌리]를 두고 있다. 보건 전문 교육의 고유한 높은 이해관계를 고려할 때, 특히 인식된 [학습자 선호도를 수용하기 위한 커리큘럼 변경은 성급하게 채택되어서는 안 된다]. 그럼에도 불구하고, 우리는 우리의 샘플에 포함된 [100%의 논문에서 본질주의의 요소들을 확인]했는데, 이는 [구조보다는 고정관념에 초점을 맞춘 세대적 사고의 한계]와 [미래의 동료를 훈련시키는 방법을 개념화하는 우리의 방식]을 [근본적으로 재고할 필요성]을 시사한다. 왜냐하면 [미래에 입학할 학생 코호트의 요구를 프레임화]하기 위해 [세대 이론을 활용]한다면, 이는 분명히 [세대주의를 영구화]하기 때문이다. 
Essentialist thinking invokes generational stereotypes to reify power imbalances and ‘entrench perceived differences in age cohorts,’ thereby transforming generational theory into ‘generationalism,’ a cognitive bias akin to racism, sexism, or ableism in its tendency to flatten nuance (Jauregui et al. 2020, p. 63). Within HPE specifically, generationalism encourages the adoption of unproven ‘best practices’ for engaging a new cohort of learners rooted in essentialist stereotypes rather than sound pedagogical research. Given the uniquely high stakes of health professions education, curriculum change—particularly that meant to accommodate perceived learner preferences—ought not to be adopted hastily (Buja 2019). Nevertheless, we identified elements of essentialism in 100% of the articles included in our sample, a pattern that suggests both the limitations of generational thinking focused on stereotypes over structures and the need to radically rethink our mode of conceptualizing how to train future colleagues, as the utilization of generation theory to frame the needs of an incoming student cohort clearly perpetuates generationalism.

[문헌에서 확인된 이러한 경향]은 [진화하는 학생 집단과 고등 교육 및 HPE의 전문적인 요구]에 대한 접근법에 [거의 변화가 없음]을 보여준다. 이는 특히 자우레귀와 동료들이 '밀레니얼 학습자의 신화'를 폭로한 것과 비교하면 더 그렇다. 따라서 HPE에서 [세대 이론의 결함]은 잘 문서화되어 있지만, [세대적 분열]에 대한 논평은 HPE 교육학이 진화하는 과정에서 [지금까지도 지속적인 프레임 방법이 되어 왔고, 앞으로도 그럴 것]이다. ['복잡한 연령 관련 현상']을 [세대를 가지고 설명하는 것]은 종종 ['익숙하고 편안하며, 채택하기 쉽고, 일견 정당한 것처럼 보인다']. 그러한 이유로, HPE 및 고등 교육에 걸쳐서 [교육 정책과 교육학의 지속적인 진화]를 만들어가는 과정에서 [심지어 불완전한 세대 프레임워크]의 가치를 입증해 보이려는 많은 수의 교사, 학자 및 관리자가 아직도 남아 있다. 다른 사람들은 [세대를 세분화하는 것]이 의료 소비자 선호도의 중요한 추세를 밝힐 수 있으므로 '사회에서 증가하고 변화하는 의료 요구사항에 부합'하도록 설계된 미래 의료 커리큘럼의 개발에서 고려되어야 한다고 주장한다.
This trend in the literature demonstrates how little has changed in approaches to evolving student populations and professional demands in higher education and HPE, specifically, as compared to Jauregui and colleagues’ debunking of the ‘myth of the Millennial learner.’ Thus, while the flaws in generation theory vis-à-vis HPE are well-documented, commentaries on generational divides have been and likely will continue to be a perennial framing method as HPE pedagogy evolves. Generational explanations for ‘complex age-related phenomena’ are often ‘familiar and comfortable, … easy to adopt, and seem legitimate on their face’ (Rudolph 2021, p. 946). As such, there remains a sizeable segment of teachers, scholars, and administrators across the spectrum of HPE and higher education more broadly who attest to the value of even imperfect generational frameworks in shaping the continued evolution of educational policy and pedagogy (Twenge 2009; Selingo 2018). Others maintain that attending to generational segmentation may illuminate important trends in health care consumer preferences, and therefore ought to be considered in the development of future medical curricula designed to ‘match the growing and changing health care needs in society’ (Busari 2013, p. 345).

[세대]는 [사회적 구성]으로서, '세대 고정관념의 편재성과, 다양한 연령대의 사람들을 묘사하는데 그러한 라벨을 적용하는 것이 사회적으로 받아들여지는 특성'이기에 발생한다. 이것이 지속되는 이유는 사회학적 현상에 대한 접근 가능한 '상식적' 설명을 제공하기 때문이다. 따라서 고등교육 내외의 세대차이에 관한 문헌은 효과적인 교육학적 방법에 대한 노력을 집중하기 위해 [인간의 행동과 우리의 집단적 상태]를 [분류]하려고 시도한다. 그러나, Borges 등은 X세대와 밀레니얼 의대생들 사이에서 성격적 특성의 차이를 발견했지만, 그들은 이러한 발견이 커리큘럼 설계와 전문적인 훈련에 미치는 영향에 대해 추가 연구가 필요하다고 결론 내렸다. [세대별 성격 차이]가 [교육 및 조언 실천의 효과]에 영향을 미치는지 여부와 그 방법을 입증하는 [강력하고 종단적인 연구가 없는 한], 우리는 [[세대적 학습자]의 요구라는 가정을 충족시키기 위해 HPE를 적응시키는 데 초점을 맞추는 것]이 보건 분야에서 [[모든 공급자]가 오늘날의 의료 문제를 해결할 수 있도록 준비]시키기 위한 지속적인 교육의 필요성을 흐릿하게 만들 것이라고 경고한다. 월시와 아벨슨의 세대 간 의료 전문성 연구가 보여주듯이, [보건 전문가들]은 생물 과학과 기술의 발전, 법과 정책의 변화, 사회 정치와 문화의 변화, 그리고 더 광범위한 경제 동향과 함께 적응하고 진화한다.
Generations are social constructions that emerge from ‘the ubiquity of generational stereotypes and the socially accepted nature of applying such labels to describe people of different ages’ and persist because they offer accessible, ‘common sense’ explanations for sociological phenomena (Rudolph 2021, p. 946). Accordingly, the literature on generational differences within and beyond higher education attempts to categorize human behavior and our collective condition in order to focus efforts on effective pedagogical methods (Howe and Strauss 1997; Isaacs 2020). Yet, while Borges et al. (2006) found differences in personality traits across Generation X and Millennial medical students, they concluded that the implications of these findings for curricular design and professional training required further study. In the absence of robust, longitudinal studies demonstrating whether and how generationally specific personality differences impact the effectiveness of teaching and advising practices, we caution that the focus on adapting HPE to meet the presumed needs of generational learners obscures the necessity for ongoing education in the health professions that prepares all providers to meet today’s healthcare challenges. As Walsh and Abelson’s study of medical professionalism across the generational divide demonstrates, the health professions adapt and evolve alongside bio-scientific and technological advances (Walsh and Abelson 2008), changes in law and policy, sociopolitical and cultural shifts, and broader economic trends.

[세대적 설명]이 익숙하다는 것을 넘어, 우리의 분석은 HPE의 오랜 도전과 새로운 도전 모두를 해결하기 위해 [세대 학습자의 신화에 지속적으로 의존해온 것]은 다음과 같은 이유 때문이었을 것이다.

  • [Z세대 학습자의 요구를 수용하기 위해 기존 커리큘럼을 조정하기 위한 팁]과 같은 [대인 관계 솔루션]은 [즉시 실행 가능한 것]으로 보이기 때문이다 
  • 반면, [21세기 임상 실습에 필요한 지식과 기술을 재평가하는 것]과 같은 [구조적 해결책]은 너무나도 거창해 보이기 때문이다.

그렇다면, HPE에서 세대 이론의 미래는 무엇인가? 우리는 매 15-20년마다 학생들의 필수화와 다른 새로운 집단의 같은 패턴을 반복해야 하는 운명인가, 아니면 [끊잆없는 사회문화적 변화와 직업적 변화에 대응하는 더 생산적인 방법을 상상]할 수 있는가?

Beyond the familiarity of generational explanations, our analysis suggests the continued reliance on the myth of the generational learner to address both longstanding and novel challenges in HPE may result

  • because interpersonal solutions, such as tips for adapting existing curricula to accommodate the needs of Gen Z learners, appear immediately actionable
  • whereas structural solutions, such as reevaluating the knowledge and skills necessary for clinical practice in the 21st century, are dauntingly large.

What, then, is the future of generation theory in HPE? Are we doomed to repeat the same patterns of essentializing and othering new cohorts of students every 15–20 years, or can we imagine a more productive way to respond to ongoing sociocultural and professional change?

 

세대론을 넘어선 세대론?
Generation theory beyond generationalism?

우리는 궁극적으로 HPE에서 교육학적 도전을 프레임화하고 실용적인 해결책을 찾는 수단으로 [세대 이론으로 회귀하는 것]이 [연령주의]와 [해로운 본질주의적 고정관념]을 영구화한다고 결론짓지만, 우리는 세대 변화에 대응하는 데 초점을 [더 큰 문제가 보이는 하나의 증상]으로 인식한다: 현재의 HPE에 대한 교육과정과 교육적 접근방식은 현장에서 인식되는 변화에 적응해야 한다. [대인 관계 초점]을 주로 채택하든 [구조적 도전]을 중심에 두든, 샘플에 포함된 기사의 중요한 주제를 식별하는 데 초점을 맞추는 것은 [HPE에서 세대 이론의 적용]을 숙고해보고, [가능하다면 거기서 벗어날 수 있는 새로운 관점]을 제시한다. 
While we ultimately conclude that the (re)turn to generation theory as a means of framing pedagogical challenges and seeking practical solutions in HPE perpetuates ageism and harmful, essentializing stereotypes, we recognize the focus on responding to generational changes as a symptom of the larger problem: that current curricular and pedagogical approaches to HPE must adapt to perceived changes in the field. Our focus on identifying the overarching themes of the articles included in our sample, whether they adopt primarily an interpersonal focus or center structural challenges, invites a new perspective through which to contemplate the application of—or, preferably, the move away from—generation theory in HPE.

  • 한 쪽에서 보면, [구조적 변화]에 초점을 맞춘 기사 내의 상대적으로 높은 빈도로 [변위displacement]가 등장하는 것은, [커리큘럼 및 교육학적 변혁의 구조적 원동력structural drives]에 맞추어진 HPE 출판물조차도, 여전히 무의식적으로 [Z세대의 고유한 요구(필수주의적 접근법)] 또는 [결함의 관점(세대적 타자화 방식)]으로 이러한 문제를 프레임할 수 있음을 시사한다 
  • 다른 쪽에서 보면, [구조적 변화]와 관련된 출판물에서 [세대적 겸손]과 [세대적 위치성]이 더 높은 빈도로 나타나는 것은 HPE와 실천에 영향을 미치는 [사회적, 경제적, 제도적 힘에 참여하는 것]이 세대 이론의 함정에 대한 효과적인 균형일 수 있음을 시사하며, 교육자로 하여금 미래의 동료들에게 [빠르게 발전하는 분야에서 practice를 하는 데 필요한, '관련성있고 효과적인 교육'을 제공할 수 있게 한다. 

On the one hand, the relatively high frequency of displacement within articles focused on structural changes suggests that even HPE publications attuned to the structural drivers of curricular and pedagogical transformation may still unwittingly frame these challenges in terms of Gen Z’s unique needs (an essentialist approach), or faults (by way of generational othering).

On the other hand, the greater incidence of generational humility and generational situatedness in publications concerned with structural changes suggests that attending to the social, economic, and institutional forces impacting HPE and practice may be an effective counterbalance to the pitfalls of generation theory, allowing educators to provide future colleagues with the relevant, effective training needed to practice in a rapidly evolving field.

학생이나 HPE 내의 광범위한 변화에 적응할 수 있도록 교육자를 준비시키기 위한 문헌의 중요한 목표를 식별하는 것은 [세대 차이]에 의존하는 연구의 추진력과 근거를 풀기 시작한다. 학계는 새로운 지식의 창조를 담당하고 있으며, 인간의 상태를 설명하기 위해 편리하고 접근 가능한 방법을 끊임없이 요구한다. [문화, 역사, 그리고 인간 행위자라는 별자리]는 연구 자체가 위치하는 교차점이며, 따라서 위에서 설명한 [세대적 위치성]이다. [세대적 위치성]을 보여주는 작가들은 그들의 내용과 방법에서 [예측적이고 미래지향적]일 뿐만 아니라, 그들의 [주제에 대한 역사적, 문화적 영향]에 대해 더 의식하고 있으며, 지금 이 순간을 더 면밀하게 알고 있다. [세대적 위치성]는 [변화하는 학생 인구에 적응하는 것]보다 [변화하는 시간에 맞춰 진화 것]에 중심을 두는 인식된 세대 분열에 대한 반응을 알려준다 —세대 이론에 대한 구조적 대 대인 관계적 접근법. 
Identifying the literature’s overarching aims—to prepare educators to adapt to students or broader changes within HPE—begins to unravel the impetus and rationale for studies that rely on generational differences. Academia is tasked with the creation of new knowledge, and constantly requires convenient and accessible ways to describe the human condition. This constellation of culture, history, and human actors are intersections where research situates itself, hence the generational situatedness described above. Authors who demonstrate generational situatedness are more aware of the historical and cultural impingements on their subject, conscientious in the present moment, as well as predictive and future-oriented in their content and methods. Generational situatedness informs responses to a perceived generational divide that center evolving to meet the changing times over adapting to a changing student population—a structural vs. interpersonal approach to generation theory.

궁극적으로, [한 세대를 다음 세대로부터 다소 자의적으로 분할하는 것]은 우리에게 고작 [한 개인이 태어난 때가 언제인가]를 알려줄 뿐이다; 사회 심리학자 Jean M Twenge에 따르면, '세대'를 이렇게 '다른 시기의 사회 문화적 환경에 대한 유용한 대리지표'로 이해한다면 [전문직 학생들이 성공을 위해서 무엇이 필요한가]에 대한 귀중한 통찰을 제공할 수 있을지 모르지만, 우리는 HPE 기관들이 [본질적으로 본질화하는 세대 이론을 배제]하고, 대신 [새로운 세대의 학생들의 추정된 요구]보다 [의료 및 고등 교육의 변화하는 본질에 적응]하는 데 초점을 맞추도록 권장한다.

Ultimately, the somewhat arbitrary partitioning of one generation from the next tells us little more than when an individual was born; while this understanding of a ‘generation’ as, per social psychologist Jean M. Twenge, a ‘useful proxy for the sociocultural environment of different time periods’ may offer valuable insight into what professional students need to be successful, we encourage HPE institutions to dispense with generation theory, which is inherently essentializing, and focus instead on adapting to the changing nature of healthcare and higher education, rather than the supposed needs of a new generation of students (Twenge 2017, p. 399).

[세대 차이]는 [특정한(그리고 사회적으로 구성된) 기간에 태어난 사람들이 고유한 본질적이고 내재적인 특성]보다는 [사회 문화적 환경 내에서 개인의 위치]에 기인한다. 따라서, 교육자들은 다가오는 보건 전공 학생들을 효과적으로 가르치기 위해서는 [Z세대를 이전의 코호트와 구별하는 것]이 [1995년과 2012년 사이에 태어난 사람들 사이에서 근본적으로 다른 것]이 아니고, 그 중심에는 ['현대 문화의 반영']이 있다는 이해에서 출발해야 한다. 따라서 HPE가 세대 이론을 완전히 포기하도록 설득할 수 없다면, [세대주의]보다는 [세대적 위치성]이라는 렌즈를 통해 새로운 도전을 맥락화할 때 이익을 얻을 것이다. 
Generational differences result from an individual’s situatedness within a sociocultural milieu rather than essential, intrinsic qualities unique to those born within a specified—and socially constructed—time frame. Thus, to effectively teach incoming health professions students, educators must start from an understanding that what distinguishes Gen Z from previous cohorts is, at its core, a ‘reflection of contemporary culture’ (Twenge 2009) and not something fundamentally, innately different about those born between 1995 and 2012. Thus, it follows that HPE would benefit from contextualizing novel challenges through the lens of generational situatedness rather than generationalism if they cannot be convinced to abandon generation theory altogether.

[세대의 사회적 구성]과 [세대 '이론'을 영속시키는 매력]을 존중하면서도, [세대적 위치성]는 [한 시대를 정의하는 경제적, 정치적, 사회 문화적, 역사적 순간]을 [모든 구성원이 유사하게 경험하고 영향을 받지 않을 것]이며, 이러한 [획기적인 순간들이 우리 사회의 가장 어린 구성원들에게만 영향을 미치는 것도 아니라는 것]을 우리에게 상기시킨다. 예를 들어, 코로나와 기술 발전이 [연령, 경제 계층, 연령, 인종 등]에 따라 [어떻게 다양한 방식으로 모든 환자와 제공자에게 영향을 미치는지]를 고려하도록 범위를 확장하면 HPE의 미래에 대한 더 생산적인 대화가 열린다.

Honoring the social construction of generations and the perennial allure of generation ‘theory,’ generational situatedness reminds us that not all members of an age cohort will experience and be affected by the economic, political, sociocultural, or historical moments that define an era similarly, nor do these epochal moments influence only the youngest members of our society. Broadening our scope to consider how COVID and technological advancements, for instance, impact all patients and providers in myriad ways unique to their age, economic class, age, race, and etc., opens more productive conversations about the future of HPE.

우리는 [보건 전문 교육자들]에게 [HPE에서 세대주의를 무분별하게 적용하는 것]을 비판하고, 보건 전문 학생들(그리고 기성 의료인]들이 [지속적으로 진화하는 전문직업적 풍경에서 practice할 수 있도록 준비하는 것]을 목표로 [교육을 조정할 때], [세대적 위치성]를 [세대적 겸손]의 필수적인 보완물로 채택할 것을 촉구한다.

  • '준비 안 된' 학생들의 '징징거림'을 한탄하기보다는, 우리의 보건의료전문직 훈련 프로그램이 [더 다양한 학생들에게 접근가능하고 포용적이게 보장함]과 동시에, 우리의 [학습 목표와 전문적 기대]를 명확히 하는 기회로 삼자. 
  • [짧은 집중력과 테크놀로지에 대한 집착]을 한탄하기보다는, [교육 테크놀로지을 활용하여 교육 및 학습을 보다 능동적이고 매력적으로] 만드는 동시에, [새로운 테크놀로지가 현대 의료행위에 어떻게 통합되는지 모델링하는 새로운 방법]에 대해 알아보자.
  • 요즘 학생들이 지나치게 '불안해하고' '위험을 회피한다'고 치부하기보다는, 미래의 의료 전문가들이 커리어의 성취를 이룰 수 있도록, 번아웃과 학자금 대출 부채에 대해 힘든 대화를 나누자.

We urge health professions educators both to critique the facile application of generationalism in HPE and to adopt generational situatedness as a necessary complement to generational humility as they adapt their teaching with the aim of preparing health professions students—and established providers—to practice in a constantly evolving professional landscape.

  • Rather than lament the ‘neediness’ of ‘underprepared’ students, let’s take this as an opportunity to clarify our learning goals and professional expectations, at the same time ensuring that our health professions training programs are accessible and inclusive to a wider diversity of students.
  • Rather than bemoan short attention spans and an obsession with technology, let’s explore novel ways to leverage educational technology to make teaching and learning more active and engaging, while also modeling how new technologies are integrated into contemporary healthcare practice.
  • Rather than dismiss this generation of students as overly ‘anxious’ and ‘risk-averse,’ let’s have hard conversations about burnout and student loan debt so that we can best prepare future healthcare professionals for fulfilling careers.

만약 우리가 [세대적 학습자의 신화를 포기하는 것]을 거부한다면, 적어도 [세대적 위치성]을 실천하기 위해 노력하고, 우리의 교육학적 관행의 변화에 대한 [구조적 동인structural driver]에 더 완전히 관심을 기울이도록 하자.
If we refuse to relinquish the myth of the generational learner, let us at least strive to practice generational situatedness and more fully attend to the structural drivers of change in our pedagogical practices.

한계
Limitations

우리는 현재 HPE 문헌에 대한 분석의 한계를 인정한다. 첫째, 우리 샘플의 대부분의 기사는 학부 간호학 문헌에서 나왔다. 이는 Z세대가 바칼로레아 후 보건 전문가 프로그램에 도착하기 전 평균 4년 동안 바칼로레아 간호 프로그램에 도착했기 때문에 예상되는 것이다. 따라서 이 분야에서 출판을 위한 진전된 시작이 있을 것이다. 그러나 젊고 큰 간호 코호트의 교훈의 적용 가능성은 의료 및 약학 교육을 포함한 모든 수준의 보건 전문가 훈련에 적용되지 않을 수 있다.
We acknowledge limitations of our analysis of current HPE literature. First, the majority of articles in our sample came from undergraduate nursing literature. This is to be expected, as Gen Z arrived in baccalaureate nursing programs on average four years before arriving in post-baccalaureate health professions programs, so there would be an advanced start to publishing in that field. However, the applicability of lessons of a younger and larger nursing cohort may not be applicable to all levels of health professions training, including medical and pharmacy education.

둘째, COVID-19 대유행이 시작된 후 사회적으로 멀리 떨어진 세계에서 필요한 변화에 대응하여 여러 Z세대 기사가 작성되었다. 교육자들이 유행병 학습 환경을 탐색하는 동안 기술적으로 숙련된 가상 학습자 세대를 가정할 가능성이 높기 때문에 이러한 초점은 본질주의와 세대 다른 요소를 증가시킬 수 있다. 마지막으로, 작가, 평론가, 그리고 코더로서 우리 자신은 모두 같은 대학 내에서 일하는 백인 중산층 밀레니얼 세대이기 때문에 본질주의적인 사고를 하는 경향이 있을 수 있다. 우리는 루빅 코딩을 적용하여 우리 고유의 편견을 인식하고 허들링하려고 시도했지만, 우리의 주관적 해석은 여전히 우리 자신의 사각지대를 위한 여지를 남길 수 있다.
Second, several Gen Z articles were written after the onset of the COVID-19 pandemic, often in response to necessary changes in a socially-distant world. This focus could augment elements of essentialism and generation othering as educators were more likely to assume a generation of technically-proficient, virtual learners while navigating the pandemic learning environment. Finally, as authors, reviewers, and coders we ourselves may be prone to essentialist thinking, as we are all white, middle-class Millennials working within the same university. We attempted to recognize and hurdle our own inherent biases by applying rubric coding, however our subjective interpretations may still leave room for our own dead angles.

결론들
Conclusions

Z세대 교수 및 학습과 관련된 HPE 문헌의 최근 출판물에 대한 주제 분석은 [세대 이론의 지속적인 매력]과 [세대 학습자의 지속적인 신화]를 보여준다. 이 접근법은 심각하게 환원적이어서, 보건의료전문계열 학생에 대한 고정관념에 의존하거나 심지어는 폄하하기까지 한다. 우리의 분석은 또한 [세대적 겸손]과 [세대적 위치성]에 대한 유망한 증거와, [세대적 학습자의 신화]를 파괴하고, [진화하는 전문직업적 및 학생집단의 요구에 대한 보다 총체적인 대응]을 장려하는 [세대 이론에 대한 접근법]을 보여주었지만, 우리는 [세대이론을 적용하는 본질주의]의 증거도 광범위하게 발견했다. 또한, 우리의 분석은 광범위한 교육학적 도전을 [세대 간 투쟁]으로 프레임화하는 변위displacement의 패턴도 보여준다. 이 접근 방식은 빠르게 변화하는 의료 분야에서 학생들이 실습할 수 있도록 준비하는 것을 목표로 하는 더 생산적인 교육학적 개입을 배제하는 것이 우려된다.
Thematic analysis of recent publications in HPE literature related to Gen Z teaching and learning reveals the enduring allure of generational theory and the persistent myth of the generational learner. This approach is problematically reductive, relying on essentialist stereotypes that other—and even disparage—health professions students. While our analysis also reveals
- promising evidence of generational humility and generational situatedness,
- approaches to generational theory that disrupt the myth of the generational learner and encourage a more holistic response to evolving professional demands, as well as student populations,

we find pervasive evidence of essentialism in the application of generation theory. Moreover, our analysis reveals a concerning pattern of displacement, whereby a wide variety of pedagogical challenges are framed as generational struggles—an approach we fear precludes more productive pedagogical interventions aimed at preparing health professions students to practice in a rapidly changing healthcare arena.


세대 프레임워크는 오랫동안 [HPE의 변화에 대한 편리한 약칭]을 제공했으며, 이는 [세대 학습자 신화에 무슨 매력이 있어서 사라지지 않는지]를 설명하는 데 도움이 된다. 그러나 이제는 우리는 현장과 학생 인구집단의 변화에 대해 [더 생산적이고 덜 문제적인 반응]을 찾아나갈 때이다. 소위 'Z세대' 학생들이 점점 더 많은 수의 HPE 프로그램에 등록함에 따라, 우리는 교육자들이 이러한 [학생들에 대한 일반화에 저항]하고, 대신 우리가 [현재와 미래의 의료 환경에서 학생들이 practice할 수 있도록 최선의 준비]를 하려면 [HPE에서 어떤 진화가 일어나야 하는지]에 대해 포괄적으로 생각할 것을 촉구한다.

Generational frameworks have long provided a convenient shorthand for changes in HPE, which helps to explain the enduring appeal of the myth of the generational learner, but it is time we find a more productive and less problematic response to changes in the field and within our student populations. As so-called ‘Gen Z’ students enroll in HPE programs in increasing numbers, we urge educators to resist generalizations about these students and to instead think comprehensively about what evolutions in HPE must occur if we are to best prepare our students to practice in present and future healthcare settings.


Med Teach. 2022 Oct 28;1-8. doi: 10.1080/0142159X.2022.2135428. Online ahead of print.

Generational situatedness: Challenging generational stereotypes in health professions education

Affiliations collapse

1College of Medicine, Northeast Ohio Medical University, Rootstown, OH, USA.

2College of Pharmacy, Northeast Ohio Medical University, Rootstown, OH, USA.

PMID: 36306344

DOI: 10.1080/0142159X.2022.2135428

Abstract

Purpose: Use of generation theory is pervasive within health professions education (HPE) literature, yet its application perpetuates unfounded generalizations that disadvantage learners. The objectives of this thematic analysis are first, to understand how generation theory is applied to 'Generation Z' HPE students and second, to propose a more productive framework for approaching evolutions within HPE.

Methods: A literature search was conducted to identify HPE publications pertaining to Gen Z learners. A thematic analysis was undertaken to identify a priori themes and uncover new themes.

Results: Qualitative analysis revealed evidence of three a priori themes as well as four newly identified themes across our sample.

Conclusion: The near ubiquity of essentialism and generational othering across our sample illustrates the ongoing challenges posed by generationalism in HPE discourse. While traces of generational humility and generational situatedness suggest a more holistic response to evolving student populations, we nevertheless discourage the continued use of generation theory to guide HPE pedagogy and instead urge educators to resist essentializing generalizations by thinking comprehensively about what evolutions in HPE must occur if we are to best prepare our students to practice in present and future healthcare settings.[Box: see text].

Keywords: Gen Z; Generation Z; Generation theory; health professions education.

성찰적 그리고 비성찰적 학생을 위한 성찰적 공간 만들기: 대그룹 글쓰기 세션에서 결정적 순간 탐색(Acad Med, 2020)
Creating Reflective Space for Reflective and “Unreflective” Medical Students: Exploring Seminal Moments in a Large-Group Writing Session 
Bruce H. Campbell, MD, Robert Treat, PhD, Benjamin Johnson, MD, and Arthur R. Derse, MD, JD

문제
Problem

자신을 "반성적이지 않다"고 묘사하는 바쁜 의대생들은 그들의 초기 임상적 만남의 실존적 스트레스, 모호한 감정, 죽음과의 붓, 도덕적 딜레마를 자발적이고 창의적으로 숙고할 것 같지 않다. 그러나, 매우 반성적인 학생들은 의도적으로 저널링을 하거나, 글을 쓰거나, 창의적인 표현을 위한 다른 배출구를 찾으면서 독립적으로 이러한 사건들에 집중하기 위해 잠시 멈출 수 있다. 의학 교육자들은 성찰을 모든 의사들에게 중요하고 필요한 기술로 보고 있으며, 대부분의 미국 의대들은 성찰 활동을 임상 전 교육과 임상 교육의 필수 구성요소로 지정하고 있다. 이러한 커리큘럼 요소들은 종종 성찰 능력과 성숙도의 증거를 위해 수집되고 평가되지만, 학생들은 빈번하고 조정되지 않은 성찰 활동이 "성찰 피로"를 초래할 수 있다는 점에 주목한다. 결과적으로, 빠르게 적응하는 학생들은 적절한 응답을 만들고 제출하는 것을 배울 수 있는데, 이는 진정한 성찰적 노력에서 비롯되지 않을 수 있다.
Busy medical students who describe themselves as being “unreflective” are unlikely to spontaneously and creatively contemplate the existential stress, ambiguous emotions, brushes with mortality, and moral dilemmas of their initial clinical encounters. However, highly reflective students might independently pause to focus on these events, intentionally journaling, writing, or finding other outlets for creative expression. Medical educators see reflection as a critical and necessary skill for all physicians,1 and most U.S. medical schools assign reflective activities as required components of preclinical and clinical education. These curricular elements are often collected and assessed for evidence of reflective capacity and maturity, but students note that frequent, uncoordinated reflective activities can lead to “reflection fatigue.”2 Consequently, students who adapt quickly can learn to create and submit appropriate responses, which may not result from actual reflective effort.3

우리는 위스콘신 의과대학(MCW)의 모든 학생들, 특히 초기 임상 경험이 있는 학생들에게 성찰적이고 서사-기반 기술 개발 활동을 제공할 기회를 찾고 있었다. 그 때 우리는 ERAS에 대한 personal statement을 작성하는 것에 대한 전체 3학년 수업을 위한 워크숍을 만들고 운영하라는 요청을 받았다. 우리는 성찰적인 활동을 워크숍과 연계할 것을 제안했다. 우리는 성찰적 글쓰기가 매우 개인적이어야 한다는 것을 인정했지만, 우리는 또한 학생들이 그들의 동료들과 함께 일하는 것에 이점이 있다는 것을 느꼈다.
We were seeking opportunities to provide reflective and narrative-based skill-building activities for all students at the Medical College of Wisconsin (MCW)—particularly those having their initial clinical encounters—when we were asked to create and run a workshop for the entire third-year class on creating a personal statement for the Electronic Residency Application Service (ERAS). We proposed linking a reflective activity to the workshop. We acknowledged that reflective writing should be intensely personal, yet we also felt that there were advantages for the students in working with their peers.

이에 학생들이 [3학년]의 중요한 순간을 파악하고 성찰적 글쓰기 연습을 통해 탐색하는 세션을 기획한 후 또래 집단 내에서 [메타 성찰(반사 과정에 대한 성찰)]을 진행하였다. 우리는 학생들의 글쓰기, 성찰, 서술 연습에 대한 인식, 특히 이번 세션에 대한 인식을 더 잘 이해할 수 있도록 수업 전후에 설문지 자료를 수집했다.
Therefore, we designed a session in which students identify the seminal moments of their third year and explore them through a reflective writing exercise followed by meta-reflection (reflection on the reflective process) within a group of peers. We gathered questionnaire data before and after the session to help us better understand students’ perceptions of writing, reflective, and narrative exercises in general and of this session in particular.

접근
Approach

2014년부터 MCW는 의과대학 교육과정 전반에 걸쳐 지속적인 전문직업성 개발의 일환으로 3학년에 2주의 필수 intersession를 추가했다. [1주일간의 intersession 프로그램]1월(학사 중간)에, 6월(3학년에서 4학년으로 전환)에 진행된다. 중간고사 주간은 학생들이 수업으로 다시 연결하고 나쁜 소식, 관심의 충돌, 다양성과 포용성, 생명윤리, 말기 관리, 개인 건강, 전공의 준비와 같은 주제에 대한 토론에 참여하도록 장려한다.
Beginning in 2014, MCW added 2 required intersession weeks to the third year as part of continuous professional development interspersed throughout the medical school curriculum. The first week-long intersession program is held in January (the midpoint of the academic year) and the second in June (as students transition from the third to the fourth year). The intersession weeks encourage students to reconnect as a class and to engage in discussions on topics such as breaking bad news, conflicts of interest, diversity and inclusion, bioethics, end-of-life care, personal wellness, and residency preparedness.

우리는 [4학년을 위한 레지던트 애플리케이션 개인 진술 작성 워크숍]을 진행하는 것을 바탕으로 [자기만의 개인 진술 써보기 세션]을 진행하도록 초대받았습니다. 2015년에 처음 제공되고 각 중간고사 프로그램의 일환으로 모든 3학년 학생들에게 요구되는 이 새로운 [1.5~2시간 세션]은 아래에 자세히 설명되어 있으며 차트 1에 요약되어 있습니다. 모든 학생들이 글쓰기 활동에 참여할 것으로 기대하지만, 세션 전후에 우리가 요구하는 익명의 연구 질문은 선택 사항이며, 세션이 끝날 때 그들이 쓴 글을 소리내어 읽거나 제출할 것이라는 기대는 전혀 없다는 것을 명시적으로 듣는다.
We were invited to facilitate a Creating Your Personal Statement session based on our ongoing voluntary fourth-year Residency Application Personal Statement Writers Workshops.4 This new 1.5- to 2-hour session—first offered in 2015 and required for all third-year students as part of each intersession program—is detailed below and outlined in Chart 1. Although all students are expected to participate in the writing activities, they are explicitly told that the anonymous research questions we ask them to complete before and after the session are optional and that there is no expectation that they will either read their writing aloud or submit it at the end of the session.

이 프로젝트의 연구 부분은 MCW 제도 검토 위원회의 승인을 받았고, 학술 문제를 위한 수석 부학장의 승인을 받았다.
The research portion of the project was approved by the MCW Institutional Review Board and endorsed by the senior associate dean for academic affairs.

ERAS 개인 정보 소개
Introduction to ERAS personal statements

학생들은 3학년 전체 수업(약 200명)을 수용할 수 있도록 설계된 방의 테이블에서 최대 8명의 학생들이 스스로 선택한 그룹으로 앉습니다. 이 세션은 인터넷, 문헌, 그리고 우리의 개인적인 경험으로부터 얻은 정보를 요약하는 개인 진술에 대한 소개로 시작한다. 리소스는 전자적으로뿐만 아니라 하드카피 형식으로도 공유됩니다. 
Students sit in self-selected groups of up to 8 at tables in a room that is designed to hold the entire third-year class (approximately 200 students). The session begins with an introduction to personal statements, which summarizes information from the Internet, the literature, and our personal experience. Resources are shared in hard-copy format as well as electronically.

워밍업 글쓰기: "재미있는" 글쓰기 연습
Warm-up writing: “Fun” writing exercise

소개가 끝난 후 학생들은 세션 설문지의 처음 5개 질문에 5점 척도(1 = 5에 강하게 반대 = 강하게 동의함, 표 1)를 사용하여 답변하고 세션이 끝날 때 완료되도록 설문지를 따로 준비해야 합니다. 그런 다음 [간단하고 재미있는 주제의 "자유롭게 쓰기"]를 해보게 된다 (이 글쓰기는 편집, 수정, 다시 읽지 않고 지속적으로 글을 쓰고, "내가 봤다"와 "내가 했다"를 "느꼈다"와 "생각한다"보다 더 많이 묘사하는 데 초점을 맞춘다.). 종이가 제공되고 학생들은 손으로 글을 쓰도록 권장되지만, 많은 학생들은 대신 노트북으로 작업하는 것을 선택한다. 일단 학생들이 그들의 프롬프트를 선택하면, 그들은 [5분 동안 중단 없이 글을 쓴다]. 그리고 나서 그들은 그들의 테이블 동료들과 그 [과정에 대해 토론]하도록 초대된다. 이들은 자신이 쓴 글의 내용을 마음에 들면 공유할 수 있게 돼 있지만, 글 자체보다는 글을 쓰는 과정에 대해 이야기하는 것이 권장된다. 

After the introduction, students are asked to answer the first 5 questions on the session questionnaire using a 5-point scale (1 = strongly disagree to 5 = strongly agree; Table 1) and to set the questionnaire aside to complete at the end of the session. They are then guided through a “free write” of a simple, fun topic (writing continuously without editing, correcting, or rereading, and focusing on describing what “I saw” and “I did” more than what “I felt” and “I think”). Paper is provided and students are encouraged to write by hand, but many choose to work on their laptops instead. Once students choose their prompt, they write for 5 uninterrupted minutes. They are then invited to discuss the process with their tablemates. They are allowed to share the content of what they wrote if they choose, but they are encouraged to talk about the process of writing rather than the writing itself.

성찰적 글쓰기 연습
Reflective writing exercise

다음으로, 주요 [성찰적 글쓰기 연습의 목표]가 설명되고(차트 1), 학생들은 자신이 쓴 것을 동료나 교수진과 공유하라는 요청을 결코 받지 않을 것임을 상기시킨다. 학생들은 보충 디지털 부록 1에 나열된 각 시나리오에 대해 1~2개의 단어를 적음으로써 이전 몇 달 동안의 임상 및 비임상 경험을 바탕으로 일련의 잠재적인 글쓰기 프롬프트를 작성하도록 안내받는다. 
Next, the goals of the main reflective writing exercise are described (Chart 1) and students are reminded that they will never be asked to share what they have written with their peers or the faculty. The students are guided to create a series of potential writing prompts based on their clinical and nonclinical experiences over the prior months by jotting down 1 or 2 words in response to each of the scenarios listed in Supplemental Digital Appendix 1 (available at https://links.lww.com/ACADMED/A808).

학생들이 시나리오 목록을 작성한 후 '보여줘, 말하지마'에 초점을 맞춰 [20분간 자유롭게 글을 쓸 수 있는 기준이 될 경험 중 1~2개를 선택]한다. 시간이 되면, 그들은 그들의 [글을 검토하고 소그룹 토론]에 참여한다. 그들은 글쓰기 과정에서 발생한 통찰력과 놀라움에 초점을 맞추도록 요청받는다. 그런 다음 소규모 그룹은 이러한 [통찰력을 전체 클래스와 공유]합니다. 
After students work through the list of scenarios, they select 1 or 2 of the experiences to serve as the basis for a 20-minute free write, focusing on “show, don’t tell.” When the time is up, they review their writing and engage in small-group discussions. They are asked to focus on the insights and surprises that occurred during the writing process. The small groups then share these insights with the entire class.

마무리
Wrap-up

실습을 마치면 학생들은 이 세션의 목적이 [자신의 임상 로테이션과 환자 치료 경험을 되돌아볼 수 있는 기회]를 제공하기 위한 것이었음을 상기하게 된다. 우리는 그들이 쓴 것이 그들의 개인적인 진술의 일부로 끝날 수 있다고 제안한다. 학생들은 교내 창의적 기회를 요약하고 검토한 후, 세션 시작 시 주어진 설문지의 마지막 3개 항목(표 1)을 완료해야 합니다. 서면 의견을 제시해 주십시오. 학생들은 설문지를 두고 가지만, 그들의 글을 가지고 간다. 추가적인 도움을 원하는 학생들은 세션을 진행하는 교수진과 직접 대화할 수 있다. 이 경험으로 인해 트라우마를 느끼는 학생은 누구나 교직원과 대화하거나 학생 정신 건강 서비스를 받을 수 있다. 
At the end of the exercise, the students are reminded that the purpose of the session was to offer them an opportunity to reflect on their clinical rotations and patient care experiences. We suggest that what they wrote could end up as part of their personal statement. After a summary and a review of on-campus creative opportunities, the students are asked to complete the last 3 items on the questionnaire they were given at the beginning of the session (Table 1). Written comments are encouraged. The students leave their questionnaires behind but take their writing with them. Students who want extra help can speak directly with the faculty facilitating the session. Any student who feels traumatized by the experience is encouraged to talk to a faculty member or is directed to student mental health services.

데이터 분석
Data analysis

첫 번째 8개 세션(2015년 1월 ~ 2018년 6월)의 설문지 데이터는 마이크로소프트 엑셀 for Office 365 데이터베이스(워싱턴주 레드먼드 소재 마이크로소프트 Corporation)에 입력되었다. 데이터는 IBM SPSS Statistics 24.0(IBM, Armonk, New York)을 사용하여 Spearmanrho 상관관계, 분산 분석 및 Mann-Whitney U-tests를 계산하였다. 자유응답 댓글은 긍정적, 부정적 또는 제안으로 분류되었다. 
The data from the questionnaires from the first 8 sessions (January 2015–June 2018) were entered into a Microsoft Excel for Office 365 database (Microsoft Corporation, Redmond, Washington). The data were analyzed with IBM SPSS Statistics 24.0 (IBM, Armonk, New York) to calculate Spearman rho correlations, analysis of variance, and Mann–Whitney U-tests. Free-response comments were classified as being positive, negative, or suggestions.

결과
Outcomes

2015년 1월부터 2018년 6월까지 진행된 8회 개인 진술 작성 세션에 참여한 MCW 3학년 학생들은 약 71%에 해당하는 1,139개의 익명 설문지를 반환했다(각 MCW 반에는 약 200명의 학생이 있으며, 각 학생은 두 번 참여하도록 배정되어 총 가능한 1,600개의 설문지 중에서. 설문지를 작성하지 않고 참석했거나 참석하지 않아 참석하지 못한 학생이 몇 명인지 파악할 수 없었습니다.) 제출된 1,139개의 설문지에서 유효한 응답은 질문당 1,115개에서 1,125개까지 다양했다(표 1). 설문지의 338개(30%)에도 최소 1개의 추가 서면 의견이 포함됐다. 
MCW third-year students participating in the 8 Creating Your Personal Statement sessions held between January 2015 and June 2018 returned 1,139 anonymous questionnaires, representing a questionnaire completion rate of about 71%. (Each MCW class had approximately 200 students, and each student was assigned to participate twice, for a possible total of 1,600 questionnaires. We were unable to determine how many students either attended without completing a questionnaire or failed to attend as attendance was not taken.) On the 1,139 questionnaires that were turned in, valid responses varied from 1,115 to 1,125 per question (Table 1). Three hundred and thirty-eight (30%) of the questionnaires also included at least one additional written comment.

이 자료는 학생들이 동료들이 성찰적인 활동을 어떻게 보는지 잘못 인식했다는 것을 보여주었다. 또래 학생들이 글쓰기, 성찰, 서술형 연습이 자신들보다 시간 낭비라고 느낀다는 데 동의하거나 강하게 동의하는 학생(이하 동의)이 2배 더 많았다(440/1119[39%] 대 209/1115[19%]).
The data demonstrated that students misperceived how their peers viewed reflective activities. Twice as many students agreed or strongly agreed (hereafter agreed) that their peers felt writing, reflective, and narrative exercises were a waste of time as they themselves did (440/1,119 [39%] vs 209/1,115 [19%]).

학생들은 또한 그들이 예상했던 것보다 더 많은 운동으로부터 이익을 얻는 것으로 보였다. 472/1,125명(42%)만이 창의적 글쓰기에 익숙하다는 데 동의했지만, 세션이 끝난 후 634/1,118명(57%)은 세션 중 자신의 글쓰기 양, 품질 및/또는 통찰력에 놀랐다는 데 동의했고 863/1,117명(77%)은 세션이 일부 수업에 대해 더 명확하게 생각하는 데 도움이 되었다는 데 동의했습니다초면의 만남. 대부분의 학생들(951/1,115[85%])은 그들이 임상 회전의 첫 달 동안 항상 기억할 수 있는 여러 번의 만남과 경험을 가졌다고 믿었다.
Students also appeared to benefit from the exercise more than they anticipated. Only 472/1,125 (42%) came into the session agreeing that they were comfortable with creative writing, yet after the session, 634/1,118 (57%) agreed that they were surprised by the amount, quality, and/or insight of their writing during the session and 863/1,117 (77%) agreed that the session had helped them think more clearly about some of their clinical encounters. Most students (951/1,115 [85%]) believed that they had several encounters and experiences during their first months of clinical rotations that they would always remember.

Spearman 상관관계(표 2)를 사용하여 우리가 발견한 가장 강력한 관계 중 하나는 [고등학교와 대학에서 더 많은 영어 또는 쓰기 수업을 듣는 것으로 보고된 학생]들이 쓰기, 성찰, 서술 연습을 [시간 낭비로 볼 가능성이 적다]는 것이다. 또한 이 학생들은 창의적이고 성찰적 글쓰기에 더 익숙했다. 이 세션이 임상적 만남에 대해 명확하게 생각하는 데 도움이 되었다고 보고한 학생들은 그들의 글의 양, 질, 그리고/또는 통찰력에 대해 동료들보다 더 많이 놀라고 있었다. 다가올 personal statements에 대해 생각하고 있다고 보고한 학생들은 [그들의 글쓰기의 질에 놀랐고, 그 세션이 그들의 임상적인 만남 중 일부에 대해 더 명확하게 생각하는 데 도움을 주었다]는 특성을 동료들보다 더 많이 보였다.

Using Spearman correlations (Table 2), one of the strongest relationships we found was that students who reported taking more English or writing classes in high school and college than their peers were less likely to view writing, reflective, and narrative exercises as a waste of time; these students were also more comfortable with creative and reflective writing. Students who reported that the session helped them think clearly about clinical encounters were more likely than their peers to be surprised by the amount, quality, and/or insight of their writing. Students who reported that they were thinking about their upcoming personal statements were more likely than their peers to be surprised by the quality of their writing and to indicate that the session helped them think more clearly about some of their clinical encounters.

우리가 발견한 더 약하지만 여전히 중요한 연관성은 [동료들보다 더 많은 영어나 쓰기 수업을 듣는다고 보고한 학생들]이 [동료들이 쓰기, 성찰, 서술 연습을 시간 낭비로 간주한다고 믿는 경향]이 [더 강하다]는 것이다. [글쓰기를 가장 편안하게 생각한 학생들]은 그들이 항상 기억할 것이라고 믿었던 초기 임상적 만남을 여러 번 경험했을 가능성이 더 높았다. 그들의 초기 임상 경험 중 몇 가지를 항상 기억할 것이라고 믿는 학생들은 그들의 글쓰기의 양, 질, 그리고/또는 통찰력에 더 많이 놀라고, 그 세션이 그들의 임상 경험에 대해 더 명확하게 생각하고 그들의 개인적인 진술에 대해 생각하는 데 도움을 주었다고 믿는다.
Weaker but still significant associations we found included that the students who reported taking more English or writing classes than their peers were more likely to believe that their peers viewed writing, reflective, and narrative exercises as a waste of time. The students who were most comfortable with writing were more likely to have had several initial clinical encounters they believed they would always remember. Students who reported believing that they would always remember several of their initial clinical experiences were more likely to be surprised by the amount, quality, and/or insight of their writing, believe that the session helped them think more clearly about their clinical experiences, and be thinking about their personal statements.

반대로 [성찰적 글쓰기를 시간 낭비로 보는 학생들]은 [또래 친구들도 같은 생각을 한다고 믿는 경향]이 더 높았다. 게다가, 그들은 그들의 동료들보다 영어와 글쓰기 수업을 덜 들었다고 믿는 경향이 더 있었다; 자신의 초기 임상적 만남들 중 몇 가지를 항상 기억할 것이라고 믿는 경향이 더 적었고, [자신의 글쓰기의 양, 질, 통찰력에 덜 놀라는 경향]이 있었다. 이들은 이 세션이 임상적인 만남에 대해 명확하게 생각하는 데 유용하다고 생각할 가능성도 낮고, 개인적인 진술에 대해 생각할 가능성도 적었다.
Conversely, students who viewed reflective writing as a waste of time were more likely to believe that their peers felt the same way. In addition, they were more likely to believe that they took fewer English and writing classes than their peers; were less likely to believe they would always remember several of their initial clinical encounters; were less likely to be surprised by the amount, quality, and/or insight of their writing; were less likely to believe that the session was useful in clearly thinking about clinical encounters; and were less likely to be thinking about their personal statements.

1월(중년)과 6월(3학년 말) 세션에서 서로 다른 반응을 이끌어낸 질문은 8번, "전공의 지원 개인 진술에 무엇을 포함시킬지 생각하기 시작했다"는 질문뿐이었다. ERA 마감일이 다가올수록 학생들은 개인 진술에 대해 생각할 가능성이 더 높았다. Mann-Whitney U-testing은 다른 모든 질문에 대한 응답이 세션 간에 안정적이라는 것을 보여주었다. 
The only question that elicited different responses between the January (midyear) and June (end-of-third-year) sessions was question 8, “I am starting to think about what I might include in my residency application personal statement,” confirming that students were more likely to be thinking about their personal statements as the ERAS deadline approached. Mann–Whitney U-testing demonstrated that responses to all the other questions were stable between the sessions.

2018년에는 학생들에게 3학년 때 반성적인 활동(쓰기 등)을 한 적이 있는지 묻는 질문을 추가했다. 이 질문에 응답한 280명의 학생 중 105명(38%)이 일부 성찰적이거나 창의적인 활동을 보고했다. 
In 2018, we added a question asking students if they had done any reflective activity (writing or otherwise) during the third year. Of the 280 students who responded to this question, 105 (38%) reported some reflective or creative activity.

세션이 끝날 때 모인 익명의 서면 의견은 성찰적인 쓰기 세션을 지속하는 데 도움이 되었습니다. 338건의 댓글 중에서, 
275명(81%)이 긍정적이었습니다(예: "대단한 세션!", "생각을 말로 표현하는 멋진 방법"), 18명(5%)은 부정적이었다(예: "글을 쓰기에는 너무 길다. "수갑 터널" "어떻게 이것이 긍정적인 경험이 될 수 있을까?" 그리고 44명(13%)이 제안을 했다(예: "반성적이거나 서술적인 글쓰기에 대해 더 많이 알려주세요" "연초에 이것을 해라.").
Written, anonymous comments gathered at the end of the sessions were supportive of continuing the reflective writing sessions (see Supplemental Digital Appendix 2 at https://links.lww.com/ACADMED/A808). Of the 338 comments received, 275 (81%) were positive (e.g., “Great session!” “Cool way to put thought into words”), 18 (5%) were negative (e.g., “Too long to write. Carpal tunnel.” “How could this be a positive experience?”), and 44 (13%) offered suggestions (e.g., “Say more about reflective or descriptive writing.” “Do this earlier in the year.”).

이 연구의 잠재적 한계는 다음을 포함한다 

  • (1) 검증되지 않은 설문지를 사용하여 하나의 캠퍼스에서만 수행되었습니다 
  • (2) 표본 크기가 크면 통계적으로 유의한 연관성 중 일부는 중요하지 않을 수 있습니다.

Potential limitations with this study include that

  • (1) it was performed at only one campus using nonvalidated questionnaires, and
  • (2) given the large sample size, some of the statistically significant associations might be unimportant.

다음 단계
Next Steps

글쓰기를 요청받은 시간에 대한 학생들의 서면 의견을 검토한 결과, 2019년에 우리는 자유 글쓰기 연습을 위한 완벽한 기간을 아직 정하지 못했지만 세션의 [성찰적 글쓰기 부분을 10분으로 단축]했다. 우리는 또한 [워밍업 "재미있는" 글쓰기 연습]을 학생들을 [서사 의학 기술에 노출시키기 위한 독서 연습]으로 대체했다: 우리는 [짧은 한 구절의 소설이나 에세이]를 함께 읽고, 학생들에게 [소그룹 토론에 참여]하도록 한 다음, 학생들에게 [독서의 "영항 속에서" 즉각적인 글을 쓰게] 했다. 나머지 세션은 그대로 유지되었다. 서면 댓글을 바탕으로 한 밀착독서 경험이 호평을 받았다.
Based on our review of the students’ written comments regarding the length of time they were asked to write, in 2019 we shortened the reflective writing portion of the sessions to 10 minutes, although we have yet to settle on the perfect duration for the free-writing exercises. We also replaced the warm-up “fun” writing exercise with a close-reading exercise5,6 to expose students to narrative medicine techniques: We read a short passage of fiction7,8 or an essay9 together, asked the students to engage in small-group discussions, and then had the students write to a prompt “in the shadow” of the reading. The rest of the session remained the same. Based on written comments, the close-reading experience was well received.

ERAS 제출 마감일 몇 주 전에 4학년 학생들에게 동료-편집 레지던트 애플리케이션 개인 진술 작성자 워크숍을 계속 제공하고 있습니다. 이러한 워크샵의 조합은 각 학생들에게 개인적인 진술에 대해 작업할 수 있는 여러 기회를 제공하고, 바라건대, 의미 있는 개인 및 그룹 성찰에 참여할 수 있는 기회를 제공합니다.
We continue to offer our peer-editing Residency Application Personal Statement Writers Workshops to the fourth-year students in the weeks before the ERAS submission deadline. The combination of these workshops offers each student multiple opportunities to work on their personal statements and, hopefully, engage in meaningful individual and group reflection.

우리는 [성찰적 글쓰기와 독서 활동]을 [그룹 환경에 통합]한 3학년 각 세션이 [임상 환경에서 서사적 순간]을 더 잘 이해하면서, 학생들에게 [자신의 경험에 대해 생각하고 쓸 수 있는 사적인 장소]를 제공하기를 바란다. 이 세션은 다음과 같은 두 가지 목표를 달성하려고 시도합니다: [교직원들]은 학생들이 좀더 성찰적이 되기를 바라고, [학생들]은 그들의 개인적인 진술을 시작하고 싶은 욕구가 있다. 학생들은 레지던트 신청서 개인 진술을 곰곰이 생각하면서, 초기의 필수임상실습에 몰입하기 때문에 타이밍으로는 최적이다. 이 접근법이 모든 의대생들(반성적이고 비반성적)이 배려심 있고, 동정심 있고, 유능하고, 통찰력 있는 의사가 되기 위한 여정을 위해 준비한다는 더 큰 목표에 어떻게 부합하는지 알아보기 위해 더 많은 데이터가 필요하다.
We hope that each of our third-year sessions, incorporating reflective writing and close-reading activities in a group setting, offers students a private place to think and write about their experiences while better understanding narrative moments in clinical settings. These sessions attempt to meet twin goals: Faculty hope that the students become more reflective, and the students have a desire to kick-start their personal statements. The timing is optimal since students are immersed in early, required clinical rotations while pondering their residency application personal statements. More data are needed to learn how this approach fits with the larger goal of equipping all medical students—reflective and unreflective, alike—for their journeys toward becoming caring, compassionate, competent, and insightful physicians.

 


Acad Med. 2020 Jun;95(6):882-887. doi: 10.1097/ACM.0000000000003241.

Creating Reflective Space for Reflective and "Unreflective" Medical Students: Exploring Seminal Moments in a Large-Group Writing Session

Affiliations collapse

Affiliation

1B.H. Campbell is professor of otolaryngology and communication sciences, Medical College of Wisconsin, Milwaukee, Wisconsin; ORCID: https://orcid.org/0000-0001-9485-5728. R. Treat is associate professor of emergency medicine and director of measurement and evaluation, Office of Academic Affairs, Medical College of Wisconsin, Milwaukee, Wisconsin; ORCID: https://orcid.org/0000-0003-2291-3858. B. Johnson is an otolaryngology resident, Wayne State University, Detroit, Michigan. A.R. Derse is the Julia and David Uihlein Chair in Medical Humanities, professor of bioethics and emergency medicine, and director, Center for Bioethics and Medical Humanities, Medical College of Wisconsin, Milwaukee, Wisconsin.

PMID: 32101930

DOI: 10.1097/ACM.0000000000003241

Abstract

Problem: Reflection is a critical skill for all physicians, but some busy medical students describe themselves as "unreflective." The authors sought to provide all third-year medical students at the Medical College of Wisconsin (MCW) with opportunities to explore seminal clinical and personal moments through reflective writing during workshops on preparing a personal statement for the Electronic Residency Application Service.

Approach: The authors developed and facilitated semiannual 1.5- to 2-hour sessions (January and June) for MCW third-year medical students (about 200 per class), pairing information on personal statements with reflective writing and group reflection activities. Students wrote reflectively but were not required to share their writing with peers or faculty. They discussed insights gleaned during the writing process in small groups and with the class. They completed pre- and postsession questions on an anonymous questionnaire.

Outcomes: Eight all-class sessions were held between January 2015 and June 2018. Students completed 1,139 of 1,600 questionnaires (completion rate of approximately 71%). They misperceived their peers' views of reflective activities. Twice as many students agreed their peers felt writing, reflective, and narrative exercises were a waste of time as they themselves did (39% vs 19%). While 42% entered the session comfortable with creative writing, 57% were surprised by the amount, quality, and/or insight of their writing during the session and 77% agreed the session helped them think more clearly about clinical encounters. Students who believed reflective writing was a waste of time were more likely to believe their peers felt that also, and they were less likely to believe the session helped them reflect on clinical experiences. Most written comments were positive.

Next steps: To expose students to narrative medicine techniques, the authors added a close-reading exercise and shortened the reflective writing activity in 2019, hoping this would better equip all students for their journeys.

눈치보기: 의학 수련과정에서 과소대표된 여성의 경험(Perspect Med Educ. 2022)
“Walking on eggshells”: experiences of underrepresented women in medical training
Parisa Rezaiefar · Yara Abou-Hamde · Farah Naz · Yasmine S. Alborhamy · Kori A. LaDonna

서론
Introduction

서구 세계에서 의학 분야에서 여성의 대표성이 증가하고 있으며, 경우에 따라서는 동등함에도 불구하고, 여성들은 그들의 경력 향상에 있어 상당한 사회 문화적, 구조적 장애에 계속 직면하고 있다. 여성은 남성에 비해 의료 분야에서 직무 만족도가 낮고, 소진율이 높으며, 임금 불평등을 경험한다[2,3,4]. 전 세계적으로, 여성 의사들은 또한 학문적 경력을 추구하거나, 지도자 자리를 얻거나, 승진할 가능성이 적습니다 [5,6,7,8]. 그러나 불평등은 단일-이슈 현상이 되는 경우가 거의 없다. 증거에 따르면 그러한 도전은 의사 대표가 부족한 여성(UWiM)에게 복합적으로 작용한다. 예를 들어, 2009년과 2018년 사이에 미국 의과대학의 전체 전임 여성 교수진의 비율이 꾸준히 증가했지만, 대표가 부족하다고 간주되는 인종 또는 민족 출신 여성의 비율은 13%로 정체되었다[6].  
Despite growing—and in some cases equal—representation of women in medicine across the Western world [1], women continue to face significant sociocultural and structural impediments to the advancement of their careers. Compared with their male counterparts, women experience lower job satisfaction, higher rates of burnout, and wage inequity in medicine [2,3,4]. Globally, women physicians are also less likely to pursue academic careers, attain leadership positions, or be promoted [5,6,7,8]. Inequity is rarely a single-issue phenomenon, however. Evidence suggests that such challenges are compounded for underrepresented women in medicine (UWiM). For example, although the overall proportion of full-time women faculty in US medical schools has increased steadily between 2009 and 2018, the percentage of women from a race or ethnicity considered to be underrepresented has stagnated at 13% [6].

최근의 형평성, 다양성 및 포용 노력은 부분적으로 의학에서 [과소 표현되는 것이 수반하는 복잡성]에 주의를 기울이지 않기 때문에 이러한 도전을 완화하지 못했다[9]. 예를 들어, "과소대표"의 개념화는 기관마다 매우 다양하다[10].

  • 일부는 URiM을 "일반 인구의 수에 비해 의료 직업에서 과소 대표되는 인종 및 민족 인구"로 개념화하면서 AAMC의 정의를 그대로 채택한다[11].
  • 다른 사람들은 URiM을 "인종, 민족, 사회경제적 지위, 건강 상태 또는 장애와 같은 개인적 특성이 의식적 또는 잠재의식적 편견이나 차별의 위험에 처한 개인"을 포함한다고 해석한다[10].
  • 캐나다 의학부 협회(AFC)는 URiM에 대한 공식적인 정의를 가지고 있지 않다. 그럼에도 불구하고 AFMC 지도부는 프로그램이 원주민, 여성, 장애인 및 가시적 소수자를 포함한 지정 지분 그룹을 어떻게 지원하고 있는지를 측정하는 데 도움이 되는 "캐나다 의대를 위한 형평성 및 다양성 감사 도구"를 개발했다[12].

Recent equity, diversity, and inclusion efforts have not eased these challenges, in part because efforts do not attend to the complexities of what being underrepresented in medicine (URiM) entails [9]. For instance, conceptualizations of “underrepresented” vary widely across institutions [10].

  • Some adopt the Association of American Medical Colleges definition verbatim, conceptualizing URiM as “racial and ethnic populations that are underrepresented in the medical profession relative to their numbers in the general population.” [11].
  • Others interpret URiM to include “individuals whose personal characteristics, such as race, ethnicity, socioeconomic status, health condition, or disability, place them at risk for conscious or subconscious bias or discrimination” [10].
  • In Canada, the Association of Faculties of Medicine of Canada (AFMC) does not have a formal definition of URiM. Nevertheless, AFMC leadership developed “the Equity and Diversity Audit Tool for Canadian Medical Schools” to help programs gauge how they are supporting designated equity groups, including Aboriginal peoples, women, persons with disabilities, and visible minorities [12].

URiM에 대한 [보다 광범위한 정의]는 지금까지 의료 교육 맥락에서 간과되고 충분히 탐구되지 않았던 가시적 및 보이지 않는 마커를 탐색하는 것의 [오랜 복잡성]에 고개를 끄덕인다[13]. 그러나 진정으로 의미가 있기 위해서는, [과소 표현의 정의]가 또한 어떻게 [가시적이고 보이지 않는 과소 표현된 정체성을 여러 개 갖는 것]이 [역사적으로 남성 우위적이고 이성적이며 유럽 중심적인 직업]에서 배우고 일하는 사람들을 위한 [소외를 복합할 수 있는지] 설명해야 한다. 1989년 페미니스트의 비판적 인종 학자인 킴벌레 크렌쇼는 [성별과 인종의 교차]로 인해 [흑인 여성]이 [[백인 여성]과 [흑인 남성]을 더한 것]보다 더 큰 차별을 경험한다는 사실을 설명하기 위해 [교차성]이라는 용어를 도입했다[16]. [젠더, 인종 또는 민족]을 [사회적 및 제도적 권력으로부터 분리]된 [단일monolithic 정체성]으로 접근하는 것은 "굴복이 중첩되는 시스템 내에서 그리고 페미니즘 및 반인종주의의 가장자리"에 위치할 수 있는 사람들을 효과적으로 지원하지 못할 위험이 있다[16]. 
More expansive definitions of URiM nod to the long-recognized complexities of navigating both visible and invisible markers [13], that have, so far, been overlooked and underexplored in the medical education context. However, to be truly meaningful, definitions of underrepresentation must also account for how having multiple visible and invisible underrepresented identities may compound marginalization for those learning and working in a historically male-dominant, heteronormative, and Euro-centric profession [14, 15]. In 1989, Kimberlé Crenshaw, a feminist critical race scholar, introduced the term intersectionality to account for the fact that, because of the intersection of their gender and race, Black women experience greater discrimination than both white women and Black men [16]. Approaching gender, race, or ethnicity as monolithic identities divorced from social and institutional power risks failing to effectively support those who may be located both “within overlapping systems of subordination and at the margins of feminism and antiracism” [16].

그들이 [UWiM이 되는 것의 의미와 영향]을 완전히 이해하지 못하는 한, 기관과 개인 의료 교육자들은 UWiM 교육생들의 개인적이고 전문적인 요구를 지원하기 위해 고군분투할 것이다. 의학 교육 학자들은 뉘앙스를 점점 더 요구하고 있지만, [과소 표현의 복잡성]은 여전히 탐구되지 않고 있다. 지금까지 우리가 아는 것은 [인종차별이나 성차별의 범위]를 정량화하는 데 초점을 맞추고 있다[19, 20]; 그러한 과소표현의 경험이 의사로서의 UWiMs의 인식에 [어떻게] 영향을 미치는지를 설명한 연구는 거의 없다. 이러한 이해에 따라 형평성, 다양성, 포용성 작업이 좌우되기 때문에 여성 교육생들이 의학에서 과소대표 개념을 어떻게 개념화했는지, 그들의 경험이 그들이 구상하는 진로에 어떤 영향을 미쳤는지를 조사하기 위해 정성적 탐구를 진행했다. 
Unless they have a fulsome understanding of the meaning and impact of being UWiM, institutions and individual medical educators will struggle to support the personal and professional needs of UWiM trainees. Medical education scholars are increasingly calling for nuance, yet the complexities of underrepresentation remain underexplored [17, 18]. So far, the little we know focuses on quantifying the scope of racism or sexism [19, 20]; few studies have elucidated how such experiences of underrepresentation influence UWiMs’ perception of themselves as physicians [21,22,23,24]. Since equity, diversity, and inclusion work depends on such an understanding, we conducted a qualitative exploration to investigate how women trainees conceptualized underrepresentation in medicine and how their experiences influenced their envisioned careers.

방법들
Methods

모든 연구 절차는 교육 프로그램과 관련된 두 개의 학술 기관(의전 #H-05-20-5708 및 #M16-20-036)의 기관 연구 윤리 위원회에 의해 승인되었다.
All study procedures were approved by Institutional Research Ethics Boards at two academic institutions affiliated with the training program (Protocols # H-05-20-5708 and # M16-20-036).

모집
Recruitment

모집은 2020년 6월부터 9월까지 진행되었다. YAH와 FN은 부서 목록을 사용하여 캐나다의 가정의학 대학원 교육 프로그램에 등록된 모든 연수생(n = 159)에게 채용 이메일을 보냈다. 정의에 대한 합의가 부족하고 캐나다의 의료 연수생 인구 통계에 대한 데이터가 부족하다는 점을 고려하여[25], 우리는 대표성 부족을 정의하지 않기로 결정했다. 대신, 우리는 참가자들이 인종이나 민족뿐만 아니라 성 정체성, 성, 종교, 나이, 신체적 체격, 장애(보이는 것 또는 보이지 않는 것) 또는 사회경제적 지위(SES)와 같은 특성에 근거하여 UWiM으로 스스로 식별하도록 초대했다. 
Recruitment took place between June and September 2020. Using a departmental list, YAH and FN sent a recruitment email to all trainees (n = 159) enrolled in a family medicine postgraduate training program in Canada. Given the lack of consensus around definitions and the dearth of data on medical trainee demographics in Canada [25], we elected not to define underrepresentation. Instead, we invited participants to self-identify as UWiM based not only on race or ethnicity, but also on characteristics such as gender identity, sexuality, religion, age, physical build, disability (visible or invisible), or socioeconomic status (SES).

데이터 수집
Data collection

우리는 풍부한 데이터를 생성하기 위해 "참가자들이 서로의 인식을 피드백하는" 방법인 그룹 인터뷰를 사용하여 데이터를 수집했습니다 [26, 페이지 100]. 그룹 인터뷰는 또한 YAH와 FN의 학술적 작업과 COVID-19 팬데믹 동안 UWiM 훈련생의 참여를 촉진했다. 구체적으로 연수생들의 학업일이 끝날 때 집단면접을 추가하는 것은 임상업무의 중단을 최소화하면서 여러 관점을 수집하는 이상적인 방법이었다. 
We collected data using group interviews, a method where “participants feed off of each other’s perceptions”[26, p. 100] to generate rich data. Group interviews also facilitated both the scholarly work of YAH and FN and the participation of UWiM trainees during the COVID-19 pandemic—a global emergency disproportionately affecting women, particularly those identifying as underrepresented. Specifically, adding group interviews at the end of trainees’ academic day was an ideal method of collecting multiple perspectives with minimum interruption to their clinical duties.

10명의 연습생들이 YAH가 이끄는 3개의 그룹 인터뷰 중 하나에 참여하는 것에 동의했다. 코로나19 제약 때문에 고투미팅을 이용해 단체 인터뷰를 진행했다. 각 인터뷰는 2-5명의 참가자가 참여했으며 45분에서 140분 사이에 진행되었다. 반구조화된 가이드를 사용하여 YAH는 대화를 안내하기 위해 다음과 같은 중요한 질문을 제시했다. 
Ten trainees consented to participate in one of three group interviews led by YAH. Because of COVID-19 restrictions, group interviews were conducted using GoToMeeting. Each interview was attended by 2–5 participants and lasted between 45 and 140 min. Using a semi-structured guide, YAH posed the following overarching questions to guide conversations:

  1. 1. 무엇이 당신을 UWiM이라고 정의합니까?
  2. 2. UWiM 정체성이 지금까지 훈련 경험에 어떤 영향을 미쳤습니까?
  3. 3. UWiM 정체성이 환자 및 의료 팀의 다른 구성원과의 상호 작용에 어떤 영향을 미쳤습니까?
  4. 4. UWiM으로서의 경험이 직업이나 직업 선택에 어떤 영향을 미친다고 생각하십니까?
  5. 1.What defines you as UWiM?
  6. 2.How has your UWiM identity influenced your training experience thus far?
  7. 3.How has your UWiM identity impacted your interactions with patients and other members of the healthcare team?
  8. 4.How do you perceive your experiences as a UWiM influence your professional or career choices?

모든 그룹 인터뷰는 NVivo 자동 전사 소프트웨어를 사용하여 오디오 녹음 및 전사되었다[27]. YAH와 FN은 녹취록의 정확성과 익명성을 보장했다. 
All group interviews were audio-recorded and transcribed using NVivo automated transcription software [27]. YAH and FN ensured the accuracy and anonymization of transcripts.

데이터 분석
Data analysis

성찰적 주제 분석에 대한 브라운과 클라크의 [28] 6단계 접근법에 따라 팀원들은 독립적으로 대본을 읽고 데이터에 익숙해졌다. 다음으로, YSA는 일련의 팀 미팅을 통해 개선되고 확정된 예비 주제를 식별하기 위해 선택적 코딩에 참여했다. 마지막으로, YAH와 YSA는 전체 데이터 세트를 재코딩했다. 분석 과정 전반에 걸쳐, 팀 구성원들은 데이터 패턴을 식별하여 의학에서 과소 표현된 참가자들의 경험을 이해하는 것을 목표로 점점 더 해석적인 분석 '스토리라인'을 구성했다. 
Guided by Braun and Clarke’s [28] six-phased approach to reflexive thematic analysis, team members independently read transcripts to familiarize themselves with the data. Next, YSA engaged in selective coding to identify preliminary themes that were refined and finalized over a series of team meetings. Finally, YAH and YSA re-coded the entire dataset. Throughout the analytical process, team members identified data patterns, constructing increasingly interpretive analytical ‘storylines’ aimed at understanding participants’ experiences of underrepresentation in medicine.

데이터 분석은 참가자의 관점을 중앙 집중화하는 [Anderson이 설명한 페미니스트 인식론]을 사용하여 inform되어졌습니다 [29]. 데이터를 연역적으로 분석하기 위해 선행 이론 프레임워크를 사용하지 않았지만, 우리는 [임계 인종 이론]과 [교차성]에 민감했다[16, 30, 31]. 구체적으로, 우리는 참가자들이 자신의 정체성을 개념화하는 방법, 자신의 정체성을 인식하는 것이 훈련 경험에 어떻게 영향을 미쳤는지, 그리고 그러한 경험을 탐색하는 것이 전문가로서의 자아 인식과 그들이 구상하는 미래의 실천에 어떻게 영향을 미쳤는지에 대해 들었다.
Data analysis was informed using the feminist epistemology described by Anderson, which centralizes participants’ perspectives [29]. Although we did not use an a priori theoretical framework to deductively analyze the data, we were sensitized to critical race theory and intersectionality [16, 30, 31]. Specifically, we attended to how participants conceptualized their identities, how they perceived their identities influenced their training experiences, and how navigating such experiences affected their self-perceptions as professionals and their envisioned future practice.

반사율
Reflexivity

각 연구자의 개인적이고 전문적인 경험이 분석 과정에 어떻게 영향을 미칠 수 있는지 사려 깊게 고려하는 과정인 반사성은 질적 엄격성의 핵심 요소이다[32]. 우리는 풍부한 반사 계정을 전자 보충 자료의 표 1에 포함시켰다.
Reflexivity—a process of thoughtfully considering how each researcher’s personal and professional experiences might influence the analytical process—is a key component of qualitative rigor [32]. We have included a rich reflexive account in Table 1 of the Electronic Supplementary Material.

40037_2022_729_MOESM1_ESM.docx
0.02MB

결과.
Results

참가자들은 다양한 범위의 정체성에 기초하여 UWiM으로 확인되었다(그림 1). 참가자의 절반은 국제 의학 졸업생이었고 절반은 영어를 모국어로 보고했다. 8명의 참가자들은 인종, 민족(때로는 이름이나 억양으로 유추하기도 한다), 또는 히잡과 같은 종교적 상징 때문에 [가시적 소수집단]의 일원이라고 보고했다. 소외감을 느끼는 데 기여한 다른 [비가시적 정체성]에는 성적 지향, 종교, 낮은 SES, 정신 건강, 이민 지위, 모성이 포함되었다. 그들의 익명성을 보호하기 위해, 우리는 종종 교차하는 참가자들의 신원에 대한 추가적인 설명적 세부사항을 제공하지 않았다. 
Participants identified as being UWiM based on a diverse range of identities (Fig. 1). Half of participants were international medical graduates and half reported English as their first language. Eight participants reported being a member of a visible minority because of race, ethnicity (sometimes inferred from one’s name or accent), or religious symbols such as the hijab. Other invisible identities that contributed to feeling marginalized included sexual orientation, religion, low SES, mental health, immigration status, and motherhood. To protect their anonymity, we have not provided additional descriptive details about participants’ often-intersecting identities.

 

눈에 보이든 보이지 않든 참가자의 정체성은 그들이 [전문직profession 전반에 걸쳐 친숙하고, 기대되거나, 일반적으로 받아들여지는 것]과 다르다는 보편적인 자기 인식(타자성otherness이라고 정의된 개념)을 낳았다[33]. 그러나, 참가자의 신원 표시가 보이는지 여부에 따라 다른 것의 경험과 시사점이 다르게 나타났다. 예를 들어, 인종차별을 당했거나 종교적 상징을 착용한 사람들은 명백한 차별 사례를 보고할 가능성이 더 높았다. 
Participants’ identities, whether visible or invisible, resulted in a universal self-perception that they were different from what was familiar, expected, or generally accepted across the profession—a concept defined as otherness [
33]. However, the experience and implications of otherness appeared to differ depending on whether participants’ identity markers were visible or not. For instance, those who were racialized or who wore a religious symbol were more likely to report overt instances of discrimination:

"저는 유색인종이기 때문에 환자들이 저로부터(지역 병원 두 곳)의 치료를 거부했습니다. 이로 인해 학습 기회가 사라지고 현장에서 이를 처리하는 방법을 모르는 직원들과의 상호 작용이 매우 어색해졌습니다."(P1, GI1)
“I’ve had patients refuse care from me at (two local hospitals) because I’m a person of colour. And that’s taken away learning opportunities and made for really awkward staff interactions who don’t know how to deal with that on the floor.” (P1, GI1)

반대로, [민족성, 성적 지향 또는 낮은 SES]와 같은 [덜 명백한 정체성 표지]를 가진 사람들은 그것의 직접적인 표적이 되기보다는 [편협한 행동을 목격]할 가능성이 더 높았다. 예를 들어, 혼합 인종으로서 "눈에 띄이지" 않은 참가자(P9, GI3)는 코로나바이러스 팬데믹의 맥락에서 동료들의 반중국 정서를 목격했다. 그녀는 다음과 같이 언급함으로써 동시에 다른 것과 겉으로 소속됨으로써 발생하는 해를 캡슐화했다.

Conversely, those with less readily apparent identity markers such as ethnicity, sexual orientation, or low SES were more likely to witness intolerant behaviour rather than be directly targeted by it. For example, a participant who did not “read as visibly” (P9, GI3) of mixed race witnessed anti-Chinese sentiment from colleagues in the context of the coronavirus pandemic. She encapsulated the harm caused by being simultaneously othered and outwardly belonging by noting:

"그런 정체성이 더 숨겨져 있다는 것은 많은 사람들이 내가 웃거나 그것에 동조할 것이라고 가정할 때, 실제로는 그것이 나에게 정말로 상처를 주거나 모욕적일 때 특정한 논평이나 농담을 하게 만들었다는 것이 흥미롭다." (P9, GI3) 
“It’s interesting that having those identities being more hidden has caused a lot of people to make certain comments or certain jokes, assuming I’m going to laugh or go along with it, when in reality, that’s really hurtful or offensive to me.” (P9, GI3)


[타자성]은 임상 작업장의 [명백한 차별]뿐만 아니라, 참가자들이 [누구나 자기에게 잠재적 위협이 될 수 있다고 가정]하도록 자극한 지금까지의 삶의 경험에서 비롯되었다. 레즈비언이라고 밝힌 한 참가자는 비록 그녀가 환자와 충격적인 만남을 가진 적은 없지만, [동성애 혐오증이 만연하다는 것]은 [그녀가 누구든지 그녀에게 해를 끼칠 수 있다고 가정해야 한다는 것]을 의미한다고 설명했다. 그녀는 자신을 표적으로 삼을 수 있는 사생활의 측면을 언제 어떻게 숨겨야 할지 곰곰이 생각해 보았다.
Otherness resulted not only from overt discrimination in clinical workplaces, but also from prior life experiences, which primed participants to assume that anyone could be a potential threat. One participant identifying as lesbian described that, although she had not had a traumatic encounter with a patient, the pervasiveness of homophobia meant that she had to assume anyone could cause her harm. She ruminated on when and how to hide aspects of her personal life that might make her a target:

"저는 모든 환자와의 상호작용을 할 때 이러한 계산을 하고 있습니다… [제 아내에 대해 이야기하는 것이] 그들이 저를 어떻게 생각하는지에 영향을 미칠까요? 그것은 당신이 마음 한구석에서 하고 있는 정신적인 일일 뿐이다."(P7, GI2)
“I am doing those calculations with every patient interaction … Will [talking about my wife] affect how they think of me? It’s just the mental work that you’re doing in the back of your mind.” (P7, GI2)

실제로 모든 참가자는 [차별을 예상]하고 실제 또는 인식된 위협에 대한 [방어적 행동을 가정]하는 데 상당한 시간과 에너지를 소비했다. 많은 참가자들이 임상 환경에서 종교적 신념을 공개하는 것에 대해 우려를 표명했기 때문에, [종교]는 신분 표시기의 가시성 또는 투명성이 잠재적으로 해로운 경험을 조작하는 참가자들의 능력에 어떻게 다양하게 영향을 미쳤는지를 보여주는 중요한 예이다. 예를 들어, [성적 지향을 비공개로 함]으로써 잠재적 동성애 공포증에 반응한 참가자 7처럼, 참가자 4는 매우 유감스럽게도 환자를 advocating하는 것을 자제했다. 왜냐하면 [공통된 종교적 믿음을 드러내는 것]이 자신의 능력에 대한 인식을 편향시킬 것을 두려워했기 때문이다:
Indeed, all participants spent considerable time and energy both anticipating discrimination and assuming defensive behaviours against real or perceived threats. Since many participants expressed apprehension about disclosing religious beliefs in clinical environments, religion is a key example illustrating how the visibility or invisibility of identity markers variably affected participants’ abilities to maneuver potentially harmful experiences. For example, like Participant 7 who responded to potential homophobia by keeping her sexual orientation private, Participant 4 refrained, with great regret, from advocating for a patient because she feared that revealing shared religious beliefs would bias perceptions about her competence:

"한 환자는 자신이 로마 가톨릭 신자라는 이유만으로 DNR을 거부했다. 선임 스태프 의사와 간호사들이 내 앞에서 그것을 놀리고 있었다. 난 그냥 입을 다물었어. 아무 말도 하지 않은 이유는 만약 당신이 어떤 말을 한다면, 그들은 "아, 당신의 종교나 감정이 당신을 어떤 방향으로 이끌게 한다면 당신은 유능한 의사로서 어떻게 기능할 것인가?"라고 말할 수 있기 때문입니다."(P4, GI1) 
“[A patient] refused the DNR simply because she said that she’s a Roman Catholic. The senior staff doctor and the nurses were making fun of that in front of me. I just shut my mouth. Didn’t say anything because if you say something, they might say, Oh, how would you function as a competent doctor if you let your religion or emotion lead you in a direction or another.” (P4, GI1)

이러한 [전략적 정체성 억압]은 [가시적 소수자 지위]를 가진 사람들에게는 더욱 복잡했다. 참가자들은 자신의 경험을 공유하면서 [자신의 정체성의 측면을 숨기는 능력]이 비록 힘을 잃기는 하지만, 동시에 모든 UWiM이 보편적으로 사용할 수 없는 특권이라는 것을 깨달았다.

  • 백인이었던 참가자 7은 [자신의 성적인 면을 숨긴다는 것]은 UWiM의 지위를 완전히 숨길 수 있다는 것을 의미했다.
  • 하지만 [히잡을 착용을 중단하는 것]이 도움이 될지 궁금했던 소외된 무슬림 참가자에게는 불가능한 일이다

Such strategic identity suppression was more complicated for those with visible minority status. In sharing their experiences, participants realized that the ability to conceal aspects of one’s identity, though disempowering, was simultaneously a privilege not universally available to all UWiM. For Participant 7 who was white, hiding her sexuality meant she could conceal her UWiM status entirely—an impossibility for a marginalized Muslim participant who wondered whether ceasing to wear hijab might help:

"저는 [히잡 때문에] 생각은 서구적이지만 민족적 외양을 보입니다. 이슬람 공포증이 있는 사람들이 있을 것이기 때문에 제가 분명히 이슬람교도처럼 보이게 하는 외모를 없애는 것이 더 나은 생각일까요? 저는 그것이 제 경력에 방해가 되는 것을 원하지 않습니다."(P10, GI3)“I am more Western-minded but more ethnic-looking [because of the hijab]. Is it a better idea if I sort of remove the look that makes me look very obviously Muslim, because some people will be Islamophobic? I don’t want that to stand in my way for my career.” (P10, GI3)

자신들의 민족성과 억양이 돋보인다고 보고한 참가자 4와 10에게 [눈에 띄는 종교적 상징을 제거]하거나, [종교적 소속을 숨기는 것]은 직장 차별을 방어하기 위한 부분적인 해결책에 불과했다. 모든 참가자들이 성별에 기반한 차별을 겪었지만, 타자성을 탐색하는 것의 부담은 [가시적 소수 집단의 구성원들]에게 더 컸다. 
For Participants 4 and 10, who reported that their ethnicities and accents made them stand out, removing a visible religious symbol or concealing a religious affiliation were only partial solutions for shielding against workplace discrimination. Although all participants were privy to gender-based discrimination, the burden of navigating otherness was magnified for members of visible minority groups:

"당신[참가자 7]이 우리의 경험 사이에서 강조한 차이점은 당신에게 challenge가 될 수도 있는 자신의 정체성 부분을 거의 숨길 수 있다는 것입니다. 반면에 저에게는 안녕하세요, 저는 블랙입니다. 모두가 내가 흑인이라는 걸 알아. 그래서, 저는 여러분이 성적 정체성이라는 주제에 대해 달걀 껍질 위를 걷는 것처럼 느끼는 것이 믿을 수 없을 정도로 스트레스가 될 것이라고 생각합니다. 그리고 어떤 순간에 누군가 부적절한 말을 할지도 모릅니다. 반면에 저는 제 주변의 모든 사람들이 블랙니스에 대해 잘못된 말을 하지 않으려고 노력하는 것처럼 느껴집니다. 그리고 나는 누군가가 잘못된 말을 하기를 기다릴 뿐이다." (P6, GI2)
“The difference that you [Participant 7] highlighted between our experiences is that you can almost hide the part of your identity that may become a challenge, right. Whereas for me it’s like, hello, I’m Black. Everybody knows I’m Black. So, I think it must be incredibly stressful for you to feel like you’re walking on eggshells around the subject of sexual identity and that at any moment somebody might say something inappropriate. Whereas for me, I feel like everybody around me is walking on eggshells and trying not to say the wrong thing about Blackness. And I’m just waiting for someone to say the wrong things.” (P6, GI2)

참가자들의 차별과 타자성 경험은 [교수진의 지원 부재]로 인해 악화되었다. 특히, 그녀를 대신하여 옹호하는 한 교수진의 사례를 공유한 참가자는 없었다. 더 나쁜 것은, 교직원들이 그들의 권한을 개입시키는 데 실패함으로써 차별을 영구화했다는 것이다. 
Participants’ experiences of discrimination and otherness were exacerbated by the absence of faculty support. Notably, no participant shared an example of a faculty member who advocated on her behalf. Worse, faculty members perpetuated discrimination by failing to use their authority to intervene:

"그것을 무시하는 사람들이 가장 좌절스럽다. 내가 방으로 걸어 들어가 눈물을 흘리며 걸어나오는 것이 괜찮다고 생각하는 사람들은 그냥 '걱정하지 마, 내가 그 환자 볼게'라고 말한다. 그건 도움이 안 돼요. 내가 그런 학대를 당했다는 사실을 인정하지 않는 것은 도움이 되지 않습니다."(P1, GI1)
“The ones that ignore it are the most frustrating. The ones that think it’s okay for me to walk into a room, walk out with tears in my eyes, and then just [say] ‘don’t worry about it, I’ll see that patient then.’ That’s not helpful. You not acknowledging the fact that I’ve gone through that abuse is not helpful.” (P1, GI1)


[차별, 타자성, 그리고 교수진의 옹호의 부족]에 대한 경험은 참가자들이 [그들의 professional paths을 어떻게 개념화하는지]에 지대한 영향을 미쳤다. 대부분은 더 안전하고 포괄적인 임상 및 학습 환경을 만드는 것을 목표로 하는 진로를 구상했다. 예를 들어, 정신 건강과 씨름하는 한 참가자는 미래의 훈련생들을 위해 개인적인 취약성을 제거하도록 동기를 부여받았다.
Experiences of discrimination, otherness, and the lack of faculty advocacy profoundly influenced how participants conceptualized their professional paths. Most envisioned a career path aimed at creating safer, more inclusive clinical and learning environments. For instance, a participant who struggled with mental health was motivated to de-stigmatize personal vulnerabilities for her future trainees:

"정신 건강과 관련된 일이 있다면, 디스트레스를 받는 사람으로서 [도움을 구하는 것]과 [벗어나는 것] 사이의 선을 긋는 것은 정말 어렵습니다. 내가 곧 staff이 될 거라는 걸 알아. 새로운 전공의들을 만나면 꼭 하고 싶은 말인 것 같아요… '스트레스를 받는다면 알려주세요'."(P2, GI1)
“If you have anything going on with mental health, it’s really difficult to tread the line between help seeking and coming off as a person who’s in distress. I know I’m going to be staff very soon. I think it’s something that I try and say when I meet new residents … ‘If you’re feeling stressed, let me know’.” (P2, GI1)

또한 참가자들은 [개인적 차별 경험]이 독특할 수 있지만, [소외받는다는 것]의[ 공통된 어려움]이 공통점을 확립한다는 인식으로 취약한 환자 집단에 봉사하고자 하는 강한 열망을 나타냈다.
Additionally, participants expressed a strong desire to serve vulnerable patient populations—perceiving that while individual experiences of discrimination may be unique, the shared hardships of being marginalized established common ground:

"저는 도심의 건강을 정말 좋아하고 중독 치료제가 흥미롭다고 생각합니다. 나는 난민 건강이 매우 흥미롭다고 생각한다. 그리고 이것들은 모두 나에게 영향을 미치지 않는 분야들이다… 하지만 내 경험들 때문에, 나는 그들의 경험들을 이해하고 공감하기 위해 내 마음을 확장할 수 있을 것 같다." (P6, GI2)
“I really love inner city health and find addictions medicine interesting. I think refugee health is very interesting. And these are all areas that don’t affect me … But because of my experiences, I feel like I can sort of stretch my mind to understand and empathize with their experiences as well.” (P6, GI2)

하지만, 비록 참가자들이 공감과 이타주의로 의학을 가르치고 실천할 수 있는 힘을 부여받은 살아있는 역경에서 벗어났지만, [개인의 안전에 대한 필요성]에 의해 동기 부여된 것처럼 보였다. 이는 그들의 직업 선택은 또한 [차별로부터 스스로를 떨어뜨릴 수 있는 전문적인 공간을 개척하는 것]을 목표로 함을 뜻한다. 예를 들어, 참가자 7은 그녀의 현재 현실과 그녀가 청소년과 LGBTQ+ 환자들과 함께 일하는 것을 상상했던 미래를 비교했다. "나는 청소년 인구에 끌린다." (P7, GI2) 구체적으로, 그녀는 "당신과 같은 동맹자나 동일시하는 사람들을 찾는 것"(P7, GI2)이 환자뿐만 아니라 자신을 위한 진정하고 포용적인 방법으로 practice할 수 있도록 힘을 실어줄 것이라고 믿었다. 참가자 3은 안전에 대한 유사한 열망을 나타냈다. "나는 단지 내가 같은 생각을 가진 사람들 주변에 있고 이 [과잉 차별]에 대해 강조할 필요가 없는 환경으로 가고 싶다."(P3, GI1)
However, although participants emerged from lived adversity empowered to teach and practice medicine with empathy and altruism, their career choices also seemed motivated by a need for personal safety, aiming to carve out a professional space where they could insulate themselves from discrimination. For instance, Participant 7 contrasted her current reality with the future she envisioned working with adolescents and LGBTQ+ patients: “I’m drawn to the adolescent population” (P7, GI2). Specifically, she believed “finding your allies or people who identify like you” (P7, GI2) would empower her to practice in an authentic and inclusive way not only for patients but also for herself. Participant 3 expressed a similar desire for safety: “I just want to go to an environment where I’m around like-minded people and don’t have to stress about this [overt discrimination]” (P3, GI1).

논의
Discussion

UWiM 인터뷰 대상자들은 훈련 중에 현재 정의에서 과소 표현의 측면으로 항상 개념화되지 않는 [다양한 정체성 마커]를 설명했다. 참가자들의 설명은 UWiM 연습생들이 겪는 공개적이고 은밀한 차별의 빈도뿐만 아니라 학업 환경에서 자행되는 해악을 예측하고 회피하기 위해 그들이 소비하는 [상당한 인지적, 감정적 노동]에 대해서도 조명한다. 우리의 연구는 타자성과 차별이 어떻게 UWiM에게 의료 교육 환경을 억압적이고 적대적으로 만들 수 있는지 이해하는 데 매우 필요한 출발점을 제공한다.
UWiM interviewees described a variety of identity markers that made them feel othered during their training that are not always conceptualized as facets of underrepresentation in current definitions. Participants’ accounts shed light not only on the frequency of overt and covert discrimination UWiM trainees endure, but also on the considerable cognitive and emotional labor they expend to anticipate and deflect harms perpetrated in academic environments. Our study provides a much-needed starting point for understanding how otherness and discrimination may make the medical education environment oppressive and hostile for UWiM.

참가자들의 설명은 [권력과 특권이 지배적인 집단의 구성원들]이 [그들에게 강요하는 렌즈]를 통해 [피지배된 사람들이 어떻게 생각하고 행동하도록 강요하는지] 보여준다. 이에 대응하여 그리고 억압에 대한 생존 메커니즘으로서 소수 집단의 구성원들은 지배적인 문화의 렌즈를 통해 자신들의 정체성을 재정립할 수밖에 없는데, 이 현상은 1903년에 Du Bois[34]에 의해 아프리카계 미국인들의 맥락에서 설명되었고 더 나아가 데보라 그레이 화이트에 의해 인종화된 여성들을 포함하기 위해 "삼중의 의식"으로 발전했다. 흑인 여성에게만 초점을 맞춘 것이 아니라 캐나다의 맥락에서, 우리 참가자들의 경험은 [삼중의 의식]과 공명한다. 연구 참가자들은 다음과 같은 방식으로 다중의 '타자화된' 정체성을 조작했다[35].

  • 잘 알려진 트라우마 반응(잠재적 위협에 대한 학습 환경의 초경계 또는 "과도한 스캔")에 engage하고 
  • 소속을 용이하게 하거나 공공연한 차별을 피하기 위해 정체성 측면을 은폐함으로써 

Participants’ accounts demonstrate how power and privilege force subjugated populations to think and act through lenses that members of dominant groups impose on them. In response and as a survival mechanism to oppression, members of minority groups are forced to redefine their identity through the lens of the dominant culture, a phenomenon described by Du Bois [34] in 1903 in the context of African Americans and further developed as “triple consciousness” by Deborah Gray White to include racialized women. Though in the Canadian context and not solely focused on Black women, our participants’ experiences resonates with triple consciousness. Study participants maneuvered their multiple, ‘othered’ identities

  • by engaging in well-known trauma responses [35], including
    • hypervigilance or
    • “excessive scanning” [36] of their learning environment for potential threats, and
  • by concealing aspects of their identities to either facilitate belonging or to avoid overt discrimination [37,38,39].

그러나 [완전한 신분 은폐]는 [특권의 한 형태]로 언급되었다. 따라서 과소대표라고 식별하는 백인 여성은 확실히 직장 차별에 의해 피해를 입지만, 그들의 [백인성]은 [교차성 탐색의 부담을 덜어주는] "특수 조항, 지도, 여권, 코드북, 비자, 옷, 도구 및 백지 수표와 같이 [보이지 않는 무중력 배낭]"을 제공한다[40].

Full identity concealment was noted as a form of privilege, however. Thus, although white women who identify as underrepresented are certainly harmed by workplace discrimination, their whiteness affords “an invisible weightless knapsack of special provisions, maps, passports, codebooks, visas, clothes, tools and blank checks” that ease the burden of navigating intersectionality [40].

그럼에도 불구하고, 참가자들의 계정은 차별의 트라우마와 임상 학습 환경에서 다른 것을 탐색하는 데 소요된 감정적 노동을 모두 보여주었다[41, 42]. 레지던트 훈련의 전형적인 스트레스를 관리하면서 참가자들의 학습 관심과 정서적 에너지는 [의사로서 자신이 되어야 할 사람과 맞지 않을 수도 있다는 신호]에 의해 끊임없이 우회divert되었다. 특히 리더십과 학문적 지위로 함축된 [권력이 대부분 백인 남성들의 손에 남아있는 학문적 환경]에서 말이다. 참가자들의 경험은 주로 백인 훈련 환경에서 흑인 의대생이 되는 것에 대한 대가를 설명하는 사설에서 Monnique Johnson이 최근 발표한 것과 공명했습니다: "저에게 있어서, 이러한 공간에서 상호작용을 해야 할 때 [제 전체가 유니폼이나 마스크]처럼 느껴졌습니다. 탈진은 [내 자신이 당당하고 진실되게 나 자신일 수 있는 공간]이 없고, [나와 공감할 수 있는 사람들이 충분하지 않은 것]에서 비롯됐다."
Nevertheless, participants’ accounts revealed both the trauma of discrimination and the emotional labor spent navigating otherness in clinical learning environments [41, 42]. While managing the typical stresses of residency training, participants’ learning attention and emotional energy were constantly diverted by signals that they may not fit who they are supposed to be as doctors, particularly in academic settings where power, connotated by leadership and academic rank, remains mostly in the hands of white men and, to a lesser extent, white women [6, 43,44,45]. Participants’ experiences resonated with those published recently by Monnique Johnson in an editorial explicating the toll of being a Black medical student in primarily white training environments: “For me, my whole being when I had to interact in these spaces felt like a uniform or a mask. Exhaustion came from not having a space to be unapologetically and authentically myself and not having enough people who could relate to me” [46].

참가자인 존슨 씨와 다른 사람들의 증언은 [학습 경험과 구조의 형평성]에 대한 의문을 제기한다. 기관 지도자들과 의료 교육자들은 대표자가 부족한 훈련생들이 훈련 중에 종종 침묵과 사일로에서 상당한 정체성 불협화음을 경험한다는 것을 인식해야 한다.
Testimonies by participants, Ms. Johnson, and others raise questions about the equity of learning experiences and structures. Institutional leaders and medical educators must recognize that underrepresented trainees experience significant identity dissonance during their training, often in silence and in silos.

또한 의학은 UriM 또는 UWiM으로 식별되는 훈련생이 [차별의 트라우마를 치유할 수 있는 충분한 공간을 제공하지 않는다]는 점을 유념해야 한다[47]. 지원을 받지 못한 참가자들은 자신의 개인적 정체성과 이상화된 직업 정체성 사이의 긴장을 관리하기 위해 홀로 남겨졌고, 평생 개인적, 경력적 결과를 초래할 수 있는 두려움과 배제에 뿌리를 둔 결정을 내렸다. UWiM 훈련생들이 차별에 직면했을 때 보고하고 그러한 경험이 그들의 직업 정체성과 의도된 직업 선택에 미치는 영향을 성찰하기 위해 신뢰할 수 있는 멘토의 지도 하에 안전한 공간이 필요하다. 비록 여성들, 특히 대표가 부족한 사람들은 그들의 경력을 육성하기 위해 숙련되고 동정적인 멘토가 필요하지만, 그들은 그것이 일어날 때 차별을 호소하고 여성들에게 개인적으로 그리고 직업적으로 영향을 미치는 차별적인 힘을 해체하기 위해 의미 있는 행동을 취할 수 있는 옹호자들이 더 필요하다.
We must also be mindful that medicine does not provide adequate space for trainees who identify as URiM or UWiM to heal from the trauma of discrimination [47]. Unsupported, participants were left alone to manage the tension between their personal and idealized professional identities, making decisions rooted in fear and exclusion that could have life-long personal and career consequences. Safe spaces—under guidance from trusted mentors—are required for UWiM trainees to debrief when encountering discrimination and to reflect on the impact of such experiences on their professional identity and intended career choices. Although women, particularly those who are underrepresented, need skilled and compassionate mentors to nurture their careers, they more so need advocates who are willing to both call out discrimination when it happens, and to take meaningful action to dismantle the discriminatory forces that impact women both personally and professionally.

[교수진 지지자]가 없는 상황에서, 참가자들은 [그들이 경험한 해악(명백한 차별과 문제가 되는 부작위 포함)을 바로잡기 위해 노력]하는 것처럼 보였다. 그들은 그들이 거부당한 멘토링, 옹호, 그리고 진정한 인간이 될 수 있는 기회를 제공할 수 있는 진로를 구상했다. 참가자들이 [봉사정신]으로 이런 불협화음에서 벗어나는 것은 존경할 만하지만, [잠재적인 단점]을 모르는 것 같았다. 예를 들어, [복잡한 심리사회적 및 의료 요구를 가진 사람들을 돌보는 것]은 [동정심 피로와 소진을 악화시킬 위험]이 있는 [시간 집약적인 작업]이다. 이는 여성 의사들 사이에서 이미 잘 문서화되어 있는 현상이다.
In the absence of faculty advocates, participants appeared driven to correct the harms—including blatant discrimination and problematic inaction—that they experienced. They envisioned a career path where they could provide the mentoring, advocacy, and opportunity to be authentically human that they were denied. Although it is admirable to emerge from such dissonance with a sense of service, participants seemed unaware of potential drawbacks. For example, caring for populations with complex psychosocial and health care needs is time-intensive work that risks exacerbating compassion fatigue and burnout—phenomena that are already well-documented among female physicians.

소외된 사람들에게 봉사하려는 욕구는 학계와 리더십에서 UWiM의 부족에 대한 또 다른 가능한 설명이 될 수 있다. 즉, 차별적 구조적 문제가 여성의 리더십 위치 달성 능력을 저해하는 "누출 파이프라인"을 생성하는 것으로 알려져 있지만[47] [불평등에 대한 트라우마 반응]은 [권력의 위치]로부터의 [자기 배제]로 이어질 수 있다. 참가자들이 진정으로 흥분하고 소외된 환자들과 훈련생들을 위한 훈련과 관리를 개선할 수 있는 진로를 시작할 수 있는 권한을 부여받은 것처럼 보였지만, 모든 의사들은 이 일을 할 수 있는 기술과 동기를 가지고 있어야 한다. 이것들은 문화적으로 유능한 의사가 되기 위한 기본적인 요소들이지만, UWiM 참가자들은 그것들을 전문화된 진로의 일부로 인식하는 것처럼 보였다.
The desire to serve marginalized populations may be another possible explanation for the paucity of UWiM in academia and leadership. That is, although discriminatory structural issues are known to create a “leaky pipeline” [47] that hinders women’s ability to attain leadership positions, the trauma response to inequities might lead to self-exclusion from positions of power. Although participants seemed genuinely excited and empowered to embark on a career path that would improve training and care for marginalized patients and trainees, all physicians should have the skillset and motivation to do this work. These are fundamental components of being a culturally competent physician, yet UWiM participants seemed to perceive them as part of a specialized career path—a problematic notion that should trigger both reflection and action.

한계
Limitations

타자성과 차별에 대한 경험은 독특하게 해로우므로, 이러한 해악을 탐구하는 것을 목표로 하는 질적 데이터 세트가 "포화"되는 것이 불가능하다[48]. 우리는 그룹 환경에서 편안하게 공유하지 못한 정보를 보류했을 수 있는 한 캐나다 학술 기관의 10명의 여성 표본이 의학의 다른성에 대한 불완전한 이해를 생성한다는 것을 인정한다. 그러나 참가자들의 풍부하고 감성적인 계정은 UWiM이 탐색해야 하는 복잡성을 이해하는 데 매우 귀중한 뉘앙스를 제공했다. 질적 소견은 일반화하기보다는 이전 가능한 것을 의도하기 때문에 성별 정체성과 실습 환경에 걸쳐 연수생과 교직원에게 반향을 일으킬 수 있다. 더 많은 연구가 시급하며, 현재 UWiM의 교차성과 전문적 정체성 형성의 관계를 이해하기 위한 전국적인 연구에 착수하고 있다.
Experiences of otherness and discrimination are uniquely harmful, rendering it impossible for a qualitative dataset that is aimed at exploring these harms to become “saturated” [48]. We acknowledge that a sample of 10 women from one Canadian academic institution, who may have withheld information they did not feel comfortable sharing in a group setting, generates an incomplete understanding of otherness in medicine. However, participants’ rich and emotive accounts provided invaluable nuance for understanding the complexities that UWiM must navigate. Because qualitative findings are intended to be transferable rather than generalizable, findings may resonate with trainees and faculty members across gender identities and practice settings. More research is urgently needed, and we are currently embarking on a national study to understand the relationship between intersectionality and the professional identity formation of UWiM.

결론
Conclusion

많은 훈련생들에게, 명백한 차별과 타인의 감정은 학업 환경에서 항상 존재하는 위협이다. [형평성, 다양성, 포용성]을 목표로 하는 [정책과 개인의 행동]은 억압을 악화시키는 [과소대표의 복잡성]을 고려해야 한다. 의학부는 지역적 및 역사적 맥락을 고려하여 의학에서 과소 표현 개념화에 대한 사려 깊은 접근법으로부터 이익을 얻을 것이다. [정의와 정책]이 [공평하고 포용적이라는 것을 보장하는 것]은 다음에 달려있다.

  • 훈련생으로 대표되는 [눈에 보이는 정체성]과 [보이지 않는 정체성]의 폭에 대한 [포괄적으로 이해하는 것]
  • 의학에서 [과소 표현에 대한 진화하는 개념화]가 역사적으로 소수화된 그룹을 지원하기 위한 노력을 희석시키지 않도록 [인구 통계 데이터를 계층화하는 것]

For many trainees, overt discrimination and feelings of otherness are ever-present threats in academic environments. Policies and individual actions aimed at equity, diversity, and inclusion must consider the complexities of underrepresentation that exacerbate oppression. Faculties of medicine would benefit from a thoughtful approach to conceptualizing underrepresentation in medicine, taking local and historical contexts into account. Ensuring that definitions and policies are equitable and inclusive depends

  • on both a comprehensive understanding of the breadth of visible and invisible identities represented by trainees and
  • on stratifying demographics data to ensure that any evolving conceptualizations of underrepresentation in medicine do not dilute efforts aimed at supporting historically minoritized groups [11].

대학원 프로그램과 개별 교육자들은 [훈련 환경]이 [문화적으로 안전]할 뿐만 아니라 "[의사]로서 발달하는 자신의 정체성을 이해할 수 있는, sense-making 과정을 용이하게 하는 교육학적 공간"으로 육성할 의무가 있다. 우리는 의학 교육계가 마야 안젤루 박사의 지시에 귀를 기울일 것을 촉구한다. "당신이 더 잘 알 때까지 당신이 할 수 있는 최선을 다하라. 그럼 네가 더 잘 알 때, 더 잘 하라." 우리의 참가자들은 모든 훈련생들이 번창할 수 있는 포용적 학습 환경을 옹호하기 위해 그들의 힘과 특권을 사용함으로써 교직원들이 "더 잘하기" 위해 필요한 비판적 인식을 형성했습니다.

Postgraduate programs and individual educators have a duty not only to ensure that training environments are culturally safe but also that they foster “the pedagogical space to facilitate sense-making processes … thereby enabling [trainees] to understand their own developing identities as doctors” [49]. We urge the medical education community to heed Dr. Maya Angelou’s instruction to “do the best you can until you know better. Then when you know better, do better” [50]. Our participants generated the critical awareness necessary for faculty to “do better” by using their power and privilege to advocate for an inclusive learning environment where all trainees can thrive.

 


Perspect Med Educ. 2022 Dec;11(6):325-332. doi: 10.1007/s40037-022-00729-5. Epub 2022 Nov 22.

"Walking on eggshells": experiences of underrepresented women in medical training

Affiliations collapse

Affiliations

1Bruyère Academic Family Health Unit, Ottawa, Ontario, Canada. prezaief@uottawa.ca.

2Department of Family Medicine, University of Ottawa, Ottawa, Ontario, Canada. prezaief@uottawa.ca.

3Bruyère Academic Family Health Unit, Ottawa, Ontario, Canada.

4Department of Family Medicine, University of Ottawa, Ottawa, Ontario, Canada.

5Faculty of Education, University of Ottawa, Ottawa, Ontario, Canada.

6Department of Innovation in Medical Education, University of Ottawa, Ottawa, Ontario, Canada.

7Department of Medicine, University of Ottawa, Ottawa, Ontario, Canada.

PMID: 36417160

PMCID: PMC9684928

DOI: 10.1007/s40037-022-00729-5

Free PMC article

Abstract

Introduction: Medicine remains an inequitable profession for women. Challenges are compounded for underrepresented women in medicine (UWiM), yet the complex features of underrepresentation and how they influence women's career paths remain underexplored. This qualitative study examined the experiences of trainees self-identifying as UWiM, including how navigating underrepresentation influenced their envisioned career paths.

Methods: Ten UWiM family medicine trainees from one Canadian institution participated in semi-structured group interviews. Thematic analysis of the data was informed by feminist epistemology and unfolded during an iterative process of data familiarization, coding, and theme generation.

Results: Participants identified as UWiM based on visible and invisible identity markers. All participants experienced discrimination and "otherness", but experiences differed based on how identities intersected. Participants spent considerable energy anticipating discrimination, navigating otherness, and assuming protective behaviours against real and perceived threats. Both altruism and a desire for personal safety and inclusion influenced their envisioned careers serving marginalized populations and mentoring underrepresented trainees.

Discussion: Equity, diversity, and inclusion initiatives in medical education risk being of little value without a comprehensive and intersectional understanding of the visible and invisible identities of underrepresented trainees. UWiM trainees' accounts suggest that they experience significant identity dissonance that may result in unintended consequences if left unaddressed. Our study generated the critical awareness required for medical educators and institutions to examine their biases and meet their obligation of creating a safer and more equitable environment for UWiM trainees.

Keywords: Family Medicine; Medical education; Medical training; Underrepresented women.

의대 교수자들에게 인센티브 주기: 동기부여에 영향을 주는 인센티브의 역할 탐색 (Acad Med, 2018)
Incentivizing Medical Teachers: Exploring the Role of Incentives in Influencing Motivations 
Katherine M. Wisener, MA, and Kevin W. Eva, PhD

 

 

모든 의학 교육 프로그램의 임무는 의대생들이 환자의 삶을 개선하는 개업의로 성공적으로 전환할 수 있도록 지원하는 것이다. 그 성공 여부는 의학 교육자에게 크게 좌우됩니다. 즉, 강의실과 임상 환경에서 가르치는 임상의사와 다른 교수진들, 그들 중 다수는 급여를 받거나 대학에 고용되지 않았고, 그들 중 다수는 교육자로서 훈련을 받지 않았으며, 그들 중 다수는 2차 직업 선택으로만 교육자로서의 그들의 역할을 발견했다. 이러한 장벽을 고려할 때 동기 부여되고 효과적인 교육자를 식별하고 모집하는 것은 어려울 수 있으며, [교육의 단점]이 점점 더 [이점]을 능가한다는 우려가 있다. 일부 연구자들은 거의 절반의 교직원들이 불만을 가지고 있고 그들의 교사직을 떠나는 것을 심각하게 고려하고 있다는 것을 발견했다. 임상의의 교수 동기에는 개인적, 환경적, 체계적 요인이 영향을 미치며, 의대가 교수를 가장 잘 장려하고 교수의 우수성을 촉진할 수 있는 방법에 대한 이해가 필요하다.
The task of any medical education program is to support medical students’ successful transition into practicing clinicians who improve the lives of their patients.1 The success of this is heavily dependent on medical educators—namely, the clinicians and other faculty who teach in classroom and clinical environments, many of whom are not salaried or employed by the university, many of whom are not trained as educators, and many of whom discovered their roles as educators only as a secondary career choice.2 Given these barriers, identifying and recruiting motivated and effective educators can be challenging, and there is concern that the drawbacks of teaching increasingly outweigh the benefits. Some researchers have found that almost half of teaching faculty are dissatisfied and are seriously considering leaving their teaching roles.3,4 There are individual, environmental, and systemic factors influencing clinicians’ motivations to teach, and understanding how medical schools can best incentivize teaching and promote teaching excellence is needed.

[동기 부여motivation]는 개인이 어떤 일을 맡도록 움직이는 수단을 말한다. 동기가 부족할 때(또는 감소할 때) 인센티브(즉, 노력에 영향을 미치려는 시도로 사용되는 유형 또는 무형의 외부 제공물)를 구현하는 것이 명백한 해결책으로 보일 수 있다. 그러나 인센티브를 시행하는 것은 간단하지 않으며 긍정적인 형태의 동기부여를 줄이거나, 문제적인 형태의 동기부여를 촉진함으로써 역효과를 낼 수 있다. 예를 들어, 헌혈을 늘리려는 시도에 재정적 보상을 도입하는 것은 역효과를 낳았고 헌혈하려는 사람들의 의지를 감소시켰다. 인센티브는 사람들이 "분노, 저항, 무관심을 가지고" 행동을 하게 만들거나, "일의 가치나 효용에 대한 내적인 수용을 반영하는 의지의 태도를 가지고" 행동을 하게 만든다. 따라서 의료 교육자들 사이에서 생산적인 형태의 동기 부여를 촉진하기 위해 인센티브를 적절하게 배치하는 방법을 아는 것이 무엇보다 중요하다.
Motivation refers to the means through which an individual is moved to undertake a task.5 When there is a lack of (or waning) motivation, implementing incentives (i.e., any external offering, tangible or intangible, that is used in an attempt to influence effort) might seem like an obvious solution. However, implementing incentives is not straightforward and can be counterproductive by reducing positive forms of motivation or promoting problematic forms of motivation. For example, introducing financial rewards in attempts to drive up blood donations has backfired and reduced people’s willingness to donate blood.6,7 Incentives can lead people to perform actions “with resentment, resistance and disinterest, or with an attitude of willingness that reflects an inner acceptance of the value or utility of a task.”5 Knowing how to position incentives appropriately to foster productive forms of motivation among our medical educators is, therefore, paramount.4

이 논문은 인센티브가 긍정적으로 영향을 미치는 방법, 이유 및 시기를 탐구하기 위해 수행되는 중요한 합성을 제공한다. 우리는 연구 분야 간의 주요 차별화 요소를 강조하고 연구자들이 인센티브 제도의 부정적인 영향을 완화하기 위해 어떻게 시도했는지 보여준다. 의학 교육 문헌은 문맥을 제공하기 위해 먼저 고려된다. 이어서, 우리는 심리학, 조직 행동 및 행동 경제학 분야의 관련 연구 결과를 설명함으로써 해당 문헌의 인센티브 묘사의 차이를 강조한다. 각각은 의학 교육 맥락에 대한 추가적인 통찰력을 제공하는 관련 경험적 데이터와 이론적 이해에 기여한다. 그런 다음 실질적인 조언을 제공하고 이해의 격차가 남아 있는 부분을 개략적으로 설명하기 위해 이러한 분야 내 및 분야 전반에 걸쳐 수렴 및 분기 영역을 합성한다.
This paper offers a critical synthesis conducted to explore how, why, and when incentives are positively influential. We highlight key differentiators between fields of study and reveal how researchers have attempted to mitigate negative impacts of incentivization schemes. The medical education literature is considered first to provide context. Subsequently, we highlight gaps in that literature’s portrayal of incentives by illustrating relevant research findings from the fields of psychology, organizational behavior, and behavioral economics. Each contributes relevant empirical data and theoretical understanding that provide additional insight into the medical education context. We then synthesize areas of convergence and divergence within and across these disciplines in an effort to offer practical advice and outline what gaps in understanding remain.

방법
Method

이러한 노력의 기초가 되는 목적은 특정 관찰의 일관성/규모에 대한 결론을 도출하기보다는, 인센티브화 현상을 이해하는 데 다양한 중요한 기여를 탐구하는 것이었다. 따라서, 우리는 주어진 분야 내의 문헌을 이해하기 위한 목적적이고 반복적인 접근법에 의해 안내되는 종합synthesis인 [비판적 문헌 검토]를 수행했다. 광범위할 수 있는 기초 논문을 식별하고 조사 중인 주제의 다양한 측면에 대한 특별한 통찰력을 제공하기 위해 출판물의 비판적 평가를 통해 진행된다. 그것의 주요 강점은 연구자가 완전한 체계성에 대한 주장을 허용하기에는 너무 광범위한 현상에 대한 관심을 고려하여 광범위한 이해를 개발하기 위해 상당한 범위의 문헌을 그릴 수 있도록 하는 것이다.
The purpose underlying this effort was to explore a variety of significant contributions to understanding the phenomenon of incentivization rather than to draw conclusions about the consistency/magnitude of any particular observation. As such, we conducted a critical literature review, which is a synthesis guided by a purposeful and iterative approach to understanding the literature within a given field(s). It proceeds through the critical evaluation of publications to identify foundational papers that may be wide reaching and contribute particular insight about different aspects of the topic under investigation.8,9 Its main strength is allowing the researcher to draw on a substantial breadth of literature to develop well-rounded understanding given interest in a phenomenon that is too broad to allow claims of complete systematicity.10

Grant and Booth(2009)에 따라 프로세스를 진행하였으며, 검색, 평가, 합성 및 분석의 4단계를 포함했습니다(그림 1). 검색 단계에서 구글 스콜라는 인센티브와 관련된 주요 논문과 주요 이론적 개념을 식별하는 데 사용되었으며, 이는 검색 용어를 보다 세련된 검색에 적용하는 데 사용되었다. 처음에는 모든 관련 분야가 고려되었지만,

  • 일부는 의학 교육에서 얻은 교훈에 추가적인 지식을 제공하지 않았다. 
    (예를 들어, 일반 교육에서 교사를 장려하는 연구는 개념적으로 의학 교육자를 포함하는 연구에는 거의 불필요했다.) 
  • 그리고 일부 분야는 주로 다른 영역에서 생성된 이론과 증거로부터 이끌어내는 것으로 보였다. 
    (예를 들어, 운동 및 조직 맥락에서 코칭을 탐구하는 것은 우리를 심리학으로 다시 이끌었다.) 

탐색 과정이 전개됨에 따라 두 저자 간의 반복적인 토론을 통해 심리학, 조직행동학, 행동경제학 분야는 의학 교육과 관련될 수 있는 인센티브에 대한 우리의 이해를 심화시키는 것과 관련하여 특히 유익한 것으로 간주되었다.
Our process was informed by Grant and Booth (2009)9 and included four steps: search, appraisal, synthesis, and analysis (Figure 1). In the search stage, Google Scholar was used to identify seminal papers and key theoretical concepts related to incentivization that informed search terms that were then applied to a more refined search. While all relevant fields were considered at first, some did not contribute additional knowledge to the lessons gleaned from medical education (e.g., explorations of incentivizing teachers in general education were largely conceptually redundant to explorations involving medical educators), and some fields appeared predominantly to draw from theory and evidence primarily generated in other domains (e.g., exploring coaching in athletic and organizational contexts largely led us back to psychology). Through iterative discussions between both authors as the search process unfolded, the disciplines of psychology, organizational behavior, and behavioral economics were deemed particularly fruitful with respect to deepening our understanding of incentivization as it might pertain to medical education.

결과적으로, 그러한 관점이 잘 표현되도록 의도적인 노력으로 그러한 문헌들을 통해 추가적인 검색이 이루어졌다. 사용된 데이터베이스에는 CINAHL, 논문 초록, ERIC, MEDLINE, PsycINFO, EconLit, 그리고 Web of Science가 포함된다. 기사는 다음과 같은 질문을 다루는 경우 자세히 조사되었다. 

  • (1) 이 출판물은 인센티브/보상/장벽과 동기부여 사이의 상호작용을 탐구하고 있는가? 
  • (2) 인센티브가 특정 조치를 산출할 수 있는 메커니즘에 대한 이해를 심화시키는 데 기여하는가? 

대부분의 기사는 실증연구였지만, 추가적인 통찰력으로 이어질 수 있기 때문에 관련 사례연구, 책장, 사설 등도 고려되었다.

As a result, additional searches were made through those literatures in a deliberate effort to ensure that those perspectives were represented well. Databases used included CINAHL, Dissertation Abstracts, ERIC, MEDLINE, PsycINFO, EconLit, and Web of Science. Articles were explored in detail if they addressed the following questions:

  • (1) Does the publication explore the interaction between incentives/rewards/barriers and motivation?
  • (2) Does it contribute to deepening understanding of the mechanisms through which incentives can yield certain actions?

Most articles were empirical studies, but relevant case studies, book chapters, and editorials were also considered because they could lead to additional insight.

결과.
Results

의료 교육에서 인센티브가 어떻게 그리고 왜 사용되고 있는가?
How and why incentives are being used in medical education

주로 설문조사와 인터뷰를 통해 개발된 상당한 문헌은 임상 교사들이 가르치는 데 많은 동기를 느낀다는 것을 시사한다. 특히 눈에 띄는 것은

  • 자신의 의학적 지식을 입증하고 새롭게 하는 능력,
  • 교육자로부터 받은 혜택을 "pay it forward"할 수 있는 기회,
  • 학생들과 교류하고 도울 수 있는 기회,
  • 도전을 느끼거나 교사의 정체성을 가정함으로써 얻어지는 개인적인 만족감

가르치는 것에 대한 동기 부여를 보고하는 일부 사람들은 그것이 그들의 역할 중 가장 보람 있는 것이라고 생각한다. 표 1은 보다 포괄적인 목록을 제공한다.

A considerable literature, predominantly developed through surveys and interviews, suggests that clinical teachers feel many motivations to teach. Particularly prominent is

  • the ability to demonstrate and refresh one’s medical knowledge,3,11–14 
  • the opportunity to “pay forward” the benefits received from educators,13–18 
  • the opportunity to interact with and help students,3,11,12,15–18 and
  • personal satisfaction derived from feeling challenged or assuming a teaching identity.13,14,16–18 

Some who report feeling motivated to teach find it to be the most rewarding of their roles.19 Table 1 provides a more comprehensive list.

동시에, 일부 임상의들은 교육에 많은 장벽에 직면해 있다는 것이 분명하다. 교육에 대한 동기 부여를 보고하는 임상의들은 점점 더 그들의 교육 역할에 불만족스러워하고 있으며, 소모와 소진은 불행한 결과이다. 일반적으로 보고되는 교육의 장벽은 경쟁적인 우선순위, 인식된 기술의 부족, 열악한 교육 시설, 관심의 부족을 포함한다. 표 2는 보다 포괄적인 목록을 제공한다.
At the same time, it is clear that some clinicians face many barriers to teaching.17 Clinicians who report being motivated to teach are increasingly dissatisfied with their teaching roles,15 with attrition and burnout being unfortunate outcomes.4,11,14,19,20 Barriers to teaching that are commonly reported include competing priorities,3,11,13,14,17 a lack of perceived skill,7,17,19 poor teaching facilities,3,15,17 and a lack of interest.11,15,19  Table 2 provides a more comprehensive list.


의대 교수 이직률이 매년 평균 8~10%, 조교수 10년 유지율은 43%에 불과하고, 이직으로 발생하는 비용은 임상 교수 1인당 15만5000달러에서 55만9000달러 사이라는 점을 감안하면 이러한 장벽의 영향은 비용이 많이 든다. 이 모든 것은, [교수직을 추구하는 의대생들과 전공의들의 수가 비슷하게 감소하고 있다]는 보고와 함께 생각해본다면, 차세대 교수진을 유치하고, 현재 교수진의 손실을 막는 것이 우선순위가 되어야 한다는 주장으로 이어졌다. 그러나 다가오는 위기가 될 수 있는 것을 피할 수 있는 지침은 거의 없다.
The impacts of these barriers are costly given that medical school faculty turnover averages 8% to 10% each year,4 with the 10-year retention rate of assistant professors only 43%,20,21 and turnover costing between $155,000 and $559,000 per clinical faculty member.19 All this, combined with reports that the number of medical students and residents seeking teaching roles is similarly declining, has led to claims that attracting the next generation of faculty and preventing the loss of current faculty must be a dominant priority.4 Little guidance, however, is available to avoid what could be a looming crisis.

임상 교사들을 향한 [가장 일반적인 인센티브]는 대세를 막지 못했다. 여기에는 학술적 임명, 리더십의 인정, 교수진 개발 기회, 상, 돈, 선물, 지속적인 의학 교육 크레딧, 도서관 자원이 포함된다. 임상의들에게 교수에 대한 인센티브 순위를 물었을 때,

  • [개인적인 만족도]가 가장 높은 순위를 차지했고,
  • [교육 기회와 경력 향상]이 그 뒤를 이었으며,
  • [재정적인 지불과 선물]은 꼴찌를 차지했다.

그러나 이러한 연구에서 [자기 보고 척도]를 주로 사용하는 것은 인센티브가 수행하는 역할에 대한 충분히 미묘한 이해에서 우리가 운영해 온 정도에 대한 우려를 불러일으킨다. 예를 들어, 위에서 언급한 연구에서 재정적 보상이 전체적으로 가장 낮은 순위를 차지했지만, 그 결과는 [응답자들이 일하는 맥락]에 따라 달라진다. [돈]은 [가르치는 데 돈을 받지 않은 사람들]에 의해 가장 낮은 평가를 받았지만, [이미 돈을 받고 있는 사람들]에게는 가장 높은 평가를 받았다. 게다가, 그러한 순위는 일부 사람들이 재정적 인센티브를 위해 가르치지 않는다는 것을 암시할 수 있지만, 그들은 교육과 관련하여 일반적으로 들려오는 재정적 디스인센티브(즉, 진료를 받지 않음으로써 포기되는 돈)에 대한 우려 해결을 간과한다. 이 문헌과 그 한계를 종합하면, 특정 인센티브가 영향력이 있는지 없는지에 대한 단순한 주장보다 더 복잡한 현실을 시사한다.
The most common incentives for clinical teachers have not stemmed the tide. These include academic appointments, recognition from leadership, faculty development opportunities, awards, money, gifts, continuing medical education credits, and library resources.12,13,17 When clinicians have been asked to rank-order incentives for teaching,

  • personal satisfaction ranks highest,
  • followed by educational opportunities and career advancement,
  • with financial payments and gifts ranking last.12,13 

The predominant use of self-report measures in these studies, however, raises concern about the extent to which we have operated from a sufficiently nuanced understanding of the role that incentives play. For example, although financial rewards ranked lowest overall in the study mentioned above, that result depended on the context in which respondents were working: Money was ranked least valued by those who were not paid to teach, but highest by those who were already being paid.12 Further, such rankings may suggest that some people do not teach for financial incentives, but they neglect to address commonly heard concerns of financial disincentives associated with teaching (i.e., money that is given up by not being in clinic). Taken together, this literature and its limitations suggest a more complex reality than simple claims that certain incentives are influential or not.

사람들이 행동을 주도하는 것으로 [인식하는 것]과 [실제 행동 결정 요인] 사이의 단절을 고려할 때, 자기보고에 기초한 인센티브 계획을 설계하는 것은 위험하다. 게다가, 역효과를 내는 인센티브 제도에 대한 다양한 보고서는 우리가 가르칠 필요가 없거나 더 많은 노력을 하도록 장려될 수 있는 사람들에게 인센티브가 미치는 영향을 더 잘 이해하려면 더 깊은 탐구를 요구한다. 우선, 우리는 기대와 관찰 사이의 그러한 단절을 이해하는 것을 전문으로 하는 학문인 심리학으로 눈을 돌렸다.
Given the disconnect between what people perceive to drive their behavior and actual determinants of behavior,22 designing an incentivization scheme based on self-reports is risky. Further, various reports of incentive schemes having counterproductive consequences demand a deeper exploration if we are to better understand the impact of incentives on those who are not required to teach or who could be encouraged to give more effort. To begin, we turned to psychology, a discipline that specializes in understanding such disconnects between expectation and observation.

인센티브에 대한 심리학적 관점
Psychology’s view on incentives

심리학 연구자들은 동기가 발생하는 메커니즘에 대해 광범위한 연구를 수행했다. 동기부여의 [네 가지 요소]는 여러 주요 동기부여 이론들 사이에서 공유된다. 

  • (1) 역량(어떤 일을 잘 할 수 있는 자신의 능력); 
  • (2) 자율성 또는 가치(행위를 완료하기를 원하거나 그 행위에 투자되는 정도) 
  • (3) 귀인(성과에 대해 스스로 인식하는 책임) 및 
  • (4) 사회 인지적 요소: 개인과 사회적 맥락 사이의 상호 작용을 포함

따라서 특정 개인에 대한 인센티브의 효과는 이 네 가지 요소를 어떻게 구축하거나 감소시키느냐에 달려 있다. 자기결정이론(SDT)에서 도출된 이 문헌의 주요 차이점은 다음과 같다. 

  • "본질적으로 흥미롭거나 즐겁기 때문에" 직무가 수행되는 내재적 동기 부여 
  • "분리 가능한 성과separable outcome로 이어지기 때문에" 작업이 수행되는 외적 동기 부여. 

[분리 가능한 성과separable outcome]를 갖는다는 것은 그 일에 [가치가 있다고 여겨지는 보상] 또는 [피해야 할 처벌]의 형태로 나타나는 [도구성instrumentality]이 있다는 것을 의미한다. (예를 들어, 주제가 재미있어서라기보다는 숙제로 배정되어 있기 때문에 책을 읽는 것)

Psychology researchers have conducted extensive research on the mechanisms by which motivation arises. Four components of motivation are shared among several prominent motivational theories:

  • (1) competence (one’s self-perceived ability to do something well);
  • (2) autonomy or value (the extent to which one wants to complete, or is invested in, the act);
  • (3) attribution (one’s perceived responsibility for the outcome); and
  • (4) sociocognitive elements that involve interactions between an individual and the social context.23 

The effectiveness of an incentive for a particular individual, therefore, is dependent on how it builds on or detracts from these four components. A key distinction in this literature, drawn from self-determination theory (SDT), is that between

  • intrinsic motivation, in which a task is performed “because it is inherently interesting or enjoyable”4; and
  • extrinsic motivation, in which a task is performed “because it leads to a separable outcome.”5 

To have a separable outcome means that there is some instrumentality to the task, either in the form of a reward that is valued or a punishment to be avoided (e.g., reading a book because it is assigned as homework rather than because the topic is interesting).

교유에 [내재적 동기]가 부여된 임상의는 재미나 도전을 즐기기 때문에 그렇게 한다. (즉, 보상이 활동 자체에 포함되어 있기 때문입니다.) 일반적으로, 내재적 동기는 개인이 특정한 작업에 참여할 때, 심지어 (그러한 행동을 할 것이라는 타인의) 기대가 없고, 개인이 (특정 활동 대신) 참여할 수 있는 다른 활동이 있더라도 관찰할 수 있다. 이러한 모델에 따르면, 모든 임상의가 교육에 내재적 동기 부여를 갖는다면, 의료 훈련 프로그램을 배치하는 데 문제가 없을 것이며, 따라서 인센티브가 내재적 동기 부여를 구축할 수 있는지에 대한 질문을 제기한다.
A clinician who is intrinsically motivated to teach does so because she enjoys the fun or challenge (i.e., because the reward is embedded within the activity itself). Generally, intrinsic motivation is observable when an individual engages in a particular task even when there is no expectation and despite there being other activities in which the individual could engage.24 According to these models, if every clinician were intrinsically motivated to teach, there would be no issue with staffing medical training programs, thereby begging the question of whether incentives can build intrinsic motivation.

중요한 메타 분석에 따르면, 대부분의 경우 인센티브 제공은 특정 작업에 [내재적 동기를 부여하는 사람들]에게 때로는 영구적으로 해롭다. 인지평가 이론가들은 [보상]이 [개인의 자율성과 역량]을 떨어뜨려, 보상이 [보상을 받지 못하면 하지 않겠다]는 의미를 내포하고 있기 때문에, 그 일을 덜 바람직하지 않게 보이게 한다고 설명한다.

  • 이는 특히 업무와 성과에 따른 보상(즉, 특정 수준에서 업무를 완료하거나 완료하는 것에 기초하여 주어지는 보상)의 경우에 해당된다.
  • 업무에 수반되지 않는 보상(즉, 업무 완료 여부에 관계없이 주어지는 보상)은 [업무와 보상 사이의 도구성을 제거]한다(개인이 자율성을 되찾을 수 있도록 한다). 그러나 [역량 확인competence affirmation]을 동시에 제거하게 되므로, 과제를 잘 수행하는 것에서 오는 고유한 만족감을 제거할 수 있습니다.

A seminal meta-analysis25 reveals that the provision of incentives is, in most cases, detrimental for those who are intrinsically motivated toward a certain task, sometimes permanently. Cognitive evaluation theorists26 explain that rewards lower an individual’s sense of autonomy and competence, making the task seem less desirable because the reward implies that one would not do it if not rewarded.5 

  • This is particularly the case with task-contingent and performance-contingent rewards (i.e., those given based on completing the task or completing it at a certain level).
  • Non-task-contingent rewards (i.e., those given regardless of whether the task is completed) remove the instrumentality between the task and the rewards (allowing individuals to reclaim autonomy) but can simultaneously remove competence affirmation, eliminating the inherent sense of satisfaction that comes from a task well done.25

[인정과 긍정적 피드백]과 같은 [덜 유형적인 보상]은 자율성에 대한 많은 위험 없이 [역량을 긍정affirm]할 수 있으며, 내재적으로 동기 부여 작업에 대한 동기를 구축하는 것으로 나타났지만, 그 전달에는 중요한 뉘앙스가 있다. 심지어 긍정적인 피드백도 그것이 일상적으로 주어져서, 주어질 것이라는 기대가 자리잡으면, 자율성을 감소시킬 수 있기 때문에 결국 본질적인 동기에 부정적인 영향을 미친다. 또한

  • 임상의가 [[긍정적인 피드백]이나 [유형적인 보상]을 받을 수 있다는 것을 알고 있다면], 유형적인 보상은 "상징적 단서적 가치symbolic cue value"를 취하며, 보람 있는 역량의 정도가 달성되었음을 암시한다. 결과적으로, 그러한 상황에서는, [유형적 보상]이 더 효과적인 경향이 있다.
  • 반면에, 임상의가 [보상을 받을 것이라는 것을 모른다면], [유형적 보상]보다 [예상치 못한 언어적 칭찬]이 본질적인 동기를 증가시킨다.

Less tangible rewards such as acknowledgment and positive feedback can affirm competence without as much risk to autonomy and have been shown to build motivation for intrinsically motivating tasks,25 but there are important nuances to their delivery. Even positive feedback eventually impacts intrinsic motivation negatively because it can reduce autonomy when it is given routinely and, thus, becomes expected.25 Further,

  • if clinicians know they can either receive positive feedback or a tangible reward, the tangible reward takes on “symbolic cue value” and implies that a degree of competence has been achieved worth rewarding. As a result, in such situations, tangible rewards tend to be more effective.27 
  • If, on the other hand, clinicians do not know they are to be rewarded, then unexpected verbal praise increases intrinsic motivation more than tangible rewards.

이러한 차이는 의료 교육 문헌에서 교육을 위해 급여를 받는 사람들은 재정적 인센티브를 높게 평가하는 반면 그렇지 않은 사람들은 낮게 평가하는 이유에 대한 통찰력을 제공한다. 일단 [가시적인 보상]을 받을 수 있다는 것이 알려지면, [재정적 인센티브]는 [그 과제가 중요하다고 간주된다는 것]을 보여주는 더 큰 [상징적 단서적 가치]를 갖는다. 비록 내재적인 동기 부여가 더 큰 창의성과 생산성으로 이어지는 경향이 있기 때문에 이상적일 수 있지만, 많은 일상적인 과제들은 본질적으로 흥미롭지 않고, 많은 의학 교육자들은 가르치는 것에 외적인 동기 부여를 받는다.
This distinction offers insight into why the medical education literature suggests that those who are paid to teach rank financial incentives highly, whereas those who are not rank them low.12 Once it is known that a tangible reward is available, the financial incentive takes on greater symbolic cue value as a demonstration that the task is considered important. Although intrinsic motivation might be ideal because it tends to lead to greater creativity and productivity,23 many daily tasks are not inherently interesting, and many medical educators are extrinsically motivated to teach.

[외재적 동기 부여]에는 [과제에 대해 인식하는 자율성의 정도]에 따른 다양한 [도구적 보상의 스펙트럼]이 있다.

  • [자율성이 낮다고 인식]하는 쪽에서는 부서장의 비판을 피하려고 교육을 맡을 수 있다. 
  • [자율성이 높다고 인식]하는 쪽에서는, 비록 그것이 암묵적인 만족을 제공하지 않더라도, 가르치는 것이 자신의 역할에 필수적이라는 믿음 때문에 가르칠 수 있다.

더 큰 자율성은 더 큰 참여, 성과 및 헌신을 가져온다. SDT에 따르면, [역량]과 [관계성]의 느낌이 높아지면, 보다 [자율적인 형태의 외적 동기부여]를 형성한다. 즉, 임상의가 자신이 [성공에 필요한 관련 기술을 가지고 있다]고 믿고, 가르치는 것이 [교육을 장려하는 집단이나 문화에 소속감을 제공]한다면, 그 행동을 [자아의식에 통합할 가능성]이 더 높아질 것이다. 교수진 개발과 교육 아카데미는 역량과 연결을 증진하기 위한 두 가지 실용적인 전략을 제공한다. 이러한 활동에 참여하는 것은 교사의 정체성을 촉진하여 의미 있는 형태의 동기 부여를 구축하는 데 중요한 역할을 할 수 있으며, 이는 디자인보다 세렌디피티를 통해 교육적 역할에 온 사람들에게 특히 중요할 수 있다.

Within extrinsic motivation lies a spectrum of instrumental rewards varying in the degree of autonomy perceived over the task.26 

  • At the lower end, one might teach to avoid critique from one’s department head;
  • at the higher end, one might teach because of a belief that teaching is integral to one’s role even if it does not provide implicit satisfaction.5,28 

With greater autonomy comes greater engagement, performance, and commitment.28 According to SDT,5 increased feelings of competence and relatedness build more autonomous forms of extrinsic motivation. That is, if clinicians believe they have the relevant skills to succeed, and if teaching provides a sense of belongingness to a group or culture that promotes teaching, they’ll be more likely to integrate the behavior into a sense of self.5,29 Faculty development and teaching academies offer two practical strategies for promoting competence and connections.30 Engagement with such activities can facilitate one’s teacher identity, thereby playing a critical role in building meaningful forms of motivation, which may be especially crucial for those who came to educational roles more through serendipity than design.

요약하자면, [내재적 동기 부여된 임상 교사]에게는 긍정적 피드백의 신중한 제공을 넘어서는 인센티브를 지양하는 것이 최선이라고 하지만, [외재적 동기 부여된 교사]에게는 [자율성, 역량 및 관련성을 지원하는 경우] (인센티브가) 기능적 역할이 있을 수 있다. [완전히 내재적으로 동기 부여된 인력workforces]이라는 이상주의 너머에는, 의학교육은 [외적인 동기 부여를 성취하는 것이 최선인 사람들]에게 의존한다는 현실이 있다. 사실, 많은 역할들은 본질적(내재적)으로 흥미로운 측면이 있지만, 다른 많은 역할들은 단지 (누군가에 의해) 수행될 필요가 있다. 게다가, [이미 확인된 교육에 대한 많은 장벽들]은 심지어 본질적으로 동기부여가 될 때 조차 [강력한 저해요인]으로 작용한다. 이러한 복잡한 상황에서 SDT 연구는 제공해야 하는 실제적인 조언과 관련하여 한계에 도달합니다. 따라서 복잡한 사업장에서 직원들에게 인센티브를 주는 방법에 대한 광범위한 초점을 고려하여 조직행동 분야로 눈을 돌렸다.
In sum, although incentives beyond careful provision of positive feedback are best avoided for intrinsically motivated clinical teachers, they may have a functional role for those who are extrinsically motivated if they support autonomy, competency, and relatedness. Beyond the idealism of a fully intrinsically motivated workforce lies the reality that medical education is reliant on people for which extrinsic motivation is the best one can achieve. In fact, many roles will have some aspects that are intrinsically interesting, whereas others simply need to be done. Further, the many identified barriers to teaching act as particularly powerful disincentives even when one is intrinsically motivated. In such complex situations, SDT research hits its limit with respect to the practical advice it has to offer. We, therefore, turned to the organizational behavior field given its extensive focus on how to incentivize employees in complex workplaces.

인센티브에 대한 조직 행동의 관점
Organizational behavior’s view on incentives

조직 행동주의자들은 급여와 다른 인센티브가 직원들의 동기 부여, 만족도, 생산성에 어떻게 영향을 미치는지에 초점을 맞추었다. 직장 환경에 많은 이론이 적용되었지만, 인센티브의 영향을 중재할 것으로 예상되는 [세 가지 상호 연결된 구성요소]를 일관되게 공유한다.
Organizational behaviorists have focused on how salary and other incentives influence employee motivation, satisfaction, and productivity.31 Although numerous theories have been applied to workplace settings, they consistently share three interlinked components that are expected to mediate the impact of incentives:

  • (1) [자신]과 관련된 요소: 자신이 얼마나 많은 노력을 기울이는지 결정(예: 성취 지향, 귀인 상태).
  • (2) [과제]와 관련된 요소: 과제 또는 목표가 바람직한지, 달성 가능한지, 노력할 가치가 있는지 등
  • (3) [환경]과 관련된 요소: 한 사람의 동기를 제한하거나 가능하게 하는 조건

동기부여가 단지 개인 안에서만 존재하는 것이 아니라는 것을 인정하기 때문에, 이 후자의 요소들은 특히 중요한 추가이다. 즉, 인센티브는 [개인 내에서 동기부여를 높이고 환경 내 장벽을 낮추는 이중적인 역할]을 한다.

  • (1) factors related to the self determine how much effort one exerts (e.g., achievement orientation, attributional states);
  • (2) factors related to the task include whether it or the goal is desirable, achievable, and worth the effort; and
  • (3) factors related to the environment create conditions that limit or enable one’s motivations.

This latter class of factors is a particularly important addition because it acknowledges that motivation does not just live within the individual. That is, incentives play a dual role of raising motivation within individuals and lowering barriers within the environment.

예를 들어, 헤르츠버그의 [동기-위생 이론]은 직업 만족(즉, 동기 유발 요인)과 불만족(즉, 위생 요인)에 각각 영향을 미치는 두 가지 요인 세트를 식별한다. 직원들을 대상으로 업무에 대해 유난히 기분이 좋았던 때와 나빴던 때를 인터뷰한 결과, 기분이 좋았던 때와 의욕이 있었던 때, 기분이 나빴던 때와 의욕이 없었던 때에 대해 지속적으로 이야기하는 경우가 있었다.

  • 동기유발요인motivators는 직무의 [본질적인 조건](예: 성취, 인정, 책임, 승진, 성장)에서 비롯되었으며 SDT에 의해 요약된 동기 부여 요소와 잘 일치한다.
  • 반면, 위생 요인hygiene factors은 [상황적 조건]에서 발생하며 요인의 부재(예: 근무 조건, 대인 관계, 급여, 지위, 직업 안정성)를 통해 불만족에 기여했다.

연구에 따르면 두 요인 세트는 별도의 연속성에서 작동하므로 별도로 다루어야 합니다. 이 모델 하에서, 위에서 논의된 [인센티브(예: 교육 아카데미 및 교수 개발)]는 불만족(예: 고용 안정성 부족)을 촉진하는 [위생 요인]의 맥락에는 거의 영향을 미치지 않을 것이다. 
Herzberg’s32 motivation–hygiene theory, for example, identifies two sets of factors that separately influence job satisfaction (i.e., motivators) and dissatisfaction (i.e., hygiene factors). After interviewing employees about when they felt exceptionally good and bad about their jobs, some factors were consistently talked about in terms of feeling good and motivated, and others in terms of feeling bad and unmotivated.32 

  • Motivators arose from intrinsic conditions of the job (e.g., achievement, recognition, responsibility, advancement, growth) and align well with the components of motivation outlined by SDT.
  • Hygiene factors, in contrast, arose from contextual conditions and contributed to dissatisfaction through their absence (e.g., working conditions, interpersonal relations, salary, status, job security).33 

Research suggests that both sets of factors operate on separate continua and need to be addressed separately.34–36 Under this model, the incentives discussed above (e.g., teaching academies and faculty development) will have little influence in the context of hygiene factors that promote dissatisfaction (e.g., lack of job security).

또한 [동기부여 요인]과 [위생 요인]의 차이는 [돈이 할 수 있는 역할]을 새롭게 조명합니다. 부정적인 동기부여자로서, 돈은 조직행동주의자들에 의해 [존재할 때 만족감]을 만들어내기보다는, [부재할 때 불만족]을 만들어낼 것으로 기대된다. 아마도 결과적으로, [(교육에 대한 강한 저해 요인을 만드는) 임상업무에서 손실된 돈]이 [교육(일반적으로 동기 부여 인센티브 목록에서 낮은 순위에 있음)에서 얻는 돈보다 더 중요하다]고 추측하는 것이 타당하다.

Additionally, the distinction between motivators and hygiene factors shines new light on the role that money might play: As a negative motivator, money is expected by organizational behaviorists to create dissatisfaction when absent rather than creating satisfaction when present. Perhaps, as a result, it is reasonable to speculate that money lost from clinical practice (creating a strong disincentive for teaching) is more important to consider than money gained from teaching (commonly ranked low on lists of motivating incentives).

동기부여 요인과 위생 요인을 모두 해결하기 위해, [매슬로의 욕구 위계 이론]의 수정된 버전은 임상 교사의 가장 기본적인 요구 또는 기본적인 요구에서 시작하여, 다음과 같이 진행되는 요인을 순서대로 해결할 것을 제안함으로써 가치를 제공한다.

  • (1) 기본 임금,
  • (2) 복리후생 및 훈련의 안전성,
  • (3) 사회적 소속감,
  • (4) 자존감, 
  • (5) 자기 실현 

To address both motivators and hygiene factors, an adapted version of Maslow’s37 hierarchy of needs theory offers value by suggesting that factors be addressed in order beginning with a clinical teacher’s most fundamental or basic needs and progressing as follows:

  • (1) basic wages,
  • (2) safety in benefits and training,
  • (3) social belongingness,
  • (4) self-esteem, and
  • (5) self-actualization.38 


따라서 적절한 [임금, 직업 안정성, 훈련 기회]가 없다면 [자존감과 자아실현]을 목표로 하는 인센티브는 거의 영향을 미치지 않을 수 있다. 실증적 연구에 따르면, 재정적 인센티브를 제공하는 것은 직원의 생산성을 30% 향상시키는 것으로 나타났으며, 이는 일자리 창출 계획(9%-17%)과 직원 참여 프로그램(1% 미만)보다 더 크게 나타났다. 그러나 일반적으로 근로자들 사이에서는 충분한 급여가 중요할 수 있지만, 임상의들은 일반적으로 임상적인 역할을 수행할 수 있는 시간을 포기하더라도 최소한의 "기본 임금"을 누리기 때문에 이러한 생각들이 의료 교육으로 어떻게 일반화되는지 알기 어렵다. 이런 의미에서 재정적 인센티브에 대한 질문은 아마도 "얼마나"에 대한 것이 아니라 "무엇이 공정한가"에 대한 것이 될 것이다.

Thus, without adequate wages, job security, and training opportunities, incentives targeting self-esteem and self-actualization may have little influence. Supportive empirical work found that providing financial incentives raised employee productivity by 30%, larger than job enrichment initiatives (9%–17%) and employee participation programs (less than 1%).39 However, although sufficient pay may be important among workers in general, it is difficult to know how these ideas generalize to medical education because clinicians generally enjoy at least “basic wages” even when one gives up clinical time to take on teaching roles. In this sense, the question of financial incentives perhaps becomes less about “how much” and more about “what is fair.”

[형평성 이론]은 [절대적인 돈의 양]은 [불공정에 대한 인식]만큼 중요하지는 않을 수 있다고 가정한다. 다른 사람들과 비교하여, [자신의 자격과 노력에 대한 과소 또는 과다 지급]을 인식하는 것은 디스트레스의 감정으로 이어진다. 예를 들어, 조직 내의 두 역할이 더 많은 경험과 기술을 필요로 하는 한 역할에도 불구하고 동일한 급여를 받는 경우, 더 높은 역할에 속한 사람들은 그들이 버는 돈의 양에 만족했지만, 이 금액을 하위 역할에 속한 사람들과 비교했을 때 불만족스러웠다. 즉, 한 사람이 [자신이 과소평가]를 받거나, [다른 사람들이 과대평가]를 받는다고 인식할 때 경제적 지위에 관계없이 동기부여가 위협받을 수 있다. [의학 교육에 대해 (교수가) 인식하는 "공정한fair" 보상금]은 종종 [교수자들이 실제로 받는 것]보다 더 높으며, 이는 [형평성equity의 문제가 작용]할 수 있음을 시사한다. 또한, 아마도 [교육에 대한 보수를 주지 않는 기관에 소속된 사람들]은 재정적 인센티브를 낮게 평가할텐데, 왜냐하면 그러한 환경에서는 아무도 [교육 사례비teaching honoraria]를 받지 못해야만 형평성이 확립되기 때문이다. 직원들은 [더 높은 공정성fairness]을 옹호함으로써 형평성을 회복하려고 하지만, 반대로 이것이 잘 되지 않으면, 노력을 덜 하거나 역할을 완전히 포기함으로써 형평성을 회복하려 할 것이다. 그러나 [급여율rate of pay]이 "공정한" 것으로 간주되는지 여부는 비교되는 기준기준에 따라 달라질 수 있다.

Equity theory40 posits that the absolute amount of money may not be as important as perceptions of unfairness. Perceiving under- or overpayment given one’s qualifications and effort, in comparison with others, leads to feelings of distress. For example, when two roles within an organization received equal pay despite one role requiring more experience and skill, those in the more senior role were satisfied with the amount of money they were making, but dissatisfied when this amount was compared with those in the junior role.41 That is, motivation may be threatened regardless of financial position when one perceives oneself to be underrewarded or others overrewarded. The perceived “fair” rate of compensation for teaching in medicine is frequently higher than what teachers are actually being paid, suggesting that equity issues may be at play.13 Also, perhaps individuals at institutions who are not paid to teach rank financial incentives low because equity is established when nobody receives teaching honoraria in such environments.12 Employees seek to restore equity by advocating for more fairness, or if unsuccessful, by exerting less effort or abandoning the role completely.42 Whether a rate of pay is considered “fair,” however, likely depends on the reference standard against which it is compared.

[다른 인센티브]도 [형평성equitability에 대한 생각]에 의해 영향을 받을 수 있는지는 조직 행동 문헌에서 명확하지 않다. 예를 들어, [교육 아카데미teaching academy]

  • [교육적 역할]을 [임상적 또는 연구적 성공]과 비교하여 [대등한 수준의 명망comparable plane of prestige]에 놓음으로써 [동기부여요인motivator]를 제공할 수 있지만,
  • 만약 아카데미가 [교육자의 이너서클]에서만 가능하다면, [아카데미에서 배제당한 교수자]에게 [지위와 소속감의 부재]를 암시하게 되므로 [위생적 요인]으로 해석될 수 있다.

It is unclear from the organizational behavior literature whether other incentives are susceptibly influenced by considerations of equitability. For example,

  • a teaching academy might provide a motivator by putting educational roles on a more comparable plane of prestige relative to clinical or research successes,
  • but if only available to an inner circle of educators, the same incentive might be interpreted as a hygiene factor by implying the absence of status and belongingness for teachers who are excluded.

[조직행동 분야]는 [개인의 특성] 외에도 [환경적 요인]에 주목함으로써 인센티브를 더 폭넓게 고려하지만, [동기부여의 촉진]에는 (심리학자나 의학교사들이 주장하는 것보다) [재정적 보상이 훨씬 중요하다]는 점도 시사하므로 우리가 어떻게 진행해야 할지에 대한 모순적 메시지를 남긴다. 이러한 주장을 조정하기 시작하기 위해 [행동경제학 분야]는 왜 재정적 인센티브가 동기부여와 동기부여를 동시에 할 수 있는지에 대한 더 미묘한 이해를 제공하고, 우리에게 내재적-외부적 스펙트럼을 넘어서는 다른 형태의 동기부여를 소개한다.
While the organizational behavior field broadens consideration of incentives by drawing attention to environmental factors in addition to individual characteristics, it also suggests that financial rewards are much more important in promoting motivation than psychologists have argued or medical teachers have claimed, leaving us with contradictory messages of how to proceed. To begin reconciling these claims, the behavioral economics field provides a more nuanced understanding as to why financial incentives can be simultaneously motivating and demotivating, and introduces us to other forms of motivation beyond the intrinsic–extrinsic spectrum.

인센티브에 대한 행동경제학자들의 견해
Behavioral economists’ view on incentives

행동 경제학 내에서 [동기구축이론(MCT)]은 [심리학에서 얻은 정보를 전통적인 경제 모델과 결합]하고, 보상에 대한 우리의 이해를 돕기 위해 특히 유용한 관점을 제공한다. MCT는 앞서 설명한 바와 같이 인센티브가 연속체의 내적인 끝과 외적인 끝 사이에서 개인의 동기를 이동시키는 것을 전제로 하지만, [연속체의 각 끝]에서 사람들은 서로 다른 일련의 원칙에 의해 동기가 부여된다는 것을 암시한다.

  • 만약 인센티브가 사람들을 [외재적 동기 극]으로 이동시킨다면, 인센티브는 [내재적 동기]를 "밀어낸다crowds out". 그러한 경우, 노력은 [인센티브의 크기]와 직접적으로 관련이 있으며, 더 큰 인센티브는 더 큰 노력을 추진한다(즉, 사람들은 화폐 시장 시스템에서 작동한다).
  • 반대로, 인센티브가 사람들을 [내재적 동기 극]으로 이동시킨다면, 인센티브는 본질적인 동기를 "밀집crowd in"시킨다. 이러한 경우, 노력은 대신 [상호주의 또는 이타주의]에 의해 추진된다(즉, 사람들은 사회 시장 시스템에서 작동한다).

Within behavioral economics, motivation crowding theory43 (MCT) combines information from psychology with traditional economics models and provides a particularly useful perspective to aid our understanding of rewards. MCT presupposes that incentives shift an individual’s motivation between intrinsic and extrinsic ends of a continuum43 as described previously, but it also suggests that at each end of the continuum, people are motivated by different sets of principles.

  • If an incentive shifts people toward the extrinsic pole, the incentive “crowds out” intrinsic motivation. In such cases, effort is directly related to the size of incentive, with larger incentives driving greater effort (i.e., people operate in money-market systems).44 
  • Alternatively, if an incentive shifts people toward the intrinsic pole, the incentive “crowds in” intrinsic motivation. In such cases, effort is instead driven by reciprocity or altruism (i.e., people operate in social-market systems).44

이러한 방향에서 중요한 의미는 [중소규모의 보상]이 동기부여에 가장 해로울 수 있다는 것이다. 이를 설명하기 위해, 한 주요 연구는 더 [큰 재정적 보상]이 [작은 보상]보다 더 많은 시간을 자선 단체에 자원봉사하게 하지만, 보상을 도입하는 것만으로도 자원봉사 시간이 4시간이나 줄어든다는 것을 발견했다. 자원봉사자들은 특정한 재정적 한계를 넘은 후에야 아무런 보상도 받지 못한 것과 같은 시간을 보냈다. 결과적으로, 충분히 큰 재정적 인센티브는 인센티브를 제공하지 않는 것보다 노력에 더 많은 영향을 미칠 수 있지만, 소규모에서 중간 정도의 재정적 인센티브는 해로울 가능성이 있다. 
The important implication within this orientation is that small- to medium-sized rewards can be the most detrimental to motivation. To illustrate, a seminal study found that larger financial rewards caused individuals to volunteer more hours toward charitable organizations than smaller rewards, but the mere introduction of a reward reduced volunteer time by four hours.45 Only after crossing a particular financial threshold did volunteers commit the same number of hours as without any rewards. As a result, large enough financial incentives can influence effort more than providing no incentives, but small to moderate financial incentives are likely to be harmful.46

안타깝게도 이 임계값을 추정하는 것은 어렵습니다. [이론적으로 충분히 큰 것처럼 보이는 양]은 실제로 사용할 때 너무 작은 것으로 인식될 수 있으며, 다른 관련 요소의 맥락에서 고려될 수 있다. 예를 들어, 50달러 사례비는 마취과 의사에게는 작을지 몰라도, 수련 중인 전공의에게는 클 수도 있다. 하지만 그룹별로 사례비를 다르게 설정하면 [인식된 불평등 위험the risk of perceived inequity]이 발생한다. 아마도 [내재적 동기를 밀어내거나, 오로지 인센티브를 얻기 위해서 교육을 함]으로써 생기는 [질 저하의 위험]을 기억하는 것이 더 중요할 것이다.
It is unfortunately difficult to estimate this threshold value. An amount that seems theoretically large enough can be perceived as too small when put in practice and considered in the context of other relevant factors.46 For example, a $50 honorarium might be small to an anesthesiologist and large to a resident in training, but setting different rates for different groups creates the risk of perceived inequity. Perhaps more importantly, it is critical to remember the risks of lessening quality that come from crowding out intrinsic motivation and having people teach purely to obtain an incentive.

이 딜레마에서 벗어날 수 있는 방법은 [인센티브 규모와 노력 사이의 관계]가 [비금전적 인센티브]에는 적용되지 않는다는 증거에서 나올 수 있다. 예를 들어, 적십자사의 대규모 실험을 통해 [복권과 기프트 카드]는 크기에 관계없이 헌혈자에게 중립적이거나 긍정적인 영향을 미치는 반면, [소액의 금전적 보상]은 헌혈 의지를 낮추는 것으로 나타났다. 그 차이는 매우 강력해서 만약 [비금전적 인센티브가 그것과 관련된 금전적 가치와 함께 제공]된다면(예: "당신은 5달러의 초콜릿 바를 받을 것이다"), 개인들은 마치 [그것이 금전적 인센티브인 것처럼 상호작용]하도록 기본설정된다. 이것은 임상의에게 "사례비"를 제공하는 것이 "150달러의 사례비"를 제공하는 것과 매우 다른 영향을 미칠 수 있음을 시사한다.
The way out of this dilemma may come from evidence suggesting that the relationships between incentive size and effort do not apply with nonfinancial incentives. For example, large-scale experiments with the Red Cross have found that lottery tickets and gift cards have neutral or positive effects on blood donors regardless of size, while small financial rewards lower willingness to donate blood.6,47 The difference is so powerful that if a nonfinancial incentive is provided with a monetary value associated with it (e.g., “you will receive a $5 chocolate bar”), individuals default to interacting as if it were a financial incentive.44 This suggests that offering a clinician “an honorarium” might have a very different influence relative to offering “a $150 honorarium.”

[내적-외적 동기부여 연속체]와 별개로 작용하는 것처럼 보이는 요소들과 관련하여, [이미지 동기부여(다른 사람들과 그들 자신이 좋은 사람이라는 것을 보여주고자 하는 사람들의 욕구)]는 친사회적 행동에 있어서 중요한 역할을 한다. 자선단체에 기부하거나, 헌혈을 하거나, 임상 교사로 봉사하기 위해 자원하는 것은 본질적으로 만족스럽지 않을 수 있지만, 일부 사람들은 이러한 일들이 [자기자신에 대한 느낌 및 자기의 공적 이미지에 대해서 기분 좋게 느끼게 해주기 때문에], 그 일들을 수행하려는 동기가 있는 것처럼 보인다. 이는 아리엘리 외 연구진이 무작위로 참가자들에게 기부 금액을 공개 또는 비공개로 지정해 자선단체에 기부하도록 했다. 그들은 개인적인 기부보다 더 많은 기부가 공공장소에서 이루어졌다는 것을 발견했다. 이러한 결과는 의학 교사medical teachers에게도 일반화될 수 있는데, 이는 임상의들이 [교육에 대한 많은 친사회적 이유]를 드러냈음을 고려하면 합리적이다. 그렇다면, [노력에 대한 대중의 인식]은 재정적 인센티브보다 더 영향을 미칠 수 있다. 그러나 이러한 발견이 인식된 형평성에 대한 관찰과 어떻게 상호 작용하고 기본적인 욕구 계층 구조에 어디에 놓여 있는지는 여전히 불분명하다.
With respect to factors that seem to operate separately from the intrinsic–extrinsic motivation continuum, image motivation (people’s desire to illustrate to others—and themselves—that they are good people) plays an important role when it comes to prosocial behaviors.43,48,49 Contributing to charities, donating blood, or volunteering to serve as a clinical teacher might not be inherently satisfying, but some appear motivated to perform the tasks because these tasks allow them to feel good about themselves and their public image. This was illustrated by Ariely et al,49 who randomly assigned participants to donate to a charity with their donation amounts being made public or private. They found that larger donations were made in public than in private. If these findings generalize to medical teachers, as seems reasonable given the many prosocial reasons for teaching that clinicians express, then public recognition of efforts may be more impactful than financial incentives. How these findings interact with the observations about perceived equitability and where one lies on the fundamental needs hierarchy, however, remains unclear.

이 문헌에서 분명한 것은 [특정한 행동과 관련된 긍정적인 이미지]는 [다른 사람들의 규범과 행동]에서 크게 파생된다는 것이다. 소득세 준수를 장려하고, 예방 접종을 받고, 운동을 하는 것은 사람들이 문화적 규범으로 보일 때 더 많이 하는 행동의 예이다. 따라서, [교육에 의해 유지되는 이미지 동기image motivation]는 부분적으로 [임상의가 위치한 맥락의 문화적 규범]에 의존할 것이다. 즉, [이미지 동기 부여]는 [교육이 인정받지 못하는 병원]에서는 (동기부여)요소가 아닐 것이다. 또한 [이러한 상황에서 제공되는 유형적 보상]은 의도치 않게 [그 행동이 어렵거나 매력적이지 않다는 인식을 강화]할 수 있다. 예를 들어, [인근에 공항이나 교도소가 개발되고 있을 때], 이웃 구성원들에게 재정적 인센티브를 제공하는 것은 [시설에 대한 지역사회의 지원을 감소]시킨다. 학습환경은 학습자의 관점에서 실질적으로 연구되어 왔으나, 특정 환경의 문화가 교사의 수업동기를 변화시키는 정도나 영향요인이 수업노력에 영향을 미치는 방식으로 수정가능한지는 여전히 미지수이다.
What is clear from this literature is that the positive image associated with particular behaviors is largely derived from the norms and behaviors of others.50,51 Encouraging income tax compliance, becoming vaccinated, and exercising are examples of behaviors people do more of when they appear to be the cultural norm.52 It is logical, then, that the image motivation held by teaching would be partially dependent on the cultural norm of the contexts within which clinicians are situated. That is, image motivation is not likely a factor in a hospital where teaching is not endorsed. Further, in such settings, tangible rewards can unintentionally reinforce the perception that the behavior is difficult or unattractive.48 For example, offering financial incentives to members of a neighborhood when airports or jails are being developed nearby reduces the community’s support for the facility.53 Although the learning environment has been studied substantially from learners’ perspectives, the extent to which the culture of a particular environment changes teachers’ motivations to teach, or whether the influential factors are modifiable in a way that impacts teaching efforts, remains unknown.

논의
Discussion

심리학, 조직행동학, 행동경제학에서 검토한 문헌을 종합할 때, 우리는 인센티브가 의학교사의 동기에 미치는 영향에 대해 세 가지 결론을 도출한다. 이것들은 인센티브를 구현하는 경우와 방법을 고려할 때 실용적인 지침으로 아래에 제시되어 있다. 
In synthesizing the literature reviewed in psychology, organizational behavior, and behavioral economics, we draw three conclusions about the influence that incentives have on the motivations of medical teachers. These are framed below as practical guidelines when considering if and how to implement incentives.

무엇이 개인을 행동으로 이끌 것인지를 결정합니다.
Determine what is driving the individual to act in the first place

첫째, [인센티브의 영향]은 [동기 부여에 중요하다고 간주되는 기본 메커니즘]과 인센티브가 [어떻게 상호 작용하는지]에 따라 달라진다. 노력에 영향을 미치는 인센티브를 도입하기 전에, 무엇이 그 사람이 그 일에 참여하도록 동기를 부여하는지를 결정하는 것이 중요하다.

  • 그들은 그것이 흥미롭고 도전적이라고 생각하나요? 
  • 그들은 그것이 그들의 역할의 핵심적인 부분이라고 생각하나요? 
  • 그들이 그것을 해야 한다는 말을 들었니? 
  • 그들은 자신에 대해 좋은 기분을 느끼기 위해 그렇게 하나요? 
  • 그 맥락에서 다른 모든 사람들도 그것을 하고 있나요? 

First, the influence of an incentive is dependent on how it interacts with the underlying mechanisms deemed important for motivation. Before introducing an incentive to influence effort, it is important to determine what is driving the person to engage in the task in the first place.

  • Do they find it interesting and challenging?
  • Do they assume it to be a core part of their role?
  • Have they been told they need to do it?
  • Do they do it to feel good about themselves?
  • Is everyone else in that context doing it?

이러한 질문은 어떤 유형의 인센티브가 가치가 있는지 알려주는 데 도움이 될 수 있는 출발점을 제공할 것이다. 단순히 가치가 있는 것(또는 없는 것)에 대한 주장을 액면 그대로 받아들이기보다, 현재 이러한 동기를 지지하거나 억제하는 인센티브 또는 억제책이 무엇인지 탐구할 가치가 있다. 예를 들어, 만약 사람들이 돈의 중요성을 경시한다면, 그들이 이미 돈을 받고 있는지, 얼마나 많은 돈이 "공정한fair" 것으로 인식될지, 혹은 그들이 돈이 중요하다고 말한다면 그것이 그들을 나쁘게 보이게 할지를 생각해보라. 그러한 고려사항은 동기부여 요인과 장벽의 피상적인 목록과 현재 작용하고 있는 복잡한 요인들의 미묘한 이해 사이를 구별할 것이다.
Such questions will provide a starting point that can help inform what types of incentives might be valued. It is also worth exploring what incentives or disincentives currently support or inhibit these motivations without simply taking claims about what is valued (or not) at face value. For example, if people downplay the importance of money, consider whether they are already being paid, what amount of money would be perceived as “fair,” or whether it might make them look bad if they were to say that money was important. Such considerations will differentiate between a superficial list of motivators and barriers and a nuanced understanding of the likely complex set of factors at play.

인센티브와 동기 부여 유형 간의 고유한 상호 작용을 고려합니다.
Consider the unique interactions between incentives and motivation types

둘째, 기본적인 동기 부여 동기와 가치를 파악한 후에는 인센티브가 실제로 필요한지 또는 해로울 수 있는지 고려하십시오. 본질적으로 동기 부여된 개인은 추가적인 동기 부여가 필요하지 않을 수 있지만, [동기부여된 원동력motivational drives의 실행을 막는 장벽]을 제거하기 위한 노력이 필요할 수 있다. 인센티브가 구현할 가치가 있다고 판단되는 경우, 어떤 유형이 가장 효과적인지(예: 금전적인지 비금전적인지), 어떻게 제공되는지(예: 사적인 것과 공적인 것)를 고려한다. 이는 [인센티브가 잘못]되면 [의미 있는 변화를 가져오지 못할 수도 있고, 지속적인 문제적 형태의 동기 부여를 유발할 수 있다]는 점을 고려할 때 신중한 생각이 필요하다. 그 경우에는 [사회적 규범이 바뀌게] 되고, [바람직한 행동을 장려하기 위한 미래의 노력이 성공할 가능성을 더욱 감소]시키게 되기 때문이다.
Second, once you have grasped the underlying motivational drives and values, consider whether an incentive is actually needed or could be detrimental. An intrinsically motivated individual might not need any additional incentive, but may require efforts toward removing barriers preventing them from enacting their motivational drives. If an incentive is deemed worth implementing, consider which type will be most effective (e.g., financial or nonfinancial) and how it will be provided (e.g., in private vs. public). This requires careful thought given that, if done incorrectly, the incentive can fail to produce meaningful change or can create sustained problematic forms of motivation that alter the social norms in a manner that further decreases the success of future efforts to encourage the desired behavior.

  • [이미지-동기부여된image-motivated 사람]의 경우 [재정적 인센티브]는 사적으로 주어질 때 가장 효과적인 반면, [개인의 기여를 인정하는 인센티브]는 공개적으로 해야 가장 효과적이다. 어떤 행동을 [일반적인 것normalizing으로 만드는 것]은 그 행동을 포용하는 방식으로 문화를 변화시킬 수 있다.
  • [외적 동기부여된extrinsically motivated 사람]의 경우, 인센티브는 예를 들어 [기술 개발 기회를 제공]하거나, [행동을 지지하는 다른 사람과의 연결]을 가능하게 함으로써 [자율성, 역량 및 관련성]에 대한 인식을 구축하려고 노력해야 한다.
  • For image-motivated individuals, financial incentives will work best privately, whereas incentives that recognize the individual’s contributions work best publicly. Normalizing the behavior might change the culture in a way that leads to embracing the behavior.
  • For extrinsically motivated individuals, the incentive should try to build one’s perceived autonomy, competency, and relatedness by, for example, providing skill-building opportunities or enabling connections with others who endorse the behavior.

 

  • [금전적 인센티브]은 효과적으로 사람들을 문 안으로 불러들일 수 있고, 일단 들어오면 그 일 자체를 가치 있게 여기고 감사하는 법을 배울 수 있지만, 무엇이 "충분히 큰" 것인지는 고려해야 할 중요하다: 그러한 인센티브는 crowding effect를 넘어서서 [정당한fair 것]으로 간주될 수 있을 정도로 충분히 커야 하지만, 과제가 어렵거나 인기가 없다는 신호를 보낼 정도로 크지 않아야 한다.
  • [비금전적 인센티브]는 사이즈에 민감하지 않으며, 특히 업무가 친사회적인 것으로 간주된다면 좋은 대안이 될 수 있다. 그러나 동일한 환경에 있는 개인마다 얼마나 충분한지에 대한 서로다른 인식을 가지고 있다면, 다른 사람들에게 다른 크기의 보상을 제공하는 로지스틱한 문제를 야기한다. [비재정적 인센티브]로 여겨질 수 있는 광범위한 것들은 [구두 피드백, 교사 커뮤니티와의 참여, 공적정, 교수진 개발 기회, 정체성 형성 지원] 등이 있다.
  • Financial rewards can effectively get people in the door where an individual can then learn to value and appreciate the task itself, but what constitutes “large enough” is important to consider: Such incentives need to be large enough to override any crowding effects and to be considered fair, but not so large that they signal the task as difficult or unpopular.
  • Nonfinancial incentives aren’t as sensitive to size and offer a good alternative particularly if the task is considered prosocial or if different individuals in the same environment have different perceptions of how much is enough, creating logistical problems in offering different-sized rewards for different people. The wide range of things that could qualify as nonfinancial incentives include verbal feedback, engagement with communities of teachers, public recognition, faculty development opportunities, and identity formation support.

인센티브 효과를 방해할 수 있는 장벽 고려
Consider barriers that may interfere with incentive effectiveness

셋째, 인센티브의 효과는 개인과 그들이 일하는 맥락에 따라 달라진다. [올바른 개인] 또는 [올바른 맥락]에서 [올바른 인센티브를 구현]하는 것은 이 싸움의 절반에 불과하다. [환경적 또는 맥락적 장벽]이 있는 맥락에서는 인센티브가 단기적이거나 거의 영향을 미치지 않기 때문이다. 사람들이 그들의 역할에서 안정감을 느끼는지, 그들이 보상을 받거나 공평하게 인정받고 있다고 느끼는지, 더 근본적인 요구가 충족되고 있는지 여부는 동시에 해결되어야 하는 중요한 고려사항이다. 

Third, the effectiveness of any incentive is dependent on individuals and the contexts within which they work. Implementing the right incentive for the right individual or in the right context is only half the battle as it will have short-term or little impact in a context where there are environmental or contextual barriers. Whether people feel secure in their roles, whether they feel like they are being compensated or acknowledged equitably, or whether more fundamental needs are being met are important considerations that need to be addressed in tandem.

결론들
Conclusions

요약하면, 심리학자, 조직 행동주의자, 행동 경제학자들은 우리에게 인센티브의 역할에 관한 유용한 권고를 개발하도록 이끈 경고 이야기와 성공 사례를 모두 제공했다. 그들이 만들어낸 통찰력에도 불구하고, 우리의 의학 선생님들 사이에서 지속적이고 긍정적인 형태의 동기 부여를 배양할 가장 가치 있고 영향력 있는 인센티브를 식별하기 위해, 그 분야는 교사들이 스스로를 발견하는 다양한 보건 전문적 맥락에서 인센티브가 어떻게, 언제, 왜 작동하는지에 대한 더 큰 명확성이 필요하다.
In sum, psychologists, organizational behaviorists, and behavioral economists have provided us with both cautionary tales and success stories that have led to the development of useful recommendations regarding the role of incentives. Despite the insights they have produced, to identify the most valuable and influential incentives that will cultivate sustained and positive forms of motivation among our medical teachers, the field needs greater clarity regarding how, when, and why incentives operate in the variable health professional contexts in which teachers find themselves.


Acad Med. 2018 Nov;93(11S Association of American Medical Colleges Learn Serve Lead: Proceedings of the 57th Annual Research in Medical Education Sessions):S52-S59. doi: 10.1097/ACM.0000000000002383.Incentivizing Medical Teachers: Exploring the Role of Incentives in Influencing Motivations
Affiliations collapse

Affiliation

1K.M. Wisener is associate director of faculty development, Faculty of Medicine, University of British Columbia, Vancouver, British Columbia, Canada; ORCID: http://orcid.org/0000-0002-6093-8338. K.W. Eva is professor and director of education research and scholarship, Department of Medicine, and associate director and senior scientist, Centre for Health Education Scholarship, University of British Columbia, Vancouver, British Columbia, Canada; ORCID: http://orcid.org/0000-0002-8672-2500.

PMID: 30365430

DOI: 10.1097/ACM.0000000000002383

Abstract

Purpose: Medical education is dependent on clinicians and other faculty who volunteer time and expertise to teaching. Unfortunately, the literature reports increasing levels of dissatisfaction, burnout, and attrition. Incentivization provides an obvious intervention, but rewards must be implemented judiciously or risk unintended consequences. With little known about the effects of incentives in medical education, the authors investigate key insights across three disciplines to explain how, why, and when incentives can be used effectively.

Method: In this critical synthesis, a purposeful and iterative literature search was conducted by exploring a variety of databases to identify seminal articles, key concepts, and generative search terms. Particularly fruitful disciplines were then explored more deliberately.

Results: Psychologists argue that the impact of an incentive depends on an individual's motivational drives. Organizational behaviorists draw attention to environmental incentives and disincentives that build or detract from motivation. Behavioral economists posit that size, type, and way in which an incentive is provided affect motivation differently.

Conclusions: The influence of an incentive depends on how it interacts with underlying mechanisms deemed important for motivation. These mechanisms change across tasks, individuals, and contexts. Recommendations derived from the effort include being deliberate about (1) determining what is driving the individual to act, (2) considering the unique interactions between incentives and motivation types, and (3) considering barriers that may interfere with incentive effectiveness. In examining each of these, the authors argue that the field needs greater clarity regarding how, when, and why incentives operate within the many contexts in which medical educators work.

 

의학교육의 학생참여: 교육과정 개발에서 모듈 공동책임자로서 학생에 관한 혼합연구(Med Teach, 2019)
Student engagement in medical education: A mixed-method study on medical students as module co-directors in curriculum development
Lennart Steffen Milles, Tanja Hitzblech, Simon Drees, Wiebke Wurl, Peter Arends and Harm Peters

 


Introduction

학생들의 참여는 전 세계적으로 의학 교육에 점점 더 많은 관심을 받고 있다. 그것은 학생들과 그들의 기관들을 위한 상호 이익과 함께 협력적인 접근을 구체화한다. 커리큘럼 개발은 학생 참여의 핵심 영역을 나타냅니다. 그러나 학생들은 어느 정도까지 참여할 수 있으며, 어떤 접근법이 효과적이고 실현 가능한가? 교육 평가에서 학생들의 기여도는 잘 확립되어 있지만, 교육과정 개발에서 학생들의 보다 적극적인 역할, 즉 그 설계와 개선에 대한 경험적 정보와 연구가 희박할 뿐이다. 본 논문의 목적은 통합 학부 의학 프로그램의 맥락에서 학생들이 [교육과정 개발]에서 [모듈 공동 책임자]로 기능하는 개념에 대해 보고하고, 이 개념을 통해 교직원 모듈 책임자와 학생 스스로의 경험에 대한 인식을 탐색하는 것이다. 
Engagement of students is experiencing growing attention in medical education world-wide (Bovill et al. 2009; Dhaese et al. 2015; Peters et al. 2018). It embodies a collaborative approach with mutual benefits for the students and their institutions. Curriculum development represents a key domain in student engagement (Aspire-to-Excellence 2013; Harden and Roberts 2015; Peters et al. 2018). But to what extent can students be involved, and what approaches are effective and feasible? While the contribution of students in the evaluation of teaching is well established, there is only sparse empirical information and research present on more active roles of students in curricular development, i.e. its design and improvement (Bovill et al. 2009; Dhaese et al. 2015; Stoddard et al. 2016). The purpose of this article is to report on the concept of students functioning as module co-directors in curriculum development and to explore the perceptions of faculty module directors and the students themselves on their experience with this concept in the context of an integrated undergraduate medical program.

[학생 참여]는 [학생들과 기관들 사이의 상호 유익한 협력적 접근]을 나타내며, [학생들의 학습과 발전]뿐만 아니라, [학업 환경과 제도적 문화의 질]을 향상시키기 위한 광범위한 활동을 의미한다. 그것의 실현은 일반적으로 그들의 기관 내에서 [관리, 교육, 연구 및 지역사회 활동에 학생들의 공식적인 참여]를 포함한다. ASPIRE-to-Excellence 이니셔티브는 학생 참여 활동에 대한 포괄적이고 실용적인 프레임워크를 제공했습니다. 커리큘럼 개발 활동(즉 커리큘럼 설계, 변경 및 개선)은 학교 관리, 학계 및 지역 사회에 대한 참여뿐만 아니라, 의료 교육에 대한 학생 참여의 핵심 영역을 나타냅니다.
Student engagement represents a mutually beneficial collaborative approach between students and their institutions and refers to a broad range of activities to enhance the learning and development of students, as well as the quality of the academic environment and institutional culture (Trowler 2010; Peters et al. 2018). Its realization generally involves formal participation of students in the management, education, research, and community activities within their institutions. The ASPIRE-to-excellence initiative has provided a comprehensive and pragmatic framework on student engagement activities (Aspire-to-Excellence 2013; Harden and Roberts 2015; Drees and Peters 2016). Curriculum development activities, i.e. curriculum design, change, and improvement, represent a key domain for student engagement in medical education in addition to engagement in school management, academic communities, and local community.

[커리큘럼 개발]과 관련하여 [가장 일반적이고 기본적인 학생 참여 모델]은 교수 과정, 프로그램 단위 및 시험에 대한 피드백을 수집하는 것을 포함한다. 이러한 학생들의 평가는 내부 교육과정 검토 과정에 대한 일반적인 인증 기준을 충족하지만, [교육과정 개선을 위한 실행 가능한 계획]으로 효과적으로 전환되지 못하는 경우가 많다. 비록 제한적이기는 하지만, 그들의 [교육 프로그램을 개선하기 위한 의대생들의 기여]가 [아직 충분히 활용되지 않았다]는 것은 문헌을 통해 증명할 수 있다. 학생들은 "실행 중인 교육과정"을 경험했고, 그들은 그 제품을 대표하고 학계의 이해관계자로서 목소리를 가지고 있다.
With regard to curriculum development, the most common and basic model of student participation involves gathering feedback on teaching courses, program units, and examinations (Bovill et al. 2009; Lawson McLean et al. 2013; Peters et al. 2018). While these kinds of evaluations by students fulfill general accreditation standards for internal curriculum review processes, they often fail to become effectively translated into actionable plans for curriculum improvement (Hsih et al. 2015). There is evidence from the literature, although limited, that the contribution of medical students to improve their educational programs has not yet been sufficiently utilized (Bovill et al. 2009). The students have experienced the “curriculum in action”, they represent its product and have a voice as stakeholders in the academic community (Boland 2005; Peluso and Takizawa 2010).

몇몇 연구들은 [의대생들의 교육과정 개발에 대한 보다 적극적인 참여]가 [교육 프로그램의 개선]으로 이어진다고 지적했다. 예를 들어, 학생들의 평가 과정을 최적화하고 대규모 학생 그룹이 참여하는 특정 교육과정 변화와 연결되는 학생 주도 교육과정 검토 모델이 보고되었다. 다른 연구는 [커리큘럼 계획에 대한 더 많은 학생의 투입]이 [계획된 결과]와 [학습된 결과]의 [더 긴밀한 정렬]과 관련이 있다는 것을 보여주었다. 또한 교육단위 기획단에는 교직원 외에 의대생도 정회원으로 참여시키는 것이 관행으로 자리 잡았으며, 여기에는 시범적인 교육과정 개편 사업에 우리 기관도 포함된다. 학생들의 참여를 더욱 높이기 위해, 베를린의 Charité – Universitätsmediz (Charité)는 최근 새롭게 [통합된, 성과-지향 학부 의학 커리큘럼]의 각 모듈의 디렉토리 보드에 의대생을 공식적으로 통합하는 개념을 개발하고 구현했다. 이 개념은 2010년에 도입되었으며 2015년 ASPIRE 학생 참여 우수상을 샤리테에 수여하는 데 핵심적인 역할을 했다.
A few studies have indicated that more active participation of medical student in curriculum development leads to improvement of the educational programs. For instance, a model of student-led curriculum review has been reported which optimized the students’ evaluation process and links to specific curricular changes involving a large group of students (Hsih et al. 2015). Other work has demonstrated that greater student input into curricular planning is associated with a closer alignment of planned and learnt outcomes (Murphy et al. 2009). Furthermore, it has become practice to include medical students in addition to faculty teachers as regular members in the planning groups of educational units, and this includes our own institution in a pilot curricular reform project (Visser et al. 1998; Burger 2006). To go even further with students' participation, the Charité – Universitätsmedizin Berlin (Charité) has recently developed and implemented a concept to formally integrate medical students into the directory board of each module of its newly integrated, outcome-oriented undergraduate medical curriculum. The concept was introduced in 2010 and played a key role in granting of the ASPIRE award for excellence in student engagement to the Charité in 2015.

이 기사의 목적은 다음과 같다. 

  • (1) 통합 학부 의학 커리큘럼의 맥락에서 모듈 공동 책임자로서 기능하는 의대생의 개념, 활동 및 관행을 설명한다. 주요 측면은 기사에 요약되어 있으며 "방법"에 대한 자세한 설명은 부록에 설명되어 있다. 
  • (2) 융합적이고 혼합적인 접근법을 사용하여 교육과정 개발 과정에서 교직원 모듈 책임자와 학생 스스로가 학생 모듈의 역할, 기능, 효과를 어떻게 인식했는지 탐구한다.

The aims of this article are

  • (1) to describe the concept, activities and practices of medical students functioning as module co-directors in the context of an integrated undergraduate medical curriculum; key aspects are outlined in the article and a “how to” elaborations are elucidated in Supplementary Appendix; and
  • (2) to explore how faculty module directors and the students themselves perceived the role, functions, and effects of the student module co-directors in the process of curriculum development using a convergent, mixed-methods approach.

방법들
Methods

설정
Setting

샤리테는 유럽 중부에 위치한 대형 의과대학으로 매년 2회 300명의 의대 신입생을 모집한다. 2010년, 학부 의학 교육과정은 [전통적인 학문 기반]의 교육과정에서 1학기부터 마지막 학기까지 [완전히 통합된 프로그램]으로 전환되었다. 이 모듈은 5년의 학습 기간과 최종 사무직 연도에 걸쳐 40개의 학제 간 주제 모듈로 구성되어 있습니다(부록 2 참조).
The Charité is a large mid-European medical school and enrolls 300 new medical students twice a year. In 2010, the undergraduate medical curriculum was transformed from a traditional, discipline-based curriculum into a fully integrated program from the first to the last semester (Maaz et al. 2018). It is organized into 40 interdisciplinary, thematic modules over a five-year study time and a final clerkship year, see Supplementary Appendix 2.

모듈 공동 책임자로서의 의대생 개념
Concept of medical students as module co-directors

통합 프로그램의 각 모듈은 다양한 분야의 교수진 3명과 의대생 1명 등 4명의 모듈 디렉터 그룹이 주도한다. 이러한 구조는 새로운 교육과정의 개발과 시행 과정에서 긍정적인 경험에서 비롯된다. 4명의 모듈 책임자는 해당 모듈의 교육과 관련된 모든 분야의 대표자로 구성된 특정 모듈 계획 그룹에 의해 선출되고 의장도 됩니다. 그들은 모듈 디렉토리 보드를 구성하고 품질 보증 및 향후 개선과 같은 모듈의 주기적 커리큘럼 개발 프로세스를 공동으로 책임진다. 학생 모듈 공동 책임자는 교직원 및 학생과 상호 작용하고, 정보를 전달하고, 학생 평가 및 피드백을 종합 및 해석하며, 교직원 모듈 책임자와 함께 모듈을 공동 개발하고, 그룹으로 조직한다.
Each module of the integrated program is led by a group of four module directors: three faculty members from various disciplines, and one medical student. This structure originates from positive experiences during the development and implementation of the new curriculum. The four module directors are elected by, and also chair, a specific module planning group, consisting of delegates from all disciplines involved in the teaching of that module. They form the module directory board and are jointly responsible for the cyclic curricular development process of their module, e.g. quality assurance and future improvement. Student module co-directors interact with faculty and students, relay information, synthesize and interpret student evaluation and feedback, co-develop the module together with faculty module directors, and organize themselves as a group.

표 1은 학생 모듈 공동 책임자의 구체적인 업무 및 활동에 대한 개요를 제공합니다. 부록 1은 "방법" 관점에서 그들의 과제와 실천요강에 대한 상세한 설명을 포함한다. 부록 3은 교육과정에 대한 모범적인 기여에 대해 보고한다.
Table 1 provides an overview on the specific tasks and activities of the student module co-directors. Supplementary Appendix 1 entails a detailed description of their tasks and practices from a “how to” perspective. Supplementary Appendix 3 reports on exemplary contributions to the curriculum.

전반적으로 학생 모듈 공동 책임자는 개인으로서도, 집단으로서도 높은 수준의 자율성을 가지고 행동한다. 그들은 우리 [기관의 커리큘럼 개발과 학생 참여를 위한 더 큰 네트워크의 공식적인 요소]로 역할을 한다. 그림 1과 같이, 이 네트워크는 각 모듈에서 공부하는 학생, 모듈 디렉터, 모듈 기획 그룹, 교수진 교육과정 개발자, 학부 프로그램 교육과정 위원회, 샤리테 감독 교육위원회, 학생회 대표 조직과의 지속적인 상호작용을 포함한다. 
Overall, the student module co-directors act with a high level of autonomy, both as individuals and as a group. They serve as formal elements of a larger network for curriculum development and student engagement at our institution (Maaz et al. 2018; Peters et al. 2018). As shown in Figure 1, this network involves ongoing interactions with the

  • students studying in their respective module,
  • module directors,
  • the module planning group,
  • faculty curriculum developers,
  • the curriculum committee for the undergraduate program,
  • the Charité overarching education committee, and
  • the student council representative organization.


그림 1. Charité의 커리큘럼 개발을 위해 학생 모듈 공동 책임자를 조직 네트워크에 포함합니다. 의대생이라면 누구나 모듈 공동 책임자로 공석에 지원할 수 있다. 그들은 학생 모듈 책임자 그룹에 의해 선발되고 학장의 학생 사무실에서 공식적으로 고용된다. 학생 모듈 공동 책임자가 교수 모듈 책임자와 함께 모듈 검토 회의를 주재합니다. 이사회는 교육과정 위원회에 의해 공식적으로 임명된다. 또한 교수협의회에 소속된 학생대표들은 학부 의학 프로그램의 연구위원인 3명의 학생들을 임명한다.
Figure 1. 
Embedding of student module co-directors into the organizational network for curriculum development at the Charité. All medical students can apply to an open position as a module co-director. They are selected by the group of student module directors and formally employed in the Dean’s office of student affairs. Student module co-directors chair the module review meeting together with faculty module directors. The board is formally appointed by the curriculum committee. In addition, the student representatives who are part of the faculty council appoint the three students who are members of the study committee for the undergraduate medical program.

학생 한 명이 여러 모듈의 학생 모듈 공동 책임자 역할을 수행할 수 있습니다. 학생들의 작업은 매달 모듈당 10시간의 노동시간에 해당하는 유로로 보상된다.
One student can act as a student module co-director for multiple modules. The students' work is compensated with a Euro equivalent of 10 working hours per module each month.

 

방법론적 접근
Methodological approach

우리는 학생들이 모듈 공동 책임자라는 개념에 대해 풍부하고 다층적인 관점을 가질 수 있도록 융합 병렬 설계를 가진 혼합 방법 연구를 채택했다. 순차적 혼합 방법 설계에서 먼저 두 개의 온라인 설문 조사의 등급을 정량적으로 분석하였다. 그런 다음, 정량적 평가 결과를 조명하기 위해 설문 내러티브와 포커스 그룹에 대한 정성적 분석을 실시하였다. 그 자료는 2016/2017년 겨울학기 동안 수집되었다. 본 연구는 안전한 자료관리를 위하여 지방청 및 윤리위원회(제406/16호)의 승인을 받았다. 
We employed a mixed-methods study with a convergent parallel design to allow for a rich and multi-layered view on the concept of students as module co-directors (Creswell 2014). In a sequential mixed method design, we first analyzed quantitatively the ratings of two online surveys. Then, we conducted a qualitative analysis of survey narratives and a focus group to illuminate the quantitative rating results. The data were collected during the winter semester of 2016/2017. This study was approved by the local office for safe data management and by the Ethics Committee (no. 406/16).

설문조사
Surveys

두 건의 익명의 온라인 설문조사는 학생 모듈 책임자와 교수 모듈 책임자를 대상으로 했다. 둘 다 용어의 이해와 정교함을 위해 파일럿 테스트를 받았다. 설문조사는 인구통계학적 특성에 대한 질문 외에도 4점, 5점 만점의 리커트 척도 평가를 활용하였으며, 교육과정의 질적 보장과 개선과정에서 학생모듈 공동책임자의 역할, 기능, 역량에 대한 서술적 의견을 요청하였다(부록 4). 
Two anonymous online surveys were conducted, one for student module directors and one for faculty module directors (EvaSys®, Electric Paper Evaluationssysteme GmbH, Lüneburg, Germany). Both were pilot tested for comprehension and refinement of wording. In addition to questions about demographic characteristics, the surveys employed four- and five-point Likert-scaled ratings, and requested narrative comments about the role, functions, and competencies of student module co-directors in the process of curricular quality assurance and improvement (Supplementary Appendix 4).

포커스 그룹
Focus group

교육과정의 다양한 학기(1~10)와 모듈 유형(기초원리, 질병모형, 임상적용)을 다루기 위해 의도적으로 선정된 8명의 학생모듈 공동책임자를 대상으로 포커스 그룹 토론을 실시하였다. 포커스 그룹 인터뷰는 참가자들과 공식적인 상호 관계가 없는 심리학 학사 학위를 가진 건강 교육 연구원에 의해 진행되었다. 공개 토론 지침을 사용하여 그룹이 주제별 우선순위를 정할 수 있습니다(부록 5). 포커스 그룹 토론의 오디오 녹음은 정확하게 기록되었다.
A focus group discussion was carried out with eight purposively chosen student module co-directors in order to cover different semesters (1–10) and module types (foundational principles, disease models, and clinical application) of the curriculum. The focus group interview was moderated by a health education researcher with a Bachelor degree in psychology who had no formal interrelations with the participants. An open discussion guideline was used, thus allowing the group to set their own thematic priorities (Supplementary Appendix 5). An audio recording of the focus group discussion was transcribed verbatim.

양적, 질적 분석
Quantitative and qualitative analyses

정량조사 자료는 SPSS 22(IBM, Armonk, NY, USA)를 이용하여 기술적으로 분석하였다. 결과는 주파수 및 평균 ± 표준 편차로 표시됩니다. 텍스트로부터 범주를 도출하기 위한 귀납적 접근법을 이용하여 포커스 그룹 인터뷰와 내러티브 설문 의견을 정성적으로 분석하였다. 먼저 저자 LM, TH, HP는 주제별로 자료를 독립적으로 분석했다. 그런 다음, 모호성이 있는 경우 합의를 도출하기 위해 구체적인 인용문이 논의되었다. 이 문서에서 개별 학생의 인용구는 괄호 안에 "s"와 각 학생의 숫자로 표시되며, 교수진의 인용구는 "f"를 사용하여 동일한 방식으로 표시됩니다. 인용문은 저자들에 의해 독일어에서 영어로 번역되었다.
Quantitative survey data were analyzed descriptively using SPSS 22 (IBM, Armonk, NY, USA). Results are expressed as frequencies and mean ± standard deviation. The focus group interviews and narrative survey comments were analyzed qualitatively using an inductive approach for deriving categories from text (Mayring 2014). First, authors LM, TH, and HP independently analyzed the material thematically. Then, specific quotes were discussed to yield consensus in cases of ambiguity. In this article, quotes by individual students are indicated in parentheses with an “s” and the number of the respective student; quotes by faculty are displayed in the same manner by using the letter “f”. Quotes were translated from German to English by the authors.

결과
Results

정량분석
Quantitative analyses

스터디 샘플
Study sample

학생공동감독단에서는 25명 중 23명이 설문에 참여(응답률 92%)했다. 20명은 21~25세, 3명은 26~30세, 13명은 여성(57%)이었다. 평균 학습 시간은 2.5년(±1.4년)이었고, 학생 모듈 공동 책임자로서의 평균 학습 시간은 2년(±1.4년)이었다. 대부분(52%)이 하나의 모듈을 담당했습니다. 
In the group of student co-directors, 23 out of 25 students participated in the survey (92% response rate). Twenty were 21–25 and three were 26–30 years of age, 13 participants were female (57%). Mean study time was 2.5 years (±1.4 years) and mean time as student module co-directors 2 years (±1.4 years). Most (52%) were responsible for one module.

교직원 모듈 책임자 그룹에서는 107명 중 81명(응답률 76%)이 응답했다. 3명은 31~40세, 38명은 41~50세, 35명은 51~60세, 4명은 60세 이상, 26명은 여성(32%)이었다. 32명이 임상의, 22명이 임상 이론 분야, 25명이 기초 과학 분야에서 일하고 있다. 
In the group of faculty module directors, 81 out of 107 responded (76% response rate). Three were 31–40, 38 were 41–50, 35 were 51–60 and four were more than 60 years of age, 26 were female (32%). Thirty-two work as clinicians, 22 in a clinical–theoretical discipline and 25 in basic science.

대부분이 1개 모듈(75%)을 담당했으며 4년 이상 모듈 디렉터로 활동(42%, n=34%)했으며, 1년 미만 모듈 디렉터로 활동한 경우는 2개(3%)에 불과했다. 
Most were responsible for one module (75%) and had been active as a module director for more than 4 years (42%, n = 34); only two (3%) had been active for less than one year.

등급
Ratings

그림 2와 같이, 학생 모듈 공동 책임자의 87%가 교육과정 변화에 큰 영향을 미친다는 데 동의하거나 동의하는 경향이 있으며, 96%는 이것이 교육과정에 긍정적인 영향을 미친다고 생각한다. 대다수는 또한 자신이 다른 모듈 이사들과 동등한 파트너라고 생각합니다(87%가 동의하거나 동의하는 경향이 있음). 65%는 자신들의 생각이 때때로 학생들의 평가 결과와 다르다는 것에 동의하거나 동의하는 경향이 있다. 
As shown in Figure 2, 87% of the student module co-directors agree or tend to agree that they have great influence on curricular change and 96% think this has a positive impact on the curriculum. A majority also feels that they are equal partners of the other module directors (87% agree or tend to agree). Sixty-five percent agree or tend to agree that their ideas sometimes diverge from the student evaluation results.

[교직원 모듈 책임자] 대다수는 학생들이 자신의 교육과정에 기여할 수 있다는 점(93%), 학생 모듈 공동 책임자가 교육과정에 혜택을 준다는 점(94%), 업무가 건설적이라는 점(95%)에 동의하거나 동의하는 경향이 있다. 학생 모듈 공동 책임자ㅇ와 일치하여, 교직원 모듈 책임자의 80%도 학생 모듈 공동 책임자를 동등한 파트너로 본다. 교직원 모듈 책임자의 64%는 자신이 다른 교직원 모듈 책임자와 동일한 영향력을 가지고 있다고 생각하는 반면, 61%는 학생 모듈 공동 책임자보다 교육과정에 더 또는 조금 더 많은 영향력을 가지고 있다고 생각한다.
The majority of faculty module directors agree or tend to agree that students are able to contribute to their curriculum (93%), that the student module co-directors benefit the curriculum (94%) and that their work is constructive (95%). In congruence with the student module co-directors, 80% of faculty module directors also see the student module co-directors as equal partners. While 64% of faculty module directors think that they have the same influence on the curriculum as the other faculty module directors do, 61% think they have more or a little more influence on the curriculum than the student module co-directors do.

그림 3은 [교직원 모듈 책임자]가 활동과 관련된 8개의 서로 다른 영역에서 [학생 모듈 공동 책임자의 역량]을 어떻게 평가하는지 보여줍니다. 대다수의 교직원 모듈 책임자들은 학생 모듈 공동 책임자들이 교육과정에 대한 개요를 가지고 있으며, 학생들의 평가를 해석하고 교육과정 개선을 위한 제안을 제공하며 교사 및 학생들과 소통할 수 있다는 점에 83~96%의 비율로 동의하거나 동의하는 경향이 있다. 적어도 86%는 학생 모듈 공동 책임자들이 타협점을 찾을 수 있다는 것에 동의하는 경향이 있다. 이들은 수업의 질을 평가할 수 있는 능력이 있다고 판단되지만(81%가 동의하거나 동의하는 경향이 있다), 모듈의 분야 관련 내용을 평가할 수 있는 능력이 있다는 데 동의하는 교수 모듈 책임자는 훨씬 적다(49%만이 동의하거나 동의하는 경향이 있다).

Figure 3 shows how faculty module directors rate student module co-directors’ competence in eight different areas related to their activities. The majority of faculty module directors agree or tend to agree at rates between 83 and 96% that the student module co-directors have an overview of the curriculum, and that they are able to interpret students’ evaluation, provide proposals for curricular improvement and communicate with teachers and students. Eighty-six percent at least tend to agree that student module co-directors are able to find a compromise. They are deemed to be competent in assessing the quality of classes (81% agree or tend to agree), but far fewer faculty module directors also agree that they have the competence to assess the discipline-related content of the module (only 49% agree or tend to agree).

정성분석
Qualitative analyses

귀납적 접근법을 이용하여 정량적 조사 결과를 더욱 조명하기 위해 '학생 모듈 공동 책임자가 교육과정에 미치는 영향', '전략', '과제'의 세 가지 주제를 파악하고 선정하였다. 다음은 개인별로 특히 표현적이고 대표적인 인용문을 예시적으로 나열한 것이다. 인용문은 개념에 대한 다양한 인식을 설명해야 한다.
Using an inductive approach, we identified and selected the three themes “influence of the student module co-directors on the curriculum”, “strategies,” and “challenges” to further illuminate the results of the quantitative surveys. In the following, particularly expressive and representative quotes by the individuals are listed in an exemplarily manner. The quotes should illustrate the different perceptions towards the concept.

  1. 학생 모듈 공동 책임자가 교육과정에 미치는 영향. 여기서 세 개의 하위 테마가 인식되었습니다.
    Influence of the student module co-directors on the curriculum.
     Three sub-themes were recognized here.
    1. 커리큘럼에 대한 광범위하고 고유한 지식을 가져옵니다. 주제는 교수 모듈 책임자들이 제시한 인용문으로 가장 잘 특징지을 수 있다. 학생 모듈 공동 책임자는 "모듈에 대한 깊은 지식과 따라서 수업의 개요 및 학습 나선으로의 통합"(f50) 때문에 가치가 있다. 여기에는 "전체 교육과정의 주제 맥락"(f2), "어떤 내용이 이미 가르치고 어떤 수준의 세부사항"(f6), "격차"(f6)와 "중복"(f11), "실제로 나쁜 수업"(f13), "교육 계획과 수업의 현실 사이의 차이"(f13)에 대한 지식이 포함된다. 학생 모듈 공동 책임자는 "시스템에서 수업 내용을 상세히 설명할 수 있는 유일한 사람"으로 간주된다(f65). 학생들은 자신을 "진짜로 이루어지는 교육과정의 전문가"로 본다(s1).
      Bringing in broad and unique knowledge on the curriculum. This theme can best be characterized by the quotes given by the faculty module directors. Student module co-directors are valued because of their “profound knowledge of the module and thus also an overview of the classes and their integration into the learning spiral” (f50). This involves knowledge of “context of topics in the overall curriculum” (f2), “which content has already been taught and at what level of detail” (f6), the “gaps” (f6) and “redundancies” (f11), “didactically bad classes” (f13) and “differences between curricular planning and reality of a class” (f13). The student module co-directors are considered as the “only ones in the system who are able to overview in detail the content of the classes” (f65). Students see themselves as “experts of the curriculum that really takes place” (s1).
    2. 학생들의 관점에 목소리를 내는 것. 교수진과 학생들은 모두 학생 모듈 공동 감독을 "학생들의 대변자"로 본다(s23, f54). 학생 모듈 공동 책임자는 "평가 비율이 낮을 때 특히 중요한 학생들의 피드백을 묶는다"(f2). 그들의 대표성은 다양하게 인식된다. 일부 교수진은 "학생 관점이 관련성 있고 대부분 구체적인 피드백을 제공하는 대표적인 목소리를 얻는다"(f31)고 말하는 반면, 다른 교수진들은 학생 모듈 공동 책임자가 "학생의 관점에서 중요한 피드백"을 제공한다고 말한다. 불행하게도, 항상 대표적인 것은 아니다"(f7).
      Giving the students’ perspective a voice.
       Both faculty and students see the student module co-directors as the “mouthpiece of the students” (s23, f54). The student module co-directors “bundle the feedback from students which is particularly important when evaluation rates are low” (f2). Their representativeness is perceived diversely. While some faculty members state that the “student perspective gains a representative voice that provides relatable and mostly concrete feedback” (f31), others state that student module co-directors contribute “important feedback from the perspective of the students. Unfortunately, not always representative” (f7).
    3. 개선을 위한 아이디어를 제공합니다. 교수 모듈 책임자들은 학생들의 기여와 그들이 기여하는 방식의 몇 가지 측면을 중요시한다. 학생 모듈 공동 책임자는 "창의성과 신선함으로"(f24), "새로운 생각"(f4), "건설적인 비판"(f5)에 기여합니다. 그들은 종종 "중요한 강의 시간의 어려움에 대한 창의적인 해결책"(f69)을 가지고 있다. 학생 모듈 공동 책임자들은 "예산과 직업 관심사로부터 독립적"이라는 장점을 지적한다(s24). 그들은 스스로를 "교육과정이 어떻게 돌아가는지 이해하는 학생"이라고 설명한다. 반면, 교수 모듈 책임자들은 학생들이 "가끔 너무 이상적이고 긍정적으로 사물을 본다"(f21), "조직적 타당성을 보지 않고"(f72), "부족한 인적 자원"(f72)을 표현한다.
      Contributing ideas for improvement.
       Faculty module directors value several aspects of the students’ contribution and the way they contribute. The student module co-directors contribute “with creativity and freshness” (f24), “new thoughts” (f4), and offer “constructive criticism” (f5). They often have “creative solutions for difficulties with critical teaching sessions” (f69). Student module co-directors point out the advantage of “being independent of budget and career interests” (s24). They describe themselves as “students that understand how the curriculum works” (s24). On the other hand, faculty module directors express that the students “sometimes see things too idealistically and positively” (f21), “without looking at organizational feasibility” (f72), and “the scarce personnel resources” (f72).
  2. 학생 모듈 공동 책임자의 전략. 학생 모듈 공동 책임자는 모듈 책임자로서 성공하기 위한 네 가지 핵심 전략을 언급합니다.
    Strategies of the student module co-directors.
     The student module co-directors mention four key strategies for being successful as a module director.
    1. 준비를 잘 해라. "첫 번째는 준비하는 것입니다. 잘 준비해서 사람들을 정말 설득할 수 있을 것 같아요."(s26) 또한 "준비에 더 많은 노력을 기울일수록 제안이 받아들여질 가능성이 높다"(s6). 이는 일반적인 회의 준비를 넘어선 것으로 보인다. 사전에 학생들은 "어떤 주장이 나올 수 있고 어떤 반론이 좋을지에 대한 시나리오를 검토한다"(s24) 그리고 가능하다면 "이미 마음 한구석에 있는 문제에 대한 해결책을 가지고 있다"(s24). 교수 모듈 책임자는 "학생들의 준비 작업을 통해 의사 결정을 포함한 회의가 더 쉽고 빠르게 진행된다"고 보고합니다(f46).
      Be well prepared.
       “The first thing is being prepared. I think you can really persuade people by having prepared well” (s26). Furthermore, "the more effort you invest in preparation, the higher are the chances that your proposal gets accepted” (s6). This seems to go beyond general meeting preparations. In advance, students “go through scenarios about what arguments may come up and what would be good counter arguments” (s24) and, if possible, “have a solution for the problem already in the back of your mind” (s24). The faculty module directors report that “working with the students’ preparations, our meetings – including decision-making – become easier and faster” (f46).
    2. 힘들지만 전략적인 위치를 차지합니다. 예를 들어, 모듈 기획 회의에서 학생 모듈 공동 책임자는 보통 회의록을 작성합니다. "회의록을 작성하는 것은 처음에는 귀찮다고 느낄 수 있지만," "결과가 표현되어야 하는 방식으로 표현되기 때문에" (s24) "이것을 당신 자신의 손에 쥐는 것" (s27)이 유리한 것으로 보인다. 이는 회의록이 "회의에서 합의된 변경사항을 요구할 때 참조할 수 있는 문서"(s24)로 간주되기 때문에 중요하다. 학생들은 그들이 "아무도 그것을 하고 싶어하지 않기 때문에 회의록을 작성한다"(s28)는 것을 알고 있지만, "그들을 좋은 위치에 놓는다"(s8)는 것을 발견한다. 반면에, 교수 모듈 책임자들은 학생들이 "일상적인 과부하 때문에 우리가 하지 않았을 업무 패키지를 자주 인계받는다"(f46)는 것을 높이 평가한다.
      Take over laborious, but strategic positions.
       For instance, student module co-directors usually take over the minutes in module planning meetings. “Writing the minutes, may feel annoying in the beginning” (s24), but it is seen as advantageous, “holding this in your own hands” (s27) “as results are phrased in the way they should be phrased” (s24). This is important as the minutes are seen as “the document one can refer to when demanding the changes that were agreed on in the meeting” (s24). The students are aware that they “write the minutes because nobody else would like to do it” (s28), but find that it “puts them into a good position” (s8). On the other hand, the faculty module directors appreciate that the students “frequently take over work packages, which otherwise would not be done by us because of the daily overload” (f46).
    3. 모듈 계획 그룹에 접근하기 전에 모듈 디렉토리 보드 내에서 합의에 도달합니다. 이것은 수업 내용의 변화와 그 변화를 촉진하기 위한 의사소통 전략에 적용된다. 내용과 관련하여 "변경 제안은 모듈 이사 간에 논의된 후 공동으로 제시하고 최종적으로 승인한다"(f36). 커뮤니케이션 전략과 관련해서는 교직원 모듈 책임자가 주도적으로 나서는 경우도 있다. "우리가 무언가를 결정하면, 모듈 책임자 중 한 명이 '내가 알아서 하겠다'고 말하고, 그나 그녀의 글이 더 무게가 실릴 것이기 때문에, 여러 부서에 이메일을 씁니다."(s29) 다른 상황에서는 학생이 제안된 변화를 주로 전달하는데, "단순히 학생이 중립적인 위치에 있기 때문이다. (s24)".
      Reach a consensus within module directory board before approaching the module planning group.
       This applies to changes in content of classes and the communication strategy to facilitate the change. Regarding content, “proposals for change are discussed among the module directors and then jointly presented and eventually endorsed” (f36). Regarding communication strategy, the faculty module directors take the lead in some cases. “When we have decided on something, one of the module directors says, ‘I will take care of it’, and writes the emails to the various departments, since his or her writing will carry more weight” (s29). In other situations, the student primarily communicates the proposed change, “simply because the student is in a neutral position. (s24)”.
    4. 학생 모듈 공동 책임자 그룹의 지원을 받습니다예를 들어, 학생들은 "집단에 의한 지원, 집단 내 정보 교환 및 자신의 모듈에 있는 문제에 대한 다른 관점의 입력"을 중요시한다(s11). 격주 회의에서 "학생 모듈 공동 책임자 간의 교류는 많은 새로운 아이디어를 만들어 내고 그룹은 생산적으로 협력한다"(s18). 그들의 자율성은 "그룹 내의 좋은 협력과 창의성을 위한 기초"로 간주된다.
      Getting support by the group of student module co-directors.
       For example, the students value “the support by the group, the exchange of information within the group and the input from other perspectives on issues in their own module” (s11). In the biweekly meetings, “the exchange between the student module co-directors produces many new ideas and the group productively works together” (s18). Their autonomy is seen as basis “for the good collaboration and creativity within the group” (s21).
  3. 학생 모듈 공동 책임자가 직면한 과제. 학생 모듈 공동 책임자로서의 업무가 긴장감이 없는 것은 아니다. 도전적인 것으로 인식되는 두 가지 하위 주제가 확인되었다.
    Challenges student module co-directors face.
     The work as a student module co-director is not without tension. Two subthemes were identified that are perceived as challenging.
    1. 위계질서를 다루는 것. 일부 학생들은 "위계에서 더 높은 위치에 있는 사람들을 다룰 때" 토론하고 해결책을 찾는 것을 어려움으로 인식했다(s14). 다른 이들은 "더 높은 순위의 사람들과 대화를 시작하는 것에 대한 자신의 억제력의 감소"를 경험했다(s20). 어떤 경우에는 "일부 교사들이 열심히 노력해서 그것을 해낸다"(s27)는 것처럼 "지렛대가 훨씬 적다"(s21)는 경험을 하기도 있다.
      Dealing with hierarchy.
       Some students perceived it as a challenge to discuss and to find solutions when “dealing with persons having a higher position in the hierarchy” (s14). Others experienced “a drop in one’s own inhibition to start a discourse with higher ranking people” (s20). In some cases, they experience “having much less leverage” (s21), as “some faculty teachers dig in their heels and get through with it” (s27).
    2. 커리큘럼 설계의 협상 과정에 익숙해지는 것. 이것은 변화에 영향을 미치기 위해 필요한 시간과 투자된 노력을 의미한다. 예를 들어, 학생들은 "토론을 멈출 때가 왔을 때 깨달을 필요가 있다"(s27)와 "하고 싶은 모든 것을 실행할 수 없기 때문에 집중하는 것이 중요하다"(s14)를 표현한다. 또한, 학생들은 "과잉 반응하지 말고, 모든 것을 개인적으로 받아들이지 말라"(s24) 또는 "합의에 도달하려면 시간이 필요하다"(s28)는 것을 배워야 했다. 학생들은 "인내력"(s10), "자기 주도성과 지속성을 보여주는 것"(s11), " 좌절 관용"(s10)의 증가에 대해 보고했지만, "기관으로서의 자선단체와 다양한 위원회에 대한 더 많은 감사"(s20), "다른 사람의 일을 처리하는 데 더 많은 존경과 감사를 보여주는 것"(s22)도 보고했다. 
      Getting used to the negotiation process in curriculum design.
       This refers to the time needed and the effort invested in order to affect a change. For instance, students express that they “need to realize when the time has come to stop a debate” (s27) and that it is important to get focused because “one cannot implement everything one would like to” (s14). In addition, students had to learn “not to overreact, not to take everything personally” (s24) or that “reaching consensus needs time” (s28). Students reported on increases in “endurance” (s10), “showing self-initiative and persistence” (s11) and “frustration tolerance” (s10), but also “more appreciation for the Charité as an institution and its various committees” (s20) and being “more respectful and showing more appreciation in dealing with the work of others” (s22).

논의
Discussion

본 연구는 의대생들을 교과과정 개발의 순환과정에 적극적으로 참여시키기 위한 새로운 실천모형을 보고하고 연구한다. 우리는 교직원 모듈 책임자와 학생 자신 모두 모듈 공동 책임자로서의 학생들의 개념, 즉 교육과정에 대한 역할, 기능 및 이점에 대한 그들의 경험을 긍정적으로 평가한다는 것이다. 우리의 혼합 방법 접근법은 모듈 공동 책임자로 기능하는 학생들의 여러 측면과 그들의 전략 및 그들이 직면한 과제를 깊이 조명한다. 다음에서는 문헌에 비추어 우리의 발견이 시사하는 바에 대해 논의할 것이다. 
The present study reports on and researches a new practice model for actively engaging medical students in the cyclic process of curricular development. We found that both faculty module directors and the students themselves positively rate their experience with the concept of students as module co-directors, i.e. their role, functions and benefits to the curriculum. Our mixed-methods approach profoundly illuminates the multiple facets of students who are functioning as module co-directors and their strategies and the challenges they face. In the following, we will discuss the implications of our findings in light of the literature.

교직원과 학생 모두 모듈 공동감독으로 일하는 학생들이 교육과정에 도움이 된다고 지적한다. 교육과정에 대한 광범위하고 독특한 지식을 끌어내고 학생들의 평가를 종합하여 잘 배치된 학생 중심의 교육과정 개선 제안서로 번역하는 학생들의 능력은 그런 점에서 중요한 것으로 보인다. 따라서, 모듈 공동 책임자로서의 학생의 개념은 학생들이 자신의 아이디어와 개념을 도입하고 의사결정 과정에 직접 참여함으로써 학생들을 [고전적인 반응적 역할], 즉 교육된 커리큘럼 평가에서 [능동적 역할]로 이동시킨다(Daese et al. 2015). 그들의 작업은 커리큘럼 평가와 혁신을 밀접하게 연결하고 [진행 중인 커리큘럼 검토 및 개선의 주기를 닫는 데 도움]이 된다. 이 개념은 또한 학생들이 배우는 것에 영향을 미칠 뿐만 아니라 받는 가르침에 영향을 미치는 자기 주도 학습의 보다 발전된 모델(Visser et al. 1998)로 볼 수 있다.
Both faculty and students point out that students working as module co-directors benefit the curriculum. Students’ ability to bring in a broad and unique knowledge of the curriculum and translate the syntheses of the students’ evaluation into well-placed, student-oriented proposals for curricular improvement seems to be instrumental in this regard. Thereby, the concept of students as module co-directors moves the students from the classical reactive role, i.e. evaluating the taught curriculum, to a pro-active role by bringing in their own ideas and concepts and being directly involved in decision making processes (Dhaese et al. 2015). Their work closely links curriculum evaluation with innovation and helps to close the cycle of ongoing curriculum review and improvement. The concept may also be seen as a more advanced model of self-directed learning (Visser et al. 1998), where students not only have influence on what they learn, but also have an influence on the teaching they receive.

교수진과 학생들은 함께 학생 모듈 감독을 [학생들의 대변자]로 보고 있다. 그럼에도 불구하고, 두 그룹 모두 개별 학생 모듈 공동 책임자의 의견이 전체 학생 단체를 완전히 대표하는 것은 아니라는 것을 알고 있다. 세계의 다른 많은 곳과 마찬가지로, 우리 기관의 평가 참여는 자발적이며 응답률이 다소 낮다(Bosch et al. 2017). 학생 모듈 공동 책임자는 구두 학생 피드백 세션, 모듈의 학생들과의 대화 및 학생 모듈 공동 책임자 그룹의 다른 구성원들과 같은 다수의 질적 출처와 이용 가능한 정량적 학생 피드백을 합성하여 이에 대처하려고 한다. 이러한 어려움에도 불구하고 학생 모듈 공동 책임자는 학생들의 피드백과 아이디어를 모듈 리뷰에 충분히 반영하여 모듈의 커리큘럼 개선을 실질적으로 추진하는 것으로 보인다.
Faculty and students together see the student module director as a mouthpiece of the students. Nevertheless, both groups are aware that the opinion of the individual student module co-director may not be fully representative of the whole student body. Similar to many other places around the world, participation in evaluation in our institution is voluntary and the response rate is rather low (Bosch et al. 2017). The student module co-directors try to cope with this by synthesizing the available quantitative student feedback with a number of qualitative sources such as the oral student feedback session, conversations with students from the module and other members of the group of student module co-directors. Despite these difficulties, the student module co-directors seem to bring in enough students' feedback and ideas into the module reviews and thereby to substantially drive the curriculum improvement of the modules.

모듈 디렉터로서의 역할과 기능에 관해서는 교직원과 학생 모듈 디렉터는 서로를 동등한 파트너로 봅니다. 이것은 그들이 같은 전문지식을 가지고 있고 업무를 균등하게 분배한다는 것을 의미하지 않는다. [학생들의 강점] 중 하나는 ['실행 중인 교육과정'에 대한 독특한 시각]인 반면, [교직원 모듈 디렉터]들의 강점은 [교육과정의 분야 관련 내용]에 있다. 따라서 교직원과 학생 모듈 책임자는 모듈 검토 및 개선 과정에서 효과적으로 협력하는 다양한 기술과 전문 분야를 가진 개인으로 구성된 팀을 구성합니다. 여기에는 모듈 내용 및 구성에 대한 공동 책임과 커리큘럼 변경에 대한 공동 의사 결정이 포함됩니다. 이 작업이 항상 긴장감이 없는 것은 아니지만, 일반적으로 [학생들과 교수 모듈 책임자들 사이의 대화]가 [서로 분야가 다른 교수진들 사이에서의 대화]보다 분명히 덜 강렬하다는 것을 우리가 발견한 것은 흥미로웠다.
With regard to their role and function as module director, faculty, and student module directors see each other as equal partners. This does not mean that they possess the same expertise and distribute the tasks equally. One strength of the students is their unique perspective on the “curriculum in action”, while the faculty module directors’ strength lies in the discipline-related contents of the curriculum. Thus, faculty and student module directors form a team of individuals with varied sets of skills and areas of expertise which works effectively together in the process of module review and improvement. This involves shared responsibility regarding the module content and organization and shared decision-making in curricular change. This work is not always without tension, but it was interesting for us to see that in general discourses between students and faculty module directors were apparently less intense than those seen among faculty members of different disciplines.

학생 모듈 공동 책임자가 되는 연습은 학생들이 그들의 일을 효과적으로 하기 위해 몇 가지 전략을 채택하도록 이끌었다. 특히 교육 위원회에서 우리가 학술 위원회의 일원인 사람들에게, 성공 전략은 좋은 준비, 힘들고 전략적인 위치를 차지하고, 다른 주요 그룹과 사전에 동의를 찾고, 동료 커뮤니티로부터 지지를 받는 것을 포함하는 것은 놀라운 일이 아닐 수 있다. 학생들이 인식하는 도전도 마찬가지다. [커리큘럼 설계와 개선에 참여하는 교수들]은 [위계구조를 경험하고 다루는 것]과 [변화를 이루기 위해서는 노력과 시간이 필요하다는 것]을 잘 알고 있다. 모듈 공동 책임자인 학생들은 [학계에서 적극적인 역할을 하기 위해 빠르게 배우는 것] 같다. 이를 따른다면, 이 개념은 [커리큘럼 설계와 개선의 공동 창조에서의 공유 거버넌스 모델]을 의미한다(Boland 2005; Bovill et al. 2009). 학생들의 역할은 "이해관계자", "고객 또는 소비자", 또는 단순히 "시스템의 산물"을 넘어선다(Boland 2005). 그들의 역할은 [학문적 민주주의의 이상이 실천되고 배양되는 학문 공동체에서 공식적인 구성원]이 되는 것으로 바뀐다(Boland 2005). 
The practice of being a student module co-director has led students to adopt several strategies to do their work effectively. For those of us being a member of academic committees, especially in educational committees, it may not be surprising that success strategies involve good preparation, taking over laborious, strategic positions, finding consent in advance with other key groups and getting support from their peer community. The same applies to the challenges which students perceive. Experiencing and dealing with hierarchy and the efforts and time it takes to achieve changes are all well known by faculty members involved in curricular design and improvement. It seems that the students as module co-directors learn quickly to play an active role in the academic community. Along this line, the concept implies a model of shared governance in the co-creation of curriculum design and improvement (Boland 2005; Bovill et al. 2009). The role of students goes beyond being a “stakeholder”, a “client or consumer,” or just a “product of the system” (Boland 2005). Their role changes to being a formal member in the academic community, where the ideal of academic democracy is practiced and cultivated (Boland 2005).

우리의 결과를 해석할 때 커리큘럼 맥락을 고려해야 한다. 교육과정의 통합적 성격과 최근의 시행은 학생들을 모듈 공동 책임자로 두는 긍정적인 인식에 기여했을 것이다. 통합 학부 의료 프로그램은 상당한 복잡성을 수반한다(Stodard et al. 2016; Maaz et al. 2018). 새로운 통합 프로그램을 구현하기 전에, 우리의 이전 학부 교육과정은 전통적인 학문 기반 방식으로 구성되었으며, 요소 간의 상호작용이 제한적이고 감독의 필요성이 거의 없었다. 게다가, 대부분의 교직원들은 그들 자신이 학생이었을 때 비슷한 프로그램을 경험했다. 이것은 그들에게 그러한 커리큘럼에 대한 개요와 이해를 제공했다. 우리 기관의 주요 개혁으로 프로그램은 수많은 수평 및 수직 상호 연결을 가진 통합되고 복잡한 시스템으로 전환되었다(Maaz 등 2018). 문제는 오늘날의 많은 교직원들이 학생 시절에 이러한 새로운 커리큘럼을 경험하지 못했다는 것이다. 모듈 디렉터로 근무할 때, 그들은 아마도 그들의 부서와 분야의 기여가 전체 교육 프로그램에 어떻게 들어맞는지, 그리고 단일 수업의 변화가 교육과정의 다른 부분과 학생들의 학습 결과에 어떻게 잠재적으로 영향을 미칠 수 있는지 상상하기 어려울 것이다. 우리는 이러한 격차가 학생 모듈 공동 책임자와의 협업에 의해 쉽게 해소된다고 가정하며, 이는 결국 이 개념에 대한 교직원의 긍정적인 반응에 중요하다. 
The curricular context has to be taken into account in the interpretation of our results. The integrated nature of the curriculum and its recent implementation may have contributed to the positive perception of having students as module co-directors. Integrated undergraduate medical programs involve a substantial complexity (Stoddard et al. 2016; Maaz et al. 2018). Before implementation of the new, integrated program, our former undergraduate curriculum was organized in a traditional, discipline-based manner, with limited interactions between its elements and little need for oversight. In addition, most faculty teachers have gone through a similar program when they were students themselves. This provided them with an overview and understanding of such curricula. With the major reform at our institution, the program was transformed into an integrated, complex systems with numerous horizontal and vertical interconnections (Maaz et al. 2018). A problem is that many of today’s faculty members did not experience these new curricula as students. When serving as a module director it is probably difficult for them to envision how the contribution of their departments and disciplines fits into the whole educational program and how change in a single class may potentially affect other parts of the curriculum and the students’ learning outcome. We assume that this gap is closed easily by the collaboration with student module co-directors, which in turn is important for the positive response by faculty members to this concept.

이 연구는 한계가 있다. 단일 센터 환경을 나타냅니다. 지역적 맥락, 새로 구현된 커리큘럼 및 프로그램의 통합 특성은 다른 맥락으로의 이전 가능성을 제한할 수 있다. 우리의 연구는 교수 모듈 책임자가 있는 포커스 그룹을 포함하지 않았다. 교수모듈국장 설문조사의 229개 내러티브는 그들의 인식에 대한 질적 통찰력을 도출할 수 있는 실질적인 자료를 제공하였다. 우리는 예를 들어 전체 학생이나 교직원과 같은 우리 기관에 관련된 다른 그룹의 인식을 조사하지 않았다. 이러한 한계는 우리와 다른 의대에서 이 분야의 추가 연구를 위한 로드맵 또는 영감으로 보일 수 있다.
This study has limitations. It represents a single center experience. The local context, the newly implemented curriculum and the integrated nature of the program may limit transferability to other contexts. Our study did not involve a focus group with faculty module directors. The 229 narratives in the faculty module director survey provided substantial material to derive qualitative insights into their perceptions. We did not investigate the perception of other groups involved at our institution, for instance, the whole student or teaching body. These limitations may be seen as a roadmap or inspiration for further research in this area in our and other medical schools.

결론적으로, 본 논문은 학부 의학 교육과정의 지속적인 개발 과정에서 학생들의 참여를 위한 새로운 모델을 소개한다. 이 모델을 실천하는 것은 교수진과 학생 모듈 책임자 모두에게 긍정적으로 경험됩니다. 교육과정의 결과적인 개선은 학생들과 기관의 이익을 위한 것이다. 우리의 보고서는 다른 의학부들이 학생들을 커리큘럼 개발과 학생 참여의 다른 주요 영역에서 공동 책임자로 공식적으로 참여하도록 장려할 수 있다. 
In conclusion, this article introduces a new model for student engagement in the continuous development process of an undergraduate medical curriculum. Practicing this model is experienced positively by both faculty and student module directors. The resulting improvements of the curriculum are for the benefit of the students and the institution. Our report may encourage other medical faculties to formally engage their students as co-directors in curriculum development as well as in other key domains of student engagement.

 

 


Med Teach. 2019 Oct;41(10):1143-1150. doi: 10.1080/0142159X.2019.1623385. Epub 2019 Jun 16.

Student engagement in medical education: A mixed-method study on medical students as module co-directors in curriculum development

Affiliations collapse

Affiliation

1Dieter Scheffner Center for Medical Education and Educational Research, Dean's Office of Student Affairs, Charité - Universitätsmedizin Berlin , Berlin , Germany.

PMID: 31203695

DOI: 10.1080/0142159X.2019.1623385

Abstract

Introduction: Beyond participation in evaluation of teaching, there is sparse research available on more active roles of medical students in curriculum development. We report on a model of student engagement where medical students function as module co-directors, and how this is experienced by faculty and student module directors. Methods: Student engage in co-development of their curriculum with a high level of autonomy in organizing their activities. We conducted a mixed-methods, convergent design study based on surveys with faculty and student module co-directors and a student co-director focus group. Quantitative data were analyzed descriptively. Qualitative analysis was performed inductively. Results: Quantitatively, the majority of both faculty and student module directors report that the curriculum benefits from the students' work (95 and 94%). Both groups see each other as equal partners (80 and 87%). Qualitatively, this is related to students' competencies such as "bringing in broad and unique knowledge of the curriculum", "giving the students' perspective a voice," and "contributing ideas for improvement". Key strategies and challenges of the student co-module directors are illuminated. Conclusions: Student module co-directors represent a well-accepted practice model for curriculum development. This report may stimulate other faculties to engage their students more actively in medical education.

교육혁신을 구축-측정-학습으로 빠르게 평가하기: 린 스타트업을 보건의료전문직 교육에 적용하기 (Med Teach, 2022)
Evaluating education innovations rapidly with build-measure-learn: Applying lean startup to health professions education
David A. Cook, Abhishek Bikkani & M. Jeannie Poterucha Carter

 

 

서론
Introduction

교육자는 항상 혁신합니다. 교육 혁신의 예로는

  • 기존 과정의 새로운 교육 활동(예: 온라인 모듈, 그룹 토론, 수업 전 비디오 또는 인공지능 적응형 학습 인터페이스),
  • 평가에 대한 새로운 접근 방식(예: 학생이 절차적 과제에 대한 성과를 직접 기록),
  • 커리큘럼 내에서의 새로운 과정 또는 관리 절차 (예: 로테이션 성적 제출 또는 데이터 웨어하우스의 개발 및 사용을 위한 온라인 도구) 또는
  • 완전히 새로운 커리큘럼 내의 요소.

물론, 어떤 아이디어들은 다른 아이디어들보다 더 잘 작동한다. 유지할 혁신과 중단할 혁신을 선택하는 것은 유익성, 비용 및 단점과 관련된 경험적 증거를 이상적으로 기반으로 한다. 그러나 전통적인 연구 방법의 답은 종종 혁신 평가를 시기적절하고 의미 있는 방식으로 안내하기에는 너무 늦고 너무 드물게 나타난다. 예를 들어, e-러닝 및 시뮬레이션과 같은 교육 기술을 사용하는 혁신은 현재 특히 흔하지만, 이러한 기술은 매우 빠르게 발전하여 일반적인 교육 연구 연구를 수행하는 데 걸리는 시간(12~18개월) 동안 현대 스마트폰은 두 가지 디자인 '세대'를 거치게 될 수 있다. 혁신자들은 어떻게 따라갈 수 있을까?
Educators innovate all the time. Examples of educational innovations include

  • new instructional activities in an existing course (e.g. an online module, group discussion, pre-class video, or artificial intelligence adaptive learning interface),
  • novel approaches to assessment (e.g. students self-recording their performance on a procedural task),
  • new courses or administrative procedures within a curriculum (e.g. an online tool for submitting rotation grades, or development and use of a data warehouse), or
  • an entirely new curriculum.

Of course, some ideas work better than others. Choosing which innovations to sustain and which to stop is ideally based on empiric evidence regarding benefits, costs, and disadvantages. Yet the answers from traditional research methods often come too late and too infrequently to guide innovation evaluations in a timely and meaningful way. For example, innovations using educational technologies such as e-learning and simulation are particularly common at present, yet these technologies evolve so rapidly that in the time it takes to conduct a typical education research study (12–18 months), a modern smartphone might go through two design ‘generations.’ How can innovators keep up?

혁신 평가에 대한 '린 스타트업' 접근법은 전통적인 연구에 대한 유용한 대안을 제공한다. 이 접근법은 첨단 소프트웨어 시장에서 혁신의 개발과 생존에 기원을 두고 있지만, 그 이후 산업과 군대를 포함한 인터넷 기반 사업과 '전통적' 사업 모두에 널리 적용되어 왔다. 창안자(기업가)는 (적어도 서류상 또는 이사회에서) [좋게 들리는 아이디어]에서 [수익성 있는 비즈니스 모델]로 빠르게 전환하도록 촉진하기 위해 이 프로세스를 만들었습니다. 기업가들과 그들의 자금 제공자들은 제한된 시간과 자원을 고객의 요구를 충족시키는 데 효과적이고, 실행 가능하고, 지속 가능한(수익성) 아이디어에 사용할 강력한 인센티브를 가지고 있다. 그리고 그렇지 않은 아이디어들을 가능한 한 빨리 버려야 한다. [린 스타트업 접근 방식]은 짧은 평가 및 수정 주기를 사용하여 중요한 가정을 테스트하고 효과가 있는 모델에 빠르게 수렴하고 실행 불가능한 아이디어를 버린다. 신제품 제작 도구(예: 게시, 웹 사이트 제작, 게임 디자인 및 3D 인쇄용 도구)가 널리 보급되어 있다는 점을 감안할 때, 현대의 초점은 제품을 효율적으로 [구축하는 것building]이 아니라 고객이 원하고, 사용하고, 실제로 지불할 제품에 대해 [배우는 데learning] 있습니다. 실제로 '학습 속도가 새로운 불공평한 장점'이다(Maurya 2022).
The ‘Lean Startup’ approach to innovation evaluation offers a useful alternative to traditional research. This approach has its origins in the development and survival of innovations in the fiercely-competitive market of high-tech software, although it has since been widely applied to both Internet-based and ‘traditional’ businesses including industry and the military. The originators—business entrepreneurs—created this process to promote rapid transition from ideas that sound good (at least on paper, or in the board room) into profitable business models. Entrepreneurs and their funders have strong incentives to channel limited time and resources to ideas that are effective in meeting customer needs, practicable, and sustainable (profitable); and abandon as quickly as possible ideas that are not. The Lean Startup approach uses short cycles of evaluation and revision to test critical assumptions and rapidly converge on a model that works, and discard nonviable ideas. Given widespread availability of tools to build new products (e.g. tools for publishing, website creation, game design, and 3D printing), the contemporary focus is not on efficiently building a product but on learning about the product that customers want, use, and will actually pay for. Indeed, ‘Speed of learning is the new unfair advantage (Maurya 2022).

교육 혁신은 기업가적인 벤처이며, 상업적인 비즈니스 스타트업은 유망한 아이디어를 신속하게 식별하고 다듬는 린 스타트업 방법의 혜택을 받을 것이다. 그러나 린 스타트업 접근법은 교육에서 거의 주목을 받지 못했다. '린 스타트업'에 대한 PubMed 검색 결과, 혁신 보고서의 일환으로 린 스타트업 방법론을 간략하게 설명한 교육 중심 기사(Kaylan et al. 2021)가 1건만 공개됐다. 구글이 'Lean Startup Education'을 검색한 결과 다수의 블로그 게시물, 한 가지 방법 중심 기사(LeMahieu et al. 2017b), 박사 논문(Tran 2015)이 나타났다.
Education innovations are entrepreneurial ventures, and like a commercial business startup would benefit from Lean Startup methods to rapidly identify and refine promising ideas. Yet the Lean Startup approach has received little attention in education. A PubMed search for ‘Lean Startup’ revealed only one education-focused article (Kaylan et al. 2021) that briefly outlined the Lean Startup methodology as part of an innovation report. A Google search for ‘Lean Startup Education’ revealed a number of blog posts, one method-focused article (LeMahieu et al. 2017b), and a doctoral thesis (Tran 2015).

이 글의 목적은 린 스타트업의 역사와 주요 원칙을 개괄하고, 이를 보건 전문직 교육에 적용하고, 우리의 개인적인 경험을 활용하여 설명하는 것이다. 주요 청중은 보건 전문 교사들이다. 교육 관리자, 연구자 및 기업가들은 또한 이 접근법이 유용하다는 것을 알게 될 것이다. 
The purpose of this article is to outline the history and key principles of Lean Startup, apply these to health professions education, and illustrate these using our personal experience. The primary audience is health professions teachers. Education administrators, researchers, and business entrepreneurs will also find this approach useful.

교육자는 기업가이고, 혁신 팀은 스타트업입니다.
Educators are entrepreneurs, innovation teams are startups

[기업가]의 한 가지 정의는 '대개 상당한 진취성과 위험을 지닌 모든 기업을 조직하고 관리하는 사람'이다. 대부분의 교육 혁신가들은 스스로를 조직자이자 창시자로 인식하겠지만, 그들은 정말 위험을 감수하는 사람들일까? 교육 혁신의 위험은 벤처 캐피털 투자를 수반하지 않을 수 있지만, 그럼에도 불구하고 위험은 사소하지 않다.

  • 첫째로, 혁신의 개발과 구현은 혁신자와 그 팀의 시간과 자원의 헌신을 요구한다.
  • 둘째, 기술혁신을 사용하는 것은 사용자(학습자 또는 기타 교육자)에 의한 투자도 포함한다:
    • 시간과 자원의 투자(예: 기회 비용)와
    • 기술혁신이 실제로 의도한 대로 작동하는 신뢰의 투자(예: 이러닝 모듈이 그들을 임상실습을 위해 적절하게 준비할 것이다).
  • 셋째, 일부 혁신은 학교나 프로그램의 인증 상태에 영향을 미칠 것이다.
  • 마지막으로, 혁신자의 명성은 위태롭습니다. 실패한 혁신은 이력서에 좋지 않을 수 있습니다.

One definition of entrepreneur (www.dictionary.com) is ‘a person who organizes and manages any enterprise, usually with considerable initiative and risk.’ Most education innovators will recognize themselves as organizers and initiators, but are they really risk-takers? Risk in education innovation may not involve a venture capital investment, but risks are nonetheless non-trivial.

  • First, the innovation’s development and implementation requires a commitment of time and resources by the innovator and their team.
  • Second, using the innovation involves investments by users (learners or other educators) as well:
    • investments of time and resources (i.e. opportunity costs), and
    • investment of trust that that the innovation actually works as intended (for example, that an e-learning module will adequately prepare them for clinical practice).
  • Third, some innovations will impact a school or program’s accreditation status.
  • Finally, the innovator’s reputation is on the line: a failed innovation might not look good on one’s curriculum vitae.

[스타트업]은 '극도의 불확실성 조건 하에서 새로운 제품과 서비스를 창출하도록 설계된 인간 기관'으로 정의되어 왔다(Ries 2011). 이러한 기준을 충족할 수 있는 다양한 기관 중에는 혁신자와 협력하여 아이디어를 실현하는 교육 혁신 팀이 있습니다. 교육 혁신은 확실히 '불확실성이 있는 조건'이다. 예를 들어, 전공의 정오 회의를 재설계하려면 다음과 같은 수많은 우선 순위를 균형 있게 조정해야 한다.

  • 전공의의 실제 학습 요구 충족(이전보다 더 효과적으로 개선됨), 
  • 현상 유지를 원하는 교직원의 기분을 상하게 하지 않고, 
  • 지원 직원을 압도하지 않으며, 
  • 인증 요구 사항을 충족하며, 
  • 관리자들을 행복하게 하고, 
  • 제한된 시간과 리소스로 이를 달성합니다. 

어떻게 이런 일이 일어날 수 있을까요? 그것은 불확실합니다!

A startup has been defined as, ‘A human institution designed to create new products and services under conditions of extreme uncertainty’ (Ries 2011). Among the various institutions that might meet these criteria is the education innovation team—those working with the innovator to bring their ideas to fruition. An educational innovation certainly represents a ‘condition of uncertainty.’ For example, a redesign of resident noon conferences would require balancing numerous priorities:

  • meeting residents’ real learning needs (hopefully more effectively than before),
  • avoiding offending faculty members who want to maintain the status quo,
  • not overwhelming the support staff,
  • meeting accreditation requirements,
  • keeping administrators happy, and
  • accomplishing this with limited time and resources.

How can this happen? It is uncertain!

우리의 목적을 위해, 우리는 '제품'이라는 용어를 매우 폭넓게 정의하며, 기본적으로 [모든 교육 활동이나 혁신]을 포함합니다.
For our purposes, we define the term ‘product’ very broadly—encompassing essentially any educational activity or innovation.

또한 우리는 '고객'이라는 용어를 혁신자가 해결하려고 하는 문제를 실제로 물건을 구매하는지 여부에 관계없이 폭넓게 정의합니다. 교육 고객은 일반적으로 학습자이지만 다른 이해관계자(교사, 관리자, 환자, 연구원)도 포함될 수 있다. 일반적인 사업에서 고객은 제품과 공급업체 중에서 선택한 후 제품을 구매합니다. 때때로 이것은 학생이 대학, 선택 과정, 지속적인 교육 활동, 교과서 또는 온라인 자원 구독을 선택할 때 교육에서도 마찬가지이다. 또는 관리자가 온라인 학습 관리 시스템 또는 표준화된 테스트를 선택할 때에도 그렇다. 그러나 일반적으로 교육 고객은 의식적으로 특정 제품을 선택하거나 구입하지 않습니다. 일단 레지던트 프로그램에 연결되면 대학원 의사는 훈련과 환자 치료 활동을 거의 통제할 수 없습니다. 
일단 과정에 등록하면, 학생들은 일반적으로 교육이 매일 어떻게 진행되는지 선택하지 않는다. 그럼에도 불구하고 학습자와 기타 이해관계자를 고객으로 보는 것은 비금전적 투자(시간, 정신적 에너지)와 암묵적 옵션(지시적 격차, 필요, 욕구, 우선순위, 혁신, 솔루션, 개입 및 다른 상황에서 선택을 제시할 수 있는 대안)에 주의를 집중한다면 도움이 될 수 있다.

We also define the term ‘customer’ broadly, as anyone whose problem the innovator is trying to solve—regardless of whether anyone actually buys anything. The customer in education is usually the learner, but could also include other stakeholders (teachers, administrators, patients, researchers). In a typical business a customer purchases a product after choosing among products and suppliers. Sometimes this is also true in education, as when a student chooses a university, an elective course, a continuing education activity, a textbook, or an online resource subscription; or when an administrator chooses an online learning management system or standardized test. Commonly, however, education customers don’t consciously choose or purchase a specific product: once attached to a residency program, postgraduate physicians have little control over training and patient care activities; once enrolled in a course, students don’t typically choose how instruction proceeds day by day. Nonetheless, viewing learners and other stakeholders as customers can be helpful if it focuses attention on non-monetary investments (time, mental energy) and implicit options (instructional gaps, needs, wants, priorities, innovations, solutions, interventions, and alternatives that could present a choice under other circumstances).

린 스타트업 접근 방식
The lean startup approach

내역 및 개요
History and overview

에릭 리스는 2000년대 후반에 소프트웨어 회사를 공동 설립하면서 '린 스타트업'의 아이디어를 개발했으며, 자신의 경험을 앞서 설명한 두 가지 개념과 결합했다(Ries 2011).

  • 컨셉 1은 도요타의 '린 제조'(Womack et al. 2007)로, [제조 공정에서 낭비를 전략적으로 제거하는 데 중점]을 두고 있다. 그리고 제품이 사전에 완전히 명시되지 않고 짧고 반복적인 주기로 개발되고 정제되는 소프트웨어 산업의 '애자일 개발'의 보완적 개념(Beck et al. 2001). 
  • 컨셉 2는 Steve Blank의 '고객 개발' 아이디어입니다(Blank 2013, 2020). [고객의 니즈를 이해하고 대응하는 것]이 엔지니어링 및 제품 개발보다 더 중요하다는 것을 의미합니다. 

Eric Ries developed the idea of the ‘Lean Startup’ while co-founding a software company in the late 2000s, merging his own experiences with two previously-described concepts (Ries 2011).

  • Concept 1 is Toyota’s ‘lean manufacturing’ (Womack et al. 2007), which focuses on strategically eliminating waste in a manufacturing process; and the complementary concept of ‘agile development’ (Beck et al. 2001) from the software industry in which products are developed and refined in short, repeated cycles rather than being fully specified up-front.
  • Concept 2 is Steve Blank’s idea of ‘customer development’ (Blank 20132020)—that understanding and responding to customer needs (sources of ‘pain’) are more important than engineering and product development.

[린 스타트업의 핵심 전제]는 다음과 같다.

  • 모든 새로운 벤처(우리의 경우 교육 혁신을 포함)가 성공하는 방법을 배워야 한다.
  • 학습은 경험적 데이터에 기반해야 한다,
  • 이러한 데이터는 '사무실 밖으로 나가기'와 고객과의 상호작용을 통해 가장 잘 얻어낸다.

The central premises of the Lean Startup are

  • that any new venture (including, in our case, education innovations) must learn how to be successful,
  • that learning must be based on empiric data, and
  • that these data are best obtained by ‘getting out of the office’ (Blank 2020) and interacting with customers.

린 스타트업 접근 방식은 혁신가들이 아이디어를 기능성 제품으로 전환하고, 고객이 어떻게 반응하는지 측정하고, 이러한 결과로부터 학습하여 제품을 개선한 다음, 이 사이클을 반복하도록 지원합니다(이상적으로 여러 번, 그리고 빠르게). 중요한 것은 초기 제품이 잘 개발되어서는 안 된다는 것입니다. 오히려, 아이디어를 미리 완성하려는 모든 노력은 시간과 자원의 낭비이기 때문에 거의 기능적이지 않아야 합니다('최소한의 실행 가능한 제품'). 핵심은

  • 가능한 한 빠르고 빈번하게 주기를 반복하여
  • 고객의 요구를 더 잘 이해하고 응답하도록 제품을 반복적으로 수정하고,
  • 이로서 제품 아이디어를 고객이 실제로 사용할 수 있는 것으로 신속하게 다듬는 것입니다(이는 혁신자가 처음에 구상한 것과 상당히 다를 수 있음).

The Lean Startup approach helps innovators turn their idea into a functional product, measure how customers respond, learn from these results to refine the product, and then repeat this cycle (ideally multiple times, and rapidly). Importantly, the initial product need not—in fact, should not—be well-developed. Rather, it should be barely functional (a ‘minimal viable product’), because any efforts to perfect the idea up-front are a waste of time and resources. The key is

  • to repeat the cycle as quickly and as frequently as possible,
  • iteratively revising the product to better understand and respond to customer needs, and
  • thus rapidly refine the product idea into something that customers will actually use (which may be quite different from what the innovator initially envisioned).

린 스타트업은 실제로 [특정 영역에 초점을 둔 과학적 방법의 응용]일 뿐이며, 실용적인 시간에 민감한 문제로 용도 변경되었다(Ries 2011).
Lean Startup is really just a focused application of the scientific method, repurposed to a practical time-sensitive problem (Ries 2011).

5대 원칙
Five key principles

Ries(2011)는 린 스타트업의 5가지 핵심 원칙을 개략적으로 설명합니다. 첫째, 기업가들은 어디에나 있다. 위에서 언급했듯이, 교육 혁신가들은 기업가이고, 그들의 팀은 스타트업이다.
Ries (2011) outlines five core principles of the Lean Startup. First, entrepreneurs are everywhere. As noted above, education innovators are entrepreneurs, and their teams are startups.

둘째, 기업가정신은 경영이다. 스타트업은 '단순한 상품이 아니라 기관'이며 효과적인 관리가 필요하다. 핵심 혁신자인 팀 리더는 벤처 기업을 관리하고 팀에 책임을 물을 준비가 되어 있어야 합니다.
Second, entrepreneurship is management
. A startup ‘is an institution, not just a product’ and requires effective management. The team leader—the key innovator—must be prepared to manage the venture and hold the team accountable.

셋째, 스타트업은 고객에 대해 학습한 것을 검증할 필요가 있다. 스타트업(즉, 혁신 팀)의 목적은 [학습하는 것]이지 반드시 제품을 구축하거나 고객의 요구를 충족하기 위한 것은 아닙니다. Ries는 혁신자들이 효과적이고 지속 가능한 제품과 사업을 구축하는 방법(즉, 무엇을 구축해야 하는지)을 배울 필요가 있다고 주장한다. 만약 그들이 배움learning 대신 스스로의 구축building하는 데 초점을 맞춘다면 그들은 결국 실패할 것이다. 학습은 혁신자들이 그들의 기본 가정과 비전을 경험적으로 시험할 수 있게 하는 실험을 필요로 한다.—비즈니스 모델을 'de-risk'하는 것이다. 교육 환경에서, 이는 새로운 과정 아이디어를 도입하기보다는, 혁신 팀이 [변화가 정말로 필요한지 여부를 결정하는 데 집중]하도록 장려한다는 것을 의미합니다. 그리고 변화의 필요가 당연하자면warranted, 코스 개발에 [반복적인 '지속적인 품질 개선' 접근법]을 채택해야 한다. 학습자가 정말로 필요로 하는 것(현재 어떤 gap이 존재하는가, 학습자가 무엇을 실제로 사용할 것인가, 무엇이 학습 결과를 실제로 최적화할 것인가)을 파악하는 데 초점을 맞춥니다. 마우리아가 말했듯이, '인생은 아무도 원하지 않는 것을 만들기에는 너무 짧다'(Maurya 2012). 혁신의 [지속가능성]과 [확장성] 또한 테스트되어야 합니다. 새로운 고객들(예: 내년 또는 다른 기관의 학생)이 그것을 사용할 수 있을까?
Third, startups need validated learning about customers
. The purpose of a startup (i.e. the innovation team) is to learn, not necessarily to build a product or meet customer needs. Ries maintains that innovators need to learn how to build an effective and sustainable product and business (i.e. what to build). If they focus on building itself instead of learning they will ultimately fail. Learning requires experiments that allow innovators to empirically test their fundamental assumptions and vision—to ‘de-risk’ their business model. In an education setting, this means that rather than jumping in and implementing a new course idea, Lean Startup encourages the innovation team to focus on determining whether a change is really needed; and if change is warranted then to adopt an iterative ‘continuous quality improvement’ approach to course development. The focus is on identifying what learners really need (what gaps currently exist, what they will actually use, and what will really optimize learning outcomes). As Maurya stated, ‘Life’s too short to build something nobody wants’ (Maurya 2012). The sustainability and scalability of the innovation should also be tested: will new customers (e.g. students next year or from other institutions) be able to use it?

넷째, 검증된 학습을 달성하기 위해 스타트업(혁신 팀)은 빌드-측정-학습 사이클(그림 1 및 아래 설명)을 빠르고 자주 거쳐야 합니다. 성공적인 팀은 주요 질문(가정)에 계속 집중하면서 이 프로세스를 가속화할 수 있습니다.
Fourth, to accomplish validated learning, startups (innovation teams) need to go through the Build-Measure-Learn cycle (Figure 1, and described below) quickly and frequently. Successful teams can accelerate this process while continuing to focus on key questions (assumptions).

다섯째, 스타트업(혁신팀)은 혁신회계에 집중해야 한다. 여기에는 의미 있는 메트릭스 식별, 구체적인 목표 설정, 결과 측정, 데이터에 대응하고 목표를 달성하기 위한 작업의 우선 순위가 포함됩니다. 이러한 초점은 혁신자들이 장기적으로 원하는 결과를 달성할 책임을 지게 한다.

Fifth, startups (innovation teams) must focus on innovation accounting. This involves identifying meaningful metrics, setting specific goals, measuring results, and prioritizing work to respond to data and meet objectives. Such focus holds innovators accountable to achieving the long-term desired outcomes.

 

검증된 학습 및 빌드-측정-학습 주기
Validated learning and the build-measure-learn cycle

성공 정의: 비즈니스 모델 명확화
Define success: Articulate the business model

그것은 '성공'이 어떻게 생겼는지 명확하게 정의하는데 도움이 된다. 비즈니스 벤처의 경우, 성공은 보통 고객에게 지불하고 순이익에서 측정된다. 교육 혁신의 경우 성공은 [신규 사용자, 완료율, 학습자 지식 또는 개발 또는 지속적인 비용(교사 시간 포함)]에서 측정될 수 있다.
It helps to clearly define what ‘success’ would look like. For a business venture, success is usually measured in paying customers and net profits. For an educational innovation, success might be measured in new users, completion rates, learner knowledge, or development or ongoing costs (including teacher time).

이러한 성공의 비전을 '비즈니스 모델'('조직이 가치를 창출, 제공 및 포착하는 방법'에 대한 설명)에서 포착하면 훨씬 더 도움이 됩니다. Maurya(2012)는 혁신의 본질(및 수반되는 비즈니스 모델)을 한 페이지로 증류하기 위해 [린 캔버스]를 개발했다. 린 캔버스를 제작하면 팀은 깊이 있고 명확하게 생각할 수 있으며, 가정을 우선시하고, 다른 모델을 대조하며(예: 다른 고객, 문제, 솔루션 또는 비용 구조로 여러 캔버스 생성) 효과적으로 의사 소통할 수 있습니다. 우리는 이 템플릿을 새로운 린 교육 캔버스를 만들기 위해 적용했습니다(그림 2).
Capturing this vision of success in a ‘business model’ (a description of ‘how an organization creates, delivers, and captures value’ [https://en.wikipedia.org/wiki/Business_model]) helps even more. Maurya (2012) developed the Lean Canvas to distill the essence of an innovation (and the accompanying business model) onto a single page. Creating a Lean Canvas forces the team to think deeply and clearly, and helps to prioritize assumptions, contrast different models (e.g. generating several Canvases with different customers, problems, solutions, or cost structures), and communicate effectively. We have adapted this template to create a novel Lean Education Canvas (Figure 2).


린 교육 캔버스를 사용하여 가정의 우선순위를 정하고 프로젝트 전체의 진행 상황/진화를 모니터링할 수 있습니다. 전문가들은 캔버스의 초기 완성을 다음과 같은 순서로 권장합니다(Maurya 2012). 섹션을 공백으로 두어도 괜찮습니다(이는 높은 우선순위 테스트를 수행할 수 있는 위험한 문제가 될 수 있습니다).
The Lean Education Canvas can be used to prioritize assumptions and monitor the progress/evolution of the project as a whole. Experts recommend that the Canvas be initially completed in a single sitting, in the following order (Maurya 2012). It’s ok to leave a section blank (this might suggest a risky issue that warrants high-priority testing).

1. 고객 부문 + 문제 – 이러한 섹션은 긴밀하게 연결되어 있으므로 함께 작성합니다. 즉, '고객'과 2차 수혜자를 모두 식별합니다(예: 의대생에 대한 평가를 기록하는 임상 강사의 새로운 시스템의 경우, 1차 수혜자는 강사, 2차 수혜자는 학생, 지원 직원 및 학장).
1. Customer Segments + Problem
– complete these sections together, as they are tightly interconnected; identify both immediate ‘customers’ and secondary beneficiaries (for example: for a novel system for clinical preceptors to record assessments of medical students, the immediate customer is the preceptor; secondary beneficiaries include students, support staff, and the dean).

3. 고유한 가치 제안 – 차이가 중요한지 확인하고 얼리 어답터를 목표로 삼으십시오. [사람들이 제품을 사용한 후 얻을 수 있는 혜택]의 관점에서 이를 설명하도록 하십시오.
3. Unique Value Proposition
– make sure your difference matters and aim for the early adopters; try to state this in terms of benefits derived after people use your product.

4. 솔루션 – 단일 솔루션에 얽매이지 말고 '각 문제를 해결하기 위해 구축할 수 있는 가장 간단한 것'을 적습니다(Maurya 2012).
4. Solution(s)
– don’t get bound to a single solution; write down the ‘simplest thing you could possibly build to address each problem’ (Maurya 2012).

5. 채널 – 주요 인력(기본 및 보조 고객)과 어떻게 소통하고 참여를 이끌어낼 것인가? 여기에는 푸시 메시징(예: 이메일), 풀 메시징(예: 고객이 웹 사이트) 및 입소문 공유(리퍼링)가 포함될 수 있습니다.
5. Channels
– how will you communicate with and get buy-in from key people (primary and secondary customers)? This can include push messaging (you initiate contact, e.g. email), pull messaging (customers find you, e.g. website), and word-of-mouth sharing (referral).

6. 재정 지원 – 일부 교육 혁신은 수익을 창출하기 위한 것이지만, 장기적인 지속 가능성을 보장하기 위해 재정적 지원을 받지 않아도 됩니다. 수익 출처에는 학교 예산 기금, 외부 보조금 및 등록금이 포함될 수 있습니다.
6. Financial Support – some educational innovations intend to generate revenue, but even those that do not must garner financial support to ensure long-term sustainability; revenue sources might include school budget funds, external grants, and subscription fees.

7. 비용 구조 – 혁신을 개발하고 구현하는 데 필요한 비용에 대한 상세하고 현실적인 추정치를 개략적으로 설명합니다.
7. Cost Structure – outline a detailed, realistic estimate of costs required to develop and implement the innovation.

8. 주요 지표 – 여기에는 혁신의 초기 및 반복 사용, 학습 결과(지식, 기술, 행동), 시스템 결과(학교 또는 환자 치료에 미치는 영향), 유료 구독 및 추천이 포함될 수 있습니다.
8. Key Metrics – these might include initial and repeated use of the innovation, learning outcomes (knowledge, skills, behaviors), system outcomes (impact on school or patient care), paid subscriptions, and referrals.

9. 불공평한 이점 – 주어진 제품을 처음 출시하는 것은, 이점이 아니라, 실제로 위험입니다. (Maurya 2012) 진정한 '불공정한' 이점에는 고객과의 연계 가치, 내부자 정보, 개인 전문 지식, 개발 팀 기술, 수많은 기존 고객 및 대규모 네트워크/커뮤니티가 포함됩니다.
9. Unfair Advantage – being first to launch a given product is actually a risk, not an advantage; (Maurya 2012) truly ‘unfair’ advantages include customer-aligned values, insider information, personal expertise, development team skills, numerous existing customers, and a large network/community.


원래의 비즈니스 모델은 경험적 테스트에서 거의 살아남지 못할 것이다(Blank 2020). 당연하다. 실제로 비즈니스 모델을 변경하거나 성공의 비전을 재정의할 수 있는 증거(검증된 학습!)를 제공하는 것이 린 스타트업의 핵심 목적입니다.
The original business model will almost never survive empiric testing (Blank 2020). That’s expected. Indeed, providing evidence (validated learning!) to change the business model or redefine the vision of success is the central purpose of the Lean Startup.

 

가정 식별 후 테스트
Identify assumptions, then test

스타트업(혁신팀)의 목적은 고객에 대해 최대한 많이 배우는 것입니다. 팀은 일반적으로 고객이 무엇을 원하거나 필요로 하는지 아이디어로 시작하지만, 실제로는 단순한 가정일 뿐이며 가정을 테스트해야 합니다. 가정을 식별하는 것은 직관적이거나 쉽지 않다. 표 1은 다음 두 가지 접근 방식을 설명합니다

  • 스스로에게 일련의 탐색적 질문을 던지고
  • 린 교육 캔버스의 각 진술을 체계적으로 잠재적인 가정으로 봅니다.

The purpose of a startup (innovation team) is to learn as much as they can about their customers. The team usually starts with an idea of what the customer wants or needs, but in reality this is merely an assumption—and assumptions need to be tested. Identifying assumptions is not intuitive or easy. Table 1 describes two approaches:

  • asking oneself a series of probing questions, and
  • systematically viewing each statement in the Lean Education Canvas as a potential assumption.

일단 식별되면, 가정은 프로젝트 실패의 위험에 기초한 시험을 위해 [우선 순위]를 매겨야 한다: [불확실성]이 높고, 잠재적으로 [임팩트]가 큰 가정이 우선 순위가 된다. [테스트하기 쉬운 가정]도 종종 조기에 테스트됩니다.
Once identified, assumptions should be prioritized for testing based on risk of project failure: assumptions with high uncertainty and potentially high impact get first priority. Assumptions that are easy to test are often tested early as well.

 

사무실에서 나가십시오. 고객과의 대화
Get out of the office: Talk with customers

가정을 식별하고 테스트하기 위해 혁신자들은 [사무실에서 나와 잠재 고객과 소통]해야 합니다(Blank 2020). 만트라는 다음과 같다. '당신의 건물 안에는 사실이 없으니 밖으로 나가세요'(Blank 2012). 고객 중심 학습('고객 개발')은 '깨달음으로 가는 길'(Blank 2020)으로 분류되었습니다.
To both identify and test assumptions, innovators need to get out of the office (Blank 2020) and interact with potential customers (Constable 2014). The mantra is: ‘There are no facts inside your building, so get outside’ (Blank 2012). Customer-focused learning (‘customer development’) has been labeled the ‘path to epiphany’ (Blank 2020).

'문제점'(고객 발견)에 대한 초기 이해는 일반적으로 고객과의 대화(질적 데이터)를 수반합니다. 전문가들은 포커스 그룹(그룹 사고를 유발함)이나 서면 질문지(팀이 이미 올바른 질문과 잠재적 답을 알고 있다고 가정함)보다는 일대일 인터뷰를 권고한다(Maurya 2012; Constable 2014). 이러한 인터뷰에 대한 자세한 지침을 이용할 수 있다(Constable 2014). 정량적 테스트는 이후 단계에서 인터뷰를 보완한다(Constable 2018; Blank 2020).
Initial understanding of ‘pain points’ (customer discovery) typically involves talking with customers (qualitative data). Experts recommend 1-on-1 interviews rather than focus groups (which promote group-think) or written questionnaires (which presume the team already knows the right questions and potential answers) (Maurya 2012; Constable 2014); detailed guidance on such interviews is available (Constable 2014). Quantitative testing complements interviews at later stages (Constable 2018; Blank 2020).

빌드: 실행 가능한 최소 제품
Build: The minimal viable product

불행히도, 고객들은 자신이 진정으로 원하는 것이 무엇인지, 무엇이 가장 효과적으로 작동할 것인지 모르는 경우가 많습니다. 그들의 의견과 믿음은 시험되어야 할 추가적인 가정이다. 따라서 고객(학습자, 교사 등)과 상호 작용할 수 있는 '최소 실행 가능한 제품'(MVP)이라는 가시적인 것을 매우 조기에 구축하는 것이 중요합니다. MVP는 가정을 경험적으로 테스트할 수 있게 한다. 

  • 고객은 정말 그 제품을 사용하나요? 
  • 고객은 그것을 예상한 대로 사용하나요? 
  • 원하는 (학습) 결과를 쉽게 얻을 수 있습니까? 
  • 어떤 장애물에 부딪히고, 이를 해결하기 위해 제품을 재설계할 수 있는 방법은 무엇입니까? 
  • 이러한 변화가 초기 비전과 의도된 기능에 어떤 영향을 미칩니까? 

이러한 모든 질문 및 기타 질문에 대한 답변은 빌드-측정-학습 주기(그림 1)에 따라 이루어집니다.
Unfortunately, customers often don’t know what they really want or what will work most effectively; their opinions and beliefs are further assumptions that need to be tested. Thus, it is critical to build something tangible very early—a ‘minimal viable product’ (MVP) with which customers (learners, teachers, etc) can interact. The MVP enables assumptions to be empirically tested:

  • Do customers really use the product?
  • Do they use it as envisioned?
  • Does it facilitate the desired (learning) outcomes?
  • What stumbling blocks do they encounter, and how can the product be redesigned to resolve these?
  • How do these changes affect the initial vision and intended functionality?

All of these questions, and more, will be answered in cycles of Build-Measure-Learn (Figure 1).

혁신자들은 일반적으로 그들의 제품이 거의 완벽하기를 원하지만, 린 스타트업은 정반대의 것을 장려한다. 첫 번째 제품은 '최소한의 노력(시간과 비용 포함)으로 검증된 학습을 최대한 수집할 수 있는 신제품 버전'이어야 합니다(Ries 2009). 이것은 보통 MVP가 의도적으로 저렴하고 불완전하다는 것을 의미한다. [스타트업의 초점]은 제품을 만들거나 고객을 기쁘게 하는 것이 아니라 [문제에 대한 실행 가능하고 지속 가능한 솔루션을 구축하는 방법을 배우는 것]입니다. 따라서 MVP에는 [하나 이상의 중요한 가정(가설)을 테스트하는 데 필요한 최소한의 기능]만 포함되어야 한다. 종종 이것은 [계획된 최종 제품과 표면적으로 거의 유사하지 않은 구현]을 포함한다. 그러나 MVP는 기능성의 [더 깊은 수준에서 강한 오버랩]을 가져야 한다. 기능 보존 단축키의 구체적인 예로는 주문을 처리하기 위해 컴퓨터 프로그램을 작성하는 대신 손으로 주문을 처리하는 것, 소셜 네트워크를 사용하는 대신 혁신 팀이 사용자의 질문에 답하도록 하는 것, 화면상의 아바타가 화면을 돌아다니는 것보다 한 곳에 서도록 하는 것 등이 있다. 표 2에는 추가적인 미니멀리즘 대안이 나열되어 있다.
Innovators typically want their product to be near-perfect, but Lean Startup encourages precisely the opposite: the first product should be a ‘version of a new product which allows a team to collect the maximum amount of validated learning with the least effort’ (Ries 2009) (including time and money). This usually means the MVP is deliberately inexpensive and incomplete. Remember that the focus of the startup is not to build products or please customers, but to learn how to build practicable, sustainable solutions to a problem. Thus, the MVP should contain only the minimal features required to test one or more critical assumptions (hypotheses). Often this involves an implementation that bears little superficial resemblance to the envisioned final product. However, the MVP should have strong overlap at deeper levels of functionality. Specific examples of function-preserving shortcuts include processing orders by hand instead of writing a computer program to process orders; having the innovation team answer users’ questions instead of employing a social network; and making on-screen avatars stand in one place rather than walk around the screen. Table 2 lists additional minimalistic alternatives.

MVP 출범이 늦어진다는 것은 학습의 지연을 의미한다. 혁신자들은 종종 열등하거나 불완전한 제품을 출시하는 것에 대해 우려를 표하며, 고객을 소외시킬 것을 두려워한다. 이러한 두려움은 고객이 누구인지, 고객이 진정으로 원하는 기능이 무엇인지 알고 있으며, 고객은 누락된 기능에 대해 충분히 신경 써서 불쾌감을 느낀다고 가정합니다. 이 모든 가설은 시험할 수 있고, 종종 시험할 때 거짓으로 판명된다. 실제로 가장 중요한 질문 중 하나는 항상 이것이다. 고객은 품질을 어떻게 정의합니까? 즉, 고객이 진정으로 관심을 갖는 기능은 무엇입니까? 중요한 것은, MVP가 '실패'하더라도 학습이 이루어지면(특히 실패가 예상한 방식으로 발생하지 않는 경우가 많기 때문에) 그 경험이 큰 성공을 거둘 수 있다는 것이다.
Any delay in launching the MVP means a delay in learning. Innovators often express concerns about releasing an inferior or incomplete product, fearing to alienate customers. This fear assumes that they know who their customer is, they know what features their customer truly wants, and the customers will care enough about missing features that they will be offended. All of these are hypotheses that can (and should) be tested; and often, when tested, they prove false. Indeed, one of the most important questions is always: How does the customer define quality, i.e. what features do they really care about? Importantly, even if the MVP ‘fails’ the experience can be a great success if learning is gained (especially since failure often does not occur in the expected way).

다시 강조하자면, MVP의 목적이 꼭 고객을 기쁘게 하기 위한 것이어야 할 필요는 없으며, 전반적인 혁신에 대한 가정(가설)을 테스트하여 학습하는 것입니다.
To again emphasize: the purpose of the MVP is not (necessarily) to please customers, but to test assumptions (hypotheses) about the overall innovation and thereby to learn.

측정
Measure

MVP를 테스트하려면 [의미 있고 실행 가능한 결과]의 측정이 필요합니다. '의미 있음'은 테스트 중인 가설(가정)과의 관계를 나타냅니다. 이상적으로, 결과는 강력한 원인-효과 추론(즉, MVP에 대한 학습)을 지원할 것이다. 웹사이트 조회수 또는 환자 체류 기간과 같은 결과를 측정하는 것은 이러한 결과가 MVP의 특정 특징에 기인할 수 없거나 핵심 가정을 다루지 않는 경우 검증된 학습을 제공하지 않는다.
Testing the MVP requires measurement of meaningful, actionable outcomes. ‘Meaningful’ indicates a relationship with the hypothesis (assumption) being tested: ideally, outcomes will support a strong cause-effect inference (i.e. learning about the MVP). Measuring outcomes such as Website hits or patient length of stay does not provide validated learning if these outcomes cannot be attributed to a specific feature of the MVP or do not address a key assumption.

정성적 데이터(인터뷰)는 모든 단계에서 필수적이지만, 프로젝트가 진행됨에 따라 정량적 데이터(수치)의 중요성이 점점 커지고 있습니다. 유료 고객을 유치하는 데 의존하는 기업에게 '해적 지표'(McClure 2007)는 의미가 있다('AARR'이라는 머리글자가 해적처럼 들리기 때문에 일명). 이러한 지표는 다음에 초점을 맞춥니다. 

  • 고객 획득(신규 방문자 수), 
  • 활성화(진행 상황을 저장하거나 계정을 활성화하여 재방문을 계획할 수 있을 만큼 충분한 경험을 누리는 고객), 
  • 유지(실제 재방문), 
  • 추천(동료에 대한 추천), 
  • 수익(어떤 것에 대한 지불)

이들은 많은 교육 환경에 적응할 수 있다(예: 온라인 모듈은 새로운 사용자, 모듈 완료, 지속적인 사용 및 추천을 추적할 수 있다). 교육의 다른 성과로는 환자 결과 및 재정적 비용뿐만 아니라 학습자 만족도, 동기 부여, 태도, 지식, 기술 및 침대 머리맡에서의 행동이 포함될 수 있다'최고의' 결과는 문제의 가정을 직접적으로 알려주는 것이다. 잠재적 결과 측정의 비용, 타당성, 타당성 및 임상/교육 관련성 또한 중요한 고려사항이다.
Qualitative data (interviews) are vital at all stages, but quantitative data (numbers) become increasingly important as a project progresses. For a business dependent on attracting customers who pay, the ‘pirate metrics’ (McClure 2007) (so-called because the acronym ‘AARRR’ sounds like a pirate) are meaningful. These metrics focus on customer

  • Acquisition (number of new visitors),
  • Activation (customers who enjoy the experience enough to plan a return visit by saving progress or activating an account),
  • Retention (actual return visits),
  • Referral (recommendations to colleagues), and
  • Revenue (payment for something);

these could be adapted to many education settings (e.g. an online module might track new users, module completion, ongoing use, and referrals). Other outcomes in education might include learner satisfaction, motivation, attitudes, knowledge, skills, and behaviors at the bedside, as well as patient outcomes and financial cost. The ‘best’ outcome is one that directly informs the assumption in question. Cost, feasibility, validity, and clinical/educational relevance of potential outcome measures are also important considerations.

정량적 데이터는 시간 경과에 따른 비교(설계 변경과 이상적으로 연계), '경쟁사'와의 비교(또는 전통적인 접근 방식) 또는 동시 통제군과의 비교 등이 있다. 강력한 원인 효과 결정을 용이하게 하는 한 가지 방법은 'A-B 테스트'를 포함하며, 이는 기본적으로 두 가지 버전의 MVP(버전 A, 버전 B)가 생성되는 제어 실험이며, 중요할 것으로 의심되는 특징에서만 다르다. 사용자의 절반은 버전 A를 제공하고 절반은 버전 B를 제공하며 결과는 비교된다. 대면 교육에서는 종종 어렵지만, A-B 비교는 컴퓨터 보조 교육에서는 비교적 간단하며 소프트웨어 개발에서는 일반적이다. 실제로 구글과 아마존 같은 거대 기술기업들은 제품 디자인을 다듬기 위해 지속적으로 A-B 테스트를 사용한다. 한 전문가(McLure 2007)는 무엇을 해야 할지 모르면 '대단히 추측해 보고 A-B 테스트를 해보십시오.'라고 제안합니다.
Quantitative data can be compared over time (ideally linked with design changes), with a ‘competitor’ (or traditional approach), or with a concurrent control. One way to facilitate robust cause-effect determinations involves ‘A-B testing,’ which is basically a controlled experiment in which two versions of the MVP (version A, version B) are created, differing only in a feature suspected to be important. Half the users are offered version A, half are offered version B, and outcomes are compared. While often difficult in face-to-face instruction, A-B comparisons are relatively straightforward for computer-assisted instruction, and are commonplace in software development. In fact, technology giants such as Google and Amazon use A-B testing continuously to refine their product design. One expert (McClure 2007) suggests that if you don’t know what to do, ‘Just guess and then A-B test—a lot!’

학습: 피벗 또는 지속성
Learn: Pivot or persevere

측정이 수집되고 분석되면 학습(데이터 해석)과 의사결정이 필요한 시점이다. 근본적인 결정은 [인내]할 것인지(초기 아이디어를 계속 다듬을 것인지) 아니면 [피벗]할 것인지(초기 아이디어를 포기하거나 근본적으로 변경하여 다른 고객, 기능 세트 또는 제품에 초점을 맞출 것인지)입니다. 핵심은 각 결정이 검증된 학습을 기반으로 한 정보에 정통하다는 것입니다. 다시 말하지만 스타트업(혁신팀)의 초점은 제품을 만들거나 고객(학습자)에게 서비스를 제공하는 것이 아니라 효과적이고 실용적이며 지속 가능한 솔루션(비즈니스 모델)을 구축하는 방법을 배우는 데 있습니다.
Once measurements have been collected and analyzed, it is time for learning (data interpretation) and decisions. The fundamental decision is whether to persevere (continuing to refine the initial idea) or to pivot (abandoning or radically changing the initial idea to focus on a different customer, feature set, or product). The key is that each decision is well-informed—based on validated learning. Again, the focus of a startup (innovation team) is not so much to build a product or serve customers (learners) but rather to learn how to build an effective, practicable, sustainable solution (business model).

반복하다…빠르게 
Repeat … rapidly

그런 다음 또 다른 핵심 가정(가설)의 우선 순위를 정하고, 그 가설, 측정 및 결정을 테스트할 MVP를 만드는 것으로 다시 순환이 시작됩니다. 가설과 측정값이 더 우수하고 각 사이클이 더 빨리 완료될수록 혁신 팀은 더 잘 배우고 더 많은 경쟁 우위를 확보할 수 있습니다.
And then the cycle begins again—with prioritization of another key assumption (hypothesis), creation of an MVP to test that hypothesis, measurement, and decision. The better the hypotheses and measurements, and the faster each cycle can be completed, the better and more the innovation team will learn and the greater their competitive advantage.

전체적으로, Maurya(2012)는 [고객과 관련성을 유지하고, 솔루션이 아닌 문제를 사랑하며, 전체 혁신(효과와 지속 가능성 포함)의 위험을 체계적으로 제거]할 필요성을 강조한다. 린(교육) 캔버스(그림 2)는 모델의 만족도, 실행 가능성 및 실현 가능성을 포함하여 모델을 체계적으로 '스트레스 테스트'하는 데 도움이 됩니다.
Throughout, Maurya (2012) emphasizes the need to stay relevant to customers, love the problem not the solution, and systematically de-risk the entire innovation (including effectiveness and sustainability). The Lean (Education) Canvas (Figure 2) is helpful in systematically ‘stress testing’ the model, including its desirability, viability, and feasibility.

물론, 실제 교육 설정은 전형적으로 과정 빈도(예: 매년 1회)와 사이클 빈도를 제한하는 잠재적 '고객'(예: 연간 25명)에 의해 제약을 받는다. 그러나 초점은 [제품 테스트]보다는 [검증된 학습]에 있다. 관련 가정을 테스트할 수 있다면 구체적인 과정, 주제, 참여자는 중요하지 않습니다. 따라서, 많은 빌드-측정-학습 주기는 의도된 과정과 학습자의 외부에 초점을 맞출 수 있습니다(제안 내용은 표 2 참조).
Of course, real-life education settings are typically constrained by the course frequency (e.g. once each year) and potential ‘customers’ (e.g. 25 students per year), which limit the cycle frequency. However, the focus on validated learning rather than product testing is liberating: the specific course, topic, and participants don’t matter if relevant assumptions can be tested. Thus, many Build-Measure-Learn cycles could focus outside the intended course and learners (see Table 2 for suggestions).

교육은 복잡하고 완전히 이해되지 않는 활동이다. 교육 관련 문제에 대한 혁신적인 해결책도 마찬가지로 복잡하며 '효과가 있었는가'라는 단순한 예/아니오 질문으로 좀처럼 줄어들지 않는다. Build-Measure-Learn의 반복적 특성은 각 사이클이 점진적으로 미묘한 질문을 다루면서 자연스럽게 이 상황에 적합하다(이게 중요한 문제인가). 이 혁신은 실행 가능한 해결책입니까? 그것이 얼마나 학습을 촉진하는가? 비용 효율적이고 지속 가능한 제품입니까?)

Education is a complex and incompletely understood activity. Innovative solutions to education-related problems are likewise complex and rarely reduce to simple yes/no questions of ‘Did it work?’ The iterative nature of Build-Measure-Learn lends itself naturally to this situation, with each cycle addressing progressively nuanced questions (

  • Is this an important problem?
  • Is this innovation a viable solution?
  • How well does it promote learning?
  • Is it cost-effective and sustainable?).

린 스타트업의 실제 적용: 사례 시리즈
Application of lean startup in practice: A case series

2015년 9월부터 2016년 1월까지 린 스타트업(Lean Startup) 방법에 대한 경험이 있는 외부 컨설팅 업체와 제휴하여 보건전문가를 위한 온라인 학습에 적극적으로 혁신을 꾀했습니다. 이 기간 동안 우리는 고객 개발 인터뷰와 시장 조사를 실시했으며, 이 정보를 사용하여 세 가지 개별 교육 혁신을 식별하고 테스트했습니다(표 3 참조). 이 중 두 개는 실패했다. 세 번째는 상당한 가능성을 보였지만 불행히도 지속적인 개발을 우선시할 자금을 확보하지 못했다. 이러한 프로젝트 중 어느 것도 규모에 맞게 구현된 적은 없지만, 교육 활동을 분류하고 개발하는 린 스타트업의 속도와 유연성을 보여줍니다. 예를 들어, 우리는 다른 가정들이 더 높은 우선순위로 판단되었기 때문에 이러한 혁신들 중 어떤 것이 실제로 학습을 얼마나 잘 촉진시키는지 시험하지 않았다(예: 혁신의 학습 효과는 사람들이 그것을 사용하지 않거나 재정적으로 실행 불가능한지는 중요하지 않다).
From September 2015 to January 2016 we partnered with an external consulting firm with experience in Lean Startup methods to actively innovate in online learning for health professionals. During this period we conducted customer development interviews and market research, and using this information we identified and tested three separate educational innovations (see Table 3). Two of these failed. The third showed substantial promise, but unfortunately has not secured funding to prioritize continued development. While none of these projects was ever implemented at-scale, they illustrate the speed and flexibility of Lean Startup in triaging and developing educational activities. For example, we did not test how well any of these innovations actually promoted learning because other assumptions were judged as higher priority (e.g. an innovation’s learning effectiveness doesn’t matter if people don’t use it or if it is financially infeasible).

 

초기 고객 발굴 및 아이디어 발굴
Initial customer discovery and ideation

지역 리더와의 대화를 바탕으로 중간 수준의 제공자(간호사 실무자 및 의사 보조자)가 지속적인 교육을 위해 혁신적인 지원이 잠재적으로 필요한 것으로 파악했다. 13개 중간 수준의 제공자와의 인터뷰는 사례 기반 학습(서면, 시뮬레이션 및 실제 환자와의 학습), 동료와 사례를 논의할 기회, 매우 짧은 기간 동안의 활동을 포함한 몇 가지 '페인 포인트'을 확인했다.
Based on conversations with local leaders, we identified midlevel providers (nurse practitioners and physician assistants) as potentially needing innovative support for continuing education. Interviews with 13 midlevel providers identified several ‘pain points’ including a desire for more case-based learning (written, simulated, and with real patients), opportunities to discuss cases with colleagues, and activities of very short duration.

후속 팀 브레인스토밍 세션은 세부 사항, 관련성, 혁신 및 실현 가능성에 있어 큰 차이를 나타내는 30개 이상의 고유한 아이디어를 식별했습니다. 비록 많은 아이디어가 모호하거나 실현 불가능했지만, 이 활동은 팀을 단결시키고 후속 활동을 위한 토대를 제공했다. 시간이 지남에 따라, 우리의 목표 고객 그룹은 (인터뷰에서) 사례 기반 학습의 인지된 가치를 확인한 실무 의사와 거주자를 포함하도록 다양화되었습니다.
A subsequent team brainstorming session identified over 30 unique ideas representing large variation in detail, relevance, innovation, and feasibility. Although many ideas were vague or infeasible, the activity united the team and provided a foundation for subsequent activities. Over time, our target customer group diversified to include practicing physicians and residents, who affirmed (in interviews) the perceived value of case-based learning.

혁신 1. '케이스 앱'
Innovation 1. ‘CasesApp’

고객 발굴, 아이디어 제시 및 가정
Customer discovery, ideation, and assumptions

우리의 초기 고객 개발은 임상의가 진정한 임상 사례에 대한 접근과 논의를 중요시할 것을 제안했다. 임상의들은 또한 우리에게 학습 시간이 매우 제한적이라고 말했고, 모바일 장치가 이 장벽을 극복하는 데 도움이 될 수 있다고 제안했다. 따라서 신뢰할 수 있는 동료와 실제 환자 사례를 공유하고, 보고, 비동기적으로 논의하는 것을 지원하는 모바일 앱이 중요한 요구를 충족할 것이라고 가정했다. 바쁜 임상의들이 서면 사례를 입력할 시간이 없을 수 있다는 것을 인지하고, 모바일 장치 카메라로 캡처한 비디오를 사용하여 사례를 만들고 논의하는 것이 더 빠르고 쉬울 것이라는 가설을 세웠다.
Our initial customer development suggested that clinicians would value access to, and discussion of, authentic clinical cases. Clinicians also told us that time for learning was very limited, and proposed that mobile devices might help overcome this barrier. Consequently, we hypothesized that a mobile app to support sharing, viewing, and asynchronously discussing real patient cases with trusted colleagues would fill a critical need. Recognizing that busy clinicians might not have time to type out a written case, we further hypothesized that creating and discussing cases would be faster and easier using video captured with mobile device cameras.

우리는 기존 제품을 탐색하는 시장 조사를 실시했습니다. 여러 제품이 의사 사례 기반 학습을 지원했지만 모바일 장치를 사용한 제품은 거의 없었고 신뢰할 수 있는 그룹 내에서 사례 토론을 지원하지 않았습니다.
We conducted market research exploring existing products. Several products supported physician case-based learning, but few used mobile devices and none supported case discussions within trusted groups.

우리는 몇 시간 동안 브레인스토밍을 하고 사실이 아닐 경우 실패로 이어질 수 있다는 가정에 우선순위를 매겼다(표 3 참조). 그런 다음 가장 위험한 가정을 테스트하기 시작했습니다.
We spent several hours brainstorming and prioritizing the assumptions that, if untrue, could lead to failure (see Table 3). We then set out to test the riskiest assumptions.

초기 가정 테스트: 빌드-측정-학습
Testing initial assumptions: Build-measure-learn

한 가지 중요한 가정은 임상의가 짧은 사례를 구두로 제시하고 모바일 기기를 사용하여 기록하는 것이 편하다는 것이었다. 이번 테스트에서 MVP는 단순히 표준 비디오 녹화 기능을 갖춘 스마트폰이었다. 주요 지표는 사례를 다른 사람과 공유하고자 하는 임상의의 수와 2분 이내에 사례를 생각해 낼 수 있으며 스마트폰을 사용하여 구술 발표를 편안하게 비디오로 녹화하는 것이었다. 우리는 질문한 임상의의 80%가 하나의 사례를 기록할 의향이 있고 기록할 수 있을 것이라는 가설을 세웠다. 우리는 스마트폰을 손에 들고 복도를 뛰었고, 한 시간 내에 6명의 의료 전문가(의사 5명, 중간급 의료진 1명)에게 접근했다. 6명 모두 2분 이내에 사례를 기록했고, 4명은 최소한의 도움만 필요했으며, 5명은 다른 임상의와 사례를 기꺼이 공유했습니다. 이것은 우리의 가정을 확인했고, 우리는 다음 단계로 진행하기로 결정했다. 
One key assumption was that clinicians were comfortable orally presenting a short case and recording it using a mobile device. The MVP for this test was simply a smartphone with standard video recording capability. Key metrics were the number of clinicians willing to share a case with others, able to come up with a case in two minutes or less, and comfortable video-recording their oral presentation using our smartphone. We hypothesized that 80% of clinicians asked would be willing and able to record one case. We hit the hallways with smartphones in hand, and within an hour had approached six health professionals (five physicians and one midlevel provider). All six recorded a case in under two minutes, four required only minimal help, and five were willing to share their case with other clinicians. This affirmed our assumption, and we decided to proceed with the next step.

빌드
Build

다음 가정은 임상의가 다른 임상의의 비디오 클립 사례와 관련이 있다는 것이었습니다. 이 가정을 테스트하려면 표준 스마트폰 소프트웨어보다 더 많은 것이 필요했습니다. 양방향 상호 작용을 용이하게 하는 프로토타입이 필요했습니다. 따라서 우리는 임상의가 환자 사례를 비디오로 녹화하여 스스로 선택한 동료 그룹과 공유할 수 있는 매우 간단한 스마트폰 앱을 개발했다. 그런 다음 동료들은 비디오로 녹화하고 사건에 대한 의견을 공유할 수 있었다. 우리는 6명의 임상의사를 고용하여 각각의 사례를 기록하고 이 사례를 논의하기 위해 동료 그룹을 초대했다.
The next assumption was that clinicians would engage with video clip cases from other clinicians. Testing this assumption required more than standard smartphone software; we needed a prototype that would facilitate bi-directional interaction. Thus, we developed a very simple smartphone app that allowed clinicians to video-record themselves presenting a patient case and share this with a group of self-selected peers. The peers could then video-record and share comments on the case. We recruited six clinicians to each record a case and invite a group of peers to discuss this case.

재다
Measure

우리는 세 가지 주요 메트릭스를 제안했습니다. 예를 들어 사례를 본 응답자의 30%는 질문이나 코멘트로 응답하고, 40%는 두 번째 사례를 보고, 40%는 동료에게 사례 앱을 추천합니다. 테스트에서 초청된 72개 공급자 중 24개(33%)가 실제로 시제품을 사용해 보았다. 이 중 5명(21%)이 댓글 달기에 성공했고, 2명(10%)은 두 번째 사례를 봤으며, 2명(10%)은 동료에게 케이스앱을 추천하겠다고 답했다. 
We proposed three key metrics: 30% of those who viewed a case would respond with a question or comment, 40% would view a second case, and 40% would recommend CasesApp to a colleague. In testing, 24 of 72 (33%) invited providers actually tried the prototype. Of these, 5 (21%) successfully added a comment, 2 (10%) viewed a second case, and 2 (10%) indicated they would recommend CasesApp to a colleague.

배우다.
Learn

목표 메트릭을 충족하지 못했습니다. 임상의들이 사례 기반 논의에 관심을 표명했지만, 실제로는 이러한 비디오 녹화 사례에 관여하지 않았다. 그래서 우리는 이 생각을 버렸습니다. 
We failed to meet any target metrics. Although clinicians expressed interest in case-based discussions, in actuality they did not engage with these video-recorded cases. So, we abandoned this idea.

혁신 2. '''비디오 360'''
Innovation 2. ‘Video360’

고객 발굴, 아이디어 제시 및 가정
Customer discovery, ideation, and assumptions

11월 중순에 첫 번째 혁신을 포기한 후 연말(4주) 전에 두 번째 제품을 구상, 개발 및 테스트하자고 제안했습니다. 깨끗한 슬레이트로부터 시작하여 고객 개발 대화를 재분석하고 광범위하게 브레인스토밍했으며, 마지막으로 시뮬레이션된 환자 만남의 몰입형 온라인 가상 현실(VR) 비디오가 실제 환자와의 더 많고 다양한 경험에 대한 명시된 욕구를 대체할 수 있는 아이디어(가설)를 선택했다. 우리는 이것이 학습 결과에 어떻게 긍정적인 영향을 미칠지에 대한 명확한 기대를 가지고 있지 않았지만, 이 고위험 고수익 아이디어를 테스트하는 것은 타당해 보였다. 결국, 린 스타트업 접근 방식을 사용하면 우리는 노력해도 크게 손해 볼 것이 없다. 
After abandoning our first innovation in mid-November, we proposed to ideate, develop, and test a second product before year-end (4 weeks). Starting with a clean slate we re-analyzed our customer development conversations and brainstormed broadly, finally choosing the idea (hypothesis) that immersive online virtual reality (VR) videos of simulated patient encounters might substitute for the stated desire for more, varied experiences with real patients. We didn’t have a clear expectation for how this would favorably impact learning outcomes, but it seemed reasonable to test this high-risk, high-payoff idea. After all, using the Lean Startup approach we would not lose much for trying.

다시 한 번 우리는 관련 임상 주제 범위를 중심으로 한 중요한 가정(표 3)을 우선시했다(이것이 틈새에서만 작동할 것인가). 아니면 우리는 이것을 임상 훈련의 범위에 걸쳐 사용할 수 있습니까?) 
Once again we prioritized critical assumptions (Table 3), which revolved around the range of relevant clinical topics (Would this work only in a niche? Or could we use this across the spectrum of clinical training?).

제작 및 측정
Build and measure

제안된 혁신은 360° 카메라(비용 $400)를 사용하여 시뮬레이션 또는 실제 환자 만남을 기록하고, 저렴한 VR 헤드셋(각 $10)을 사용하여 후속 재생을 수행하는 것이었다. 다양한 주제에 대한 우리의 가정을 테스트하기 위해, 우리는 상담, 신체 검사 및 외상 소생이라는 세 가지 다른 임상 활동의 시뮬레이션을 비디오로 녹화했다. 우리는 이 비디오들을 진행하기 위해 유튜브를 이용했다. 우리는 공식적인 '사용자 경험' 실험을 통해 이러한 시나리오를 평가할 계획이었지만, 임상의, 교육자 및 전문 혁신자로 구성된 우리 팀은 이 단계 이전에도 심각한 문제를 확인했다.

  • 우선 영상이 다소 흐릿하고 편집이 예상보다 번거로웠다.
  • 둘째, 신체 검사와 의사소통 만남은 360° 기능의 혜택을 받지 못했고, 어떤 면에서는 실제로 더 나빴다.
  • 셋째, 소생 시나리오의 증분적 이점은 최소였고, 여러 카메라의 비디오와 더 광범위하고 비용이 많이 드는 편집이 필요했을 것이다.

The proposed innovation involved recording simulated or real patient encounters using a 360° camera (cost USD $400) and subsequent playback using inexpensive VR headsets ($10 each). To test our assumption regarding range of topics, we video-recorded simulations of three distinct clinical activities: counseling, physical exam, and trauma resuscitation. We used YouTube to host these videos. We planned to evaluate these scenarios through formal ‘user experience’ experiments, but our team of clinicians, educators, and professional innovators identified serious problems even before this step. First, the video was somewhat blurry and the editing more cumbersome than anticipated. Second, the physical exam and communication encounters did not benefit from the 360° feature, and in some ways were actually worse. Third, the incremental benefit for the resuscitation scenario was minimal, and would have required video from multiple cameras and more extensive (and costly) editing.

배우다.
Learn

이러한 발견은 360° 비디오가 광범위한 주제에 걸쳐 가치를 더할 것이라는 우리의 희망을 반증했다. 따라서 우리는 정량적 데이터 수집이나 최종 사용자 테스트를 진행하지 않았습니다. 대신, 우리는 이 아이디어가 만들어진 지 2주 만에 포기했다.
These findings disproved our hope that 360° video would add value across a broad spectrum of topics. As such, we never proceeded with quantitative data collection or end-user tests. Instead, we abandoned this idea only two weeks after its genesis.

혁신 3. '온 파'
Innovation 3. ‘OnPar’

아이디어와 첫 번째 MVP
Ideation and first MVP

우리의 세 번째 혁신은 다시 사례 기반 학습과 연결되었습니다. 그러나 이 아이디어는 공식적인 브레인스토밍에서 나오는 것이 아니라 비디오360 프로젝트를 중단한 후 팀이 압축을 풀기 위해 카드 게임을 하는 동안 발생했다. 누군가가 카드 게임이 임상 사례 관리를 시뮬레이션할 수 있다고 제안했고, 우리는 그 아이디어를 Solitaire와 유사한 게임으로 정교하게 만들었다. 다음 근무일에, 우리는 의사에게 최근의 흥미로운 사례에 대해 설명하도록 요청하고 주요 결과(이력, 시험, 테스트 결과)를 종이 색인 카드에 기록했습니다. 각 카드의 반대편에 우리는 발견을 이끌어낼 임상 질문을 작성했다('가슴 엑스레이에서 무엇을 나타냈습니까?'). 간단한 규칙을 만들었습니다. 플레이어는 각 카드의 질문을 검토하고 사건 해결을 위해 결과가 필요한지 여부를 결정했다. 만약 그렇다면, 그들은 카드를 넘기고, 그렇지 않다면 그들은 카드를 버렸습니다. 가장 적은 카드를 내면서 올바른 진단을 내리는 것이 목표였다. 
Our third innovation again connected to case-based learning. However, rather than emerging from formal brainstorming, this idea occurred while the team was playing cards to decompress after dropping the Video360 project. Someone suggested that a card game might simulate management of clinical cases, and we elaborated the idea into a game similar to Solitaire. The following workday, we asked a physician to describe a recent interesting case and recorded key findings (history, exam, test results) on paper index cards. On the opposite side of each card we wrote a clinical question that would elicit that finding (‘What did chest x-ray show?’). We created simple rules: The player reviewed each card’s question and decided whether the result was needed to solve the case. If yes, they turned the card over; if not they discarded the card. The goal was to make the right diagnosis while playing the fewest cards.

우리는 여러 명의 임상의와 함께 그 게임을 테스트했다. 모두가 게임을 즐겼고, 이 개념을 열렬히 지지했으며, 이는 일상적인 임상 실습에서 시간과 비용 효율에 대한 실질적인 요구를 모방했음을 시사했다. 한 임상의 교육자는 이것이 비분석적 임상 추론 과정을 장려한다고 추가로 제안했다. 
We tested the game with several clinicians. All enjoyed the game and enthusiastically endorsed the concept, suggesting that it emulated the practical demands for time and cost efficiencies in their daily clinical practice. One clinician educator further suggested that this encouraged nonanalytical clinical reasoning processes.

빌드-측정-학습: 2세대 MVP
Build-measure-learn: Second-generation MVP

이 MVP에 대한 호의적인 반응이 우리를 앞으로 나아가게 했다. 가장 위험한 가정(표 3)은 임상의가 게임을 원하는지 여부(구체적으로 2차 게임을 원하는지 여부)와 임상의가 게임 라이브러리를 강화하기 위해 새로운(실제) 사례를 공유하는지 여부에 초점을 맞췄다. 2세대 MVP는 인덱스 카드로 다시 구성되었는데, 이번에는 진단 관련 심전도와 교과서에서 복사한 흉부 X-ray의 접착 이미지를 사용하여 더욱 세심하게 제작되었다. 
The favorable reception to this MVP prompted us to move forward. The riskiest assumptions (Table 3) focused on whether clinicians would want to play the game (specifically, that they would play a second round), and whether clinicians would share new (real) cases to augment our game library. The second-generation MVP again consisted of index cards, this time more carefully constructed (but still hand-written) and using glued-on images of diagnosis-relevant electrocardiograms and chest x-rays copied from textbooks.

우리는 세 가지 사례를 만들고 여러 전문 분야와 훈련 단계를 대표하는 임상의와 함께 게임을 시험해 보았고, 각 시험 후에 게임 규칙을 반복적으로 개선했다. 각 케이스가 끝난 후 우리는 우리의 가정을 테스트하고, 그들이 두 번째 라운드를 하기를 원하는지 물어보고(가능한 경우 허용) 그들을 초대하여 케이스를 작성하는 데 도움을 주었다. 골프(최소 타수를 노리는 것)와 유사성을 인식해 경기 이름을 '온파'로 지었다. 
We created three cases and trialed the game with clinicians representing several specialties and stages of training, iteratively refining the game rules after each trial. After each case we tested our assumptions, asking if they wanted to play a second round (allowing this when possible) and inviting them to help us write a case. Recognizing the similarity to golf (i.e. striving for the fewest strokes), we named the game ‘OnPar.’

빌드-측정-학습: 3세대 MVP
Build-measure-learn: Third-generation MVP

종이 프로토타입에 대한 반응이 매우 좋았기 때문에 우리는 빠른 프로토타이핑 도구를 사용하여 컴퓨터 기반 MVP를 만들 수 있었다. 우리는 개인적으로 약 30명의 임상의들을 초대했고, 그들은 차례로 이메일과 트위터를 통해 동료들을 초대했고, 그 결과 30일 동안 90명이 프로토타입에 액세스했다. 이 중 30%는 계정을 활성화하고 최소 1건의 사례를 완료했다. 예상을 뛰어넘는 성과로 우리는 더 많은 발전을 지속하기로 했다. 불행하게도, 우리 기관은 다른 교육 우선 순위를 추구하기로 결정했고 이 프로그램에 대한 자금 지원은 철회되었다. 
The highly-favorable response to paper prototypes led us to create a computer-based MVP using a rapid-prototyping tool. We personally invited about 30 clinicians to play, who in turn invited colleagues by email and Twitter resulting in 90 people accessing the prototype over a 30-day period; of these, 30% activated an account and completed at least 1 case. With outcomes exceeding expectations, we decided to persevere with further development. Unfortunately, our institution opted to pursue other educational priorities and funding for this program was withdrawn.

논의
Discussion

린 스타트업은 지금까지 주로 비즈니스 벤처에 적용되었지만, 우리의 경험은 교육 혁신을 신속하게 테스트, 정제 및 포기하는 데 있어 이 접근 방식의 유용성을 강조합니다. 불과 5개월 만에 고객 니즈를 파악하고, 혁신을 위한 수많은 아이디어를 창출했으며, 공식적으로 3개의 혁신을 테스트했습니다(그 중 2개는 불과 2주 만에 폐기). 우리는 이 접근 방식이 교실 수업 방법, 온라인 모듈 및 게임, 소규모 그룹 형식, 임상 순환 구조, 평가 활동 및 커리큘럼 재설계를 포함한 사실상 모든 교육 혁신에 적용될 수 있다고 예상한다.
Although Lean Startup has thus far been applied primarily to business ventures, our experience highlights the utility of this approach in rapidly testing, refining, and abandoning education innovations. In only five months we identified customer needs, generated numerous ideas for innovation, and formally tested three innovations (abandoning two of them in as little as two weeks). We envision that this approach could apply to virtually any educational innovation, including classroom teaching methods, online modules and games, small group formats, clinical rotation structures, assessment activities, and curriculum redesigns.

우리는 (초기 '지속적 vs 피벗' 결정으로 제한되지 않음) 구현을 위해 선택된 아이디어를 다듬는 데 있어 이 접근 방식의 가치를 강조한다. Build-Measure-Learn은 혁신을 최대 규모(및 전체 투자)로 구축 및 테스트하는 일반적인 접근 방식과 달리 소규모(저비용) 테스트 실행을 기반으로 제품을 정교하게 다듬기 위해 반복되는 빠른 데이터 중심 주기를 강조합니다. 혁신자도 고객도 대개 고객이 진정으로 필요로 하는 것이 무엇인지 알지 못합니다. 린 스타트업은 상상된 니즈가 아닌 실제 니즈를 발견하고 해결할 수 있는 도구를 제공합니다.
We underscore the value of this approach in refining ideas once selected for implementation (not limited to the initial ‘persevere vs pivot’ decision). Build-Measure-Learn emphasizes fast, data-driven cycles that iterate to refine the product based on small-scale (inexpensive) test runs, in contrast to the typical approach of building and then testing an innovation at full scale (and full investment). Neither innovators nor customers usually know what the customer really needs; Lean Startup provides the tools to discover and address real rather than imagined needs.

린 스타트업은 (전통적인) 린 접근법, PDSA(Plan-Do-Study-Act), 식스 시그마, 구현 과학 등의 품질 개선 프레임워크와 대비된다. 이러한 전통적 접근법은 [고객 개발 및 검증된 학습('무엇을 만들 것인가?')]이 아닌, 주어진 제품이나 결과를 최소의 낭비와 오류('어떻게 더 낫게 만들 것인가?')로 제공하는 방법에 초점을 맞추고 있습니다. 린 스타트업은 디자인 사고(고객 중심 아이디어에 초점을 맞춘) 및 민첩성과 같은 다른 혁신 프레임워크를 보완하고 겹칩니다. (고객의 요구를 충족하기 위해 아이디어를 신속하게 점진적으로 세분화합니다.) 
Lean Startup contrasts with quality improvement frameworks such as (traditional) Lean approaches (Womack et al. 2007; LeMahieu et al. 2017b), Plan-Do-Study-Act (PDSA) (Cleghorn and Headrick 1996; Berwick 1998; LeMahieu et al. 2017b), Six Sigma (LeMahieu et al. 2017a), and implementation science (Glasgow et al. 1999; Nordstrum et al. 2017). These traditionally focus on how to deliver a given product or outcome with minimum waste and error (‘How to build it better?’) rather than customer development and validated learning (‘What to build?’). Lean Startup complements and overlaps other innovation frameworks such as design thinking (which focuses on customer-focused ideation) and Agile (which quickly incrementally refines ideas to meet customer demands) (Kidd and Johnson 2020).

Build-Measure-Learn은 과학적 방법의 다른 이름일 뿐이며, A-B 테스트는 단순히 집중(잠재적으로 무작위화됨) 제어 시험이다(Constable 2018). 잘 실행된 린 스타트업 프로젝트의 연구 결과는 종종 동료 검토 출판을 보증할 수 있으며, 특히 여러 주기의 연구 결과가 '실제로 작동하는 것'에 대한 일관된 메시지로 통합되는 경우 더욱 그렇다.
Build-Measure-Learn is just another name for the scientific method, and A-B testing is simply a focused (potentially randomized) controlled trial (Constable 2018). Findings from well-executed Lean Startup projects could often warrant peer-reviewed publication, especially if findings from several cycles are amalgamated into a coherent message of ‘what really works.’

우리가 '고객'이나 '비즈니스 모델'과 같은 용어를 사용하는 것은 교육의 시장화에 대한 지지를 의미하는 것이 아니라, 린 스타트업이 그 기원을 두고 있는 분야에서 이러한 용어를 빌렸을 뿐입니다. 교육의 시장화, 경제성, 비용효율은 이 글의 범위를 넘어서는 복잡한 주제이다.
Our use of terms like ‘customer’ and ‘business model’ does not imply endorsement of the marketization of education; we merely borrowed these terms from the field in which Lean Startup had its origin. The marketization, economics, and cost-effectiveness of education are complex topics beyond the scope of this article (Furedi 2011; Cook and Beckman 2015; Maloney et al. 2019).

결론
Conclusion

린 스타트업은 보건 전문 교육 분야에서 빠르고 강력한 혁신과 평가를 위한 엄청난 잠재력을 가지고 있다.
Lean Startup has tremendous potential for rapid, robust innovation and evaluation in health professions education.

 


Med Teach. 2022 Sep 28;1-12. doi: 10.1080/0142159X.2022.2118038. Online ahead of print.

Evaluating education innovations rapidly with build-measure-learn: Applying lean startup to health professions education

Affiliations collapse

Affiliation

1Division of General Internal Medicine, Mayo Clinic College of Medicine, Rochester, NY, USA.

PMID: 36170876

DOI: 10.1080/0142159X.2022.2118038

Abstract

Purpose: The Lean Startup approach allows innovators (including innovative educators) to rapidly identify and refine promising ideas into models that actually work. Our aim is to outline key principles of Lean Startup, apply these to health professions education, and illustrate these using personal experience.

Methods and results: All innovations are grounded in numerous assumptions; these assumptions should be explicitly identified, prioritized, and empirically tested ('validated learning'). To identify and test assumptions, innovators need to get out of the office and interact with customers (learners, teachers, administrators, etc). Assumptions are tested using multiple quick cycles of Build (a 'minimal viable product' [MVP]), Measure (using metrics that relate meaningfully to the assumption), and Learn (interpret data and decide to persevere with further refinements, or pivot to a new direction). The MVP is a product version that allows testing of one or more key assumptions with the least effort. We describe a novel 'Lean Education Canvas' that synopsizes an innovation and its business model on one page, to help identify assumptions and monitor progress. We illustrate these principles using three cases from health professions education.

Conclusions: Lean Startup has tremendous potential for rapid, robust innovation and evaluation in education.[Box: see text].

Keywords: Program evaluation; agile development; empirical research; qualitative research; research design.

코멘터리: 의학교육의 패러다임, 가치론, 인간행동학 (Acad Med, 2018)
Commentary: Paradigms, Axiology, and Praxeology in Medical Education Research
Zareen Zaidi, MD, PhD, and Douglas Larsen, MD, MEd

 

 

연구자들의 [연구 패러다임]과 [이론적 관점]은 [연구 과정]에 영향을 미친다. 승인된 RIME(Research in Medical Education) 기사를 예로 들어 다음 질문을 살펴봅니다. 연구자들의 철학적 기반은 무엇이며, 그것이 출판물에서 드러나나요? 어떤 연구 패러다임이 잠재적으로 그들의 방법 선택을 가이드하는가? 그런 다음 우리는 연구 결과가 다른 의학 교육자들의 행동에 어떻게 영향을 미칠 수 있는지 논의한다. 우리는 연구 설계가 패러다임, 이론, 방법론 및 방법을 어떻게 포괄하는지 강조한다. 더 진행하기 전에, 우리는 이 요약을 준비하는 동안 사용한 주요 개념에 대한 간단한 개요를 제공한다. 입문서와 관련된 더 자세한 자료는 관심 있는 사람들을 위한 참고 문헌에 제공된다. 우리는 독자들이 이러한 개념과 이론의 적용 가능성을 고려하여 자신의 실천과 연구를 안내할 것을 권장한다.
Research paradigms and theoretical perspectives of researchers influence the research process—even research questions posited by researchers are shaped by how they view the world. Using the accepted Research in Medical Education (RIME) articles as exemplars, we explore the following questions: What are the philosophical underpinnings of the researchers, and are they made visible in their publications? What research paradigms potentially guide their choice of methods? We then discuss how the results from research can influence actions of other medical educators. We highlight how research design encompasses paradigms, theory, methodology, and methods. Before proceeding further, we provide a brief primer on the key concepts that we used while preparing this summary. More detailed resources1–6 related to the primer are provided in the bibliography for those interested. We encourage readers to consider the applicability of these concepts and theories to guide their own practice and research.

프라이머: 연구자들은 그들의 연구 활동에 영향을 미치는 다양한 [철학적 프레임워크]나 [패러다임]을 따른다. [패러다임]은 신념이나 세계관의 집합으로 볼 수 있으며, 세계의 본질과 개인이나 사물에 대한 세계의 관계, 또는 단순히 인식론적 입장으로 볼 수 있다. 이러한 패러다임은 시간이 지남에 따라 진화해왔고 현재까지도 계속 그렇게 하고 있다. 연구자들은 일부 중첩이 있는 패러다임에 대해 다른 레이블을 사용할 수 있다. 따라서 패러다임은 경직된 프레임워크보다는 [관련이 있는 사상적 학파의 느슨한 결합]으로 간주되어야 한다. 가장 잘 알려진 패러다임으로는 실증주의/후기실증주의, 포스트모더니즘/포스트구조주의, 비판론/이데올로기 패러다임, 구성주의, 실용주의 등이 있다. 패러다임에 대한 포괄적인 검토를 제공하는 것은 저자들의 의도가 아니다. 오히려 우리는 독자들에게 이해하기 쉬운 설명을 우리의 후속 대화의 기초로서 제공하는 것을 목표로 한다.
Primer:
 Researchers follow various philosophical frameworks or paradigms that impact their research activities. Paradigms can be viewed as a set of beliefs or worldviews, the nature of the world and the relationship of the world to individuals or objects, or simply as epistemological stances.7 These paradigms have evolved over time and continue to do so to date. Researchers may use different labels for the paradigms with some overlap; therefore, the paradigms should be regarded as loosely bound, related schools of thought rather then rigid frameworks.3 The best-known paradigms include positivism/postpositivism, postmodernism/poststructuralism, critical theory/ideological paradigm, constructivism, and pragmatism.3,8 It is not the intent of the authors to provide an encompassing review of paradigms; rather, we aim to provide easy-to-understand descriptions for readers as a primer to our subsequent conversation.

[실증주의]는 역사적으로 가장 잘 알려진 패러다임이다. 이 패러다임을 따르는 연구자들은 [발견되어야 할 하나의 진실]이 있으며, [현실은 관찰 가능하고 측정 가능]하며, [인과관계 연구]를 통해 발견될 수 있다고 믿는다. 고정된 측정 가능한 현실에 대한 생각은 많은 비판을 받았고, 연구자들은 측정이 잘못될 수 있고, 편견이 있으며, 완전한 객관성은 불가능하다는 것을 인정했다. 이것은 객관성을 위해 노력하지만 완전한 중립성은 어떤 절대적인 의미에서도 얻을 수 없다는 것을 이해하는 연구자들과 함께 후기실증주의 패러다임을 이끌었다. [후기실증주의자]들은 "진실"은 근사치이며 "우리가 현실에 대해 알고 있는 것은 지금은 진실이다. 단, 더 많은 연구가 더 나은 설명, 더 정확한 척도를 찾을 때까지"라고 이해한다.
Positivism is historically the best-known paradigm.3 Researchers following this paradigm believe that there is a single truth to be discovered and that reality is observable, is measurable, and can be discovered in cause-and-effect studies.3,9 The idea of a fixed measurable reality received much criticism with researchers conceding that measurement is fallible, researchers have biases, and complete objectivity is not possible.3 This led to the postpositivist paradigm with researchers striving for objectivity but understanding that complete neutrality is not obtainable in any absolute sense.
Postpositivists understand that “truth” is an approximation or “what we know about reality is true for now—until more studies find a better explanation, a more accurate measure.”9,10 

[포스트모더니즘]은 어떤 현상의 현실이 그것을 경험하는 자와 주관적으로 상대적이라고 가정한다. 이 패러다임은 또한 탈구조적 또는 탈식민지적이라 불리며 [현대 사회에 대한 비판]을 제공한다. 포스트모던 연구자들은 [기존의 내러티브를 해체]하고 [현상에 대한 재개념화된 설명]을 만드는 것을 목표로 한다. 
Postmodernism posits that reality of a phenomenon is subjectively relative to those who experience it.11 This paradigm is also variably referred to as poststructural or postcolonial and offers critiques of modern society.3 Postmodern researchers aim to deconstruct existing narratives and produce reconceptualized descriptions of phenomena.12 

[비판적 이론/이데올로기 패러다임]은 연구를 통해 [인식된 사회적 부당성]을 [해결하는 것]을 목표로 한다. 이 패러다임에서는 [현실은 시간이 지남에 따라 결정되는 사회적, 정치적, 문화적, 경제적, 민족적, 성별적 가치에 의해 형성된다]는 것을 인정한다. 이 경우 연구자는 (포스트모더니즘과는 반대로) 연구과제, 목적, 방법의 중심이 되는 가치에 대해서 [proactive한 입장]을 가지고 있다. 
Critical theory/ideological paradigm aims to address perceived social injustices through research and advocating for policy changes, acknowledging that reality is shaped by social, political, cultural, economic, ethnic, and gender values crystallized over time.7 The researcher in this case (as opposed to postmodernism) has a proactive stance with values being central to the task, purpose, and methods of research.13 

[구성주의]는 현실이 그것을 경험하는 사람들에 의해 구성되고 상대적이라는 것을 인식한다. 지식은 [연구자와 참가자 사이의 경계]를 흐리게 하는 [우리의 상호 작용]을 통해 만들어진 구성으로 구성되므로 [객관성에 도전]한다. 지식은 연구자와 참여자에 의해 [공동으로 만들어지며 시간에 따라, 개인에 따라, 상황에 따라 달라진다]
Constructivism recognizes that reality is constructed by those who experience it and is relative.14 Knowledge consists of the constructions made through our interactions blurring the line between researchers and participants, therefore challenging objectivity. Knowledge is cocreated by researchers and participants and is time dependent, individual dependent, and context dependent.9 

[실용주의]는 종종 진실과 현실의 문제를 회피하는 "대안적 패러다임"으로 간주되며, 이는 연구자가 실증주의/후지향주의에서 구성주의에 이르는 패러다임의 범위 사이에서 선택을 강요받지 않도록 한다. 이 연구자들은 사회적, 역사적, 정치적 맥락을 인정하면서도, [연구의 목적에 초점]을 맞춘다. 즉, [진실]은 그 당시에 작동하는work 것으로 간주합니다. 
Pragmatism is often regarded as an “alternate paradigm” sidestepping issues of truth and reality, allowing the researcher to be free of being forced to make a choice between the ranges of paradigms from positivism/postpositivism to constructivism.15 These researchers focus on the purpose of research while appreciating social, historical, and political context—describing truth as what works at the time.16

[방법론]은 [방법의 설명과 정당화]이지 [방법 자체]가 아니다. [방법]은 연구의 실제 연구 활동 또는 실제 활동이다.1 빈틈없는 성찰적 연구자는 연구와 관련하여 자신의 패러다임을 설명하는 데 세심한 주의를 기울일 것이며, work에 inform하는 philosophy를 설명할 것이다. 
Methodology is the description and justification of methods, and not the methods themselves. Methods are the actual research actions or practical activities of research.1 An astute reflexive researcher will pay careful attention to describing their paradigm in relation to the research, describing the philosophy informing the work.

[가치론]은 연구 과정에서의 [가치의 역할과 위치], 특히 [패러다임, 방법론, 방법론 사이의 관계]에 대한 가치의 영향을 의미한다. 즉, 연구 패러다임이 가치론적인 이유는 [연구자의 가치]가 [방법의 선택]에 inform하기 때문이다.
The role and place of values in the research process, specifically the influence of values on the relationship between paradigm, methodology, and methods, is known as axiology—that is, the research paradigm is axiological in that the values of the researcher inform the choice of methods.

[프락세오로지]라는 단어는 프락시스, 즉 액션에서 유래했다. 프락세오로지(Praceology)는 [인간의 행동의 영향을 연구하거나 의미를 만들고 행동을 해석하는 과학의 한 분야]이다. [교육이 효과를 발휘하게 하고, 일상적인 교육 실천에서 더 잘 작동하게 만드는 데 있어서 연구의 의미는 무엇이냐]는 질문에 구체적으로 답한다.
The word praxeology stems from praxis—action. Praxeology is the branch of science which studies the effect of human actions or makes meaning and interprets actions.4,5 It specifically answers the question of what research means for making education work and making it work better in the everyday practice of teaching.4

RIME 출판물의 연구 패러다임은 어떻게 제정되는가?
How Are Research Paradigms Enacted in RIME Publications?

우리는 각 연구팀의 패러다임이 방법론에 어떤 영향을 미쳤는지 탐구함으로써 독자들에게 기사의 일반적인 요약을 제공하는 것을 넘어서는 것을 목표로 한다. "AM 마지막 페이지: 의학교육과 관련된 연구 패러다임에 대한 가이드"를 지침 프레임워크로 사용하여, 우리는 각 수용된 RIME 논문을 검토하여 작가의 연구 패러다임이 어떻게 가시화되고 사용되는 방법인 축성과 관련된 정보에 근거한 선택을 할 수 있는지 고려했다(표 1). 그런 다음 우리는 일상적인 교수 관행인 사전학에서 연구의 영향에 대해 논평한다. 우리는 저자들의 명시적인 진술이 없다면, 아래의 분류는 우리 자신의 해석을 나타내며, 저자나 다른 독자들이 동의하지 않을 수 있다는 것을 인식한다. 우리는 먼저 실증주의/후기실증주의 패러다임을 대표한다고 느끼는 연구 논문을 고려하고, 그 다음으로는 비판이론, 구성주의, 실용주의 패러다임을 가진 논문을 고려한다.
We aim to go beyond providing the readers with a general summary of the articles by exploring how paradigms of each research team influenced the methodology. Using “AM Last Page: A Guide to Research Paradigms Relevant to Medical Education17 as our guiding framework, we reviewed each accepted RIME paper to consider how authors’ research paradigm might be made visible and informed choices related to methods used—axiology (Table 1). We then comment on the impact of the research in the everyday practice of teaching—praxeology. We recognize that without explicit statements from the authors, the categorizations below represent our own interpretations, and the authors or other readers may disagree. We first consider the research papers we felt represented a positivist/postpositivist paradigm, followed by papers with critical theory, constructivist, and pragmatist paradigms.

Research paradigms in medical education research Suzanne Bunniss & Diane R Kelly

 

실증주의자/후기 실증주의자 패러다임 연구
Positivist/postpositivist paradigm research

이 패러다임에서 지식은 가설 검증에 의해 얻어진다. 쿨라세가람 등은 "발견의 순서와 그에 따른 직접 지도가 학생들의 기술 이전에는 도움이 되지만, 학생들의 유지나 시험 후 즉각적인 성과에는 도움이 되지 않는다"는 명확한 가설을 밝혔다. 연구 설계는 공식 지시(Do then see) 전에 시뮬레이션된 환경에서 학습자 봉합 기술 성능을 보다 일반적인 공식 지시 순서와 비교하고, 이어서 실습(Do then see)을 비교하기 위한 설득력 있는 무작위 제어 시험이다. 연구원들은 자기효능감과 학생들의 성취도에 관한 자료를 수집했는데, 이는 눈이 먼 평가자에 의해 5점 만점의 글로벌 평가 척도로 평가되었다.

Knowledge in this paradigm is gained by hypothesis testing. Kulasegaram et al18 articulate a clear hypothesis that “the sequence of discovery, followed by direct instruction would benefit students’ transfer of skills, but not their retention or immediate post-test performance.” The study design is an eloquent randomized controlled trial to compare learner suturing skills performance in a simulated setting before formal instruction (Do then See) versus the more typical sequence of formal instruction, followed by practice (See then Do). The researchers gathered data related to self-efficacy and student performance scored on a five-point global rating scale by a blinded rater.

연구자들의 [후기 실증주의 패러다임]은 기술 습득 측정에 초점을 맞춘 [실험 설계]에 반영된다. 후기실증주의에 충실하게, 저자들은 그들의 결과가 완전히 객관적일 수 없으며 봉합 작업에 할당된 단일 비율, 맥락 및 시간의 사용에 의해 영향을 받았다는 것을 인정한다. 또한, 그들은 다른 outcome를 연구하기로 선택할 수 있었다는 점에 주목한다. 특히, [행동 과정]은 [구성주의 패러다임]을 사용하여 가장 잘 연구되었을 수 있다.

The researchers’ postpositivist paradigm is reflected in the design of the experiment with its focus on the measurement of skill acquisition. True to postpositivism, the authors acknowledge that their outcomes cannot be completely objective and were impacted by the use of a single rater, the context, and time allocated for the suturing task. Additionally, they note that they could have chosen to study different outcomes—specifically, behavioral processes, which may then have been best studied using constructivist paradigms. 

[가치론]과 관련하여, 연구 목적을 보았을 때, 후기실증주의는 [연구 설계와 잘 일치]하고, [유용한 정보를 제공]한다. 저자들은 [먼저 스스로 과제를 탐색하고 고군분투한 다음 지시를 받은 학생]들이 [먼저 교육을 받은 다음 독립적인 연습을 통해 과제를 탐색하도록 허용된 학생]들에 비해 나중에 이전 과제를 더 잘 수행한다는 것을 보여준다. 이 연구의 결과는 직접 교육과 과제 완료를 수반하는 전통적인 교육에 도전하기 때문에 [시뮬레이션에 참여하는 의학 교육자들에게 영향]을 미칠 수 있다. [Guided SRL]과 [직접 교육]의 사려 깊은 조합은 그러한 학습 기회를 최적화할 수 있다.

Regarding axiology, for the purpose of their study the postpositivist paradigm is well aligned with the research design and provides useful information. The authors show that students who first are allowed to explore and struggle with the task on their own and then receive instruction perform better on a later transfer task compared with those who are instructed first and then allowed to explore the task through independent practice. The results of this study can and should impact medical educators involved in simulation as the results challenge traditional teaching involving direct instruction followed by completion of tasks. A thoughtful combination of guided self-regulated learning and direct instruction can optimize such learning opportunities.

[실증주의자/후기실증주의자 연구(양적 또는 질적)의 목적]은 [가설을 검정하고 변수 간의 인과관계를 설정하는 것]이다. 펠드만 외 연구진과 오니시 외 연구진은 모두 [테스트가 교육에 미치는 영향]을 조사한다. 펠드만과 동료의 연구에서, [후기실증주의 패러다임]은 국립 의학 컨퍼런스에서 사전 및 사후 테스트를 모두 통합한 정보를 가지고, [객관식 질문 기반 시험 강화 학습(TEL) 개입]의 사용과 관련된 연구 질문에 답하는 데 매우 적합했다. [무작위 대조 시험]을 실시한 결과, 그들은 사실을 반복적으로 검색하면 지속적인 의료 교육 환경(CME)에서 선언적 지식의 보존이 시간이 지남에 따라 향상된다는 것을 발견했다. 지속적인 전문성 개발(CPD)은 의료 전문가들이 자신의 업무 분야의 최신 변화를 최신으로 유지하도록 보장하는 데 필수적이다. 의료 전문가들은 CME 과정에 참여하며 지식과 숙련도를 입증하기 위해 면허 시험을 다시 치러야 한다. 본 연구가 기존 문헌에 덧붙이는 것은 검색실습을 촉진하는 인지시험이 학부 또는 대학원 교육에서 CPD에게도 마찬가지로 가치가 있다는 점이다. CME 인가 기관은 참석자들이 지식을 공고히 할 수 있도록 반복적인 TEL을 고려해야 한다.
The objective of positivist/postpositivist research (quantitative or qualitative) is to test hypotheses and to establish cause-and-effect relationships between variables.19 The studies by Feldman et al20 and Onishi et al21 both investigate the effect of testing on education. The postpositivist paradigm was well suited to answer Feldman and colleagues’ research question regarding the use of a multiple-choice-question-based test-enhanced learning (TEL) intervention on knowledge, which incorporated both pre- and posttesting at a national medical conference. Undertaking a randomized controlled trial, they found that repeated retrieval of facts improved retention of declarative knowledge in a continuing medical education setting (CME) over time. Continuing professional development (CPD) is essential in ensuring that health care professionals remain up-to-date with the latest changes in their fields of practice. Health care professionals attend CME courses and are often required to retake licensing exams to demonstrate knowledge and proficiency. What this study adds to the existing literature is that cognitive tests promoting retrieval practice are just as valuable for CPD as they are in undergraduate or postgraduate education. CME-granting agencies should consider repeated TEL to help attendees solidify their knowledge.

오오니시 등의 연구의 초점은 [이사회 인증 결정의 영향]을 결정하는 데 있으며, 이는 다음을 기반으로 합니다. 교육생이 전체 평가를 통과하기 위해 모든 하위 구성요소를 통과해야 하는지 여부(즉, 비보상적) 또는 한 하위 구성요소에 대한 성능이 평가의 다른 섹션에 대한 성능을 보상할 수 있는지 여부(보상적). 후기실증주의 패러다임에 기초하여, 저자들은 일본의 국가 데이터베이스를 사용하여, [종합점수]와 [보상성 및 비보상성 점수와 관련된 종합결정]의 [내부구조]와 [결과적 타당성] 증거를 검토했다. 그들은 인증 평가의 보상 및 비보상 채점에 대한 결정이 신뢰성에 극적인 영향을 미친다는 것을 입증한다. 특히, [역량과 안전이라는 이름으로 특정 요소를 반드시 통과시켜야 한다는 결정]에서 나오는 [비보상 채점]은 종종 평가의 신뢰성을 크게 떨어뜨릴 것이다. 비보상 채점은 학습자가 환자 안전에 영향을 미치는 특정 내용 영역에서 완전히 유능함을 보장하는 이점이 있지만, 전체적인 의사 결정 신뢰도 감소를 포함한 심리측정학적 결과를 고려할 필요가 있다. 연구의 [가치론(즉, 후기실증주의적 패러다임 렌즈)]과 [방법]은 잘 일치하지만, 저자들은 검사자의 설정, 맥락, 전문성, 학습자 샘플 및 가치가 모두 연구에 영향을 미칠 수 있다는 것을 인정한다. 본 연구의 결과는 자체 기관 또는 국가 차원에서 고평가 시험 계획에 참여하는 교육자들에게 특히 중요합니다. 예를 들어, 미국 의료 면허 시험(USMLE) 또는 면허 시험.


The focus of Onishi and colleagues’ research is to determine the impact of examining board certification decisions, which are based on whether trainees should pass all subcomponents to pass the entire assessment (i.e., noncompensatory)—or whether performance on one subcomponent can compensate for performance on other sections of the assessment (compensatory). Grounded in the postpositivist paradigm, using psychometric theory the authors used a national database in Japan to examine internal structure and consequential validity evidence of composite scores and composite decisions related to compensatory and noncompensatory scoring. They demonstrate that decisions about compensatory and noncompensatory scoring of certification assessments have dramatic effects on the reliability. Specifically, noncompensatory scoring, which emerges from a determination that a certain element absolutely must be passed in the name of competence and safety, often will significantly reduce the reliability of the assessment overall. Although noncompensatory scoring does have its benefits to ensure that learners are fully competent in specific content areas with implications for patient safety, there is a need to consider psychometric consequences including reducing the overall decision reliability. While the axiology of the study (i.e., the postpositivist paradigm lens) and its methods are well aligned, the authors do acknowledge that the setting, context, specialty, learner sample, and values of the examiners could all influence the study. The results of this study are particularly important for educators involved in the planning of high-stakes exams at their own institutions or at national levels—for instance, United States Medical Licensing Examination (USMLE) or licensing examinations.

펠드만 외 연구진과 오니시 외 연구진은 지식 측정에 대해 [후기실승주의적 관점]에서 접근하지만, 둘 다 [구성주의적 접근]이 가장 적합한 미래 연구에 대해 질문을 제기한다. 지식 보유도 중요하지만, CPD가 환자 치료나 의사가 침대 머리맡에서 "하는 것"을 개선하도록 하는 것이 중요하다. [구성주의적 방법]은 실제 수행, 테스트되고 평가되는 것에 대한 가치 판단, 특정 사실과 성과를 다른 것보다 더 중요하게 여기는 권력 구조, 신념 체계 및 문화적 편견에 대한 질문에 답하는 가장 좋은 접근법일 수 있다. 구성주의 연구는 후기실증주의 연구의 결과와 다른 관점을 제공하거나 추가할 수 있다.
Though the studies by Feldman et al and Onishi et al regarding the measurement of knowledge approach education from a postpositivist perspective, they both raise questions for future research that are best suited to a constructivist approach. Although knowledge retention is important, it is important to ensure that CPD improves patient care or what the physician “does” at the bedside. Constructivist methods may be the best approach to answering questions about real-life performance, about the value judgments made around what is tested and assessed, and about the power structures, belief systems, and cultural biases that value certain facts and performances over others. Constructivist studies may provide a different perspective than or could add to the results of the postpositivist research.

포스터 외 연구진과 박 연구진은 또한 실증주의 및 후기실증주의 패러다임을 사용하여 특정 작업장의 과제와 성과를 연구한다. 포스터 등은 [지식을 객관적인 것으로, 즉, 측정 가능한 고정된 현실]로 보았다. 그들은 [USMLE 테스트 상황]을 전자 건강 기록(EHR)의 사용과 관련하여 의대생들을 조사하는 기회로 사용했다. 데이터에 따르면 전국적으로 EHR을 사용하는 임상실습의 비율은 5년 동안 증가했지만, 이러한 기록에 메모를 입력하는 학생의 비율은 안정적으로 유지되었고, 오더를 실제로 입력하는 학생의 비율은 감소했다고 한다. 이 연구는 예측에 초점을 맞추고 일반화 가능한 데이터를 생성하는 것을 목표로 하기 때문에 주로 실증주의 패러다임에 속하지만, 저자들은 맥락(EHR의 가용성)이 결과에 영향을 줄 수 있다고 언급한다. 그들의 작업은 [두 가지 진행중인 대화에 영향]을 미칩니다. 하나는 환자 차트에 의대생에 의한 문서화를 허용하고 장려하는 [새로운 메디케어 가이드라인]에 관한 것이고, 다른 하나는 [레지던트 시작 전 환자 오더 작성 및 프로그레스 노트 작성의 숙련]을 권장하는 AAMC의 Core EPA 문서에 관한 것입니다. 커리큘럼 계획에 참여하는 의학 교육자들은 학생들이 이러한 과제를 연습하고 피드백을 받을 수 있는 적절한 기회를 갖도록 보장해야 한다.
Foster et al22 and Park et al23 also use positivist and postpositivist paradigms to study specific workplace tasks and performance. Foster et al view knowledge as objective—that is, a fixed reality, which is measurable. They used the USMLE test setting as an opportunity to survey medical students regarding the use of electronic health records (EHRs). Data revealed that while the percentage of clerkships nationwide using EHRs has increased over a five-year period, the percentage of students entering notes into those records has remained stable, and the percentage of students entering orders has actually decreased. This study falls mainly in the positivist paradigm as they focus on prediction and aim to produce generalizable data, though the authors mention that context (availability of EHRs) can impact the results. Their work has implications for two ongoing conversations, one regarding the new Medicare guideline that allows and encourages documentation by medical students in patient charts, and another regarding the Association of American Medical Colleges’ core entrustable professional activities document, which recommends proficiency in writing patient orders and progress notes prior to entering residency. Medical educators involved in curricular planning must ensure that students have adequate opportunity to practice these tasks and receive feedback.

Park 등은 [완전한 객관성이 달성될 수 없다는 것을 인정]하면서, 객관적인 지식을 얻기 위해 노력한다. 이들은 소아 인턴의 역량 등급 통계 분석에 업무량 측정치가 포함될 때 평가 점수의 신뢰성과 정밀도가 크게 증가한다는 것을 보여준다. 이 연구는 [후기실증주의적 패러다임과 일치]하여, 측정을 사용하여 복잡한 현상을 명확히 하고 통찰력을 제공한다. 이 연구는 직장 기반 평가(WBA)에서 교육생의 업무량 같은 [교란 요인을 식별]하는 것의 중요성을 강조한다. 대학원 의학 교육을 위한 인증 위원회는 이제 WBA가 필수적인 마일스톤 보고의 사용을 의무화하고 있다. 이 논문은 교육자 작업량을 포함한 작업장의 다른 복잡성을 고려하지 않고 WBA의 정확성에 대해 교육자들에게 생각할 거리를 제공한다.
Park et al strive to obtain objective knowledge, acknowledging that complete objectivity is not achievable. They demonstrate that when measures of workload are included in the statistical analysis of competency ratings for pediatric interns, the reliability and precision of assessment scores increase substantially. Consistent with a postpositivist paradigm, the study uses measurement to clarify and give insights into complex phenomena. The study highlights the importance of identifying confounders to workplace-based assessment (WBA), such as workload of trainees. The Accreditation Council for Graduate Medical Education now mandates the use of milestones reporting, for which WBA is essential. This paper provides food for thought for educators regarding the accuracy of WBA without taking into account other complexities of the workplace including trainee workload.

Burkhardt 등은 의대 입학전형에서 판단의 주관성을 제거하는 데 [예측적 입학모형(EM)]을 사용할 경우의 이점에 대한 가설을 생성하는데, 의대 입학사정관 등 교육 지도자들이 자신의 학교에 누가 다닐지 예측한다. 그들은 그들의 결과가 연역적이며 결과가 절대적으로 객관적이지 않을 수 있다는 것을 인정한다. 저자들은 [후기실증주의적 도구]를 사용하면 주관적인 판단을 제거함으로써 과정을 개선할 수 있음을 보여준다. EM 모델은 입학관리실에서 지원자의 가능한 행동에 대한 정보를 제공하기 위해 사용될 수 있으며, 특히 대표성이 낮은 소수자와 여성의 모집에서 유용하고, 주 내 지원자와 주 외 지원자의 균형을 맞추기 위해 사용될 수 있다. 저자들은 인간의 판단에 비해 열등하지 않고 일부 측면에서는 모델의 우월성을 보여준다. 이 연구는 다양성을 개선하기 위한 의도적인 실천/단계들이 얼마나 도움이 될 수 있는지를 보여주는 사례이다.
Burkhardt et al24 generate a hypothesis about the benefits of using a predictive enrollment model (EM) in eliminating subjectivity of judgments in the medical school admissions process, where educational leaders such as medical school admissions officers make predictions about who will attend their school. They acknowledge that their results are deductive and that outcomes may not be absolutely objective. The authors demonstrate that the use of a postpositivist tool can improve the process by eliminating subjective judgments. EM models can be used by admissions offices to provide information about likely behavior of applicants, which can be valuable in the admissions office particularly in the recruitment of underrepresented minorities and women, and to balance in-state versus out-of-state applicants. The authors show noninferiority and in some aspects superiority of their model compared with human judgment. This study is an example of how deliberate practice/steps to improve diversity can be helpful.

올해 RIME 선정에서 또 다른 [실증주의 연구]는 Aakre 등의 스코핑 리뷰이다. 연구자들은 전자 지식 및 관리 시점 교육 자원과 관련된 양적 및 질적 연구를 연구하기 위해 [중립적이고 객관적이며 독립적이며 가치 없는value-free 입장]을 유지한다. 가장 자주 인용되는 전자 자원은 UpToDate였다. 지식 자원의 교육적 또는 임상적 영향에 대한 연구는 부족했다. 의학 지식의 지속적인 성장과 그에 따른 효과적인 지식 합성과 실천으로의 번역의 필요성을 고려할 때, 이 분야의 추가 연구는 특히 자원이 지식과 치료 시점에 영향을 미치도록 보장하는 것이 중요하다.
Another positivist study in this year’s RIME selection is the scoping review by Aakre et al.25 The researchers maintain a neutral, objective, independent, and value-free stance to study quantitative and qualitative research related to electronic knowledge and point-of-care education resources. UpToDate was the most frequently cited electronic resource. A paucity of research was noted regarding the educational or clinical impact of knowledge resources. Given the ever-accelerating growth of medical knowledge, and the consequent need for effective knowledge synthesis and translation to practice, further research in this field is important, particularly ensuring that resources have impact on knowledge and at the point-of-care.

비판적 이론과 구성주의 패러다임 연구
Critical theory and constructivist paradigm research

곤잘레스 외 연구진과 수헤라 외 연구진은 [암묵적 편향 훈련]에 참여한 교육자와 학습자의 경험을 이해하고자 한다. 연구자들은 [구성주의 패러다임]을 가지고 있고 [근거 이론]을 사용한다. 구성주의에 충실하게, 저자들은 개인들 사이에 여러 진실이 구성된다고 믿으며, 연구 결과는 현실에 대한 인식이 사회적으로 어떻게 만들어지는지를 보여준다. 두 연구 모두 지속적인 성찰과 자기계발의 중요성을 강조한다. 수헤라 등은 [편견을 드러냄으로써 나타나는 긴장]과 [학습자와 교사가 이러한 긴장을 어떻게 조정하는지] 논의하는 반면, 곤잘레스 등의 연구는 [편향과 관련된 대화를 촉진하기 위한 교수진의 준비되지 않은 모습]을 보여준다. 그 결과는 편향 교육과 관련된 교수진 개발 및 참여자들이 자신의 편견을 발견했을 때 불안감을 해소하는 데 사용될 수 있다. 미국 의사회는 최근 의사를 고용하는 모든 조직에 의한 정기적이고 반복적인 암묵적인 편향 훈련의 제공을 옹호하는 입장문을 발표했다. 곤잘레스 외 연구진과 수헤라 외 연구진의 연구 결과는 교육과정 설계에 참여하는 교육자들에게 도움이 될 것이며, 과정을 알리는 중요한 팁을 제공할 것이다.
The studies by Gonzalez et al26 and Sukhera et al27 seek to understand the experiences of educators and learners engaged in implicit bias training. The researchers have a constructivist paradigm and use grounded theory. True to constructivism, the authors believe that multiple truths are constructed between individuals, and the results of the studies showcase how the perception of reality is socially created. Both studies highlight the importance of a constant process of reflection and self-improvement. Sukhera et al discuss the tensions emerging from revealing bias and how learners and teachers navigate these tensions, while the work by Gonzalez et al demonstrates the unpreparedness of faculty to facilitate conversations related to bias. The results can be used for faculty development related to bias instruction and to allay anxieties when participants discover their own biases. The American College of Physicians recently released a position statement advocating for the provision of regular and recurring implicit bias training by all organizations that employ physicians.28 The results of the research by Gonzalez et al and Sukhera et al will be helpful for educators involved in curriculum design, providing important tips to inform the process.

[비판적인 종합 검토]에서, 와이즈너와 에바는 [교육에 대한 인센티브]를 탐구하기 위해 문헌을 검토한다. [비판적 합성]은 [비판]과 [합성]의 두 가지 주요 방법론을 중심으로 진행된다. 저자들이 자신의 패러다임을 명시적으로 밝히지는 않지만, 기사를 검토한 결과, [여러 개의 진실이 존재한다는 것을 인정]하면서, [비판적인 입장]을 취하고 있음을 알 수 있다. 저자들은 문학의 종합(의학 교육뿐만 아니라 심리학, 행동학, 조직학 문헌도 포함)을 제공한다. 그러나 한 걸음 더 나아가 이용 가능한 문헌을 비평한다. 그들은 교수진별로 자체 보고된 인센티브를 나열하고, 비판을 제공하는 동안 교수진이 어떻게 교수와 관련된 재정적 의욕 저하에 대한 우려(즉, 진료소에 있지 않음으로써 포기하는 돈)를 제기하지 않는지에 대해 논의한다. 또한, 그들은 [인센티브의 영향]은 다른 개인의 동기 부여에 영향을 미치는 요인에 좌우되며 제공되는 인센티브의 유형은 신중하게 고려되어야 한다고 지적한다. 비판적 합성은 의료 교육자들이 일하는 많은 맥락에서 인센티브가 어떻게, 언제, 왜 작동하는지에 대한 더 큰 명확성이 필요하다는 것을 강조한다.
In a critical synthesis review, Wisener and Eva29 review the literature to explore incentives for teaching. Critical synthesis revolves around two main types of methodology: criticism and synthesis. Although the authors do not explicitly state their paradigm, a review of the article reveals that they take on a critical stance, acknowledging that multiple truths do exist. The authors provide a synthesis of literature—not just from medical education but also psychology, behavioral, and organizational literature—but then go a step further to critique the available literature. They list self-reported incentives by faculty and, while providing a critique, discuss how faculty neglect to bring up concerns of financial disincentives associated with teaching (i.e., money that is given up by not being in clinic). Additionally, they point out that the influence of an incentive is dependent on factors influencing different individuals’ motivation and that the type of incentive offered has to be carefully thought out. The critical synthesis highlights that the field needs greater clarity regarding how, when, and why incentives operate within the many contexts in which medical educators work.

실용주의 패러다임 연구
Pragmatism paradigm research

Gowda 등은 [예술에 대한 조사를 통해 관찰능력을 기르는 과목]의 효과를 [성찰 능력, 불확실성에 대한 관용, 개인적 편견에 대한 인식에 미치는 영향]으로 조사하였다. [과정이 관찰에 미치는 영향]을 탐구한다. 저자들은 그들의 패러다임을 명시적으로 언급하지는 않지만, 현실 세계의 입장을 채택하면서 엄격함을 만들어내기 위한 [다양한 방법의 필요성]을 인정한다. 즉, "질문에 대한 과정[연구] 접근법 및 혼합을 명확히 하는 것"입니다. 저자들은 수업의 효과를 질적으로 탐구하기 위해 포커스 그룹뿐만 아니라 반영 능력에 대해 이전에 확립된 평가 척도를 사용하는 혼합 방법 설계를 사용한다. 그들은 과정에 참여하는 학생들의 성찰 능력이 향상되고, 세상을 관찰하고 해석하는 데 있어 주관성의 역할에 대한 인식이 증가된 것을 발견했다. 이 연구는 모든 교육자, 특히 임상 기술을 가르치는 데 관련된 모든 교육자에게 중요하다. [주의 깊은 관찰]은 학생들에게 자동적으로 존재하는 것으로 추정되어서는 안 되며, 학습된 기술로 간주되어야 한다. 또한 관측한 것의 불확실성을 성찰하는 능력은 학생들에게 모호하게 될 수 있다. 그 연구는 또한 교과과정에서의 예술과 인간의 통합을 지원하기 위해 증거를 제공하는 증거이다.

Gowda et al30 explore the effects of a course on observation through examining art in influencing reflective ability, tolerance for uncertainty, and awareness of personal bias. The authors do not explicitly state their paradigm but do acknowledge the need for diversity of methods to produce rigor, adopting a real-world stance, i.e., a “horses for courses [whatever works] approach to the question, and clarifying the mix.”16 The authors use a mixed-methods design using previously established rating scales for reflection ability as well as focus groups to explore the effects of the course qualitatively. They found improvement in reflective ability of students participating in the course and an increased awareness of the role of subjectivity in observing and interpreting the world. This study is important for all educators but particularly those involved in teaching clinical skills. Careful observation should not be presumed to be automatically present in students and should be considered a learned skill. Additionally, the capacity to reflect on the uncertainty of observations can help students deal with ambiguity. The study is also valuable because it provides evidence to support the integration of arts and humanities in the curriculum.

결론들
Conclusions

올해의 RIME 기사에서, 저자들은 개념적 틀을 명확하게 표현했거나, 저자들이 누구의 작품을 만들고 있는지에 대해 진술했다. 그러나 연구 패러다임을 명확히 밝힌 논문은 두 편뿐이었다. 이 두 저자들은 구성주의 관점에서 연구 질문을 하고 있다고 언급했다. 질적 연구원들은 그들이 방법을 정당화하기 위해 그들의 패러다임을 분명히 할 수 있다는 것을 느낄 수 있다. 우리가 느끼기에 드러났다고 보는 논문은 실증주의, 후기실증주의, 실용주의 패러다임에 대한 것이었는데, 패러다임적 입장을 명시하지 않았다. 대부분의 서류들이 실증주의/후기실증주의 패러다임을 주목하는 것은 흥미롭다. 우리는 연구논문에 귀속되는 연구 패러다임이 논문에 제공된 정보를 바탕으로 한 우리 자신의 연구 해석임을 지적하고 싶다. 작가로부터 명확한 진술 없이, 우리는 이러한 해석에 동의하지 않았고, 작가들은 우리의 해석과 동의하지 않을 수 있다. 
In this year’s RIME articles, the authors have either clearly articulated conceptual frameworks (Burkhardt et al,24 Gonzalez et al,26 Kulasegaram et al18), or the authors state on whose work they are building (Aakre et al,25 Feldman et al,20 Foster et al,22 Gowda et al,30 Onishi et al,21 Park et al,23 Sukhera et al,27 Wisener and Eva29). However, only two papers had clearly articulated a research paradigm (i.e., Gonzalez et al and Sukhera et al). These authors state that they were approaching the research questions from a constructivist perspective. It is possible that qualitative researchers may feel they need to state their paradigm clearly to justify the methodology. The papers that we felt represented positivist, postpositivist, and pragmatism paradigms did not explicitly state their paradigmatic position. It is interesting to note that the majority of papers belonged to the positivist/postpositivist paradigms. We would like to point out that the research paradigms attributed to the research papers (other then Gonzalez et al and Sukhera et al) are our own interpretations of the research, based on information provided in the paper. Without clear statements from the authors, we had difficulty making these interpretations, and it is possible that authors may disagree with our interpretations.

연구 패러다임에 관한 연구는 거의 없다. 그러나 의학교육에 대한 실험적 연구를 검토한 결과, 사용된 개념적 틀에 대한 명시적 문구가 조사된 논문의 절반 미만이 포함되어 있어 의학교육 연구자들이 연구에 사용한 개념적 틀을 명확하게 기술해야 한다는 주장이 제기되었다. 패러다임 입장과 관련한 명시적 진술이 담긴 전체 의학교육 연구 논문의 수에 대해서는 언급할 수 없지만, 모든 의학교육 연구자들이 자신의 [개념적 프레임워크]뿐만 아니라 [연구 패러다임]도 명확하게 밝힐 것을 권장한다. 예를 들어 후기실증주의 저자들의 명시적 진술은 지식 및 지식 및 지식에 영향을 미칠 수 있다. 연구원들은 택시 기술을 유지하는 방법에 대한 설명을 추가하고 그들의 연구를 논의해야 한다. 검토자, 편집자, 편집자 및 독자들은 일반적이어야 한다. 우리는 "우리가 알고 있는 것을 의도적으로 아는 것"은 것이 어려울 수 있다는 것을 인정한다. 그리고 라벨을 붙이는 것은 때때로 불가능해 보일 수 있지만, 패러다임의 한계를 아는 것은 그것을 명확히 하는 것만큼 중요하다. 
There is little available in medical education literature about research papers articulating research paradigms. However, a review of experimental studies in medical education revealed that less half the articles examined contained an explicit statement of the conceptual framework used, leading to calls for medical education researchers to clearly state the conceptual framework they have used in their research.31,32 We are unable to comment on the number of overall medical education research papers containing explicit statements regarding paradigms stances, but we encourage all medical education researchers to clearly state not just their conceptual frameworks but also the research paradigm. Explicit statements of paradigm by postpositivist authors, for example, might influence the discourse around knowledge and the limitations of any one way of knowing. Researchers should also consider adding a statement of how they maintained axiology and discuss the praxeology of their research. Reviewers, editors, and readers need to evaluate the rigor of research, and clear statements by authors should be the norm. We acknowledge that it can be challenging to “intentionally know what we know,” and to articulate and label may at times seem impossible, but knowing the limits of our paradigm is as important as articulating it.33

좋은 품질의 연구는 패러다임, 방법론, 그리고 방법들을 다루고 그들 사이의 내부적인 일관성을 입증한다.1 이러한 가치론적 무결성은 연구 증거를 전달, 번역 또는 합성하는 데 가치를 유지할 수 있는 능력을 가지고 있다. 우리는 의학 교육 연구자들이 그들의 연구의 가치론적 무결성을 고려할 것을 권고한다. 연구자들은 시간이 지남에 따라 연구자의 기억, 성찰 및 관점을 위한 저장소 역할을 하기 위해 [성찰 저널]을 유지하는 것을 고려할 수 있다. 연구과정에 대한 메타인지적 성찰을 위한 저널 형태로 제공되는 공간은 성찰성 발달에 도움이 될 수 있다. 
Good-quality research attends to paradigm, methodology, and methods and demonstrates internal consistency between them.1 This axiological integrity then has the ability to retain values in transferring, translating, or synthesizing research evidence.34 We recommend that medical education researchers consider the axiological integrity of their research. Researchers can consider maintaining a reflexive journal to serve as a repository for their researcher’s memories, reflections, and perspective over time. The space provided in the form of a journal for metacognitive reflection on the research process can help in the development of reflexivity.35

결론적으로, 연구자들은 종종 특정한 연구 패러다임을 가지고 연구 질문들에 접근한다. [패러다임적 입장]은 질문의 유형과 선택 방법을 결정합니다. 비록 패러다임의 명확성이 중요하지만, 어떤 한 가지 입장도 인간 학습의 복잡한 현상의 모든 측면을 설명하는 것은 불가능하다는 것을 인식하는 것이 중요하다. 각 접근 방식에는 강점과 한계가 있습니다. 교육에서 가장 중요한 많은 이슈들은 다중 렌즈를 통해 탐구될 수 있다. 올해 RIME 프로그램의 연구는 연구자들이 다루는 질문의 다양한 패러다임을 보여준다. 렌즈의 다양성을 고려함으로써, 자신의 접근 방식의 한계와 향후 단계에 대한 가능성이 더 명확해진다. 이러한 깨달음은 우리의 연구에 겸손함을 가져다 주고 더 큰 가능성을 열어줍니다.
In conclusion, researchers often approach the questions that they investigate from a particular research paradigm. This stance determines the types of questions that can be asked and the methods that are chosen. Although paradigmatic clarity is important, it is important to recognize that no one view or approach is able to describe all aspects of the complex phenomena of human learning. Each approach will have its strengths and limitations. Many of the issues that are most important in education can be explored through multiple lenses. The studies from this year’s RIME program demonstrate a diversity of paradigms of the questions that researchers address—by considering the diversity of lenses, the limitations of one’s own approach and possibilities for future steps become more clear. This realization brings humility to our research and opens us up to greater possibilities.

 

 


Acad Med. 2018 Nov;93(11S Association of American Medical Colleges Learn Serve Lead: Proceedings of the 57th Annual Research in Medical Education Sessions):S1-S7.

 doi: 10.1097/ACM.0000000000002384.

Commentary: Paradigms, Axiology, and Praxeology in Medical Education Research

Affiliations collapse

Affiliation

1Z. Zaidi is associate professor and associate chief of faculty development, Division of General Internal Medicine, director of scholarship, Department of Medicine, and director of longitudinal portfolios, University of Florida College of Medicine, Gainesville, Florida; ORCID: http://orcid.org/0000-0003-4328-5766. D. Larsen is associate professor of neurology and pediatrics, Department of Neurology, and director of medical student education, Division of Pediatric and Developmental Neurology, Washington University School of Medicine, St. Louis, Missouri.

PMID: 30365423

DOI: 10.1097/ACM.0000000000002384

Abstract

This supplement includes 11 research papers accepted by the 2018 Research in Medical Education Committee. In this Commentary, the authors draw the attention of medical educators and researchers to questions about the researcher's philosophical paradigm. Such questions fundamentally guide research-the choice of conceptual frameworks, methods, and methodology. The authors provide a brief overview of research paradigms and the related concept of axiology and praxeology in medical education research. The authors map the 11 accepted research articles, describing the researchers' stated or implied worldviews and the impact on chosen methods. The authors close by encouraging researchers to state the research paradigm behind their research, comment on how they ensured that the methods used displayed consistency with that paradigm, and highlight the value the research adds to everyday education.

의학교육연구자의 연구 패러다임 선택 가이드: 더 나은 연구를 위한 기반 만들기(Med Sci Educ. 2019)
A Medical Science Educator’s Guide to Selecting a Research Paradigm: Building a Basis for Better Research 
Megan E.L. Brown1 & Angelique N. Dueñas1

 

서론
Introduction

최근 의학 교육 내에서 방법론적 엄격성을 높이는 움직임이 있었다[1, 2]. 많은 학자들은 "학문적 정당성"을 달성하기 위해서는 [3] 강력한 이론적 틀[4,5]이 작품 내에서 지식의 본질에 관한 논의에 참여하는 것이 필요하다고 주장한다[6]. 간단히 말해서, 명확한 연구 원칙은 다른 사람들이 당신의 연구를 이해하는 데 도움이 됩니다.
There has been a recent movement within medical education towards greater methodological rigor [1, 2]. Many scholars argue that in order to achieve “academic legitimacy” [3] strong theoretical frameworks [4, 5] engaging in discussion concerning the nature of knowledge within a piece of work are required [6]. Put simply, clear research principles assist others in understanding your research.

연구 프로젝트의 패러다임 내에서 작품 내 지식의 본질을 상세히 설명하고 탐구한다. [연구 패러다임]은 "문제를 어떻게 이해하고 다루어야 하는지에 대해 과학자들 간에 공유되는 공통의 믿음과 합의의 집합"으로 정의될 수 있다[7]. 패러다임은 사물이 어떻게 작동하는지에 대한 가정이며, 때때로 "현실에 대한 공유된 이해"를 포함하는 "세계관"으로 설명된다[8, 9]. 패러다임은 "문제 해결 방법을 안내"하고, 작가의 방법 선택에 직접적인 영향을 미치기 때문에 자신의 연구 패러다임을 상세히 설명하는 것이 필수적이다[10]. 모든 연구자들은 연구를 시작하기 전에 [세계의 상태에 대한 가정]을 한다. 그 연구가 양적인지 질적인지에 관계없이, 이러한 가정은 연구 결과의 해석에 영향을 미치기 때문에 중요하다. 미트로프와 보노마는 이러한 입장을 요약하고 "실험의 힘은 그 기초가 되는 기본 가정의 명확성만큼만 강력하다. 이러한 가정은 실험실 실험뿐만 아니라 사회적 연구에도 기초를 두고 있습니다."라고 말했다 [11]. 패러다임은 또한 현상을 관찰할 때 이론의 적용을 위한 [기본 규칙ground rules을 설정]하는 데 도움이 된다. 이러한 기본 규칙은 연구를 위한 "상황을 설정set the scene"하여 새로운 개념을 가장 잘 평가하는 방법에 대한 정보를 제공한다[7].
The nature of knowledge within a piece of work is detailed and explored within a research project’s paradigm. A research paradigm may be defined as “the set of common beliefs and agreements shared between scientists about how problems should be understood and addressed” [7]. A paradigm is an assumption about how things work, sometimes illustrated as a “worldview” involving “shared understandings of reality” [8, 9]. Detailing one’s research paradigm is essential, as paradigms “guide how problems are solved” [10], and directly influence an author’s choice of methods. All researchers make assumptions about the state of the world before undertaking research. Regardless of whether that research is quantitative or qualitative, these assumptions are important as they impact upon the interpretation of a study’s results. Mitroff and Bonoma summarize this position and put forth “the power of an experiment is only as strong as the clarity of the basic assumptions which underlie it. Such assumptions not only underlie laboratory experimentation but social… research as well” [11]. Paradigms also assist in setting ground rules for the application of theory when observing phenomena. Such ground rules “set the scene” for research, providing information as to how best evaluate new concepts [7].

그 결과, 의학 및 보건 전문직 교육은 전통적으로 실증주의 또는 포스트 실증주의 패러다임에서 수행되어 왔으며, 이 두 패러다임 모두 [보편적인 진리가 존재함]을 유지하며, "의학에서는 신체 부위, 상태 및 치료에 대한 강조하는 것은, 보편적으로 일정하게 복제 가능한 팩트가 있음을 가정한다." [12] 이러한 신념이 지배적이라는 점을 감안할 때, 의학 교육 내에서는 패러다임적 가정을 명시적으로 상술하는 문학이 상대적으로 부족했다. 이것은 연구 및 강의실 모두에서 결과 해석과 기본 규칙 설정에 있어 가정이 수행하는 중요한 역할을 점점 더 널리 인식하면서 변화하고 있다[13, 14]. 이처럼 자신의 패러다임을 명시적으로 인정하는 것이 의료과학교육 연구의 기대 요소가 되고 있다.
Medicine and, as a consequence, health professions education, has traditionally been conducted from a positivist or post-positivist paradigm, detailed later in this paper, both of which maintain a universal truth exists, as, “in medicine, the emphasis on… body parts, conditions and treatments assumes that these are universally constant replicable facts” [12]. Given the dominance of this belief, there has been a relative dearth of literature within medical sciences education explicitly detailing paradigmatic assumptions. This is changing, with an increasingly widespread recognition of the important role assumptions play in result interpretation and in setting ground rules, both in research and in classrooms [13, 14]. As such, explicitly acknowledging one’s paradigm is becoming an expected element of medical science education research.

연구의 패러다임을 자세히 설명하기 위해서는 패러다임이 무엇으로 구성되어 있는지를 고려하는 것이 중요하다. 작품의 패러다임은 그림 1에 자세히 나와 있는 여러 개의 "구성 요소"로 구성되어 있다. 이러한 구성 요소들의 첫 번째 집합(축론, 존재론, 인식론, 방법론)은 자신의 방법을 선택하는 것과 같은 "직접적인 사고와 행동"이라는 철학적 가정으로 구성된다[16].
In order to detail your work’s paradigm, it is important to consider what a paradigm consists of. The paradigm of a piece of work is constructed of several “building blocks,” detailed in Fig. 1. The first set of these building blocks (axiology, ontology, epistemology, methodology) are composed of philosophical assumptions that “direct thinking and action” such as selecting one’s methods [16].

프로젝트 패러다임 구축의 첫 번째 "벽돌"인 가치론Axiology는 가치와 윤리에 대한 연구를 포함합니다 [17]. 연구할 가치가 있는 영역이 확인되고 연구 윤리가 고려되면 "현실의 본질"에 대한 질문인 존재론Ontology가 고려되어야 한다[3]. 일단 당신이 당신의 연구 영역의 현실에 대한 확고한 철학적 이해를 가지고 있다면, [그 현실 안에 있는 지식의 본질]은 결정할 필요가 있다. —이것은 인식론epistemology이라고 알려져 있다.
Axiology, the first “brick” in the construction of a project’s paradigm involves the study of value and ethics [17]. Once an area of value to study has been identified, and research ethics considered, ontology, which questions “the nature of reality” [3] must be contemplated. Once you possess a firm philosophical understanding of your study area’s reality, the nature of knowledge within that reality needs determining—this is known as the epistemology of a piece of work.

작품의 존재론와 인식론에 대한 솔직한 논의를 통해 적절한 방법론Methodology적 접근법을 선택할 수 있고 결과 해석을 둘러싼 모호성을 줄일 수 있다[18]. 그러한 규정regulation이 없으면 "가정의 기본 맥락"이 불분명하기 때문에 "세심하게 수집된 결과도 오해를 일으킬 수 있다" [19]. 이 모노그래프는 의학 교육 연구에 적합한 패러다임을 선택하기 위한 방법 가이드를 구성하는 일련의 고려 사항을 자세히 설명합니다.
Frank discussion of a work’s ontology and epistemology allows an appropriate methodological approach to be selected and reduces the ambiguity surrounding result interpretation [18]. Without such regulation “even carefully collected results can be misleading” as the “underlying context of assumptions” is unclear [19]. This monograph will detail a series of considerations, forming a how-to guide, for selecting an appropriate paradigm for your medical sciences education research.

연구를 시작하기 전에 연구 패러다임을 선택하십시오.
Select your Research Paradigm Before You Begin Researching

패러다임이 양적 및 질적 연구의 설계에 정보를 제공하고 근본적으로 뒷받침한다는 점을 고려할 때, 연구를 시작하기 전에 패러다임을 선택하는 것이 중요합니다. Terherani 등은 이 필요성을 훌륭하게 설명한다. "연구 접근법의 기초가 되는 신념 체계, 연구 질문, 연구 접근법 사이의 정렬은 엄밀한 연구를 위한 전제 조건이다."[20]. 이러한 정렬은 오로지 전향적으로만 확보될 수 있다.
Given that paradigms inform the design of, and fundamentally underpin, both quantitative and qualitative research, it is important to select your paradigm before you begin researching. Teherani et al. emphasize the need for this nicely: “alignment between the belief system underpinning the research approach, the research question, and the research approach itself is a prerequisite for rigorous… research” [20]. Such alignment can only be assured prospectively.

작품의 연구 패러다임을 고려하지 않는 것에 대해 자주 인용되는 한 가지 주장은 이 과정의 시간 소모적인 특성이다. 인정하건대, 연구 패러다임을 선택하는 것은 시간이 걸리며, 잘 수행된다면 그렇게 해야 한다. 연구 프로젝트의 일정표를 작성할 때 이러한 고려 사항을 계획에 포함시키십시오. 해당 프로젝트와 연구팀에 따라 연구 패러다임을 선택하는 데 얼마나 많은 시간을 할애해야 하는지에 대한 지침을 제공하기는 어렵다. 연구 패러다임의 고려사항을 연구의 "설계" 단계에 포함시키는 것이 좋습니다. 현재 작업을 사용하는 것은 또한 이 작업의 시간 소모적인 측면을 줄이는 데 기여할 것이다. 많은 초보자들에게 패러다임의 언어와 과정에 접근하는 것은 힘들고 시간이 걸릴 수 있다. 그러나 이 작업은 그 과정을 쉽게 하기 위해 고안되었습니다. 
One frequently cited argument for not considering the research paradigm of a piece of work is the time-consuming nature of this process. Admittedly, selecting a research paradigm does (and should if done well) take time. Ensure you factor this consideration into your plans when drafting a timeline for your research project. It is difficult to provide guidance on how much time one should spend selecting a research paradigm as, depending upon the project in question and research team, this may vary. We recommend threading consideration of your research paradigm into the “design” phase of your research. Using the present work will also contribute to reducing the time-consuming aspect of this work; for many novices, approaching the language and process of paradigms can prove daunting and take time. However, this work is designed to ease that process.

유리 상자의 은유를 사용하여 연구 패러다임에 대해 생각해 보세요.
Try Thinking About Research Paradigms Using the Metaphor of a Glass Box

연구 패러다임은 위압적으로 보일 수 있습니다. 실제로, 경험이 많은 학자들조차도 패러다임을 구성하는 다양한 구성 요소를 구별하는 데 어려움을 겪을 수 있다. Varpio[21]가 설명한 바와 같이 [유리 상자의 은유]를 사용하여 연구 패러다임을 생각하는 것은 패러다임의 구성 요소를 더 잘 시각화하고 이해하는 데 도움이 될 수 있다. 이 은유에 따르면, 여러분의 패러다임은 여러분이 서 있는 유리 상자입니다. 여러분이 바깥 세상을 어떻게 보는지 틀을 잡습니다. 지식의 존재론과 인식론에 대한 한 사람의 믿음은 다른 방식으로 유리 상자를 색칠하여 개인마다 같은 상황에 다른 빛을 제공한다. 따라서, 같은 영역 내의 동료와 다른 접근 방식을 사용하여 주제를 연구할 수 있습니다.
Research paradigms can seem overwhelming—indeed, even experienced academics may struggle to distinguish between the various building blocks constituting a paradigm. Thinking of one’s research paradigm using the metaphor of a glass box, as described by Varpio [21], may assist in better visualizing and understanding the constituent elements of a paradigm. Using this metaphor, your paradigm is the glass box in which you stand, framing how you see the outside world. One’s beliefs regarding the ontology and epistemology of knowledge color the glass box in different ways, lending different lights to the same situation for different individuals. Given this, you may research a topic using a different approach to your colleague within the same area.

연구를 수행하는 이유에 대해 생각해 보세요.
Think About your Reason for Carrying Out the Research

이는 너무나도 당연한 고려사항으로 보일 수 있지만, 의학교육 연구 내에서 의식적으로 반영되지 않는 경우가 많은 분야이다. 이 주제를 공부하게 된 동기가 무엇입니까? 당신은 실질적으로, 학문적으로, 또는 정치적으로 동기부여를 받은 적이 있습니까? 다시 말해,

  • 여러분이 일상 업무에서 깨달은 것이 더 많은 공부가 필요한 것일까요? 
  • 당신은 단순히 더 많은 것을 알고 싶은 걸까요?
  • 당신이나 다른 사람들이 관심이 있는 정치적인 "핫 토픽"이 있는가?

This may seem like an obvious consideration, but it is an area that is often not consciously reflected upon within medical science education research. What is your motivation to study this topic? Have you been practically, academically, or politically motivated? In other words,

  • is it something you have noticed in your day to day work that requires further study;
  • are you simply passionate to know more; or
  • is there a political “hot topic” you or others are interested in researching?

여러분의 동기에 대한 여러분의 초기 생각을 바탕으로, 여러분이 정말로 성취하려고 하는 것에 대해 더 깊이 반성하도록 노력하세요. Chilisa는 표 1 [23]에서 볼 수 있듯이 연구를 수행하는 다양한 패러다임적 이유를 비교합니다. 연구를 하는 당신 자신의 이유를 생각하고 이것을 칠리사의 이유와 비교하는 것은 어떤 패러다임이 당신의 연구에 적합한 선택일 수 있는지를 비추기 위한 시작이 되어야 한다.
Building upon your initial thoughts regarding your motivation, try to reflect more deeply regarding what you are really trying to achieve. Chilisa compares different paradigmatic reasons for doing research, as can be seen in Table 1 [23]. Thinking of your own reason for doing research and comparing this with Chilisa’s reasons should begin to cast light on which paradigm may be an appropriate choice for your research.

당신의 공리학적 접근 방식을 고려하라.
Consider your Axiological Approach

당신의 연구를 위한 적절한 패러다임을 고려하는 다음 단계는 당신의 공리학적 접근 방식을 반영하는 것이다. 전통적으로 구바와 링컨은 패러다임을 [세 가지 구성 요소]를 포함하는 것으로 설명한다. [존재론, 인식론, 방법론] [24]. 그러나, 패러다임의 네 번째 정의 특성으로 [가치론]을 포함하는 방향으로의 움직임이 있었다[25]. 가치론은 윤리적 고려를 포함하며, 연구 분야 내에서 "무엇이 이뤄져야 하는지" 묻는다 [26]. [연구할 가치가 있는 것이 무엇인지]과 [해당 영역 내에서 윤리적 연구를 수행하는 방법]을 고려하기 때문에 제안된 연구의 중요한 출발점이다[27]. 이를 고려하여 Grix의 패러다임 구성 요소[15]를 수정하여 패러다임 선택의 초기 핵심 고려사항으로 가치론을 포함시켰다(그림 1).

The next step in the consideration of an appropriate paradigm for your research is reflecting upon your axiological approach. Traditionally, Guba and Lincoln describe a paradigm as involving three building blocks: ontology, epistemology, and methodology [24]. However, there has been a move towards including axiology as a fourth defining characteristic of a paradigm [25]. Axiology involves ethical considerations and “asks what ought to be” within a field of research [26]. It is an important starting point for any proposed research, as it considers what would be of value to research and how to go about conducting ethical research within that area [27]. Given this, we modified Grix’s paradigmatic building blocks [15] to include axiology as a key early consideration in paradigm selection (Fig. 1).

[가치론적 접근 방식]을 고려하는 것은 연구 제안의 계획 단계에서 여러분의 연구 팀의 모든 구성원과 함께 지정된 성찰적 공간에서 수행하는 것이 가장 좋습니다. 연구를 하는 목적을 고려하면서, 당신은 당신의 프로포절에 informing하는 [개인적인 가치]를 고려해야 한다. 자신에게 다음과 같이 물어보세요.

  • 왜 이 연구가 [내 시간과 관심을 기울일 가치]가 있을까요?
  • 무엇이 [나에게 동기를 부여]합니까? 나는 어떤 명령(예: 자금, 사회 정의)에 의해 움직입니까?
  • 아니면, [나는 교육이 본질적으로 가치있]고, [교육실천에 inform하는 모든 연구에 정당성을 제공한다]고 믿습니까? [28]

Considering your axiological approach is best done in a designated reflective space with all members of your research team during the planning phase of a research proposal. Building on considering your purpose in doing research, you must consider the personal values informing your proposal. Ask yourself the following:

  • Why is this research worth my time and attention?
  • What motivates me? Am I driven by imperatives (e.g. funding, social justice)?
  • Or, do I believe education to be inherently valuable, providing justification for any research that informs educational practice? [28]

일단 당신의 연구를 뒷받침하는 [가치가 명확]하고, 당신의 [연구가 정당]하다는 것이 확실하다면, 잠재적인 [윤리적 문제]도 고려되어야 한다. 예를 들어, 당신의 [가치론적 성찰]이 당신이 [외부의 동기 부여]에 의해 움직인다는 것을 드러낸다면, 당신의 연구 설계 내에서 이것을 공개하는 것이 적절할 수 있다. 대부분의 저널은 당신의 연구를 뒷받침하는 모든 자금과 이해 상충(개인 자금 출처를 포함할 수 있음)에 관한 세부 사항을 포함하도록 규정하고 있다. 커크만 등은 주니어 의사와 의대생에 대한 최근 환자 안전 개입의 결과를 평가하는 체계적 검토에 상세한 "경쟁적 이해관계" 진술을 포함한다[29]. 특히 관련된 것은 영국의 의사 규제 기관인 GMC(General Medical Council)와의 두 저자의 제휴와 여러 저자가 다양한 기관의 환자 안전에 대해 이전에 수행한 자문 작업이다. [어느 기관에 소속되었는지institutional affiliations]는 기관의 가치에 따라 저자의 관점과 해석을 암묵적인 방식으로 물들일 수 있다. 따라서 팀의 가치론적 성찰 내에서, 이러한 [상충하는 이해관계]나 연관성을 고려하는 것이 중요합니다.
Once the values underpinning your inquiry are clear and it is evident your research is justified, potential ethical issues should also be considered. For example, if your axiological reflection reveals you are being driven by an external motivator, it may be appropriate to disclose this within your research design. Most journals mandate inclusion of detail regarding any funding underpinning your research and any conflicts of interest (which could include sources of personal funding). Kirkman et al. include a detailed “competing interests” statement in their systematic review evaluating the outcomes of recent patient safety interventions for junior doctors and medical students [29]. Particularly relevant are two author’s affiliations with the General Medical Council (GMC), the UK’s regulatory body for physicians, and consultancy work several authors had undertaken previously on the topic of patient safety for a variety of institutions. These institutional affiliations could color the author’s perspectives and interpretations in tacit ways, in line with institutional values. As such, considering any such competing interests or associations within your team’s axiological reflection is the key.

온톨로지적 가정 반영
Reflect upon your Ontological Assumptions

비록 우리가 그것들을 명시적으로 고려하거나 자세히 설명하지 않더라도, 우리는 모두 [존재론적 가정]을 가지고 있다. 그것들을 되돌아보면 [현실의 본질에 대한 자신의 신념]에 따라 패러다임을 선택할 수 있다[3]. 현실은 당신이 연구를 수행하기를 원하는 사회 세계를 의미합니다 [22].
We all hold ontological assumptions, even if we do not explicitly consider or detail them. Reflecting upon them allows you to choose a paradigm in keeping with your beliefs regarding the nature of reality [3]. Reality refers to the social world in which you wish to conduct your research [22].

다른 패러다임은 현실의 본질을 정의하기 위해 다른 접근 방식을 채택한다. 일부 학자들은 최근 몇 년 동안 사회과학 내에서 새로운 패러다임을 정의하려고 시도하기도 한다[30]. 이를 감안할 때, 사용 가능한 모든 패러다임의 온톨로지를 자세히 설명하는 것은 이 기사의 범위를 벗어난다. 그 대신 일반적으로 의학 교육[3]에서 가장 일반적으로 사용되는 네 가지 패러다임, 즉 실증주의, 후기 실증주의, 구성주의/해석주의, 비판론에 초점을 맞추겠다.
Different paradigms adopt different approaches to defining the nature of reality. There are many paradigms research may operate within, with some scholars even attempting to define new, albeit contested, paradigms within the social sciences in recent years [30]. Given this, detailing the ontology of every available paradigm is beyond the scope of this article. Instead, we will focus upon the four paradigms most commonly used within general medical education [3]: positivism, post-positivism, constructivism/interpretivism, and critical theory.

존재론적 가정을 평가하기 위해 스스로에게 질문하세요: 당신은 "확인할 수 있는 하나의 현실"이 있다고 믿습니까, 아니면 "여러 사회적으로 구성된 현실"이 존재한다고 믿습니까? [21, 31] 

  • 전자의 입장은 "현실주의" 온톨로지적 입장으로 불리며, 
  • 후자의 입장은 "반현실주의" 또는 "상대주의"로 알려져 있다[32]. 

넓게 보면, 의학 교육에서 가장 일반적으로 사용되는 네 가지 패러다임은 이 두 가지 범주 중 하나에 속하지만, 표 2에 자세히 설명된 바와 같이, 그들의 입장을 구성하는 방법에는 차이가 있다.
To assess your ontological assumptions, ask yourself this: do you believe there is “one verifiable reality,” or that “multiple socially constructed realities” exist? [21, 31]

  • The former stance is sometimes referred to as a “realist” ontological position,
  • with the latter stance known as “anti-realism” or “relativism” [32].

Broadly speaking, the four paradigms most commonly used within medical education fall into either of these two categories, but there are differences in how they frame their position, detailed in Table 2.

당신의 인식론적 가정을 반성하라.
Reflect upon your Epistemological Assumptions

일단 당신이 [현실의 본질에 대한 당신의 가정]을 인식한다면, [지식의 본질에 대한 당신의 인식론적 가정]을 성찰하는 것은 필요하다. 당신의 연구 인식론을 고려할 때, "세상 내에서 지식으로 간주되는 것"에 대해 숙고하는 것이 유용할 수 있다[40]. 인식론은 두 가지 질문에 답하고자 합니다.

  • 첫째, 지식이란 무엇인가,
  • 둘째, 지식은 어떻게 획득되는가? [41].

Once you are aware of your assumptions regarding the nature of reality, reflecting upon your epistemological assumptions regarding the nature of knowledge is necessary. When considering your research epistemology, it may be useful to reflect upon “what counts as knowledge within the world” [40]. Epistemology seeks to answer two questions—

  • one, what is knowledge, and
  • two, how is knowledge acquired? [41].

실증주의, 후기 실증주의, 구성주의, 비판론의 인식론적 접근은 다르다. 이러한 내용은 표 3에 요약되어 있습니다.
Again, the epistemological approaches of positivism, post-positivism, constructivism, and critical theory differ. These are outlined within Table 3.

다양한 유형의 패러다임에 익숙해져 자신과 자신의 업무가 적합한지 평가
Become Familiar with Different Types of Paradigm to Evaluate Where You and Your Work Fit

이상에서는 의학교육에서 흔히 볼 수 있는 네 가지 패러다임으로 실증주의, 사후 실증주의, 구성주의, 비판론에 초점을 맞추었다[37]. 이는 개인의 의료 교육 연구 목표와 일치할 수 있는 패러다임의 일부일 뿐이다[42]. 우리는 연구원들이 가능한 한 많은 다른 유형의 패러다임에 익숙해지고, 연구원으로서 당신이 어디에 있는지 가장 잘 이해할 것을 권고하며, 또한 당신의 팀과 프로젝트가 적합하다.
Above, we have focused on positivism, post-positivism, constructivism, and critical theory as four common paradigms in medical education [37]. These are only a subset of paradigms that might align with an individual’s medical education research aims [42]. We recommend researchers to familiarize themselves with as many different types of paradigms as possible, to best understand where you as a researcher, but also your team and project fit.

패러다임의 복잡성을 고려할 때 패러다임과 관련된 철학의 뉘앙스를 너무 깊이 파고들기보다는 단순한 인포그래픽과 은유를 찾는 것이 탐구를 더 다루기 쉽게 만들 수 있다. 우리는 이미 몇 가지 간단한 표와 유리집 은유[21]를 소개했지만, 당신은 다음과 같은 다른 시각화를 찾는 것이 도움이 될 수 있다.
Given the complexity of paradigms, rather than delving too deeply into the nuances of philosophy associated with paradigms, seeking simple infographics and metaphors can make exploration more manageable. We have already introduced some simple tables and the glass house metaphor [21], but you may find it helpful to seek other visualizations, such as the

"양파" [43, 44] 간단히 말해서, "연구 양파"는 건축 블록이나 유리 벽 대신 층으로 패러다임을 고려합니다.
“research onion” [43, 44]. In brief, the “research onion” depicts paradigmatic considerations as layers, in lieu of building blocks or glass walls.

패러다임을 탐구하는 또 다른 도움이 되는 방법은 문헌 리뷰에서 그러한 점을 염두에 두는 것이다. 작가들은 그들의 패러다임을 명시적으로 논의하고 있는가? 그렇다면, 동의하십니까? 만약 그렇지 않다면, 그들의 연구 세부사항에 근거하여 그들의 패러다임을 어떻게 분류할 것인가? 자이디와 라르센은 자체 해석을 사용하여 연구 패러다임에 따라 논문을 분류하는 훌륭한 논평을 제공한다[45]. 그러한 활동은 패러다임에 대한 이해를 실용적인 방식으로 향상시키기를 원하는 사람들에게 유용할 수 있다.
Another helpful way to explore paradigms is to be mindful of such in your own reviews of literature. Are authors explicitly discussing their paradigms? If so, do you agree? If not, how would you categorize their paradigm based on their study details? Zaidi and Larsen provide an excellent commentary where they categorize papers based on research paradigms, using their own interpretations [45]. Such an activity may prove useful to those wishing to improve their understanding of paradigms, in a practical fashion.

선택한 패러다임을 사용하여 적절한 방법론 선택
Use your Chosen Paradigm to Select an Appropriate Methodology

다음으로, 지식을 어떻게 "획득"할 수 있으며, 그것이 당신의 패러다임과 자연스럽게 일치할 수 있는지를 고려할 수 있다. 예를 들어, 한 개인이 단일한 진실이 있고, 그러한 진실이 측정될 수 있다고 믿는 [엄격한 실증주의자]라면, 당신은 그들이 명시적인 가설 테스트를 통해 더 [엄격한 형태의 실험 연구]를 이용할 것으로 기대할 수 있을 것이다. 다른 방법론은 다른 패러다임과 가장 잘 일치한다[46].
How you can go about “acquiring” knowledge, so that it aligns naturally with your paradigm, might be considered next. For example, if an individual is a strict positivist, believing that there are single truths, and that such truths can be measured, you would expect them to utilize stricter forms of experimental research, with explicit hypothesis testing. Different methodologies align best with different paradigms [46].

연구팀의 방법론을 고려하는 것은 또한 연구 프로젝트를 진행하기 전에 당신의 패러다임을 이해하는 데 도움이 될 수 있다. 위의 예에 따라, 당신의 연구팀이 당신의 프로젝트에서 [실험 설계]를 가장 자주 사용한다면, 이것은 당신이 [가치있게 여기는 지식과 정보]에 대한 [당신의 관점]에 대해 뭐라고 말할 수 있습니까?
Consideration of research teams’ methodologies can also be helpful in understanding your paradigm, prior to moving forward with research projects. Following the example above, if your research team most often utilizes experimental design in your projects, what might this say about your regard for what knowledge and information you place value in?

적절한 데이터 수집 방법을 선택하려면 방법론을 검토하십시오.
Examine your Methodology in Order to Select an Appropriate Data Gathering Technique

[방법론]과 [방법]은 별개의 개념으로 간주되어야 할 때 초보 연구자에 의해 상호 교환적으로 사용되는 경우가 너무 많다[47].

  • [방법론]은 지식을 습득하기 위한 전략 또는 전체 계획이며,
  • [방법]은 데이터를 수집하고 분석하는 데 사용되는 실제 기법이다[33].

Too often, methodology and methods are used interchangeably by novice researchers, when they should be regarded as distinct concepts [47].

  • Methodology is the strategy or overall plan to acquire knowledge, and
  • methods are the actual techniques used to gather and analyze data [33].

예를 들어, 의료 환경에서 전문성 간 조사에 관심이 있는 연구팀은 [현실은 개인에 의해 주관적으로 구성된다]고 믿는 [구성주의 패러다임]과 가장 일치할 수 있다.

  • 이 팀은 적절한 [방법론]은 [민족지학]이라고 생각할 수 있다.
  • 그러나 실제 연구 [방법]은 [현장 기록, 오디오 또는 비디오 녹화 또는 정성적 인터뷰]를 통한 다양한 관찰일 수 있다[48].

이러한 방법은 방법론과 일치하지만, 방법의 최종 선택은 패러다임 고려 사항 외에도 그러한 [기술의 실용성]과도 크게 연관될 수 있다.
For example, a research team interested in examining interprofessionalism in a healthcare setting may identify most with a constructivist paradigm, believing reality is subjectively constructed by individuals.

  • Such a team might consider ethnography to be an appropriate methodology.
  • But the actual research methods they undertake might be a variety of observations with field notes, audio or video recordings, or qualitative interviews [48].

These methods align with the methodology, although eventual selection of methods may also be highly associated with the practicality of such techniques, in addition to paradigm considerations.

위의 섹션에서는 연구 프로젝트 패러다임의 "구성 요소"에 대한 개요를 제공했습니다. 참조의 용이성을 위해, 이러한 구성 요소는 의학 교육에서 사용되는 4가지 주요 패러다임에 대해 그림 2에 요약되어 있습니다 [30, 36, 49, 50].
The above sections have provided an overview of the “building blocks” of a research project’s paradigm. For ease of reference, these building blocks are summarized for the four main paradigms used within medical science education, in Fig. 2 [30, 36, 49, 50].

연구에 대해 쓸 때 패러다임과 구성 요소를 명확하게 설명하십시오.
Clearly Detail Your Paradigm and its Building Blocks When You Write about your Research

패러다임은 연구자의 마음속에만 존재하고 명확하게 전달되지 않으면 아무 소용이 없다. 연구자로서의 이해를 위해 패러다임을 명확하게 설명하세요. 그림 1과 같이 빌딩 블록에 요약된 질문에 답함으로써 패러다임을 설명하는 것이 도움이 되는 경우가 많습니다.
A paradigm does no good if it only exists in the mind of the researcher and is not clearly communicated. Clearly detail your paradigm, for your own understanding as a researcher. It is often helpful to describe your paradigm by answering the questions outlined in the building blocks, as shown in Fig. 1.

그러나 또한 여러분의 연구를 전파할 때, 여러분의 타겟 독자들이 접근 가능하고 이해할 수 있도록, 여러분의 패러다임에 대한 세부 사항을 만들어야 한다는 것을 명심하세요. 연구의 범위와 목표에 따라, 당신의 패러다임에 대한 설명은 출판을 위해 설계된 연구 보고서의 한 두 단락에서 더 큰 보고서나 논문의 여러 페이지 하위 장에 이르기까지 다양할 수 있다. 어느 경우든 패러다임에 대해 글을 쓰는 것은 독자 분이 패러다임을 전달하는 세부 사항의 수준은 다를 수 있지만 독자 분이 연구한 맥락을 이해하는 데 핵심입니다.
But also keep in mind to make any details of your paradigm accessible and understandable for your target audience when disseminating your research. Depending on the scope and goals of your research, description of your paradigm could range from a paragraph or two in a research report designed for publication, to a multipage subchapter of a larger report or thesis assignment. In either case, writing about the paradigm is key for the audience to understand the context of your research, although the level of detail in which you communicate your paradigm may vary.

당신의 패러다임에 대해 쓸 때 참고할 수 있는 접근 가능한 문헌을 찾는 것은 어려울 수 있다. 이 분야에는 패러다임 선택에 대한 시간적 고려에서 앞서 다루었던 것처럼 패러다임의 세계로 진입하는 장벽으로 작용할 수 있는 철학적 전문 용어들이 산재해 있다. 이 가이드가 이 분야의 몇 가지 기본 용어를 이해하는 데 도움이 되기를 바랍니다. 관심이 있고 시간이 있다면 지식의 본질과 다양한 패러다임적 입장을 명시적으로 논하는 '과학철학' 분야에는 풍부한 문학이 있다. 일부 중요한 문헌에는 사회 연구의 기초[36], 과학 혁명의 구조[7], 브루노 라투르가 있다. 하이브리드 세계에서의 하이브리드 사고[51]와 패러다임 대화[52].
Locating accessible literature to draw upon when writing about your paradigm can prove difficult. The field is littered with philosophical jargon that can act as a barrier to entry into the world of paradigms, as earlier addressed in time consideration of paradigm selection. We hope this guide will assist you in beginning to understand some of the foundational terms within this field. If you are interested and have time, there is a wealth of literature within the field of “Philosophy of Science” that explicitly discusses the nature of knowledge and varying paradigmatic stances. Some seminal texts include The Foundations of Social Research [36], The Structure of Scientific Revolutions [7], Bruno Latour: Hybrid thoughts in a Hybrid world [51], and The Paradigm Dialog [52].

몇몇 입문 교과서와 기사들은 다음과 같은 중요한 텍스트의 통합 요약을 제공합니다. 그러나 이에 국한되지는 않습니다. 
- Kivunja와 Kuyini의 "교육적 맥락에서 연구 패러다임의 이해와 적용" [53]; 
- Avramidis와 Smith의 "특수 니즈 연구를 위한 주요 연구 패러다임과 방법론적 함의 소개" [54]; 
- Denzin과 Lincoln의 The Sage Handbook of Qualityative Research [55] 및 
- 과학 철학: 매우 짧은 소개 [56].

Several introductory textbooks and articles offer integrated summaries of these seminal texts including, but not limited to
- Kivunja and Kuyini’s “Understanding and Applying Research Paradigms in Educational Contexts” [53];
- Avramidis and Smith’s “An introduction to the major research paradigms and their methodological implications for special needs research” [54];
- Denzin and Lincoln’s The Sage Handbook of Qualitative Research [55];
- Philosophy of Science: A Very Short Introduction [56].

철학에서 실용으로 전환
Move from Philosophy to Practicality

의료 교육의 일상적인 측면에 관련된 사람들에게, 연구의 철학적 토대를 둘러싸고 생각나는 첫 번째 질문 중 하나는 [이것이 어떻게 제 일에 실질적으로 적용될 수 있는가]하는 것입니다. 철저하게 논의된 바와 같이 엄격성과 이해도를 향상시키는 것 외에도 [연구의 실용적인 측면에 접근하는 두 가지 핵심 방법]이 있다. : 전 그리고 후
For those involved in the day-to-day aspects of healthcare teaching, many times one of the first questions that comes to mind around the philosophical underpinnings of research is: how can this be practically applied to my work? Beyond improving rigor and understanding, as thoroughly discussed, there are two key ways to approach the practical side of research: from the before and the after.

의학 교육자로서 직면하는 실제적인 문제와 질문을 고려한다면, 다른 방식으로 문제에 접근하기 위해 어떻게 다른 패러다임이 사용될 수 있는지를 고려하는 것은 패러다임을 고려하는 실용적인 "전before" 방법이다. 실제 문제가 패러다임 정보에 입각한 관점에서 접근될 수 있는 방법을 설명하기 위해 그림 3에 몇 가지 예를 포함시켰다. 일부 다양한 실제 사례의 경우, 다른 교육 수준에서, 우리는 자연스럽게 다른 패러다임과 일치할 수 있는 연구 접근법의 몇 가지 다른 예를 제공했습니다.
Considering the practical problems and questions you face as a medical sciences educator, then considering how different paradigms could be used to approach problems in different ways, is a practical “before” way to consider paradigms. To elucidate the ways in which real-world problems can be approached from a paradigm-informed perspective, we’ve included some examples in Fig. 3. For somevarious real-world examples, at different educational levels, we have provided some different examples of research approaches, that would naturally align with different paradigms.

["After" 연구 관점]에서, 프락세오로지(praxoology)는 당신이 성찰해야 하는 마지막 '-론 (-ology)'이다. 연구로부터 종종 발생하는 보다 실용적인 권고사항과 관련하여, 프랙세오로지(praxoology)는 [인간의 행동을 이해하는 것]뿐만 아니라, [의미 있는 방식으로 해석하는 것]에 관심이 있다[45]. 만약 당신의 연구가 "지식"에 기여했다면, 이것은 [의학 교육자로서 당신의 일상적인 역할]에 무엇을 의미합니까? 이렇게 하면 연구 과정 이후에 실용성도 중요해질 수 있다. 그림 2의 중간 수준의 예를 이용하여, 구성주의 접근법에서 연구를 완료했다면, [가상 조직학 실험실]의 [셀프-가이드 방법]이 유익한 학습 환경으로 이어지지 않는다는 것을 발견했을 수 있다. 이로 인해 가상 조직학 리소스와 함께 사용할 [비디오 가이드]를 만들기로 결정하게 될 수 있습니다. 따라서 학생들은 처음에 학습을 안내하는 강사 주도 예제를 사용할 수 있습니다.
From the “after” research perspective, praxeology is the last -ology you may wish to reflect upon. Concerned with the more practical recommendations that often arise from research, praxeology is concerned with not just understanding human actions, but interpreting them in meaningful ways [45]. If your research has contributed to “knowledge,” what does this mean for your day-to-day role as a medical sciences educator? In this way, practicality can be also important after the research process. Using the mid-level example from Fig. 2, if you completed research from a constructivist approach, you may have discovered that self-guided methods in virtual histology labs was not leading to a conducive learning environment. This may lead to your decision to create video guides to accompany virtual histology resources, so students have instructor-led examples to initially guide their learning.

패러다임에 실질적으로 접근하는 위의 방법들 외에도, 연구자들은 [실용주의pragmatism]의 실용적인 패러다임을 고려하기를 원할 수 있다. [실용주의]는 연구 결과에 초점을 맞추고, 따라서 인식론이나 존재론을 고려하는 데 가치를 두지 않는다. 대신, 실용주의는 문제를 이해하고 해결하는 데 가장 효과적인 것에 초점을 맞추려고 노력한다[57]. 실용주의자들은 특정 연구 질문에 답하기 위해 [실제로 가장 잘 작동하는 방법]에 의존하며, 단순히 패러다임 정렬이 아닌 [선택된 접근 방식의 실용성]에 가장 중점을 둔다[58]. 그러나 실용주의는 ["진정한" 패러다임]이라기보다는 [접근법]에 가깝다는 견해가 있다. 결과적으로, 본 연구는 다른 공통 패러다임을 가지고 있기 때문에 실용주의를 자세히 탐구하지 않았다[30].
In addition to the above ways of practically approaching paradigms, researchers may also wish to contemplate the practical paradigm of pragmatism. Pragmatism focuses on research outcomes and, as such, does not place value on considering either epistemology or ontology. Instead, pragmatism strives to focus on what works best for understanding and solving problems [57]. Pragmatists rely on the methods that work best in practice to answer specific research questions, focusing most heavily on the practicalities of the chosen approach, not just paradigmatic alignment [58]. However, it is the view of some that pragmatism should be viewed as more of an approach, rather than a “true” paradigm. Consequently, the present work has not explored pragmatism in detail as it has other common paradigms [30].

가능한 경우 숙련된 연구원과의 협업 또는 상담
Collaborate with or Consult Experienced Researchers Where Possible

패러다임은 의학 교육계의 많은 사람들에게 복잡하고 참신해 보일 수 있지만, 연구의 핵심 측면이며 사회학 및 일반 교육과 같은 다른 분야에서는 확실히 새로운 것이 아니다[59,60,61]. 이러한 점을 감안할 때, 협업은 성과를 거둘 수 있으며 성공의 최종 열쇠가 될 수 있습니다. 가능한 경우, 경험 많은 연구원들, 특히 방법론에 집중하는 연구원들과 협력하는 것은 매우 유익할 수 있다. 경험 많은 학자들은 패러다임과 관련된 철학적 질문에 대한 지침을 제공할 수 있으며, 연구팀이 어떤 방법론과 방법을 가장 잘 활용할 수 있는지 유념할 수 있다. 협업이 불가능할 경우 방법론자 또는 경험이 풍부한 연구자에게 연락하여 연구 접근 방식을 검토할 수 있는 상담 서비스를 제공하는지 여부를 문의할 수 있습니다.
While paradigms might seem complex and novel for many in the medical education community, they are a key facet of research, and certainly not new to other disciplines, such as sociology and general education [59,60,61]. Given this, collaboration can prove fruitful and may be the final key to success. When possible, collaborating with experienced researchers, particularly those who focus upon methodology, can be very beneficial. Experienced scholars can provide guidance regarding the philosophical questions associated with paradigms, while keeping in mind which methodology and methods may be best utilized by the research team. Where collaboration is not feasible, you may wish to contact a methodologist or experienced researcher to enquire as to whether they provide consultation services to review your research approach.

연구 능력을 개발하고자 하는 사람들에게는 매우 도움이 되지만, 패러다임 선택에 관한 협력은, 특히 연구자들이 [연구에 가장 적합한 패러다임에 대해 동의하지 않을 경우] 긴장을 유발할 수 있다. 협업 프로젝트에 동의하기 전에 잠재적 협력자가 만나 "공유 의제"를 개발할 것을 권장합니다. 공유된 의제에는 공통 목표 집합, 사용 가능한 자원 목록, 관심 있는 연구 질문 및 각 연구자의 개인 패러다임에 대한 토론이 포함됩니다. 개인 입장에 익숙하지 않지만 협력팀의 공유 의제에 가장 적합한 패러다임 내에서 연구해야 하는 한 명 또는 여러 명의 연구자를 대신하여 [타협]이 필요할 수 있다. 예를 들어,

  • 위에서 소개한 바와 같이, 만약 당신이 엄격한 실용주의자라고 생각한다면, 온톨로지와 현실에 대한 광범위한 논의가 연구 시간을 비생산적으로 사용한다고 생각할 수 있다.
  • 그러나 해석학자 팀과 함께 일하는 경우, 이 과정은 연구 노력과 연구 설계의 핵심 부분으로 간주될 수 있다. 개인적인 입장을 인식하고, 그것에 헌신하는 성찰적 공간에서 명확하게 표현할 수 있게 됨으로써, 협업이 완화되고 심지어 강화될 수 있다.

Although immensely helpful for those wishing to develop their research skills, collaboration with regard to paradigm choice can generate tension, especially if researchers disagree concerning which paradigm would be best suited for their research. We recommend that, prior to agreeing upon any collaborative projects, potential collaborators meet to develop a “shared agenda.” Shared agendas include a set of common objectives, a list of available resources, research questions of interest, and discussion as to each researcher’s personal paradigm. Compromise may be required on the behalf of one, or several, researchers, who may need to research within a paradigm unfamiliar to their personal stance, but best befitting the shared agenda of the collaborative team. For example,

  • if you consider yourself to be a strict pragmatist, as introduced above, you might find extensive discussions about ontology and reality to be an unproductive use of research time.
  • However, if working with a team of interpretivists, this may be viewed as a key part of their research efforts and study design. Through recognizing personal stances and being able to clearly express them in a dedicated reflexive space, collaboration may be eased, and even enhanced.

마지막으로, 출판을 위해 글을 쓸 때, 우리는 각 팀 [구성원의 패러다임적 입장에 대한 투명성]과 [긴장을 해결하기 위해 성찰성이 어떻게 사용되었는지]에 대한 세부 사항을 포함할 것을 권고한다. 이 모노그래프는 공동 집필의 예로 사용될 수 있다. 저자들은 이 주제에 중립적으로 접근했지만 개인 패러다임이 다르다. 한 작가(MB)는 구성주의자이고, 다른 작가(AD)는 실용주의자입니다. 이 작품의 개념과 구성에 있어서, 저자들은 본 논문에서 논의된 과학철학에 대한 개인적인 견해를 포함하여 그들의 패러다임적 가정에 대한 반사적 논의로 시작했다. 이 연구의 공유 의제는 각 저자가 가지고 있는 잠재적 가정을 인정하면서 가능한 한 중립을 유지하는 것으로 결정되었다. 우리는 이것이 이 모노그래프를 더 투명하게 보여줄 수 있기를 바란다.
Lastly, when writing for publication, we recommend transparency as to each team member’s paradigmatic stance and inclusion of detail regarding how reflexivity was used to navigate any tensions. This monograph may be used as an example of collaborative writing. The authors approached this topic neutrally but have different personal paradigms. One author (MB) is a constructivist, and the other (AD) is a pragmatist. In the conception and construction of this work, the authors began with reflexive discussions on their paradigmatic assumptions, including personal views regarding the philosophy of science discussed in this paper. It was determined the shared agenda of this work was to remain as neutral as possible, while acknowledging potential assumptions each author holds. We hope this allows for a more transparent presentation of this monograph.

결론들
Conclusions

초기에는 복잡하지만, 연구 패러다임의 식별은 엄격한 연구 프로젝트의 필수적인 측면이다. 또한 개별 프로젝트를 넘어 지식을 특정 패러다임과 결부시키면 의학교육 내 연구에 대한 전반적인 이해도가 높아져 전체 분야의 발전을 도모할 수 있다.
While initially complex, identification of a research paradigm is an essential aspect of any rigorous research project. Further, beyond individual projects, association of knowledge with specific paradigms may lead to a better overall understanding of research within medical education, furthering the advancement of the entire field.

이 기사를 통해, 우리는 연구 패러다임의 식별을 통해 프로젝트를 개선하고자 하는 연구자들을 위한 몇 가지 초기 팁을 간략하게 설명하려고 시도했다. 이러한 팁과 연구 팀 내에서 더 많은 열린 토론을 고려한다면, 여러분의 연구는 새로운 목적을 가지고 더 깊이 있게 이해될 수 있습니다.
Through this article, we have attempted to outline some initial tips for researchers looking to improve on projects via identification of a research paradigm. With consideration of these tips, and more open discussions within research teams, your research can take on new purpose and be understood with greater depth.

 


Med Sci Educ. 2019 Dec 27;30(1):545-553. doi: 10.1007/s40670-019-00898-9. eCollection 2020 Mar.

A Medical Science Educator's Guide to Selecting a Research Paradigm: Building a Basis for Better Research

Affiliations collapse

Affiliation

1Health Professions Education Unit, Hull York Medical School, John Hughlings Jackson Building, University Road, Heslington, York, YO10 5DD UK.

PMID: 34457699

PMCID: PMC8368685

DOI: 10.1007/s40670-019-00898-9

Free PMC article

Abstract

A research paradigm, or set of common beliefs about research, should be a key facet of any research project. However, despite its importance, there is a paucity of general understanding in the medical sciences education community regarding what a research paradigm consists of and how to best construct one. With the move within medical sciences education towards greater methodological rigor, it is now more important than ever for all educators to understand simply how to better approach their research via paradigms. In this monograph, a simplified approach to selecting an appropriate research paradigm is outlined. Suggestions are based on broad literature, medical education sources, and the author's own experiences in solidifying and communicating their research paradigms. By assisting in detailing the philosophical underpinnings of individuals research approaches, this guide aims to help all researchers improve the rigor of their projects and improve upon overall understanding in research communication.

Keywords: Medical education; Methodology; Paradigm; Research approach.

EPA 프레임워크의 논리: 스코핑 리뷰 (Med Educ, 2022)
The logic behind entrustable professional activity frameworks: A scoping review of the literature
Marije P. Hennus1 | Marjel van Dam2 | Stephen Gauthier3 | David R. Taylor3 | Olle ten Cate4

 

 

1 소개
1 INTRODUCTION

신뢰할 수 있는 전문 활동(EPA)은 역량 적용을 위한 명확한 목적을 제공하는 보건 전문가 교육에서 빠르게 진화하는 개념을 나타낸다.

  • [역량]은 교육자가 임상 실습에 제공하는 능력을 반영하는 반면,
  • EPA는 이러한 역량이 필요한 의료의 과제이다.

EPA는 개별적인 직업별 작업(또는 작업 묶음)으로, 일반적으로 식별 가능한 환자 치료 행위이며, 여기에는 여러 역량(중요한 지식, 적절한 기술 및 태도 포함)의 통합이 필요하다. 학습자는 기본적으로 이러한 작업을 수행함으로써 EPA를 위해 훈련되고 있으며, 처음에는 엄격한 감독 하에 점차 자율적으로 훈련되고 있다. EPA에서 유능해지기 위한 진행은 소위 [위탁-감독 척도]를 따른 학습자의 여정을 반영한다. 이러한 척도는 학습자가 안전한 환자 치료를 보장하기 위해 필요한 감독 수준을 포착하는 것을 목표로 한다. 역량이 증가함에 따라 감독 강도를 시간이 지남에 따라 신중하게 낮춰야 한다. 전체적으로 본다면, 일련의 EPA는 전문 교육을 위한 커리큘럼의 틀을 정의하고 알리기 위해 사용될 수 있으며, 실제로 전문직의 핵심 활동을 반영한다. 이와 같이 EPA 기반 커리큘럼은 임상 훈련과 평가를 임상의가 일상 업무에서 실제로 수행하는 작업과 연결할 수 있는 잠재력을 가지고 있다. 결과적으로, 점점 더 많은 수의 대학원 의학 훈련 프로그램이 커리큘럼을 재설계하기 위해 그것들을 사용하기 시작했다. 

Entrustable professional activities (EPAs) represent a rapidly evolving concept in health professionals' education that offers clear purpose for the application of competencies. Whereas

  • competencies reflect the capabilities trainees bring to clinical practice,1 
  • EPAs are the tasks of health care for which these competencies are needed.

An EPA is a discrete profession-specific task (or bundle of tasks), typically an identifiable act of patient care, which requires the integration of multiple competencies (including vital knowledge, appropriate skills and attitudes).2, 3 Learners are essentially being groomed for EPAs by performing these tasks, initially under strict supervision and gradually more autonomously. Progression towards becoming competent in an EPA reflects a learner's journey along so-called entrustment-supervision scales. These scales aim to capture the level of supervision a learner requires to ensure safe patient care; with increasing competence, the intensity of supervision should be carefully lowered over time.4, 5 Taken collectively, a set of EPAs can be used to define and inform the framework of a curriculum for specialty training and, in fact, reflects the profession in its core activities. As such, an EPA-based curriculum has the potential to link clinical training and assessment to the work that clinicians actually do in daily practice.6 Consequently, an increasing number of postgraduate medical training programmes have begun using them to redesign their curricula.7, 8

EPA는 이해관계자 간에 내용 타당성과 수용성을 모두 제공할 수 있는 신중하게 구성된 접근방식을 요구한다. EPA의 개발 과정을 안내하는 데 도움이 되는 지침이 존재하지만, [예비 프레임워크 초안을 작성하기 위해 사용할 논리]를 결정하는 것은 중요하고 종종 어려운 첫 번째 단계를 제시한다. EPA 프레임워크의 논리는 개발자가 직업의 관행을 전문 작업 단위로 분해하기 위해 사용하는 관점으로 정의할 수 있다. 현존하는 문헌에서 발견된 보고된 접근법에는 다음이 포함된다. 

  • 역할 ('다른 분야의 컨설턴트 전문가 역할'), 
  • 절차 ('일반적인 폐 및 중환자 치료 절차를 안전하고 효율적으로 수행') 
  • 질병 관리 ('패혈증 환자 관리') 
  • 환자 범주 ('청소년 의료') 및 
  • 기능 ('외래 환자 클리닉 실행') 

EPAs require a carefully constructed approach that can deliver both content validity and acceptance among stakeholders.9 Although guidelines exist to help guide the developmental process of EPAs,310 deciding what logic to use to draft a preliminary framework poses a crucial and often difficult first step. The logic of an EPA framework can be defined as the perspective used by the developers to break down the practice of a profession into units of professional work.11 Reported approaches found in extant literature include

  • roles (‘Act as the consultant specialist for other disciplines’),
  • procedures (‘Safely and efficiently perform common pulmonary and critical care procedures’),
  • disease management (‘Management of a patient with sepsis’),
  • patient categories (‘Adolescent healthcare’) and
  • functions (‘Running the outpatient clinic’).78 

유사한 분야에서도 서로 다른 접근법이 사용되어 왔다. 예를 들어 폐 및 중환자 의료에 대한 [미국] 펠로우십 교육을 위한 '기능' 및 '역할 기반' EPA를 [네덜란드] EPA의 보다 '질병 관리' 지향 EPA 프레임워크와 비교한다. '모든 사람에게 맞는 하나의 크기'라는 격언은 EPA 프레임워크의 개발에 분명히 적용되지 않는다. 설정, 목적, 교육 프로그램에 기반한 맞춤화가 불가피해 보인다.
Even within similar disciplines, different approaches have been used. Compare for instance the predominantly ‘function-’ and ‘role-based’ EPAs for American Fellowship Training in Pulmonary and Critical Care Medicine12 with the more ‘disease management’ orientated EPA-framework of their Dutch counterparts.13 The ‘one size fits all’ adage clearly does not hold true for the development of EPA frameworks; customisation based on setting, purpose and/or training programme seems inevitable.

이 범위 문헌 검토는 대학원 의학 교육 및 펠로우십 프로그램에 걸쳐 EPA 프레임워크 개발에 사용된 지배적인 논리와 추가 연구를 위한 영역을 강조할 뿐만 아니라 EPA 개발을 위한 모범 사례 지침을 잠재적으로 알리기 위한 그들의 합리성을 매핑하는 것을 목표로 했다.
This scoping literature review aimed to map the dominant logics used in the development of EPA frameworks across postgraduate medical education and fellowship programmes and their rationales to potentially inform best practice guidelines for EPA development in addition to highlighting areas for further research.

2 방법
2 METHODS

2.1 설계
2.1 Design

주제에 대한 기존 연구 결과를 수집, 평가 및 제시하는 반복적이고 유연한 방법인 범위 검토가 수행되었다. 우리는 철저한 검토를 추구하지 않고 지배적인 EPA 논리를 식별하고 매핑하기 위해 시작했기 때문에 체계적인 검토 대신 범위를 사용했다. 이는 체계적 검토 및 메타 분석을 위한 선호 보고 항목(PRISMA)의 범위 검토 확장에 따라 보고되었다. 
A scoping review, an iterative and flexible method to collect, evaluate and present findings from existing research on a topic,14 was performed. We used a scoping, instead of a systematic review, as we did not seek to be exhaustive but set out to identify and map dominant EPA logics.15 This was reported in accordance with the Preferred Reporting Items for Systematic Review and Meta-analysis (PRISMA)'s extension for Scoping Reviews.16

2.2 검색 전략
2.2 Search strategy

문헌 본문의 범위를 평가하기 위해, 우리는 Khalil 등으로부터 채택된 스코핑 리뷰에 대한 증거 기반 다단계 접근법을 사용했다. 2005년 1월부터 2020년 12월까지의 연구는 타당성과 폭 및 포괄성의 균형을 맞추기 위해 3단계 문헌 검색을 사용하여 확인되었다.

  • 1단계는 제목과 초록에 포함된 텍스트 단어(위탁가능 프로페셔널 활동*)를 2명의 저자(MH, MD)가 독립적으로 선별하여 MEDLINE과 Embase에 대한 제한된 검색으로 구성되었다.
  • 두 번째 단계는 이 텍스트 단어들을 포함된 모든 데이터베이스(구글 스콜라, 스코푸스, 웹 오브 사이언스 추가)에서 검색어로 사용했다. 이러한 데이터베이스는 EPA에 대한 문헌을 포괄하고 함께 고려할 때 가능한 포괄적으로 선택되었다. 이 검토에서 사용된 검색 구문에 대한 자세한 내용은 지원 정보(부록 1)에서 확인할 수 있습니다.
  • 세 번째 단계에는 확인된 모든 보고서 및 추가 연구를 위한 논문의 참조 목록 분석이 포함되었다.

To assess the extent of the body of literature, we used an evidence-based multistage approach to scoping reviews adapted from Khalil et al.17 Studies from January 2005 until December 2020 were identified using a three-step literature search in order to balance feasibility with breadth and comprehensiveness.

  • The first stage consisted of a limited search of MEDLINE and Embase by screening of text words (Entrustable Professional Activit*) contained in the title and abstract by two authors (MH, MD) independently.
  • The second stage used these text words as search terms across all included databases (adding Google Scholar, Scopus and Web of Science). These databases were chosen to span literature on EPAs and to be as comprehensive as possible when considered together. The full details of the search syntaxes used in this review can be found in the Supporting Information (Appendix 1).
  • The third stage included analysis of the reference lists of all identified reports and articles for additional studies.

2.3 연구 선정
2.3 Study selection

2.3.1 포함 기준
2.3.1 Inclusion criteria

포함시킬 수 있는 연구들은 다음과 같은 연구였다.

  • (i) 개발된 EPA 프레임워크의 논리를 설명하거나 최소한 EPA 제목을 제공한다. 
  • (ii) 대학원 의학 교육 또는 펠로우십 프로그램 및 
  • (iii) 영어로 쓰여졌다.

포함된 연구는 대조, 요약 및 결과 보고가 가능하도록 표와 서술 형식으로 차트화되었습니다.

Eligible for inclusion were studies that

  • (i) either described the logic of developed EPA frameworks and/or provided at least the titles of EPAs for
  • (ii) a postgraduate medical education or a fellowship programme and
  • (iii) were written in English.

Included studies were charted in a tabular and narrative format allowing for collation, summarising and reporting of results.

2.3.2 배제 기준
2.3.2 Exclusion criteria

다음과 같은 문헌은 제외되었다.

  • (i) 주 원고, 보충 데이터 및 온라인 보충 데이터에 EPA 프레임워크를 제공하지 않아 기본 논리를 분석할 수 없었다. 
  • (ii) EPA의 규모와 복잡성의 결정에 영향을 미칠 수 있으므로 (하위) 전문 교육 프로그램의 단일 EPA 또는 일부 EPA에 대해서만 설명한다. 
  • (iii) 학부생, 대학원 의학 교육(GME)에 입학하는 신규 졸업생의 평가 및 기타 보건 전문직(예: 간호사, 수의사, 약사)을 위한 EPA 프레임워크를 제공했다.

Papers were excluded if they

  • (i) did not provide an EPA framework in either the main manuscript, supplemental data and/or online supplemental data, making it impossible to analyse the underlying logic;
  • (ii) described only a single EPA and/or EPAs for a part of a (sub)specialty training programme as this may have impacted decisions of size and complexity of the EPAs; and/or
  • (iii) offered an EPA framework for undergraduates, for the evaluation of newly graduated students entering graduate medical education (GME) and/or for other health professions (e.g., nurses, veterinarians and pharmacists).

2.4 선별과정
2.4 Screening process

두 명의 저자(MH, MD)는 검색 과정에서 반환된 모든 제목과 초록을 독립적으로 선별하여 포함 기준을 충족하지 않는 논문을 거부하였다. 논문을 포함하거나 제외하는 결정을 제목 및/또는 요약에 기초하여 내릴 수 없는 경우, 그 결정을 알리기 위해 전문에 접근했다. 현시점에서 불확실성이 여전했다면 제3의 저자(SG)가 심판 역할을 해 합의를 이끌어냈다. 
Two authors (MH, MD) independently screened all titles and abstracts returned during the search process, rejecting papers that did not meet the inclusion criteria. If a decision to either include or exclude a paper could not be made based on title and/or abstract, the full text was accessed to inform the decision. If uncertainties still remained at this point, a third author (SG) served as referee to help reach consensus.

2.5 논리의 분류
2.5 Categorisation of logic

심사 과정 동안 데이터의 반복 분석(종종 근거 분석이라고 함)을 이용한 귀납적 코딩 스타일을 두 명의 저자(MH, MD)가 독립적으로 사용하여 코드 초안을 작성했다. 이후 팀 미팅(MH, MD, SG, DT, OtC)을 개최하여 10편의 논문의 파일럿 코딩에 대해 논의하고, 이후 데이터 코딩과 추출을 MH와 MD가 수행하는 코딩 절차를 미세 조정하였으며, 두 저자는 제3저자(SG)와 함께 논문 내 포함된 모든 논문과 코딩된 EPA 로직을 독립적으로 읽고 재독하였으며, 사용된 논리에 대한 합의가 즉시 이루어지지 않았을 때 심판 역할을 맡았습니다. 
During the screening process, an inductive coding style using iterative analysis of the data (often referred to as Grounded Analysis) was be used by two authors (MH, MD) independently resulting in draft codes.18 Hereafter, a team meeting (MH, MD, SG, DT and OtC) was held to discuss a pilot coding of 10 papers and to fine-tune the coding procedure, following which data coding and extraction were performed by MH and MD. Both authors independently read and re-read all of the included papers and coded EPA logics within the papers with the third author (SG) serving as referee for papers when consensus on the logic used was not immediately reached.

3 결과
3 RESULTS

검색전략은 총 2607개의 인용을 확인하였으며, 중복제외 후 681개의 인용을 도출하였다. 이 중 42편의 논문이 이 검토에 포함되도록 선택되었다(PRISMA 다이어그램의 경우 그림 1 참조). 
In total, the search strategy identified 2607 citations, resulting in 681 citations after de-duplication. Of these, 42 papers were selected for inclusion in this review (for a PRISMA diagram see Figure 1).

3.1 EPA 프레임워크의 논리를 설명하는 논문의 일반적인 특성
3.1 General characteristics of papers describing the logic of EPA frameworks

Microsoft Excel 버전 16.54(표 1)를 사용하여 관련 연구 데이터(예: 출판 연도, 국가, 전문성 및 교육 수준)를 추출하고 표로 작성했습니다. 포함된 논문의 주요 특성은 표 2에 요약되어 있습니다. 대학원 또는 펠로우십 프로그램에 대한 EPA 프레임워크의 논리를 설명하는 대부분의 연구는 미국(n = 22; 52%), 캐나다(n = 6; 14%), 네덜란드(n = 4; 10%)(표 2)에서 수행되었다. 보고된 전공의 범위 전체에서 가정의학과(n=4;10%), 내과학과(n=4;10%), 소아과(n=3;7%), 정신과(n=3;7%)가 가장 많았다. 또한 프레임워크의 69%는 전공의용(n = 29), 31%는 전임의용(n = 13)으로 개발되었다. 
Relevant study data (e.g., publication year, country, specialty and level of training) were extracted and tabulated using Microsoft Excel Version 16.54 (Table 1). Key characteristics of included papers are summarised in Table 2. Most studies describing the logic of EPA frameworks for postgraduate or fellowship programmes were conducted in the United States (n = 22; 52%), Canada (n = 6; 14%) and the Netherlands (n = 4; 10%) (Table 2). Across the reported range of specialties, family medicine (n = 4; 10%), internal medicine (n = 4; 10%), paediatrics (n = 3; 7%) and psychiatry (n = 3; 7%) were the most common. Furthermore, 69% of the frameworks had been developed for residency (n = 29), 31% for fellowships (n = 13).

 

3.2 다양한 EPA 프레임워크 로직
3.2 Variety of EPA-framework logics

총 862개의 EPA가 EPA 프레임워크(범위 3-79)당 14개의 EPA의 중위수로 42개 조항에 설명되었다(표 1). 데이터의 반복 분석을 사용한 귀납적 코딩 스타일을 기반으로 다음 논리가 확인되었습니다(예시).

  • 1) 임상 서비스를 포함한 서비스 제공: 직접('중상환 신생아의 영양 요구 관리') 및 간접 환자 치료('가족 회의 촉진') 및 
    비임상 의료 서비스('혈액 성분 수혈과 관련된 부작용 평가 및 보고') 
  • 2) 프로시져 ('삽관, 기관지경, 흉부천자, 중심 정맥 카테터 배치 및 초음파를 포함한 일반적인 중환자 치료 절차 수행' 및 
  • 3) 질병 또는 환자 그룹('비감염성 질염성 질염 환자 식별 및 관리') (표 1) 

A total of 862 EPAs were described in the 42 articles with a median of 14 EPAs per EPA framework (range 3–79) (Table 1). Based on an inductive coding style using iterative analysis of the data, the following logics were identified (with examples):

  • 1) service provision including clinical services for direct (‘Managing nutritional needs of critically ill newborns’) and indirect patient care (‘Facilitating family meetings’) as well as non-clinical health care services (‘Evaluating and reporting adverse events involving the transfusion of blood components’);
  • 2) procedures (‘Performing common critical care procedures, including intubation, bronchoscopy, thoracentesis, central venous catheter placement, and ultrasound’; and
  • 3) disease or patient groups (‘Identifying and managing patients with noninfectious GI luminal disease’) (Table 1). 

눈에 띄는 것은, 보고된 모든 EPA의 13%(n = 109)가 의사가 서비스하는 사람들의 의료 요구를 효과적으로 충족시키기 위해 필요한 능력을 기술했다. (예: '평생 학습 참여', '전문적 행동 시연'). 이러한 EPA는 종합적인 위탁 결정에 적합하지 않기 때문에, 이 그룹은 4) 비 EPA로 분류되었다.
Notably, 13% (n = 109) of all reported EPAs described abilities physicians require to effectively meet the health care needs of the people they serve (e.g. ‘Engaging in life-long learning’, ‘Demonstrating professional behavior’). As these EPAs are not suitable for summative entrustment decisions, this group was categorised as 4) non-EPAs.

대부분의 논문(n = 37; 88%)은 EPA 프레임워크 개발에 2개 이상의 논리를 사용했다(표준 = 3, 범위 = 1~4). 질병 또는 환자 그룹과 서비스 제공이 가장 많이 사용된 논리(각각 39%와 37%)였다(표 1).
The majority of papers (n = 37; 88%) used two or more logics in the development of EPA frameworks (median = 3, range = 1–4). Disease or patient groups and service provision were the most common logics used (39% and 37%, respectively) (Table 1).

4 토론
4 DISCUSSION

이 검토에서, 우리는 대부분의 프로그램이 EPA의 프레임워크를 확립하기 위해 [논리의 조합을 사용한다]는 것을 발견했다. 그러한 프로그램의 개발자들이 의도적으로 이러한 분류를 선택했을 수도 있고 아닐 수도 있지만, 많은 사람들은 단지 하나의 논리적 분류를 찾지 않고 최선의 접근법이 무엇인지 알아내는 데 시간을 보냈을 것이다. 지금까지 '최선의' 접근법에 대한 권고안이 제시되지 않았으며, 의료 전문 분야와 다른 보건 전문 교육 프로그램 간의 차이는 방어 가능한 것으로 보인다. 빠르게 확장되는 문헌에 비추어, 우리는 실제로 사용되어 온 지배적인 논리를 탐색하고 EPA 프레임워크를 만들기 위한 새로운 이니셔티브에 유용할 수 있는 권장 사항을 증류하고자 했다. 
In this review, we found that most programmes use a mix of logics to establish a framework of EPAs. Whereas the developers of those programmes may, or may not, have deliberately chosen these categorizations, many will have likely spent time to figure what the best approach would be, without finding just one logical categorisation. So far, no recommendations for a ‘best’ approach20 have been offered, and differences between medical specialties, and among other health professions educational programmes, seem defensible. In light of the quickly expanding literature, we sought to explore the dominant logics that have been used in practice and to distil recommendations that may be useful for new initiatives to create EPA frameworks.

4.1 EPA의 광범위한 서비스 범위
4.1 The broad service range of EPAs

EPA를 정의할 때 [EPA의 목적]을 염두에 두는 것이 유용하다. 여러 출판물들은 그것의 정의와 EPA가 역량과 어떻게 다른지 상세히 설명하였다. '전문 실무 단위'로서 EPA는 전문 업무를 개념화하기 때문에 반드시 교육 모델이 될 필요는 없다. 그들은 주로 전문 교육을 위한 커리큘럼을 개발하고 직장 평가 절차를 만드는 데 사용되었다. 그러나 [필수 작업essential tasks]을 정의하는 것이 항상 명확한 것은 아닙니다. 또한, EPA는 고유한 우선 순위, 의무 및 목적을 가진 국가 또는 심지어 [국제 기구]에 의해 점점 더 공식화되고 있다. 이는 지역적으로 EPA를 선택하거나 식별하는 자유를 제한하며 프로그램, 기관 또는 국가를 넘어서는 [총괄적 위임 결정]을 인정하는 역할을 한다. 가까운 장래에 EPA는 예를 들어 관련된 교육생과의 부작용 발생 시 책임에 대한 분쟁이 발생하거나 [의료행위 범위의 정당성]이 위태로울 때 사법기관에 의해 인정될 수 있다. 그것은 자격 증명으로 인정되고, 위탁되고, 인증될 수 있는 전문 실무 단위의 건전한 공식화의 필요성을 강조한다. 
In defining EPAs, it is useful to keep their purpose in mind. Multiple publications have elaborated on its definition and how EPAs differ from competencies.3, 10, 21 EPAs, as ‘units of professional practice’, are not necessarily an educational model as they just conceptualise professional tasks.10 They have primarily been used to develop curricula and create workplace assessment procedures for specialty training; however, defining the essential tasks is not always clear-cut. Furthermore, EPAs are increasingly formulated by national or even international bodies with unique priorities, mandates and purposes.22-26 This limits the freedom to choose or identify EPAs locally and serves to acknowledge summative entrustment decisions beyond a programme, institution or country. In a foreseeable future, EPAs may be acknowledged by legal bodies, for example, when disputes arise about accountability in case of adverse events with trainees involved27 or when the legitimacy of a scope of practice is at stake. That stresses the need for a sound formulation of the units of professional practice that can be acknowledged, entrusted and certified as a credential.

최근 몇 년 동안 교육 후 EPA의 잠재적 역할이 더 많은 관심을 받고 있다. 3개의 네덜란드 UMC의 상주 코디네이터는 최근 EPA에게 재인증의 핵심 지위를 줄 것을 간청했다. 또한, EPA의 사용은 어떤 직원이 어떤 의료 특권을 가지고 어떤 훈련을 어떤 수준에서 수행할지 명시하도록 요청하는 'Joint Commission'가 수행하는 것과 같은 [병원 자격 증명 요건]과 자연스럽게 일치fit한다. 이는 EPA의 추가 목적 역할을 한다.
In recent years, the potential role of EPAs after training has received more attention.28, 29 Residency coordinators of three Dutch UMCs recently pleaded to give EPAs a core status in recertification.30 In addition, the use of EPAs naturally fits with requirements of hospital credentialling, such as done by the ‘Joint Commission’,31 which ask to specify which employees have which health care privileges and which tasks are to be performed by which trainees under which level of supervision. This serves as an additional purpose of EPAs.

4.2 주요 논리의 장단점
4.2 Pros and cons of the main logics

EPA 프레임워크 개발을 위한 논리를 선택하는 것은 어려울 수 있다. 각 접근방식은 아래에 논의된 바와 같이 장점과 단점이 있기 때문이다.
The choice of a logic for developing an EPA framework may be difficult, as each approach comes with benefits and drawbacks as discussed below.

4.2.1 서비스 제공
4.2.1 Service provision

[서비스 제공 EPA]는 [일반적으로 임상의의 스케쥴에 포함된 활동]을 반영하므로, 장점은 손쉽게 인식, '지정assigned', 금지prohibited된다. 그것들은 [광범위하고 일반적]이며, 위임 결정은 이러한 서비스 중에 발생할 수 있는 프로시져와 질병에 대한 [적절한 경험]을 전제로 한다. 이로 인해 EPA가 주니어 학습자들에게 덜 적합하게less suitable 된다. EPA '표준 외래 환자 상담'을 예로 들 수 있는데, 이는 보다 상급 의료 교육생에게 논리적이고 적합한 활동이다. 이 EPA에는 의대생에게 적합한 독립적 EPA로서 기능할 수 있는 '의학 이력서 작성' 및 '전체 표준 신체검사 수행'과 같은 활동이 포함될 것으로 추정된다. 또한, [서비스 제공 EPA]는 사례 특이성이 부족할 수 있으며, 결과적으로 감독 임상의가 적용apply하기 어려울 수 있다. 평가 시 표본 추출에 주의하지 않는 한, 이 접근 방식은 또한 특정 EPA에 대한 평가가 포함된 환자의 프레젠테이션 전반에 걸쳐 일반화될 수 있다고 가정한다.
These EPAs reflect activities as they are usually scheduled for clinicians and are therefore easily recognised, ‘assigned’ and/or prohibited. They are broad and general, and entrustment decisions assume adequate experience with procedures and diseases that may be encountered during these services. This makes them less suitable for junior learners.3 Take for example the EPA ‘standard outpatient consultation’, a logical and suitable activity for more advanced medical trainees. This EPA will presumably include activities like ‘taking a medical history’ and ‘performing a full standard physical examination’, activities that in itself may serve as suitable standalone EPAs for medical students. Furthermore, service provision EPAs may lack case specificity and as a result can be challenging for supervising clinicians to apply.6 Unless there is careful attention to sampling in assessment, this approach also presumes assessments for a given EPA can be generalised across included patients' presentation.

4.2.2 프로시져
4.2.2 Procedures

일부 전공 분야의 경우 프로시져(또는 프로시져의 클러스터)가 선호 EPA(예: 내시경 및 수술)가 될 수 있다. 일반적으로 잘 훈련될 수 있는 명확하고 잘 표시된 작업이다. 프로시져를 EPA로 채택하는 위험은 [개별적으로 고려할 때 매우 작거나 좁은 범위의 기술에 초점]을 맞춘다는 것이다. 작고 따라서 많은 절차적 EPA가 본질적으로 문제가 되는 것은 아니지만, 학습자에게 이러한 자격을 부여하기 위한 심각한 [총괄적 위임 결정]의 절차는 까다로운 일이 될 수밖에 없다. 또한, 이러한 소규모 EPA는 신뢰에 대한 여러 조건을 포함하기보다는 [정신운동 능력에만 초점을 좁힐 위험]도 수반한다.
For some specialties, procedures (or clusters of procedures) can be preferred EPAs (e.g. endoscopies and surgeries); they are clear and well-demarcated tasks that generally can be trained well. The risk of adopting procedures as EPAs is that they may be very small when considered individually and that the focus is on a narrow range of skills.3, 6 Small and thus many procedural EPAs are not inherently problematic, but serious summative entrustment decisions to qualify learners for these are bound to lead to cumbersome procedures.3, 6 Furthermore, these small EPAs incorporate the risk that the focus will narrow to psychomotor skills only, rather than including multiple conditions for trust.

4.2.3 질병 또는 환자군
4.2.3 Disease or patient group

[비시술적 전문분야]의 경우 [질병]이 빨리 떠오른다; [질병 X를 가진 환자를 관리하는 것]은 분명한 임무처럼 들린다. 질병이 논리로 나타나는 단점은 [감별 진단이 첫 번째 과제임을 무시하는 것]이다. 또한 질병은 학습자가 취급할 수 있는 공식적인 자격을 얻기보다는 '만난 것'의 체크박스 항목이 될 위험이 있는 [길고 상세한 목록]을 초래할 수 있다. [프로시져 EPA]와 유사하게, 질병에 대한 의료 전문지식을 중심으로 한 [좁은 범위의 역량에 초점]을 맞출 수 있다. 질병을 EPA의 논리로만 사용하는 것은 유용하고 실용적이지 않을 수 있다. 예를 들어 [진단 및 리퍼referral 후 치료가 일반적인 경우]에는 [질병 또는 질병 그룹]이 유용한 논리가 될 수 있다.
For non-procedural specialties, diseases come to mind quickly; managing patients with disease X sounds like a clear task. A draw-back of diseases as a logic is the disregard of differential diagnosis as a first task. Further, diseases may result in long and detailed lists with the risk of becoming checkbox items of what the learner ‘has encountered’ rather than having received a formal qualification to handle.3, 6 Analogously to the procedural EPA, it can focus on a narrow range of competencies centred on medical expertise for a disease. Using diseases only as the logic for EPAs may not be useful and practical. In some cases, diseases or disease groups can be a useful logic, for example, when treatment after diagnosis and referral is common practice.

4.2.4 비EPA
4.2.4 Non-EPAs

우리는 발표된 모든 'EPA'가 종합위탁 결정에 적합한 것은 아니며, 어떤 것은 EPA로서 유용성이 떨어진다고 판단했다. 우리는 모든 EPA의 13%(표 1)를 비 EPA로 분류했으며, 종종 의사가 서비스하는 사람들의 의료 요구를 효과적으로 충족시키는 데 필요한 능력을 설명한다. '평생 학습 참여', '전문적 행동 시연', '환자 안전 강화', '환자 개개인에 대한 옹호' 등이 대표적이다. 이러한 활동을 수행하는 것을 금지하는 것에서 직간접적인 감독 하에 허가하는 것으로의 전환을 상상하는 것은 어렵다. 우리는 훈련에 대한 이러한 목표의 중요성에 이의를 제기하지 않지만, 그것들은 독립적 EPA와는 다른 방식으로 훈련에 통합되어야 한다. EPA로 유용하게 개념화되지 않은 훈련 목표를 다루는 몇 가지 방법이 최근 텐 카테와 슈마허에 의해 제공되었다. 
We deemed not all published ‘EPAs’ as suitable for summative entrustment decisions and hence are less useful as EPAs. We qualified 13% (Table 1) of all EPAs as non-EPAs, often describing the abilities physicians require to effectively meet the health care needs of the people they serve. Examples include ‘Engaging in life-long learning’, ‘Demonstrating professional behavior’, ‘Enhancing patient safety’ and ‘Advocating for individual patients’. It is difficult envision the transition from a prohibition to perform these activities to permission to do so with direct or indirect supervision. We do not dispute the importance of these objectives for training, but they should be incorporated in training in a different way than stand-alone EPAs. Several ways to deal with objectives of training that are not usefully conceptualised as EPAs were recently provided by ten Cate and Schumacher.32

이 연구의 몇 가지 한계를 고려해야 한다. 첫째, 의학 대학원 및/또는 동료 훈련 프로그램의 발표된 EPA 프레임워크만 포함되었기 때문에 선택과 출판 편향의 문제가 있다. 네덜란드의 모든 전문 교육 프로그램에서 사용되는 EPA 유형의 요약을 포함하는 최근 논문은 유사한 논리를 발견했으며 부분적인 '회색 문학' 확인으로 볼 수 있다. 우리의 검토에서, 주요 이해관계자 그룹과 관련된 초기 EPA 프레임워크에 대한 근거는 일반적으로 설명되지 않았다. 개발자는 처음부터 시작했거나 통치 기관이나 국가 기관이 부과한 지침과 요구사항을 따랐을 수 있다. 다음으로, 적격 기사들은 외과 전문분야의 거의(n = 2)를 포함하였고, 이는 잠재적으로 논리로서 '구조'를 과소평가하게 만들었다. 그러나 이러한 유형의 논리의 중요성은 네덜란드에서 더 높은 발생률로 뒷받침된다. 보고된 일부 EPA는 둘 이상의 논리 범주로 분류될 수 있다. EPA 세트에 따라 EPA는 한 세트에서는 환자 범주이고 다른 세트에서는 서비스 범주일 수 있다. 

Several limitations of this study must be considered. First, there is the issue of selection and publication bias as only published EPA frameworks of medical postgraduate and/or fellow training programmes were included. A recent paper that includes a summary of the types of EPAs used by all specialty training programmes in the Netherlands found similar logics and can be seen as a partial ‘grey literature’ confirmation.26 In our review, the rationales for the initial EPA frameworks as relates to key stakeholder groups were usually not described. Developers may have started from scratch or have followed guidelines and requirements imposed by governing institutions or national bodies. Next, eligible articles included few (n = 2) from surgical specialties, potentially leading to an underestimation of ‘procedures’ as a logic. The importance of this type of logic, however, is supported by its higher occurrence in the Netherlands.26 Some reported EPAs could be categorised in more than one logic category; depending on the set of EPAs, an EPA may be a patient category in the one set and a service in the other.

수용된 권장 사항을 따름으로써 [개선할 수 있는 많은 EPA 제목]을 접했는데, 이는 논리 범주에 대한 의구심을 해소했다. 예를 들어, '검사 결과 전달'은 전문 실무의 독립적 단위로 간주할 가치가 거의 없기 때문에 확실히 더 성숙한 EPA에 내포될 수 있는 조기 교육 EPA일 수 있으며 부정사infinitive로 더 잘 공식화될 수 있다('진단 시험 결과의 소통'). 우리가 했던 [범주화의 한계]는 [full EPA description]에 대한 통찰력을 거의 갖지 못했다는 것이다. 예를 들어, 우리는 '예방'을 비 EPA로 인정했지만, 규격에는 EPA가 서비스 제공 논리에 속하는 것으로 간주하도록 만들 수 있는 매우 구체적인 하위 활동의 번들 또는 목록이 포함되어 있었을 수 있다. 단지 '예방'을 위해 임상의사를 인증하는 것은 종합적인 위탁 결정에 필요한 명확성이 부족하다. 마지막으로, EPA의 효과나 유효성을 설명하는 제한된 연구가 존재하며, 현재까지 우리는 어떤 논리 범주의 우월성을 지지할 이유가 없다. 향후 연구는 일반적인 EPA 사용에 대한 타당성 증거를 제공하는 것뿐만 아니라 설명된 논리의 사용(또는 우월성)을 뒷받침하는 데 초점을 맞춰야 한다.
We encountered many EPA titles that could be improved, if accepted recommendations10 were followed, which we gave the benefit of the doubt for a logic category. For example, ‘Communicates results of exams’ might be an early training EPA that would definitely be nested in a more mature EPA, as it is hardly worth considering it a stand-alone unit of professional practice, and it might be better formulated with an infinitive (‘Communicating diagnostic exam results’). A limitation of our categorisation is that we rarely had insight into the full EPA description. For example, we qualified ‘Prevention’ as a non-EPA, but the specifications might have included a bundle or list of very concrete sub-activities that could have made us consider the EPA as belonging to the service provision logic. Certifying clinicians just for ‘prevention’ lacks the necessary clarity for a summative entrustment decision. Finally, limited studies exist describing the effectiveness or validity of EPAs, and to date, we have no reason to support superiority of any one logic category. Future research should be directed at providing validity evidence for not only the use of EPAs in general but also to support the use (or superiority) of the described logics.

5 결론
5 CONCLUSION

이 연구는 대학원 의학 교육 및 펠로우십 프로그램에 걸쳐 EPA 프레임워크 개발에 사용되는 논리를 매핑하기 시작했다. '서비스 제공', '절차' 및/또는 '질병 또는 환자 그룹'이라는 세 가지 주요 논리가 식별될 수 있다. 각 논리에 대해 명확한 정의는 예, 이점 및 한계와 함께 제공됩니다. EPA에서 직업의 필수 업무를 포착하려고 할 때, 발견된 논리 유형 중 두세 가지를 조합하여 사용하는 것이 가장 적합해 보인다. 이러한 결과는 향후 EPA 프레임워크 개발자에게 유용한 발판을 제공할 수 있다.
This study set out to map the logics used in development of EPA frameworks across postgraduate medical education and fellowship programmes. Three dominant logics could be identified, namely, ‘service provision’, ‘procedures’ and/or ‘disease or patient groups’. For each logic, a clear definition is provided together with examples, benefits and limitations. When trying to capture the essential tasks of a profession in EPAs, the use of a combination of two or three of the types of logic found seems most suitable. These findings may provide helpful scaffolding for future EPA-framework developers.

 


Med Educ. 2022 Sep;56(9):881-891.  doi: 10.1111/medu.14806. Epub 2022 Apr 19.

 

The logic behind entrustable professional activity frameworks: A scoping review of the literature

 

Affiliations

1Department of Pediatric Intensive Care, University Medical Center Utrecht, Utrecht, The Netherlands.

2Intensive Care Center, University Medical Center Utrecht, Utrecht, The Netherlands.

3Department of Medicine, Queen's University School of Medicine, Kingston, Ontario, Canada.

4Center for Research and Development of Education, University Medical Center Utrecht, Utrecht, The Netherlands.

PMID: 35388517

PMCID: PMC9542438

DOI: 10.1111/medu.14806

Free PMC article

 

Abstract

Introduction: Entrustable professional activities (EPAs), discrete profession-specific tasks requiring integration of multiple competencies, are increasingly used to help define and inform curricula of specialty training programmes. Although guidelines exist to help guide the developmental process, deciding what logic to use to draft a preliminary EPA framework poses a crucial but often difficult first step. The logic of an EPA framework can be defined as the perspective used by its developers to break down the practice of a profession into units of professional work. This study aimed to map dominant logics and their rationales across postgraduate medical education and fellowship programmes.

Methods: A scoping review using systematic searches within five electronic databases (Medline, Embase, Google Scholar, Scopus and Web of Science) was performed. Dominant logics of included papers were identified using inductive coding and iterative analysis.

Results: In total, 42 studies were included. Most studies were conducted in the United States (n = 22; 52%), Canada (n = 6; 14%) and the Netherlands (n = 4; 10%). Across the reported range of specialties, family medicine (n = 4; 10%), internal medicine (n = 4; 10%), paediatrics (n = 3; 7%) and psychiatry (n = 3; 7%) were the most common. Three dominant logics could be identified, namely, 'service provision', 'procedures' and/or 'disease or patient categories'. The majority of papers (n = 37; 88%) used two or more logics when developing EPA frameworks (median = 3, range = 1-4). Disease or patient groups and service provision were the most common logics used (39% and 37%, respectively).

Conclusions: Most programmes used a combination of logics when trying to capture the essential tasks of a profession in EPAs. For each of the three dominant logics, the authors arrived at a definition and identified benefits, limitations and examples. These findings may potentially inform best practice guidelines for EPA development.

산을 옮기는 일: 대형 유럽 의과대학의 주요 교육과정 개편을 향한 실용적 통찰(Med Teach, 2018)
Moving a mountain: Practical insights into mastering a major curriculum reform at a large European medical university
Asja Maaz , Tanja Hitzblech , Peter Arends, Antje Degel, Sabine Ludwig, Agata Mossakowski, Ronja Mothes, Jan Breckwoldt and Harm Peters 

 

서론
Introduction

학부 의학 교육의 가장 중요한 혁신 중 하나는 전통적인, 학문-기반 프로그램에서 통합 및 역량 기반 프로그램으로의 세계적인 움직임이다(Frenk et al. 2010). 이러한 근본적인 변화에 대한 요구는 의료 제공의 엄청난 발전, 환자와 사회의 확장된 요구, 그리고 의학 교육 자체의 이론과 실천의 진전에 기초하고 있다. 주요 커리큘럼 개혁은 밀접하게 관련된 이중 과제를 숙달하는 것을 의미한다. [커리큘럼]과 [전달 조직]의 모두의 변화. 이 도전의 규모는 "산을 움직이는 것"이라는 은유에 의해 잘 반영된다. 잘 설계된 계획과 엄청난 노력이 필요하다. 이 분야에서는 실용적인 추천을 받은 문학이 드물다. 따라서, 많은 기관들이 여전히 그들의 프로그램을 개혁하는 것을 주저하고 있다는 것은 놀라운 일이 아닐 수 있다. 본 논문에서는 이러한 주요 교육과정 개혁을 우리 기관에서 마스터링하기 위한 전략을 프로젝트 관리 관점에서 보고하고 실질적인 통찰력을 제공한다.
One of the most significant innovations in undergraduate medical education is the global movement from traditional, discipline-based to integrated, and competency-based programs (Frenk et al. 2010). The demand for this fundamental change is based on tremendous advances in the delivery of health care, the expanded needs of patients and society, as well as the progress in theory and practice of medical education itself. A major curricular reform implies mastering of a closely interrelated, dual challenge: the change of both, the curriculum and the delivering organization (Loeser et al. 2007; Jippes et al. 2015). The magnitude of this challenge is well reflected by the metaphor of “moving a mountain”: it needs a well-designed plan and a magnitude of effort (Bland et al. 2000; Bordage and Harris 2011). Literature with practical recommendations is scarce in this field. Thus, it may not be surprising that many institutions are still hesitant to reform their programs. In this article, we report from a project management perspective on the strategies in mastering such a major curriculum reform at our institution and provide practical insights.

베를린에 있는 Charité – Universitaets mediz in Berlin은 연간 두 번 300명의 의대생을 수용하는 유럽의 큰 의대를 대표합니다. 200명 이상의 교수들과 2000명 이상의 교수진들이 100여 개 학부에 걸쳐 교직에 종사하고 있다. 그 출발점은 전임상 2년, 임상 3년, 최종 사무원 1년으로 구성된 Flexner형 전통적인 학과 기반 학부 과정이었다. 주요 교육 형식은 강의, 세미나, 실험실 과정 및 개별 학과에 의해 제공되는 침대 머리맡 교육이었다. 환자와 함께 가르치는 것은 3학년 때부터 시작되었다.
Our institution, the Charité – Universitaetsmedizin Berlin represents a large European medical university with an intake of 300 medical students twice a year. More than 200 professors and 2000 faculty members, spread over some 100 departments, are involved in teaching. Starting point was a Flexner-type traditional, discipline-based undergraduate program consisting of two preclinical years, three clinical years, and one final clerkship year. The predominant teaching formats were lectures, seminars, laboratory courses, and bedside-teaching delivered by individual disciplines (Kiessling et al. 2004). Teaching with patients started in the third year.

교육과정과 전달기구의 주요 개혁은 세 가지 단계를 거쳤다. 

  • 시작 단계, 
  • 커리큘럼 개발 및 구현 단계,  
  • 지속 가능성 단계. 

다음은 변경 관리 관점에서 이 세 단계의 주요 특징을 설명하겠습니다.
The major reform at the Charité of both the curriculum and the delivering organization went through three sequential stages:

  • the initiation phase,
  • the curriculum development and implementation phase, and
  • the sustainability phase.

In the following, we will describe the main characteristics of these three phases from a change management perspective (Kotter and Schlesinger 2008).

시작 단계
The initiation phase

이 단계의 핵심은 [변화의 필요성을 확립]하고 [기관의 준비를 촉진]하는 것이었습니다. 우리의 경우, 전통적인 교육과정의 학생들이 변화의 필요성을 분명히 하는 주요 동인이었다. 그들의 시위는 환자 중심의 교육과 훈련뿐만 아니라 더 많은 연습practice을 요구하는 [1989년 파업]으로 절정에 달했다. 이를 통해 [실무 및 커뮤니케이션 능력 교육]이 가능한, 대안적 문제기반학습(PBL) 교육과정 제안서를 마련한 교직원과 학생들로 구성된 워킹그룹을 공식 설치하게 됐다.
The key to this phase was establishing the need for change and facilitating the readiness of the institution. In our case, students from the traditional curriculum were the main drivers in making the need for change evident. Their protest culminated in a strike in 1989 to demand more practice as well as patient-oriented education and training. This led to the official installation of a working group of faculty and students who prepared a proposal for an alternative, problem-based learning (PBL) curriculum with practical and communicative skills training.

[커리큘럼 개혁에 대한 시범 연구를 수행하는 것]이 변화에 대한 준비를 촉진하는 핵심 전략으로 부상했다. 1999년, 샤리테는 [학생 집단의 10%]에게 독일에서 최초로 [개편된 의과대학 교육과정]을 시행하는 개혁 시범 연구를 시작했다. 이번 개혁 시범사업은 실현가능성을 입증하는 것으로 매우 가치가 있었다. 동시에 커리큘럼 개발과 새로운 교육 형식에 대한 전문 지식을 갖춘 실질적이고 헌신적인 교수진을 구성했다. 파일럿은 학생들을 포함한 교직원의 많은 이해 관계자들과 함께 커리큘럼 개혁에 대한 지속적인 토론을 자극했다. 토론의 결과 중 하나는 학생들이 [새로운 커리큘럼의 비전과 결과를 설명하는 상세한 제안서]를 작성했다는 것이다. 이 기여는 학생들의 입장에 대한 신뢰도에 많은 것을 더했다.
Doing a pilot study on curricular reform emerged as the key strategy to facilitate readiness for change. In 1999, the Charité started a reform pilot study whereby 10% of the students´ cohort implemented the first reformed medical curriculum in Germany. This reform pilot work was very valuable as a demonstration of general feasibility. Simultaneously it built-up a substantial and dedicated group of faculty with expertise in curriculum development and new teaching formats. The pilot stimulated a continuous debate on curricular reform with many stakeholders in the faculty including the students. One result of the discussion was that the students drafted a detailed proposal delineating their vision and outcomes of the new curriculum. This contribution added much to the credibility of the students’ position.

두 프로그램을 병행 운영하면 졸업생을 비교 대조할 수 있었다. 이러한 연구에서 두 커리큘럼의 학생들은 졸업 의사에 대한 기대가 매우 비슷했지만, 학생들은 개혁 파일럿 프로그램에 의해 훨씬 더 잘 준비되었다고 느꼈다. 그 결과는 변화의 필요성을 촉진시켰고 학장들에게 미래의 전체 학생들을 위한 주요 커리큘럼 개혁을 시작하기 위한 설득력 있는 주장을 제공했다.
Running two programs in parallel allowed one to compare and contrast their graduating students. In such a study, students from both curricula had very similar expectations of a graduating physician, but students felt much better prepared by the reform pilot program (Burger et al. 2003; Pruskil et al. 2009; Dettmer and Kuhlmey 2010). The results catalyzed the need for change and provided the deanery with persuasive arguments to initiate the major curricular reform for the future entire students cohorts.

커리큘럼 개발 및 구현 단계
Curriculum development and implementation phase

2009년, 학장은 변화의 절박한 필요성에 대응하여 주요 교육과정 개혁을 결정했다. 새로운 학부 의료 프로그램은 [2010년에 새로 등록한 모든 학생들]을 위해 시작하도록 제안되었고, 따라서 전통적인 프로그램 및 시범 프로그램을 대체했다.
In 2009, the deanery responded to the pressing need for change and decided for a major curricular reform. A new undergraduate medical program was proposed to start in 2010 for all newly enrolled students, thus replacing the traditional and reform pilot programs.

프레임 설정
Setting up the frame

새 커리큘럼의 일반적인 청사진을 정의하기 위해 [주요 샤리테 이해당사자들과 함께 위원회가 설치]되었다. 위원들은 경험이 풍부한 교수와 교직원이었으며, 이들 중 상당수가 개혁 파일럿에 참여했으며 개혁 파일럿에 참여했던 학생들의 지원을 받았다. 이것은 변화의 원동력을 모으는 데 매우 중요했다. 6개월에 걸친 매우 집중적이고 논란의 여지가 있는 토론에서 위원회는 모듈식 구조를 개발하고 2004년에 교수진 전체의 델파이 프로세스를 포함하는 기존 결과 카탈로그에 합의했다. 결과 카탈로그는 [스코틀랜드 닥터]나 [브라운 대학 의과대학 교육 청사진]과 같은 당시 논의된 [역량 카탈로그]에서 영감을 받았다. 새로운 6년 프로그램은 40개의 수직 및 수평 통합 모듈로 구성되었습니다(연간 8개의 모듈, 최종 사무직 연도, 보충 자료 1 참조). 첫 주부터 환자접촉을 중심적으로 하고 학생 스스로 [작은 전문적 과제]를 수행할 수 있는 능력을 꾸준히 키워 임상역량을 키워나가는 것이 핵심 요소였다. 이러한 결과 방향을 지원하기 위해 [세 개의 종단 트랙]이 설계되었다.

  • 첫째, 협업 학습(및 직장에서의 미래 협업)을 지원하기 위한 형식으로서 PBL, 
  • 둘째, 환자 접촉과 밀접하게 연관된 트랙 "커뮤니케이션, 상호작용, 팀워크"와 
  • 셋째, 과학적 기반 추론(증거 기반 추론에 필요한 경우)을 육성하기 위한 "과학적 작업 트랙". 

지역사회 기반 교육(일반의사실 실습 배치, 응급의료서비스, 노숙인 환자 서비스 기관 등)에도 관심이 쏠렸다.

A committee with key Charité stakeholders was installed for defining a general blueprint of the new curriculum. Committee members were experienced professors and teaching faculty members, many of which were involved in the reform pilot and were supported by students who were also involved in the reformed pilot. This was crucial to bring together the drivers of change (Lewin 1943; Giesler et al. 2017). In a very intensive and controversial discussion over a six months period, the committee developed a modular structure and agreed on an existing outcome catalogue that had been complied in 2004 involving a faculty-wide Delphi process. The outcome catalogue was inspired by the competency catalogues discussed at those times such as the Scottish Doctor (Simpson et al. 2002) or the Educational Blueprint for the Brown University Medical School, (Brown University website 2004). The new six-year program consisted of 40 vertically and horizontally integrated modules (eight modules per year, followed by a final clerkship year, see Supplementary Material 1). The core element was to develop clinical competencies from the first week on by making patient contact central and steadily building up students abilities to carry out small professional tasks on their own. To support this outcome orientation, three longitudinal tracks were designed:

  • first, PBL as a format to support collaborative learning (and future collaboration at the workplace),
  • secondly, a track “Communication, Interaction, and Teamwork” closely interwoven with patient contact, and
  • thirdly a “scientific work track” to foster scientifically based reasoning (as needed for evidence-based reasoning).

Attention was also paid to community-based teaching, including practice placements at general practitioners offices, the emergency medical services, and an institution serving homeless patients.

[평가 프로그램]은 발달 시험을 포함한 지식 테스트, 기술의 실제 시연, 객관 구조 임상 검사(OSCE) 및 과학적 프레젠테이션을 통합했습니다. 위원회는 또한 새로운 프로그램에 의해 달성될 특정한 지식, 기술 및 태도를 가진 역량의 정의된 결과 카탈로그에 합의했다.
The assessment program integrated knowledge testing including progress testing (van der Vleuten et al. 1996), practical demonstrations of skills, Objective Structured Clinical Examinations (OSCEs), and scientific presentations. The committee also agreed on a defined outcome catalogue of competencies with specified knowledge, skills and attitudes to be achieved by the new program.

이후 general blueprint는 공식 인증 기관(샤리테 교수 위원회와 베를린 주립 대학교)이 승인하였다. 변화 과정을 용이하게 하기 위해, 학장은 비록 수업 내용, 형식, 또는 교과 시점이 다를 수 있지만, 모든 학과가 새로운 커리큘럼에서 수업 시간과 재정적 보상을 유지할 것이라는 보장을 주었다. 이는 교수진의 불확실성을 줄이고 다가올 변화에 대한 개방성을 창출했다.
The general blueprint was subsequently approved by the Charité faculty board and the State of Berlin as the formal accreditation body. To facilitate the change process, the deanery gave the guarantee that every department would maintain its teaching time and financial reimbursement in the new curriculum, although teaching content, formats, or curricular time points might differ. This reduced faculty’s uncertainty and created openness for the upcoming change (Burke 2018).

새로운 교육과정은 학기별로 6년의 기간에 걸쳐 계획되고 시행되었다. 그 과정에 대한 우리의 성찰에서, 다음 요소들이 성공의 열쇠였습니다.
The new curriculum was planned and implemented over a six-year period, semester-by-semester. In our reflection on the process, the following elements were the key to success.

효과적인 학제간 프로젝트 관리 팀 설치
Installing an effective, interdisciplinary project management team


학장은 기초과학, 임상 교수 및 의사, 커리큘럼 개발 및 변경 관리 분야의 학제 간 전문성을 한데 모은 [프로젝트 관리팀]을 신설했다. 게다가, 공식적으로 임명된 두 명의 학생들은 정회원이었다. 이 팀은 [세 가지 주요 임무]가 있었다.

  • (i) 학제간 커리큘럼 계획 및 후속 통합 전달을 위한 변경 프로세스를 위한 [교수진 전체의 구조]를 구축한다. 
  • (ii) 일반 커리큘럼 청사진을 학기 중 [구체적인 모듈]로 운영한다. 즉, 특정 교육 시간, 형식 및 내용에 대한 세분화 및 단계별 커리큘럼 결과에 도달할 수 있도록 평가와의 정렬 
  • (iii) 교직원은 환자 치료, 연구 및 교육에 대한 의무로 크게 점유되기 때문에, 교육과정 개혁이 요구하는 실질적인 구조 및 내용 관련 업무로부터 교직원의 부담을 덜어준다.

The deanery established a project management team that brought together interdisciplinary expertise in the fields of basic science, clinical teaching and physicianship, curriculum development, and change management. Furthermore, two officially appointed students were regular members. The team had three main tasks:

  • (i) to build-up a faculty-wide structure for the change process for interdisciplinary curriculum planning and the subsequent integrated delivery;
  • (ii) to operationalize the general curriculum blueprint into concrete module und semester structures, i.e. a break-down to specific teaching hours, formats, and content, as well as an alignment with assessments so that step-by-step the curricular outcomes would be reached; and
  • (iii) to unburden the faculty from the substantial structural and content-related work which a curriculum reform requires, since the faculty is largely occupied by duties in patient care, research, and teaching.

우리 팀의 필수적인 임무는 [교직원과 자주 솔직하게 소통]하여, [저항을 수용]하고, [건설적인 힘]을 발휘하는 것이었다. 팀은 [모든 부서장에게 브리핑을 실시]하여, 교육 내용과 재정적 영향에 대한 정보를 제공했습니다. 달라진 경영 관점에서 볼 때, 이러한 [브리핑]은 불확실성을 줄이고, 취해야 할 단계에 대한 교수진의 [핵심 참가자를 준비]시키기 위한 결정적인 단계였습니다. 프로젝트 관리 팀의 신뢰성을 위해 새로운 커리큘럼의 전달에 관여하지 않는 것이 중요했고, 따라서 잠재적인 이해 상충을 피하는 것이 중요했습니다.
An essential task of our team was to communicate frequently and forthrightly with faculty members to take up resistance and to use its constructive power. The team conducted briefings with every department director to inform on the effects about teaching content and financial implications. From a changed management point of view, these briefings were a decisive step to reduce uncertainty and to prepare faculty key players for the steps to be taken. For the credibility of the project management team it was important not to be involved in the delivery of the new curriculum, thereby avoiding potential conflicts of interest.

표준화된 커리큘럼 개발 및 구현 프로세스 수립
Establishing a standardized curriculum development and implementation process

핵심 요소는 커리큘럼 개발을 위한 컨의 원칙에 기초하여 각 모듈에 대한 [구조화된 8단계 계획 과정]이었다. 이 과정은 학제간, 협업 및 상향식 과정을 지원하기 위해 투명하고 전체 교수진에게 완전히 개방되었다.
Core element was a structured, eight-step planning process for each module based on Kern´s principles for curriculum development (Kern et al. 1998). The process was transparent and completely open to the entire faculty in order to support an interdisciplinary, collaborative, and bottom-up process.

그림 1은 모듈 계획 프로세스의 8가지 단계를 개략적으로 보여주고 그림 2는 교육과정 위원회와 평가위원회의 모듈 계획과 설문 조사 간의 상호 작용을 보여줍니다.
Figure 1 provides an overview of the eight steps in the module planning process and Figure 2 shows the interaction between module planning and survey by the curriculum committee and assessment board.

 

각 모듈은 학습 목표, 교육 형식, 평가 및 결과와의 정렬을 정의하는 8주의 기간 동안 매주 공개 세션에서 계획되었습니다. 첫 번째 회의에서, 기획 그룹은 그들의 [모듈 의장]을 선출했다: [세 명의 학제간 교수진]과 [한 명의 학생 공동 의장]. 이들은 공동으로 모듈 계획 프로세스를 조정하고 구성했습니다(그림 1 참조). 모듈에 대한 계획 원칙은 "인풋에서 아웃풋까지"였다. 이것은 다양한 샤리테 부서에 최초로 제공된 모든 주제 인풋thematic inputs에서 시작되도록 의도되었다. ("심혈관 시스템" 모듈의 예는 보충 자료 2를 참조하십시오.) 그런 다음 모듈 그룹은 표준화된 8단계 내에서 구체적인 내용을 공동으로 선택, 합성 및 정제하였다. 이 과정에서 [프로젝트 관리 팀]의 주요 업무는 [광범위한 수평 및 수직 통합을 촉진]하는 것이었습니다. 처음에는 여러 부서에서 해결해야 할 과제였습니다. 그러나 기초 과학자들이 그들의 교육 내용에 추가된 임상적 의미를 인식했을 때 통합은 더욱 쉬워졌다. 
Each module was planned in weekly public sessions during a period of eight weeks defining learning objectives, teaching formats, assessment, and its alignment with outcomes. In the first meeting, the planning group elected their module chairs: three interdisciplinary faculty members and a student co-chair. They collaboratively moderated and structured the module planning process (see Figure 1). Planning principle for the modules was “from inputs to outcomes”. This was meant to start from all of the thematic inputs which the various Charité departments had first given (for an example of the module “cardiovascular system” see Supplementary Material 2). The module group then collaboratively selected, synthesized, and refined the specific content within the standardized eight steps. A main task for the project management team in this process was to facilitate a broad horizontal and vertical integration. Initially, this was a challenge for several departments. However, the integration became more facile when the basic scientists recognized the added clinical meaningfulness to their teaching content.

우리 팀은 [일반 청사진의 의도된 모듈 성과] 범위 내에서 [콘텐츠와 학생들의 작업량]을 유지하도록 도왔다. [웹 기반 플랫폼]을 사용하여 프로세스를 촉진하고 교수진 전체에게 투명성을 보장했습니다. 플랫폼에는 모든 과정에 대한 정보(전달 형식 및 기간, 전체 커리큘럼 및 모듈 내 위치, 전달 기관)가 포함되어 있습니다. 8개의 단계를 마친 후, 설계한 모듈 핸드북은 검토를 위해 커리큘럼 위원회에 넘겨졌다(부록 자료 3 참조).
Our team helped to keep the content and the students workload within the range of intended module outcomes of the general blueprint. We used a web-based platform to facilitate the process (Balzer et al. 2016) and to ensure faculty-wide transparency. The platform entailed information on every single course, format and duration of delivery, the position within the total curriculum and within the module, and the delivering institution. Finishing the eight steps, the designed module handbook was then handed over to the curriculum committee for review (see Supplementary Material 3).

[모듈의 도입]은 [다차원 평가 전략]과 병행되었다. 여기에는 학생과 교사의 온라인 평가, 초청 학생의 질적 그룹 토론, 평가 결과 등이 포함됐다. 최신 정보를 얻고 새로운 모듈의 구현을 면밀히 모니터링하기 위한 특별한 전략으로, 우리는 첫 번째 코호트 학생들이 제공하는 일일 항목이 있는 온라인 학습 일지를 사용했다. 연구 일지는 개념적으로 던디 레디 교육 환경 측정(DREEM)을 기반으로 했다.
The implementation of modules was paralleled by a multidimensional evaluation strategy. This included online evaluations by students and teachers, qualitative group discussions by invited students, and the results of assessments. As a special strategy to obtain up-to-date information and to closely monitor the implementation of new modules, we employed online study diaries with daily entries provided by students of the first cohort. The study diary was conceptually based on the Dundee Ready Education Environment Measure (DREEM; Roff et al. 1997).

많은 교수진을 참여시키고 소유권을 창출합니다.
Engaging a large body of faculty and create ownership

교수진 전체, 투명성 및 상향식 프로세스는 참여와 오너십을 촉진했습니다. [학제간 기획회의]에는 학과장 자문위원, 과학자, 학생 등 많은 교수진이 협업해 참여했다. 교수진들은 내용과 적절한 교육 형식의 중요성에 대해 토론했다. 우리 팀은 회의를 주최하고 교수진의 새로운 업무에 점점 더 힘을 실어주기 위해 교수개발 활동을 체계적으로 포함시켰습니다. 이러한 과정에 기초하여 다음 요소들이 소유권을 더욱 촉진하였다.

  • (i) 모듈 계획에 참여하는 많은 교수진이 [개별 과정]을 책임지게 되었다. 
  • (ii) 상당한 수의 교수진과 학생이 모듈 의장 자리를 맡게 되었다. 
  • (iii) 합의 달성이 주요 의사 결정 원칙이었다. 

그것은 갈등이 없었다는 것을 의미하지 않는다. 반대 의견을 해결하기 위해, 우리는 갈등을 처리하기 위한 세 가지 단계를 설정했습니다. 

  • (i) 모듈 계획 그룹에서 논의에 의한 중재 노력 
  • (ii) 모듈 의장 멤버에 의한 협상 시도 
  • (iii) 교육과정 위원회의 청문 및 결정.

The faculty-wide, transparent and bottom-up process promoted engagement and ownership. Many faculty members such as department directors consultants, scientists, and students collaboratively took part in the interdisciplinary planning meetings. Faculty members debated about the importance of content and adequate teaching formats. Our team moderated the meetings and systematically included faculty development activities to increasingly empower faculty for their new tasks. On the basis of this process, the following elements further promoted ownership:

  • (i) many faculty members participating in module planning became responsible for individual courses;
  • (ii) a substantial number of the faculty and students overtook module chair positions; and
  • (iii) achieving consensus was the main decision-making principle.

That does not mean that there was no conflict. To resolve dissent, we established three levels to handle conflicts:

  • (i) mediation efforts by discussion in the module planning group;
  • (ii) negotiation attempts by members of the module chairs; and
  • (iii) hearing and decision by the curriculum committee.

여러 단계의 학생들을 참여시킨다.
Involving students at many levels

[교수의 오너십]을 촉진하기 위한 우리의 전략은 [학생의 오너십]을 촉진하기 위한 접근법과 병행되었다. 학생들은 교육과정 변화의 중요한 이해당사자이다. 그들은 실제 커리큘럼을 경험한다. 교육위원회에서 정식 위원이라는 공통적인 역할을 넘어, 모든 모듈 계획 회의에 [모듈 공동 의장] 및 [팀 상임이사]로서 학생들을 적극적으로 참여시켰습니다. 교수진들은 학생들이 훌륭한 의사가 되려는 욕구에 초점을 맞춘 기여도를 높이 평가했습니다. 또한, 부서 이익과 무관한 것으로 인식되어 갈등을 중재하는 데 도움이 되었다. 모듈이 구현될 때 [학생 모듈 공동의장]은 특정 모듈을 거친 모든 학생들의 피드백을 체계적으로 정리하고 후속 모듈 검토회에서 개선안을 제시하였다. 이에 따라 학생들은 광범위한 소유권과 함께 지속적인 교육과정 개발을 위한 중요한 동인이 되었다.

Our strategies to facilitate faculty ownership were paralleled with approaches to facilitate students ownership. Students are important stakeholders in curricular change (Peluso and Takizawa 2010). They experience the curriculum in action. Beyond the common role of being formal members in educational committees, we actively involved students in all module planning meetings as module co-chairs and as permanent members of our team. Faculty members valued the students contribution as it focused on their needs to become good physicians. Also, it was perceived to be independent of department interests and that helped to mediate conflicts. When the modules were implemented, the student module co-chairs systematically compiled the feedback of all students who had gone through the specific module and presented proposals for improvement at the subsequent module review meeting. By that, students became important drivers for ongoing curriculum development with far-reaching ownership.

주요 커리큘럼 구조로 전문 활동 활용
Employing professional activities as main curricular structure

프로젝트 관리 팀이 업무를 시작했을 때, 신뢰할 수 있는 전문 활동(EPA)의 개념은 지식, 기술 및 태도를 통합하고 역량을 직장 내 특정 실무 활동에 연결할 수 있는 잠재적 개념으로 막 등장하기 시작했습니다. 우리는 당시 대학원 교육을 위해 고안된 개념을 학부 커리큘럼에 채택하고 초기 모듈 계획 라운드에 도입했습니다. 거기서, 그것은 임상의와 기초 과학자들 모두에게 좋은 공명을 발견했고, 그래서 우리는 우리의 주요 종적 교육 구조로서 전문적인 활동을 이용하기로 결정했다. EPA는 커리큘럼 연속체를 따라 1차년도 소규모 과제에서 졸업생에게 적합한 과제까지 내포되었다. 
When the project management team took up their work, the concept of entrustable professional activities (EPAs) just began to emerge as a potential concept allowing one to integrate knowledge, skills, and attitudes and to connect competencies to specific practical activities in the workplace (ten Cate and Scheele 2007; ten Cate et al. 2015). We adopted the concept, which at that time was designed for post-graduate training, into our undergraduate curriculum and introduced it into the early module planning rounds (Peters et al. 2017). There, it found good resonance by both clinicians and basic scientists, so that we thus decided to employ professional activities as our main longitudinal curricular structure. EPAs were nested from smaller tasks in year 1 along the curricular continuum up to tasks appropriate for graduating students.

표 1은 EPA "의학적 기록을 취하고, 신체 검사를 수행하고, 결과에 대한 구조화된 요약을 제공한다"의 예시적인 개요를 제공한다. [계획 회의]에서, 우리는 중첩된 전문 활동을 주요 모듈 결과로 사용하고 복잡한 기술을 위한 과정 설계에 대한 전체 작업 접근법을 제공하는 4가지 구성 요소 교육 설계 모델(4C/ID)을 기반으로 교육을 구성했다(Jansen-Noordman et al. 2006). 그림 3은 "심혈관 시스템" 모듈 내에서 3주차 과정 및 강의 통합이 어떻게 달성되었는지를 보여주는 예입니다. 
Table 1 provides an exemplary overview of nesting the EPA “Take a medical history, perform a physical examination, and provide a structured summary of the results”. In the planning meetings, we used nested professional activities as a main module outcome and organized the teaching on the basis of the four-component instructional design model (4 C/ID, Van Merriënboer and Kirschner 2007) which provides a whole-task approach to course design for complex skills (Janssen-Noordman et al. 2006). Figure 3 illustrates an example of how course and lecture integration was achieved in week 3 within the module “cardiovascular system”.

 

그림 3. 학습 주간 매트릭스에 따라 교육 접점을 분류합니다. 
(a) 학습 목표의 차원 및 
(b) "건강"에서 "병리학적" 상태까지의 연속체 
모듈 11 "심혈관 시스템"의 예, 3주차(2차 연구) 행렬은 다음을 보여준다. 

  • (a) 학습 목표의 차원: 그림 [하단]의 교육 형식은 인지적 내용에 초점을 맞추고, [상단]의 형식은 (밀러의 피라미드에서 채택된) 실용적인 (통합적) 역량에 초점을 맞춘다. 
    (b) "정상" 조건(그림의 왼쪽)에서 "병리학적" 조건(그림의 오른쪽)까지의 연속체.

이 매트릭스를 적용함으로써 수직적, 수평적 통합이 가시화되고 인지적, 실용적 콘텐츠의 균형 잡힌 혼합이 모니터링될 수 있다.
Figure 3. 
Matrix of a study week to classify the teaching encounters according to (a) dimensions of learning objectives and (b) the continuum from «healthy» to «pathological» conditions. Example from module 11 “Cardiovascular System”, week 3 (2nd year of studies).

  • The matrix shows (a) dimensions of learning objectives: teaching formats in the bottom part of the figure focus on cognitive content, while formats in the upper part focus on practical (integrative) competencies (adapted from Miller’s pyramide).
  • The matrix also shows (b) the continuum from «healthy» conditions (left side of the figure) to «pathological» conditions (right side of the figure). By applying this matrix, vertical and horizontal integration are made visible, and a balanced mix of cognitive and practical content may be monitored.

이 주의 1강좌는 내분비내과와 사회과학(기초과학 수평통합)과 2강좌, 1강좌는 생리학, 2강좌는 임상화학, 2강좌는 내분비내분비내과(수직통합)와 2강좌는 해부학, 심장학, 2강좌가 공동으로 진행한다. 수술(수직 통합). "이번 주의 환자 사례"는 중첩된 전문 활동 "임상 조우 따라"의 한 요소를 구성한다.
Lecture 1
in this week is jointly held by the departments Physiology and Anatomy (basis science horizontal integration) and
lecture 2 by Endocrinology and Social Medicine (clinical horizontal integration),
seminar 1 by Physiology,
seminar 2 by Clinical Chemistry, and Endocrinology (vertical integration) and
practical course 2 by Anatomy and Cardiac Surgery (vertical integration).
The “patient case of the week” constitutes one element of the nested professional activity “Along the clinical encounter”.

전체 커리큘럼 개발 과정에서 EPA 개념은 기획 교직원과 학생들이 잘 받아들였고 지금도 진화하고 있다. 최근 교육 종료 EPA는 40명 이상의 주요 교수진이 참여한 델파이 연구에서 도출된 후 새로운 커리큘럼의 중요한 결과로 채택되었다.
Along the whole curriculum development process, the EPA concept was well taken up by the planning faculty and students and is still evolving. Recently, end-of-training EPAs were adopted as overarching outcomes for the new curriculum after having been derived from a Delphi study, which involved more than 40 key faculty members (Holzhausen et al. 2015).

지속가능성 단계
The sustainability phase

이 단계는 모듈 계획 및 구현이 고등 연구 기간 동안 계속 진행되는 동안 점차적으로 진화했습니다. 그것의 토대는 이미 커리큘럼 개발 및 시행 단계에 놓여 있었다. 지속가능성에 기여한 여러 가지 요소들, 가장 중요한 요소들이 다음과 같이 보고된다.
This phase gradually evolved while module planning and implementation was still going on in higher years of studies. Its foundation had already been laid in the curriculum development and implementation phase. A number of factors contributed to sustainability, the most important are reported the following.

학과들은 가르치는 데 있어 그들의 역할을 유지한다.
Departments maintain their role in teaching

새로운 교육과정에 대한 부서들의 참여에 대한 학장들의 약속은 실제로 지켜지는 것이 중요하다고 여겨졌다. 이것은 학문의 기여와 교수에 대한 보상 모두에 적용된다. 프로젝트 관리팀은 이를 항상 염두에 두고 직접 회의뿐만 아니라 웹 기반 교육과정 플랫폼을 통해 부서별 기여도를 이사들에게 가시화시켰다.
It was considered important that the deanery promises on the departments involvement in the new curriculum were indeed kept. This applies to both the contribution of the discipline and the reimbursement for teaching. The project management team always had this in mind and made the department contribution visible to the directors, not only in meetings directly but also through the web-based curriculum platform.

성과는 학생들에 의해 충족된다.
Outcomes are met by students

이것은 개혁의 미래에 매우 중요하다. 우리는 적극적으로 교육과정 성공을 소통했다. 초기 시행 동안, 우리는 [새로운 커리큘럼의 학생들]이 [전통적인 커리큘럼에 참여한 학생들]보다 더 잘했다는 것을 증명하는 [의학 발달 시험]의 결과를 기반으로 했다. 시행 후기에는 단순하지만 의미 있는 설문조사를 통해 새 교육과정 학생들이 이전 교육과정 학생들이 했던 것보다 내과의사로서 일할 준비가 훨씬 더 잘 된 것으로 나타났다. 이러한 성공은 교직원과 학생들에 의해 잘 받아들여졌다. 학생들 스스로 실시한 대규모 설문조사는 또한 대다수의 학생들이 새로운 프로그램에서의 그들의 공부방식에 상당히 만족하고 있다는 것을 보여주었다.
This is crucial to the future of the reform. We actively communicated curriculum successes. During early implementation, we built on the results of a progress test medicine demonstrating that the students of the new curriculum did better than those who had participated in the traditional one. In later stages of the implementation, a simple but meaningful survey showed that the new curriculum students felt much better prepared for working as a physician than the former curriculum students did. These successes were taken up well by the faculty and students. A large survey, undertaken by the students themselves, indicated also that the majority of students were quite satisfied with their way of studying in the new program.

새로운 구조가 작동하고 학제간 협업이 계속됩니다.
The new structures work and the interdisciplinary collaboration continues

세 번의 성공적인 실행 후, 각 모듈에 대한 책임은 [코스 코디네이터, 모듈 의장 및 교육과정 위원회]에 넘겨졌습니다. 새로 개발된 구조물과 업무는 큰 추가 지원 없이 기능해야 했다. 전반적으로, 이러한 구조물은 충분히 작동했습니다. 
또한, 60개 이상의 세미나 및 120개 이상의 강의에서 달성된 광범위한 학제간 협력이 교수 목표와 내용에 대한 상호 공유된 이해로 예시된다.
After three successful runs, the responsibility for each module was handed over to course coordinators, module chairs, and the curriculum committee. The newly developed structures and tasks had to function without any major extra support. Overall, these structures worked sufficiently. In addition, the broad interdisciplinary collaboration achieved is exemplified in more than 60 seminars and more than 120 lectures given within two disciplines in a mutually shared understanding of the teaching goals and content.

지속적인 커리큘럼 개발을 위한 구조
Structures allowing for ongoing curriculum development

시행 단계를 넘어 달성된 상태를 유지하고 커리큘럼을 더욱 발전시킬 수 있는 [적절한 구조와 자원]을 갖추는 것이 중요하다. 우리 시대에 조정의 필요성이 일정한 특징이 되었기 때문이다. 한 가지 위험은 대학 교직원의 높은 변동과 그에 따른 교육 지식의 손실이다. 효과적인 전략은 (웹 기반 플랫폼을 사용하여) 신규 교직원이 실제로 검색할 수 있는 교육과정에 대한 모든 정보를 만들고, 모든 교육적 교수개발 활동의 중심에 새로운 교육과정의 개념과 철학을 두는 것이었다. 또한, 그것은 지속가능성에 기여하는 [새로운 커리큘럼의 매우 투명한 구조]였고, 따라서 환자 치료나 연구로 지속되는 긴장에서 교육에 불리한 영향을 미칠 수 있는 모든 기회를 줄였다. 마지막으로 지속적인 교육과정 개발은 기관의 내부 교수구조와 긴밀히 연계되면서 외부협력을 통해 교육적 발전을 가져오는 구조가 필요하다.
Beyond the implementation phase, it is important to have adequate structures and resources in place which maintain the status achieved and then further develop the curriculum. This is due to the fact that in our times, the need for adjustment has become a constant feature. One risk is the high fluctuation of faculty members at universities and the subsequent loss of educational knowledge. An effective strategy was to make any information about the curriculum actually retrievable for new faculty members (by use of the web-based platform) and put the concepts and philosophy of the new curriculum at the center of all educational faculty development activities. Also, it was the highly transparent structure of the new curriculum which contributed to sustainability, thereby reducing any possible opportunities to affect unfavorably teaching in its ever-lasting tension with patient care or research. Finally, continuous curriculum development needs a structure which brings in educational advances through external collaborations, while being closely connected with the internal teaching structures of the institution.

다음 단계
Next steps

지속적인 발전의 중요한 분야는 학부생과 대학원생 사이의 연결을 강화하는 것이다. 전문 활동은 다시 한번 학생과 교직원에게 학습 궤적을 가시화하는 데 유용한 구성인 것으로 나타났습니다. 우리는 현재 위탁 척도를 전자 포트폴리오와 OSCE 체크리스트 개발 가이드라인에 통합하여 이러한 활동을 다루고 있다.
An important field of ongoing development is to enhance the connection between under- and postgraduate education. Professional activities once more turned out to be a useful construct to make the learning trajectories visible – to students and faculty. We are currently addressing these activities by integrating entrustment scales into an electronic portfolio and into Guidelines for the Development of OSCE checklists.

지역 사회 기반 교육 조치와 관련하여, 정부 규제가 지역 사회 의학을 통합하기 위한 보다 의무적인 프로그램을 위해 노력하고 있기 때문에 가까운 미래에 조치가 취해질 것이다.
Regarding community-based education actions will be taken in the near future, as governmental regulations are striving towards more obligatory programs to integrate community medicine.

교훈
Lessons learned

이 기사에서, 우리는 샤리테에서 주요 커리큘럼 개혁을 마스터하기 위한 우리의 노력에서 우리의 경험과 실용적인 통찰력을 증류했다. 다음은 해당 기관에서 주요 교육과정 개혁을 고려하고 있거나 이미 시행하기 시작한 사람들을 위한 일반적인 권고의 형태로 배운 우리의 교훈을 되새겼습니다.

In this article, we distilled our experiences and practical insights in our endeavor to master a major curriculum reform at the Charité. In the following we have reflected on our lessons learned in the form of general recommendations for those who are considering or already have started to perform a major curricular reform at their institutions.

많은 일을 기대하세요.
Expect a lot of work

그것이 쉬울 거라고 기대하지 마세요. 꽤 오랜 시간 동안 해야 할 일이 많고 많은 도움의 손길이 필요하다. 교수진은 기본적으로 변화를 마스터하고 싶어하지 않지만, 환자 치료, 연구 및 교육에 대한 일상적인 의무가 계속되는 동안 기여할 수 있는 위치에 있기 위해서는 [물리적 및 개념적 지원]이 필요합니다. [프로젝트 관리 팀]을 구성하면 추가 작업에 대한 교수진의 부담을 상당히 덜어줄 수 있습니다. 교수진은 교육과정 개발과 새로운 교수, 학습 및 평가 형식에 대한 교수 개발 활동의 시간 절약적 통합에 대해 높이 평가했습니다.
Do not expect that it will be easy. It is a lot of work to be done for quite a long time and it needs many helping hands. The faculty is not principally unwilling to master the change, but they do need physical and conceptual support to be in a position to contribute while their usual duties in patient care, research and teaching are continuing. Establishing a project management team can substantially unburden the faculty from the extra work. Faculty members have appreciated the time-saving integration of the faculty development activities on curriculum development and the new teaching, learning, and assessment formats.

저항을 받아들이고 대처하라.
Accept resistance and deal with it

저항을 두려워하거나 무시하지 마십시오. 교과과정의 변화는 항상 저항과 관련이 있다. 사실 어떤 교직원의 저항에도 대처할 수 있는 전략이 있다. 종종 불확실성을 반영하는 것이므로 그들의 우려를 진지하게 받아들이세요. 우리의 경험상, 개혁 반대자들을 적극적으로 담론에 참여시키는 것이 항상 도움이 되었다. 그들 중 다수는 그 후 새로운 커리큘럼의 중요한 지지자이자 승수supporters and multipliers가 되었다.
Do not fear or ignore resistance. Curriculum change is always associated with resistance. There are in fact strategies to deal with any faculty member's resistance. Take their reservations seriously as it often reflects uncertainty. In our experience, it has always been helpful to proactively involve reform adversaries into the discourse. Many of them subsequently became important supporters and multipliers for the new curriculum.

소통하고 경청합니다.
Communicate and listen

핵심 선수들과의 신뢰할 수 있고 빈번하며 솔직한 의사소통의 중요성을 과소평가해서는 안 된다. 주요 관계자(청장, 교육과정위원회, 교직원) 간의 원활한 소통을 위한 프로젝트 관리팀의 핵심 업무 중 하나였다. 여기에는 변화에 대한 원하는 목표를 영구적으로 소통하고 토론하고, 주요 참가자들의 반응을 정확히 듣고, 잠재적인 조직 문제를 예측하는 것이 포함됩니다.
One should not underestimate the importance of a reliable, frequent, and forthright communication with key players. It was one of the key tasks of the project management team to facilitate communication between the key players involved (deanery, curriculum committee, and faculty members). This includes communicating and discussing the desired goals of change permanently, listening precisely to the key players reactions, and anticipating potential organizational problems.

전문 활동을 핵심 종단 구조로 활용
Use professional activities as core longitudinal structures

우리는 이 새로운 개념에 의한 우리의 커리큘럼 형식, 내용 및 구조의 합성이 교수진들(임상사 및 기초 과학자뿐만 아니라 학생들도)에 의해 얼마나 잘 받아들여졌는지 놀랐다. 전문적 활동은 모든 이해 관계자들에게 의대생들의 학업 과정에 대한 점진적인 성장에 대한 유형적이고 개념적인 이해를 제공했다. 이 개념은 학습 콘텐츠를 수평 및 수직으로 자연스럽게 통합할 수 있도록 허용하고 우리 프로그램의 교육, 학습 및 평가를 전반적인 교육 종료 결과와 일치시켰다.
We were surprised how well the synthesis of our curricular formats, content, and structures by this new concept was taken up by the faculty (not only clinicians and basic scientists, but also students). Professional activities provided all stakeholders with a tangible and conceptual understanding in the gradual growth of medical students over their course of studies. The concept allowed to integrate the learning content horizontally and vertically in a natural way and aligned the teaching, learning, and assessment in our program with its overarching end-of-training outcomes.


Med Teach. 2018 May;40(5):453-460. doi: 10.1080/0142159X.2018.1440077. Epub 2018 Mar 5.

Moving a mountain: Practical insights into mastering a major curriculum reform at a large European medical university

Affiliations collapse

Affiliation

1a Dieter Scheffner Center for Medical Education and Educational Research Charité, Dean's Office of Student Affairs Universitätsmedizin Berlin, Free and Humboldt University Berlin , Germany.

PMID: 29504437

DOI: 10.1080/0142159X.2018.1440077

Abstract

Aim: Undergraduate medical education is currently in a fundamental transition towards competency-based programs around the globe. A major curriculum reform implies a dual challenge: the change of the curriculum and the delivering organization. Both are closely interwoven. In this article, we provide practical insights into our approach of managing such a fundamental reform of the large undergraduate medical program at the Charité - Universitätsmedizin Berlin.

Methods: Members of the project management team summarized the key features of the process with reference to the literature.

Results: Starting point was a traditional, discipline-based curriculum that was reformed into a fully integrated, competency-based program. This change process went through three phases: initiation, curriculum development and implementation, and sustainability. We describe from a change management perspective, their main characteristics, and the approaches that were employed to manage them successfully.

Conclusions: Our report is intended to provide practical insights and guidance for those institutions which are yet considering or have already started to undergo a major reform of their undergraduate programs towards competency medical education.

 

어떻게 의과대학이 공감을 바꾸는가: '환자에 대한 공감'과의 사랑 및 이별 편지 (Med Educ, 2020)
How medical school alters empathy: Student love and break up letters to empathy for patients 
William F. Laughey1 | Megan E. L. Brown1 | Angelique N. Dueñas1 | Rebecca Archer1 | Megan R. Whitwell1 | Ariel Liu2 | Gabrielle M. Finn1,3 

1 소개
1 INTRODUCTION

의과대학에서 공감을 가르치는 것은 확인된 역사를 가지고 있다. 불과 10여 년 전, Hojat 등은 학생들이 환자 치료의 현실을 경험함에 따라 3학년 때부터 침식이 가속화되는 등 의대 기간 동안 학생들의 공감이 실제로 침식된다는 결론을 내린 영향력 있는 논문을 발표했다. 공감이 미래의 의사의 핵심 자질이라는 점을 감안할 때, 공감의 감소는 ('윤리적 침식' 문제의 일부이며) 충격적인 결과입니다. 비록 의대 중 공감을 측정하는 연구에 대한 최근 리뷰가 적어도 서구 국가에서 전반적인 추세는 확실히 공감 점수가 감소하는 것으로 나타났지만, 모든 정량적 연구가 동일한 결론에 도달한 것은 아니다.
Empathy teaching in medical school has a chequered history. Just over a decade ago, Hojat et al1 published an influential paper concluding that student empathy actually erodes during medical school, with erosion accelerating from third year onwards as students experience the realities of patient care. Given that empathy is a core quality for a future physician, empathic decline—part of the problem of ‘ethical erosion’2—is a shocking result. Not all quantitative studies have reached the same conclusion, though a recent review3 of studies that measure empathy during medical school found that, in Western countries at least, the overall trend is indeed for empathy scores to decline.

그러나 정량적 연구를 고려할 때, 공감을 측정하는 바로 그 노력이 복잡하거나 논란이 없는 것은 아니라는 것을 인식해야 한다. 공감의 구성 요소는 인지적 측면과 정서적 측면을 모두 포함하며, 일부 정의는 전적으로 인지적 특징에 중점을 두고 있지만, 다른 이들은 감정적 공명이 없는 공감이라고 주장하기도 한다. 따라서 공감을 측정하기 위한 모든 척도가 실제로 그렇게 하는 것은 아니다. 공감에는 인지적, 정서적 요소 외에도 행동적, 도덕적 요소도 있다. 또한 존재론적 관점에서 공감을 인지행동적 용어로 보아야 하는지, 습득해야 할 기술로 보아야 하는지, 아니면 한 인간이 다른 사람에게 빚지고 있는 자질인 '존재의 방식'으로 보아야 하는지에 대한 논쟁이 있다. 인지적, 정서적, 행동적, 도덕적 요소를 포함한 이러한 공감의 측면은 본 연구와 정보에 입각한 데이터 수집 및 분석에서 민감화 개념sensitizing concepts으로 작용한다.
In considering quantitative research, it should be recognised, however, that the very endeavour of measuring empathy is not without complication or controversy.4-6 Empathy is complex, its components include both cognitive and affective aspects, and while some definitions centre entirely on cognitive characteristics (including Hojat's1), others argue that empathy without emotional resonance may not be empathy at all.7 Therefore, not all scales that purport to measure empathy may actually do so.6 Besides cognitive and affective elements, empathy also has behavioural and moral components.7 Furthermore, in ontological terms, there is debate regarding whether empathy should be viewed in cognitive-behavioural terms, as a skill to be acquired, or as a personal attribute, a quality that one human owes to another, a ‘way of being’.8, 9 These facets of empathy—including cognitive, affective, behavioural and moral components—act as sensitising concepts10 within this study and informed data gathering and analysis.

의과대학이 학생 공감에 어떤 영향을 미치는지 조사하는 대안적 접근 방식은 질적 탐구 쪽으로 눈을 돌리는 것이며, 이러한 다면적인 개념의 뉘앙스를 탐구하는 데 더 적합할 것이다. 현재까지 질적 연구는 [숨겨진 커리큘럼]의 측면을 의대생들이 임상적 공감을 어떻게 보는지에 대한 핵심 영향력자influencer로 파악한다. 이러한 측면에는 다음이 포함된다.

  • 긍정적 및 부정적 역할 모델링,
  • 환자 관계 확립보다 생물의학 지식 습득을 우선 순위에 두는 것
  • 환자 관여에 대한 암묵적 감정 규칙
  • 대처 전략으로 냉소주의를 채택하는 것

질적 연구는 또한 다음에 의해 학생들의 공감이 어떻게 부정적인 영향을 받는지를 밝혀냈다.

  • 시간의 압박,
  • '어렵다'고 인식되는 환자,
  • 스트레스 받는 근무환경,
  • 성찰의 기회 부족

An alternative approach to investigating how medical school influences student empathy is to turn to qualitative enquiry, arguably better suited to exploring the nuances of such a multifaceted concept.11 To date, qualitative research identifies aspects of the hidden curriculum12 as key influencers of how medical students view clinical empathy. These aspects include

  • positive and negative role modelling,
  • the prioritising of acquiring biomedical knowledge over establishing patient rapport,
  • the implicit emotional rules of engaging with patients and
  • the adoption of cynicism as a coping strategy.13-15 

Qualitative research has also identified how student empathy is adversely influenced by

  • the pressures of time,
  • patients who are perceived to be ‘difficult’,
  • stressful working conditions and
  • a lack of opportunity for reflection.1416-19 

그러나 본 논문에서 다룬 연구 격차인 의학적 교육에 의한 공감의 형성방식과 공감감소 문제에 대한 질적 연구가 미흡하다는 것이 대체적인 의견이다.
However, it is generally agreed that there is insufficient qualitative research into how empathy is shaped by medical education, and the problem of empathic decline,11, 16 the research gap addressed in this paper.

우리는 이전에 의료 교육에서 전혀 활용되지 않았던 질적 탐구 형태인 사랑 및 이별 편지 방법론(LBM)으로 눈을 돌렸다.
We have turned to a form of qualitative enquiry never previously utilised in medical education—love and break up letter methodology (LBM).20, 21

연애와 이별 편지 방법론은 기술 기반 연구인 UX(User Experience)에 뿌리를 두고 있다. UX에서, 참가자들은 기술의 한 측면에 사랑과 이별의 편지를 쓰도록 요청 받는다. 글자는 다음 포커스 그룹 토론의 트리거가 됩니다. LBM은 정서적 영역을 포함하여 논의 중인 개념과 참가자의 관계를 이해하는 창의적인 방법이다. 우리는 LBM이 의대를 통해 학생들이 공감에 대해 얻는 긍정적이고 부정적인 감정을 이해하는 데 도움이 될 것이라고 추론했다. 특히 부정적인, 혹은 '헤어진' 감정은 윤리적 침식의 개념에 대한 유용한 통찰력을 제공할 수 있다. 이와 같이 LBM은 환자공감 실천을 통해 학생관계의 변화하는 성격을 이해하고자 하는 본 연구의 요구조건에 부합한다.
Love and break up letter methodology has roots in User Experience (UX), a technology-based research.22 In UX, participants are asked to write a love and break up letter to an aspect of technology. The letters form the triggers for the focus group discussion that follows. LBM is a creative way to understand participants' relationships with the concept under discussion, including affective domains. We reasoned that LBM would help us understand the positive and negative feelings that students acquire about empathy as they progress through medical school. The negative, or ‘break up’, feelings, in particular, may provide useful insight into the concept of ethical erosion.2 As such, LBM suits the requirements of this study, which aims to understand the changing nature of student relationships with the practice of empathy for patients.

우리의 주요 연구 질문은 [상급 의대생]들이 [환자에 대한 공감]이라는 개념과의 [변화하는 관계]를 어떻게 특징짓는가 하는 것이었습니다. 우리의 목표는 의과대학 과정을 거치면서 공감에 대한 그들의 감정이 어떻게 변하는지 탐구하는 것이다.
Our primary research question was how do senior medical students characterise their changing relationship with the concept of empathy for patients? Our aim is to explore how their feelings about empathy change as they progress through medical school.

2 방법
2 METHODS

2.1 연구 접근법
2.1 Research approach

본 연구에서는 [현실과 지식의 주관성과 사회성]을 강조하는 [상대론적 존재론]과 [사회구성주의 인식론]을 채택한다. 이는 [현실주의자realist], 또는 실증주의자의 양적 관점에서 진행된 대다수의 임상적 공감 연구와는 대조적이다. 후자는 공감의 변화를 측정하는 데 적합하지만, 이러한 변화가 왜 또는 어떻게 발생하는지에 대한 자세한 통찰력을 제공하지 못했다. 이 접근 방식 내에서, 우리는 성찰적 주제 분석을 선택하여 참여자의 경험을 해석하는 데 있어 연구팀의 적극적인 역할을 인정하는 방식으로 데이터를 분석하였다.

Within this study, we adopt a relativist ontology and social constructionist epistemology, which highlight the subjectivity and social nature of reality and knowledge.23-26 This is in contrast to the majority of clinical empathy research, which has been undertaken from a realist, or positivist, quantitative standpoint.11, 27-29 Whilst the latter is suited to measuring changes in empathy, it has not provided detailed insights into why or how these changes occur, questions better explored with a relativist, qualitative approach, adopted here. Within this approach, we have selected reflexive thematic analysis30, 31 to analyse our data in a way that acknowledges the active role of the research team in interpreting participant experiences.32

2.2 설정 및 참가자
2.2 Setting and participants

데이터는 HYMS 윤리 위원회(1902)의 승인에 따라 2019-20학년도 동안 헐 요크 의과대학(HYMS)에서 수집되었다. 모집은 의과대학 경험이 충분한 학생들이 연구 질문에 답할 수 있도록 객관적인 표본을 얻기 위해 4, 5학년 때부터 독점적으로 이루어졌다. HYMS는 850명(여 59%, 남 41%)의 학생이 재학 중인 중소규모 학교이다. 4학년과 5학년은 각각 147명(여 58%, 남 42%)과 132명(여 52%, 남 48%)이다. 모든 자발적 참여자(n = 21)는 포커스 그룹에 참여했지만, 이후 날짜를 맞출 수 없는 한 학생은 예외였다. 우리는 연구 질문에 맞추기 위해 전임 임상 배치 경험이 있는 학생들을 의도적으로 모집했다. 참여는 인센티브가 아닌 자발적이었고, 이메일, 소셜 미디어, 입소문을 통해 모집이 이루어졌다.

Data were collected at the Hull York Medical School (HYMS), during the academic year 2019-20, following approval from the HYMS ethics board (1902). Recruitment was exclusively from years 4 and 5 in order to obtain a purposive sample of students with sufficient experience of medical school to answer the research question. HYMS is a small-medium sized school with 850 students (59% female, 41% male). Years 4 and 5 have 147 (58% female, 42% male) and 132 (52% female, 48% male) students respectively. Every volunteer (n = 21) took part in the focus groups, with the exception of one student who subsequently could not make the date. We purposively recruited students with experience of full-time clinical placements, in order to align with our research questions. Participation was voluntary, not incentivised, and recruitment occurred via email, social media, and word of mouth.

2.3 데이터 수집
2.3 Data collection

포커스 그룹 참여에 앞서, 각 참가자는 익명의 인구 통계 데이터를 수집하기 위한 온라인 설문조사를 완료했다. 학생들은 공감에 대한 자신의 정의와 의과대학 재학 중 공감의 변화가 있었는지에 대해 고려하도록 요청받았다. 이러한 설문 질문은 후속 포커스 그룹 토론을 위해 학생들의 생각을 자극하기 위해 휴리스틱하게 작용했으며, 따라서 독립적인 결과로 보고되지 않는다. 
Prior to focus group participation, each participant completed an online survey to collect anonymous demographic data. Students were prompted to consider their own definition of empathy and whether their empathy had changed during medical school. These survey questions acted heuristically to stimulate student thoughts for the subsequent focus group discussion, and so are not reported as standalone results.

포커스 그룹의 시작에서, 참가자들은 30분 동안 환자에 대한 공감을 위해 사랑과 이별 편지를 모두 쓸 수 있는 시간이 주어졌다. 편지 쓰기 프롬프트는 보충 자료로 제공됩니다. 그리고 나서 학생들은 그들의 편지를 큰 소리로 읽는 동안 연구원들은 후속 토론 프롬프트를 위해 메모를 했다. 각 포커스 그룹에는 적어도 두 명의 연구원이 참석했는데, 한 명이 퍼실리테이션을 하는 동안 다른 한 명은 현장 메모를 했다. 레터 리딩에 이어 진행자는 토론을 위해 레터에 의해 제기되는 반복 포인트를 강조했는데, 그 중 상당수는 동료들이 의견을 내고 서로의 기여를 논의하면서 학생 주도로 이루어졌다. 
At the beginning of the focus group, participants were given 30 minutes to write both a love and a break up letter to empathy for patients. The letter writing prompts are provided as Supplementary Material. Students then read their letters aloud whilst researchers took notes for subsequent discussion prompts. At least two researchers were present at each focus group – one facilitated whilst the other took field notes. Following letter reading, the facilitator highlighted recurrent points raised by the letters for discussion, much of which was student-led, as peers commented and discussed one another's contributions.

4개의 포커스 그룹이 소집되었지만, 1개는 너무 작아서 분석에 포함시킬 수 없었다(마지막 순간에 결석한 학생은 2명만 참석했다는 의미). 총 3개의 포커스 그룹이 사용 가능했다. 이 세 그룹은 각각 7, 8, 5명의 학생으로 구성되어 있으며, 총 20명이었다. 토론 시간(편지 읽기 제외)은 각각 48분, 42분, 43분이었다. 포커스 그룹 1, 2는 대면 진행했지만 그룹 3은 코로나19로 인해 비디오 스트림으로 진행되었습니다. 포커스 그룹이 녹음한 오디오는 MW & WL에 의해 수동으로 변환되었습니다. 다른 정성적 연구와 마찬가지로, 우리는 (이미 사본이 있는) 편지 읽기 같은 일부 내용을 생략하고 집중적인 전사 전략을 선택했다. 모든 예시적인 인용문은 그대로 캡처되었다.
Four focus groups were convened, but one was too small to be included in the analysis (last minute absence meant only two students attended), leaving a total of three usable groups. These three groups comprised 7, 8 and 5 students respectively, total 20. Discussion times (excluding letter reading) were 48, 42 and 43 minutes respectively. Focus groups 1 and 2 were conducted face-to-face, but group 3 was conducted by video stream, due to COVID-19. Focus group recorded audio was manually transcribed by MW & WL. In common with other qualitative research,33, 34 we chose a focussed transcription strategy, omitting some content such as the reading of letters (where we already had copy). All illustrative quotes were captured verbatim.

2.4 데이터 분석
2.4 Data analysis

포커스 그룹 성적표와 연애편지와 이별편지를 함께 분석하였다. 브라운과 클라크가 자세히 설명하고 키거와 바르피오가 최근 요약한 과정에 따른 반사적 주제 분석이 수행되었다. 브라운과 클라크의 주제 분석 6단계는 다음과 같다.

  • (a) 데이터를 숙지합니다. 
  • (b) 초기 코드 생성 
  • (c) 테마 검색; 
  • (d) 주제 검토 
  • (e) 테마 정의 및 이름 지정 
  • (f) 보고서 작성

연구자(WL, MB, MW, RA)는 포커스 그룹 대화록과 편지를 독립적으로 코딩하여 분석을 심화하도록 모든 데이터를 이중 코딩하였다. 코드북은 공유 Google 드라이브를 사용하여 구성되었으며 포커스 그룹을 분석하면서 귀납적 코드를 추가했습니다. 분석 및 연구자 토론은 각 포커스 그룹 이후 데이터 수집과 동시에 수행되었으며 그룹은 몇 주씩 분리되었다. 주제는 WL에 의해 서면 서술로 구성되었다. 그 팀은 '정보력'이 충족된 시점에 대해 논의하기 위해 정기적으로 만났다.
— 연구 연구 질문에 답하고 전이 가능한 결과를 생성하기에 충분한 표본 크기:

Focus group transcripts and love and break up letters were analysed together. Reflexive thematic analysis, following the process detailed by Braun and Clarke,30 and recently summarised by Kiger and Varpio31 was undertaken. Braun and Clarke's six steps of thematic analysis were adhered to:

  • (a) Familiarise with data;
  • (b) Generate initial codes;
  • (c) Search for themes;
  • (d) Review themes;
  • (e) Define and name themes; and
  • (f) Produce the report.

Researchers (WL, MB, MW, RA) independently coded focus group transcripts and letters, ensuring all data were double coded to deepen the analysis. The code book was formed using a shared Google drive and inductive codes were added as the focus groups were analysed. Analysis and researcher discussion were occurring contemporaneously with data collection, after each focus group, with the groups being separated by several weeks. Themes were constructed into a written narrative by WL. The team met regularly to discuss the point at which ‘information power32, 35 —a sample size sufficient to answer the study research question and generate transferrable findings—had been met.

2.5 반사적 고려사항 및 민감 개념
2.5 Reflexive considerations and sensitising concepts

우리의 접근 방식은 귀납적이었지만, 이론은 내내 논의되었다. 반사적 대화를 통해 정서적, 인지적, 행동적, 도덕적 요소를 포함한 광범위한 관점에 동의하면서 공감에 대한 개인적인 해석을 명확히 했다. 이 모든 것은 우리의 포커스 그룹 질문 및 데이터 분석을 구상한 [민감한 개념]을 형성했다. 예를 들어, 거의 필요하지 않았지만, 우리는 이러한 개념을 중심으로, 자발적인 논의가 수그러들 경우, 포커스 그룹 질문 프롬프트를 고안했다.
Although our approach was inductive, theory was discussed throughout. Through reflexive conversations, we clarified our personal interpretations of empathy, agreeing on a broad-based view, including affective, cognitive, action and moral components. All of these formed the sensitising concepts10 around which we conceived our focus group questioning and data analysis: for example, although rarely needed, we devised focus group question prompts in case spontaneous discussion waned, which centred on these concepts.

3 결과
3 RESULTS

3.1 인구통계 및 배경 설문지 데이터
3.1 Demographics and background questionnaire data

20명의 학생들은 주로 의학교육 4학년이었고, 15명의 여성과 5명의 남성이 참여했다. 표 1은 조사 데이터의 전체 세부 정보를 제공합니다.
The 20 students were primarily in their fourth year of medical education, 15 women and 5 men participated. Table 1 provides full details of survey data.

분석 결과 22개의 하위 테마와 3개의 주요 테마(표 2)가 생성되었습니다.
Analysis generated 22 sub-themes and three major themes (Table 2).

주요 주제는 예술과 기교로서의 공감, 공감 부담, 미덕으로서의 공감이었다. 결과는 이 제목 아래에 서술적으로 제시된다.
The major themes were

  • empathy as art and artifice,
  • empathic burden, and
  • empathy as a virtue.

Results are presented narratively under these headings.

3.2 예술과 책략으로서의 공감
3.2 Empathy as art and artifice


학생들은 진정한 공감 소통이 [숙달을 위한 예술]이고, 그 [예술의 숙달]은 [장기적인 노력]이라는 것을 인식했습니다. 역설적이게도, 그들은 또한 임상적 공감의 실천에 많은 책략이 있다는 것을 인식했다.
Students recognised that true empathic communication is an art to master, and mastery of that art is a long-term endeavour. Paradoxically, they also recognised that there is much artifice in the practice of clinical empathy.

여러분의 작은 몸짓과 신호를 포착하는 것은 진정한 예술입니다. 제가 어떤 식으로든, 어떤 형태로든, 어떤 대가도 될 수 없지만, 계속 노력할 것입니다. 편지, 5학년 3반
Picking up on all your little gestures and signals is a true art that I am in no way, shape or form a master at, but will continue to work on. Letter, 5th year student, group 3

난 그걸 속이고 있었어…. 아주 오랫동안 그러지 않겠다고 약속했던 건 알지만 더 이상 숨길 수 없어 편지, 4학년 학생, 1조
I’ve been faking it…. for so long. I know I promised I wasn't, but I can't hide it anymore. Letter, 4th year student, group 1


학습은 모의환자(SP)와 함께 형식적인 수업과 실습으로 시작됐고, 임상배치 체험이 이어져 실제 환자와의 공감을 관찰하고 실천할 수 있는 기회가 마련됐다. SP와의 세션은 실제 환자를 만나기 전에 연습할 수 있는 귀중한 기회를 제공했지만 [SP 시나리오의 허구성]과 [역할극의 당혹스러운 요소]가 한계로 보였다. 공식적인 가르침은 [비언어적 표현]보다는 [공감적 진술]에 중점을 둔 것으로 보고되었다.

Learning began with formal teaching and practice with simulated patients (SPs), followed by the experience of clinical placement, allowing opportunity to observe and practice empathy with real patients. Sessions with SPs afforded a valued opportunity to practice before meeting real patients, though the fictitious nature of SP scenarios and the embarrassment factor of role plays were seen as limitations. Formal teaching was reported to centre on empathic statements rather than non-verbal expression.

의과대학은 우리에게 공감을 가르칠 것입니다. 하지만 그것은 항상 언어적이고 우리가 전에 사용했던 공감을 매우 많이 가지고 있습니다. 하지만 그들은 당신의 끄덕임이나 눈맞춤 같은 것을 체크하지 않습니다. 그것은 정말 중요하지 않습니다. 토론, 5학년 학생, 그룹 3
Med school will teach us empathy but it's always verbal and there are so many types of empathy that we did use before, but they don't tick that box kind of, like your nod or your eye contact or whatever, it doesn't really matter. Discussion, Year 5 student, group 3


평가는 또한 공감 진술, 특히 객관적 구조 임상 검사(OSCE)에 초점을 맞췄고, 여기서 공감 기술은 [속임수]로 바뀌었다. 이런 고압적인 상황에서 말 그대로 '공감 상자 체크'를 하기 위해 학생들은 강제적이고 거짓된 공감 발언을 하는 것 외에는 대안이 없었다.
Assessments also focussed on empathic statements—particularly, Objective Structured Clinicals Examinations (OSCEs)—and here the art of empathy turned to artifice. In order to literally ‘tick the empathy box’ in these high-pressure situations, students had no alternative other than to make forced, fake empathic statements.

내 생각에 너는 체크박스가 된 것 같아, '힘들겠다' '정말 답답하다' '이런 일을 겪어야 해서 미안하다'. 하지만 10분간의 OSCE에서, 내가 정말 신경 썼을까? 이게 정말 무슨 의미가 있었나요? 편지, 4학년 학생, 1조
I think you became a tick-box, ‘that must be hard’ ‘really frustrating’ ‘sorry you've had to go through this’. But in a 10-minute OSCE, did I really care? Did this really mean anything? Letter, 4th year student, group 1


학생들은 시험에서 [감정이입 진술을 위조하는 관행]과 같은 아이러니를 보았다. 시험이 [가짜 공감을 평가하는 것]이 되기 때문이다.
Students saw irony in the practice of faking empathic statements in examinations, as the examination then becomes an assessment of fake empathy.

그러니까 어차피 가짜일 거고 공감하는 척을 얼마나 잘하는지 평가하시는 거에요. 토론, 4학년 학생, 1조
So it's gonna be fake anyhow and you are assessing how good you are at faking empathy. Discussion, 4th year student, group 1


학생들은 시험공감과 실생활공감이 별개라는 것을 인식했다.
Students recognised that examination empathy and real-life empathy were two different things.

분명히 시험에서는 단어라고 생각합니다. 하지만 병동에서는 컨설턴트를 보면 정해진 문구보다는 환자들과 어떻게 지내는지가 중요하다고 생각합니다. 컨설턴트들은 진술 없이 여전히 매우 공감해 왔다. 토론, 5학년 2반
I think definitely for exams it's the words, but I think on the wards, if you watch consultants, it's how you are with the patients rather than set phrases. Consultants have still been very empathetic, without the statements. Discussion, 5th year student, group 2


이 문제는 [SP를 사용하는 것]으로부터 강화되었는데, SP는 이미 non-authentic한 OSCE 설정에 추가적인 인공적 요소를 추가했기 때문이다.
The problem was augmented by the use of SPs, which adds an additional layer of artifice to the already non-authentic OSCE setting.

나는 SP에게 진짜 공감을 보여주는 것은 정말 어렵다고 생각한다. 마치 모든 것이 가짜이고, 그들이 배우라는 것을 알고 있고, 그것이 진짜가 아니라는 것을 알고 있다. 토론, 5학년 2반
I think it's really hard with the SPs to show any real empathy, like it's all fake, you know they are actors, you know it's not real. Discussion, 5th year student, group 2

현재의 검사 기반 시스템을 [임상 배치 중에 병원 지도교사와 GP가 내린 판단으로 대체]하는 등 평가에 대한 대안적 접근법이 제시되었다.
Alternative approaches to evaluation were suggested, including replacing the current exam-based system with judgments made by hospital tutors and GPs during clinical placement.

공감에서의 속임수의 문제는 평가에 국한되지 않았다. 실제로, 학생들은 공감하는 말을 속이는 것이 [실제 환경에서도 흔한 관행]이라는 것을 자유롭게 인정했습니다. 대화의 공백을 메우기 위한 장치로 '힘드시겠어요'와 같은 말을 사용하는 것이 일반적인 주제였다.
The problem of artifice in empathy was not confined to assessment. Indeed, students freely acknowledged that faking empathic statements was common practice in real-world settings too. A common theme was the use of statements like ‘that must be difficult’ as a device to fill gaps in conversation.

 

그들은 약간 단어 토사물처럼 되기 시작한다.
They start to become a bit like word vomit …

우리는 그것을 필러처럼 사용해왔습니다. 마치 여러분이 보통 멈췄을 때, 우리는 그것을 거기에 넣는 것을 배웠습니다. 토론 교류, 4, 5학년 학생, 2조
We have used it as our fillers, it's like, whenever you would have a normal pause, we have learned to put it in there. Discussion exchange, 4th & 5th year students, group 2


한 편지는 이것을 시로 표현했다:
One letter expressed this in poetry:

침묵은 시간이 생각할 수 있도록 많은 것을 말해준다.
탄산음료 같은 빈 충전재만 있는 게 아닙니다.
당신은 진정한 의미를 가질 수 있는 많은 잠재력을 가지고 있습니다.
하지만 강요된 말은 당신이 기울고 있는 방식입니다. 편지, 5학년 2반

Silence speaks volumes it allows time to think.
Not just empty fillers like a carbonated drink.
You have so much potential to really have meaning.
But forced words is the way you are leaning. Letter, 5th year student, group 2


가짜 공감이 감지되기 쉽다고 추론하면서, 학생들은 공허한 공감을 나타내는 말에 위화감을 느꼈습니다. 우리가 [공감적 불협화음]이라고 부르는 불편감입니다.
Reasoning that fake empathy is easy to detect, students felt a sense of discomfort around hollow empathic statements, a discomfort we have termed empathic dissonance.

제가 당신에 대해 가장 싫어하는 것은, 감정이입입니다. 우리가 거짓으로 말할 때, 우리는 진정성을 잃는다. 사람들은 이것과 그것을 바로 꿰뚫어 볼 수 있다… 그리고 나는 진심이 아닌 것처럼 보이고 싶지 않다. 편지, 4학년 학생, 1조
What I hate most of all about you, empathy, is when we are faking it, when we lose authenticity. People can see straight through this and its embarrassing… and I hate to seem not genuine. Letter, 4th year student, group 1





진정한 예술 공감 연습을 마스터하기 위해, 학생들은 [가장 가치 있는 교훈]은 [단어보다는 침묵에 있다]는 것을 나타낸다. 여기서 배우는 것은 모범적인 비언어적 의사소통을 보여주는 임상의사의 역할 모델에서 영감을 받아 공식적인 커리큘럼과 맞지 않는다.
In seeking to master the true art empathic practice, students indicate the most valuable lessons are more often in the silences rather than the words. Learning here is out-with the formal curriculum, inspired by clinician role models demonstrating exemplary non-verbal communication.

의대에서의 후반기를 향하면서 초점은 [당신이 말하는 것]에서 [당신이 말하는 방식]으로 바뀐다. … 목소리 톤을 바꾸고 조금 더 앉아서 눈을 마주칠 때처럼… 그리고 그것이 병원 의사들이 정말 잘하는 것입니다. 특히 완화의료 의사들 말입니다. 선배가 침대 옆에 무릎을 꿇는 의사들을 내가 보는 것만큼 자주 보는 것 같지는 않은데… 토론, 5학년 2반
The focus towards the later years in med school switches from what you say to how you say it… sort of when you change your voice tone and sit a bit further in making the eye contact… and that's what hospital doctors are really good at, especially… the palliative care physicians. I don't think I see doctors that senior get on their knees next to beds as often as I see them… Discussion, 5th year student, group 2


학생들은 또한 공감을 언제 적용할지를 선택하고 선택하는 법을 배우는 과정을 묘사했다. 어떤 환자들에게는 공감이 도전이였는데, 여기에는 자신을 도울 준비가 되어 있지 않은 사람들, 그리고 불평하거나 요구하거나 불친절해 보이는 사람들이 포함된다. [어려운 환자]에게는 당연히 공감능력이 더 어렵다는 인식과, 임상의가 이러한 상황에서 학생 공감능력에 악영향을 미쳐 [이러한 환자에 대한 학생의 냉소]를 증가시키고 있다는 인식 모두 있었다.

Students also described a process of learning to pick and choose when to apply empathy. For certain patients, empathy was a challenge, including those who seemed unprepared to help themselves and those who were otherwise complaining, demanding or unfriendly. There was both a sense that empathy is naturally more difficult for difficult patients, and also that clinicians were exerting an adverse influence over student empathy in these situations, increasing student cynicism in regard to these patients.

어려운 환자라고 생각되는 환자에게 공감하는 것은 어려울 수 있습니다. 토론, 4학년 학생, 2반
Patients you see as difficult, it can be difficult to be empathetic towards them… Discussion, 4th year student, group 2

또한, 여러분은 더 냉소적이 될 수 있습니다. 만약 여러분이 GP에 있고 GP가 '이 환자가 병원에 오는 것은 정말 그들에게 도움이 되지 않는다'와 같다면 그것은 여러분의 공감을 반대로 영향을 미칩니다. 토론 교환, 5학년 학생 두 명, 그룹 3
Also, you can become more cynical as well… if you are in GP and the GP is like ‘this patient coming in just really doesn't help themselves’ then that impacts your empathy the other way… Discussion exchange, two 5th year students, group 3

 

3.3 감수해야 할 짐
3.3 Empathy as a burden to bear

[다른 사람의 이야기에 자신을 담는 행위]는 특히 [우울하거나 불행한 상황에 직면한 환자]를 본 후에 감당해야 할, 상당한 부담으로 판명되었다. 시간이 지남에 따라, 그들은 환자 이야기의 감정적인 측면에 더 많이 노출됨에 따라, 학생들은 그들이 적응을 하고 그들의 동정심 있는 반응을 무시한다는 것을 인식한다.
The act of putting yourself in somebody else's story proved a significant burden to bear, especially after a run of patients who were either depressed or facing unfortunate circumstances. Over time, as they became more exposed to the emotional aspects of patient stories, students recognise they undergo an adaptation, a blunting of their compassionate response.

난 끝이야, 끝이야. 난 더 이상 신경 안 써. 여러분은 매일, 환자 한 명 한 명, 눈물 한 방울을 흘리고 있습니다. 항상 할 수는 없어요. 편지, 4학년 학생, 1조
I am so done, so done. I just don't care anymore. You are draining… day after day, patient after patient, tears after tears. I can't do it all the time. Letter, 4th year student, group 1

여러분은 공감할 수 있는 어려운 상황을 가진 환자들에게 노출되지만, 그것에 대해 무뎌져야 합니다. 그래서 그들을 사례로 더 많이 보세요. 토론, 4학년 학생, 3반
You're exposed to patients with difficult situations that you do empathise with, but you do have to become blunt to that, so see them more as cases. Discussion, 4th year student, group 3


어떤 상황에서는, 특히 정서적으로 '나쁜 곳'에 있는 경우, 공감 노력이 닿지 않는 것처럼 느껴졌다. 예를 들면, 학생 스스로가 평가의 압박으로 스트레스를 받거나, 원거리 배치에서 외로움을 느낄 때.
In some circumstances, the empathic effort felt out of reach, particularly if students themselves were in an emotionally ‘bad place’, for example when feeling stressed by the pressure of assessments, or lonely in a remote placement.

하지만 그 동안 너(=공감)에 대한 나의 감정은 시험받았고, 사실 3, 4학년 때 나는 너(=공감)에 대해 대부분 무시하고 잊어버렸어. 왜 그랬을까? 어쩌면 제가 의학에 대해 즐겼던 것을 잊었는지도 모릅니다. 어쩌면 우리가 배워야 할 터무니없는 양의 지식, 시험을 치르고, 아무도 없는 곳에 갇혀서 어떤 종류의 삶을 유지하는 것이 여러분보다 선례가 되었는지도 모릅니다. 편지, 5학년 1조
Along the way, however, my feelings towards you have been tested, in fact in 3rd and 4th year, I largely ignored and forgot about you. Why was this? Maybe I forgot what I enjoyed about medicine, maybe the ridiculous amount of knowledge we have to learn, the constant pressure of performing in exams, being stuck in the middle of nowhere and maintaining some sort of life took precedent over you. Letter, 5th year student, group 1


임상발표의 다양한 진단과 관리적 함의를 파악해야 하는 [인지부하]는 공감을 할 수 있는 공간을 적게 남겼다. 이와 관련하여 학생들은 '오토파일럿'에 대한 임상 추론의 상당 부분을 수행하는 숙련된 임상의에 비해 불이익을 느꼈습니다.
The cognitive load of grasping the various diagnostic and management implications of a clinical presentation left less space for empathy. With regard to this, students felt disadvantaged compared to experienced clinicians who do much of their clinical reasoning on ‘autopilot’.

...생각하는 시간의 압박도 있습니다. 그래서, 컨설턴트들과 함께, 그들의 주제를 알고 있는 좋은 사람들은 공감할 수 있는 그런 종류의 사고 시간을 가집니다. 그리고 그 상담, 즉 의학적 측면에서는 단지 2~3분 정도의 생각만 하면 됩니다. 토론 4학년 학생, 그룹 1
…there is also the thinking time pressure. So, with consultants, the nice ones, who know their subject back to front, they have that kind of thinking time to be empathetic and the consultation, the medical side of it, only takes like 2 or 3 minutes of their thinking. Discussion 4th year student, group 1


헤어진 편지들에서 특히 분명한 것은 ['시시한 것fluffy'으로서의 공감]의 개념이었다. 이것은 소중한 시간을 소비하고 평가를 통과하지 못하게 하는 [사소한 방해물]이다. 당신은 공감 부분이 아니라 과학 부분에서 배우는데, 왜 신경을 써야 하는가?
Especially apparent in the break up letters was the concept of empathy as ‘fluffy’, a trivial distraction that eats up precious time and does not get you through assessments—you learn from the science part, not the empathy part, so why bother?

우리가 추는 춤은 주요 이슈를 회피하고 끝없는 감정을 탐구하는 데 시간을 낭비하는 경향이 있다. 요점을 고수하고 잡다한 말fluff 없이 우리가 필요한 것을 말하는 것이 훨씬 간단하다. 편지, 5학년 2반
The dance we tend to do, skirting ‘round the main issue and wasting time exploring endless emotions. Much simpler just to stick to the point and say what we need without the fluff. Letter, 5th year student, group 2


일부 학생들은 공감해야 한다고 생각했을 때 공감을 경험하지 못한 것에 대해 잘못을 느끼고, 또 다른 공감 부담을 가중시켰다.
Some students were left feeling at fault for being unable to experience empathy when they thought they should, adding another layer of empathic burden.

공감은 또한 내가 나 자신이나 환자에 대해 [매우 다른 견해를 가진 사람들]과 같이 특정 환자들과 공감하려고 애쓸 때 죄책감을 느끼게 할 수 있다. 나는 어렵다고 느낀다. 편지, 4학년 2반
Empathy can also make me feel guilty when I struggle to empathise with certain patients such as those with very different views to my own or patients… I feel are difficult. Letter, 4th year student, group 2



학생들은 공감의 부담에 대처하기 위한 다양한 메커니즘을 가지고 있었다. 압도적으로, 가장 일반적인 대처 전략은 [또래 또는 가족과 함께 디브리핑]하는 것이었다. 다른 전략에는 정서적 고립이 포함되었고, 학생들은 순수하게 진료의 '과학'에 집중했다.
Students had a variety of mechanisms for coping with the burden of empathy. Overwhelmingly, the most common coping strategy was debriefing with peers or family. Other strategies included emotional detachment, with students concentrating purely on the ‘science’ of a consultation.

내 친구나 엄마랑 얘기하고 싶어 나는 어떤 기술도 있다고 생각하지 않는다. 그것은 단지 내가 어떤 속상한 상황에 대처하는 방법일 뿐이다. 토론, 4학년 학생, 3반
I feel like I would chat to my buddy about it, or my mum. I don't feel like there are any techniques, it's just how I would deal with any upsetting situation. Discussion, 4th year student, group 3

만약 그들이 울면서 들어와서 여러분이 과학에 집중한다면, 여러분은 그것을 피할 수 있을 것입니다. 하지만 여러분이 공감과 아이디어, 우려, 기대에 정말 열심히 노력한다면, 여러분은 빨려들어갈 것입니다. 토론, 4학년 학생, 1조
If they come in crying and you just focus on the science bit then you kind of get around it… but then if you try really hard on the empathy and the ideas, concerns, expectations, you get sucked in. Discussion, 4th year student, group 1


일반적으로 학생들은 [의과대학의 자원]으로 눈을 돌리기 보다는 [그들 자신의 대처 전략]을 찾았다. 어떤 사람들은 그들이 대화할 수 있다고 느끼는 배치당 적어도 한 명의 튜터를 찾기를 희망했지만, 배치의 일시적 성격은 전문적인 관계를 구축하는 것을 더 어렵게 만들었다.
Generally, students found their own coping strategies rather than turning to the resources of the medical school. Although some hoped to find at least one tutor per placement that they felt they could talk to, the temporary nature of placements made building professional relations more difficult.

…. 만약 당신이 당신이 친하게 지내는 그 튜터를 찾을 수 있다면, 그래서 각 블록에 대해 당신은 때때로 하나를 찾을 수 있지만, 당신은 다음 블록으로 이동한다. 토론, 4학년 학생, 1조
…. if you can find that tutor you get along with, so for me each block you can sometimes find one, but then you move blocks. Discussion, 4th year student, group 1


공감교육의 [잠재 교육과정]을 탐색하는 것 자체가 부담으로 작용했다. 학생들은 [공식 교육과정]이 공감의 가치를 증진시키는 반면, [잠재 교육과정]은 이를 폄하하는 경우가 많은 상황에서 위선을 보았다. 학생들은 환자의 아이디어, 우려 및 기대(ICE)에 대한 논의를 [적극적으로 방해하는 감독관]과 함께 일하는 현실적 과제를 설명했습니다.

Navigating the hidden curriculum of empathic teaching proved a burden in itself. Students saw hypocrisy in a situation in which the formal curriculum promotes the value of empathy, whilst the hidden curriculum is often disparaging of it. Students described the real-world challenge of working with supervisors who actively discourage discussions of patient's ideas, concerns and expectations (ICE).

그는 매번 ICE를 한다고 우리를 꾸짖는다.
He tells us off for doing like ICE every time.

네, ICE를 하면 문제가 생기죠 토론 교류, 4학년 학생, 1조
Yeah, we do ICE, we get into trouble. Discussion exchange, 4th year students, group 1

병원에서는 ICE에 대해 이야기하면 낙담당하거나 서두르기 때문에 우리의 관점을 바꾸게 됩니다. 이는 분명히 그들의 관리를 바꾸지 않기 때문에 '내가 단지 그것을 위해 그것을 하고 있는 것인가?'라고 생각하게 만듭니다. 이것은 공감에 대한 우리의 관점을 바꾼다. 토론, 5학년 2반
In hospital it is discouraged or hurried along if you talk about ICE, so this does change our view, it makes you think ‘am I doing it just for the sake of it?’ as clearly it does not change their management. This changes our view on empathy. Discussion, 5th year student, group 2

3.4 미덕으로서의 공감
3.4 Empathy as a virtue

특히 러브레터를 통해 학생들이 공감을 '더 나은' 사람으로, 더 사심 없는 사람으로 만드는 미덕으로 본다는 것이 특히 분명했다.
It was particularly apparent, especially through love letters, that students see empathy as a virtue, something that makes you a ‘better’, more selfless person.

타인에 대한 생각, 걱정, 기대는 당신의 존재의 중심이며, 나의 이기적인 영혼을 당신에게 끌어당긴 것은 바로 그 사심 없는 마음입니다. 편지, 4학년 학생, 1조
Ideas, concerns, and expectations of others is the centre of your being, and it is that selflessness that has drawn my selfish soul to you. Letter, 4th year student, group 1


공감은 [관련 이익의 집합]과 일치했으며, 그 중 다수는 [선순환적 함의]를 가지고 있다. 학생들은 공감이 [환자와의 연결, 관계와 신뢰 구축, 경청 및 돌봄의제 수립, 환자를 사례나 질병이 아닌 사람으로 대하는 길]이라고 판단했다. 환자에 대한 이해도 향상되면 관리 계획을 조정할 수 있는 등 실질적인 이점도 얻을 수 있습니다.
Empathy was aligned with a collection of associated benefits, many of which also have virtuous connotations. Students reasoned empathy was the route to

  • connecting with patients,
  • building rapport and trust,
  • establishing a listening and caring agenda and
  • treating patients as people, not cases or diseases.

Improved understanding of patients also yields practical benefits, such as being able to tailor management plans.

환자와의 관계와 발전, 그리고 신뢰 관계를 구축할 수 있게 해주셔서 정말 좋습니다. 편지, 4학년 2반
I love how you enable me to build rapport and develop and a trusting relationship with patients. Letter, 4th year student, group 2

공감은 지속적으로 제가 환자에게 더 나은 치료를 제공할 수 있도록 허락한다. 환자를 전체적으로 고려함으로써, 질병 이외의 복잡한 요구를 가진 누군가가... 당신이 없는 저를 상상하고, 그 숫자를 상상하세요. 편지, 4학년 3반
You continuously allow me to provide patients with better care …. through considering the patient as a whole, someone with complex needs other than a disease… imagine me without you, imagine the number. Letter, 4th year student, group 3


공감능력이 보다 효과적인 학습과 연결되었는데, 그 이유는 공감능력이 환자와의 교육적 만남을 더 기억에 남도록 만들기 때문이다.
Empathy was linked to more effective learning, largely because it made educational encounters with patients more memorable.

공감은 당신이 더 많은 공감을 가졌을 때의 경험을 기억하게 한다고 생각한다. 여러분이 무언가에 더 관심을 가질 때, 여러분은 그것을 더 잘 기억할 것입니다. 공감을 더 많이 할 때 학습에 도움이 된다고 생각해요. 토론, 4학년 학생, 1조
I just think it makes you remember experiences when you have more empathy involved. When you care more about something you are going to remember it better… I think it does help your learning when you have more empathy. Discussion, 4th year student, group 1


공감은 또한 전문적 정체성과 밀접한 관련이 있었고, 의대에 [입학하는 동기]와 그곳에 [남아 있는 이유] 둘 다로 보였다.
Empathy was also closely linked to professional identity and was seen both as a driver for entering medical school and reason for remaining there.

공감은 우리가 의대를 시작한 이유였습니다. 모든 예비 학생들은 동기부여와 필수품으로 인용했습니다. 편지, 5학년 2반
You were the reason we started medical school; cited by every prospective student as a motivator and a necessity. Letter, 5th year student, group 2

공감과 함께라면 저는 이 정도 수준의 함정과 높은 수준을 따라잡을 수 있을 것 같습니다. 왜냐하면 궁극적으로 여러분이 제가 이 일을 하는 이유라는 것을 상기시켜주기 때문입니다. 편지, 4학년 학생, 1조
Together I think I can keep up with the pitfalls and heights of being in this degree, because ultimately you remind me that you're the reason why I’m doing this. Letter, 4th year student, group 1

4 토론
4 DISCUSSION


이 정성적 연구는 의과대학 4학년이 될 때까지 학생들이 환자에 대한 공감을 어떻게 느끼는지 이해하기 위해 LBM을 활용했다. 학생들이 보고한 이별 감정 중 일부를 고려하는 것은 특히 흥미롭다. 왜냐하면 이러한 감정들이 우리가 공감의 쇠퇴를 이해하는 데 도움이 될 수 있기 때문이다.

This qualitative study has utilised LBM to understand how students feel about empathy for patients by the time they reach the senior years of medical school. It is particularly interesting to consider some of the break up feelings that students reported, because these may help us to understand empathic decline.

아마도 가장 인상적인 발견은 [가짜 공감]과 관련이 있을 것이고, 학생들은 '그 말을 들으니 유감이다'와 같은 공감하는 진술이 종종 불성실하다는 것을 자유롭게 인정한다. 이는 배치와 평가 설정, 특히 OSCE 모두에 해당했다. 연구는 이전에 의료 교육 및 실습에서 가짜 공감을 강조했습니다. 또한, PA(Physicien Associate) 학생을 대상으로 한 연구는 OSCE의 공감 평가와 동일한 과제를 보고한다. 학생들은 문자 그대로 '공감 상자'를 클릭하도록 강요받고 그들이 진정으로 의도하지 않은 감정 표현을 억지로 외운다. PA학생에 대한 연구와 마찬가지로, 이 연구는 의대생들이 공감 부조화를 경험한다는 것을 확인했다. [공감 부조화]란 [진짜 의도하지 않은 공감의 진술을 하도록 강요당했을 때 학생들이 느끼는 불편함]을 뜻한다. 우리의 데이터는 또한 이러한 진정성 부족, 평가 시스템에 대한 좌절, 공감 부조화 문제가 공감 실천에 대한 일반적인 학생의 냉소를 키울 위험이 있음을 시사한다. 이러한 냉소주의는 다른 곳에서 보고되었고 학생들이 진정한 공감 실천에서 멀어지게 할 위험이 있다. 
Perhaps the most striking finding relates to fake empathy, with students freely acknowledging that empathic statements like ‘I am sorry to hear that’ are often insincere. This was true both for placement and for assessment settings, particularly OSCEs. Research has previously highlighted fake empathy in medical education and practice.36-38 Furthermore, research with Physician Associate (PA) students38 reports identical challenges with the assessment of empathy in OSCEs: students feel compelled to literally ‘tick the empathy box’ and force out rote empathic statements that they do not truly mean. As with research on PA students, this study has identified that medical students experience empathic dissonance38—the discomfort students feel when are forced into making statements of empathy they do not truly mean. Our data also suggest that this lack of authenticity, frustration with the assessment system and the problem of empathic dissonance risk breeding a general student cynicism towards the practice of empathy. This cynicism has been reported elsewhere and risks turning students away from authentic empathic practice.13

[공감의 불성실성insincerity]에 대한 우리의 발견은 [공감적 진술]에 중점을 두고 있지만, 우리는 이러한 유형의 진술을 평가절하하고 싶지 않다. 진료에 관한 모델들은 [공감적 진술]의 authentic한 사용을 정확히 지지한다. 시뮬레이션된 환자(SP)를 사용한 연구는 인간 연결의 가치를 확인한다. 그러나, 이 같은 연구는 또한 [공허한 공감적 진술]이 흔하게 발견되고, 환자를 좌절시킬 위험이 있다는 것을 시사한다. 교육자들에게 [공감적 진술]에 대해 균형 잡힌 시각을 가지고, 그들의 장점뿐만 아니라 한계도 인정하면서, 또한 비언어적 의사소통의 가치를 증진시킬 것을 제안한다. 본 연구의 학생들은 환자의 머리맡에 무릎을 꿇는 시간을 갖는 임상의들의 바디랭귀지에 감명을 받았고, 이에 대한 지지는 공감적 경청을 중심으로 문헌에 나와 있다. 

Whilst our findings regarding insincerity in empathy centre on the empathic statement, we do not wish to devalue this type of statement. Models of the consultation rightly support its authentic use.39 Research with simulated patients (SPs) confirms their value in establishing a human connection.40 However, this same research also suggests that hollow statements of empathy are easy to detect and risk frustrating the patient.40 We propose that educators take a balanced view on empathic statements, acknowledging their merits but also their limitations, whilst also promoting the value of non-verbal communication. Students in this study were impressed by the body language of clinicians who take the time to kneel by the patient's bedside, and there is support for this in the literature around empathic listening.40-42

['감정노동']과 [연민 피로]로서의 공감의 개념은 실제 임상의에 대한 연구에서 확립된다. 우리의 데이터는 또한 학생들이 [너무 많은 공감적 참여]가 [정서적 소진]으로 이어질 것을 두려워한다는 것을 확인시켜준다. 여기에 발표된 증거는 이 우려를 뒷받침하는 일부 연구와 반박하는 다른 연구로 모순된다. 그러나 [공감이 번아웃으로 연결될 위험이 있다는 단순히 인식]이 학생들을 환자에 대한 공감에서 멀어지게 할 수도 있다. 본 연구는 또한 학생들의 공감을 저해할 수 있는 유사한 잠재력을 가진 숨겨진 교육과정 내의 요소들을 강조한다. 의학교육이 '과학적인 것'을 우선시하는 경향과 임상실천에서 공감할 시간이 없음을 암시하는 부정적 역할모델링 등 일부 요인은 이전에 보고되었다. 
The concepts of empathy as ‘emotional labour43 and compassion fatigue44 are established in research with practising clinicians. Our data confirm that students also fear that too much empathic engagement leads to emotional burnout. Published evidence here is contradictory, with some research to support this concern45, 46 and other research to refute it.46 However, simply the perception that empathy risks burnout may turn students away from empathy for patients. This study also highlights factors within the hidden curriculum11 with similar potential to deter student empathy. Some factors have been previously reported, including the tendency for medical education to prioritise the ‘science stuff’47 and the negative role modelling that implies there is no time for empathy in the real world of clinical practice.38

또한 우리의 자료에서 그리고 이전에 PA 학생 연구에서 보고된 것은 의학교육의 경향으로 [일부 환자들은 공감할 자격이 있지]만, [다른 환자들은 공감할 자격이 없다]고 믿도록 학생들을 사회화하는 것이다. 학생들은 감독관들이 '어려운' 환자에 대해 하는 부정적인 논평에 영향을 받았다. 공감에 대한 그녀의 글에서, Halpern은 [의료진을 향한 도전적인 행동]이 때로는 [도움을 요청하는 외침]이라는 것을 상기시킨다. 샤피로는 내집단을 위한 공감을 유보하고, 외집단을 배제하지 말라고 경고한다. 모든 환자를 '무조건적 긍정적 존중'으로 대하라는 로저스의 문구는 완벽함을 위한 조언이지만, 교육자들이 학생들에게 소통할 수 있는 전문적인 기준으로 남아 있다.
Also evident in our data, and previously reported in PA student research,38 is the tendency of medical education to socialise students into the belief that whilst some patients ‘deserve’ empathy, others do not. Students were influenced by negative comments supervisors make about ‘difficult’ patients. In her writing on empathy, Halpern reminds us that challenging behaviours are sometimes a cry for help.48 Shapiro cautions against reserving empathy for in-groups and excluding out-groups.47 Rodgers’ phrase of holding all patients in ‘unconditional positive regard’49 is a counsel of perfection, but remains a professional standard for educators to communicate to students.

본 연구의 학생들은 회복탄력성에 대한 선행연구와 마찬가지로, 회복탄력성이 낮을 때 공감적 진료상담이 이루어지기 어렵다는 것을 알 수 있다. 특히 회복탄력성을 감소시킨 두 가지 요인은 [평가에 대한 스트레스]와 [원격 배치의 외로움]이었다. 외로움은 학생들이 동료들로부터 지지를 구하는 것을 확인한 주요 대처 전략에 반한다. 학생들은 학교의 자원보다 동료들에게 더 쉽게 의지했다. 교육자들은 또한 학생들이 배치를 통해 자주 로테이션할 때 임상 멘토를 찾기 어렵다는 것을 알아야 한다. 이것은 회복력에 부정적인 영향을 미칠 수 있으며 종적 통합 임상실습에 대한 잠재적인 논쟁거리이다. 
As with previous research on resilience,44, 45, 50 students in this study indicate that when resilience is down empathic consulting is difficult to achieve. Two factors which particularly reduced resilience were the stresses of assessments and the loneliness of remote placements. Loneliness militates against the main coping strategy that students identified that of seeking support from peers. Students more readily turned to peers than to the resources of the school. Educators should also be aware that students find clinical mentors difficult to find when frequently rotating through placements. This may have adverse effects on resilience and is a potential argument for longitudinal integrated clerkships.51

[미덕으로서의 공감]이라는 주제는 학생들이 공감을 직업 정체성에 맞추고, 의학을 선택하는 주요 동기로 인용하면서 데이터를 통해 강하게 흘러갔다. 이러한 미덕적 측면은 임상적 공감의 진정한 본질과 그것이 의학 교육 내에서 어떻게 간주되어야 하는지에 대한 철학적, 존재론적 고려를 제기한다. 미덕이 특성, 즉 인간의 속성이라는 것을 감안할 때, 우리는 공감을 같은 방식으로 보아야만 할까요? 블룸의 분류학에서 공감은 기술보다 태도에 가까운가? 연구자들은 현대 의학 교육이 공감을 [기술]로서 가르치고 평가하는 데 너무 중점을 두고 있으며, 공감이 한 인간human being이 다른 사람에게 빚진owes to 자질이라는 개념을 과소평가한다고 주장해왔다. 
The theme of empathy as a virtue ran strong through the data, with students aligning empathy to professional identity and citing it as a prime motivator for choosing medicine. These virtue aspects raise philosophical and ontological considerations as to the true nature of clinical empathy and how it should be regarded within medical education. Given that virtue is a trait, a human attribute, should we regard empathy in the same way? In terms of Bloom's taxonomy,52 is empathy closer to an attitude than a skill? Researchers have argued that contemporary medical education puts too much emphasis on teaching and assessing empathy as a skill and undervalues the notion that empathy is a quality that one human being owes to another.48

기술에서 벗어나 태도 또는 더 나은 속성으로 패러다임 전환을 통해 본 논의에서 제기된 몇 가지 문제에 대한 가능한 해결책을 제시합니다. OSCE의 경우, 교육자들은 공감의 '보여주기shows'와 '수행능력'를 평가하는 효용성을 재고할 수 있다. '보여주기shows'와 '수행능력'은 [정확히 OSCE가 밀러의 피라미드에서 차지하는 수준]이기 때문이다. [공감을 '존재의 방식'으로 여기는 교육자들]은 [동정심을 보이는 것] 만으로는 [진정한 공감 행위]와 동일시되지 않는다는 것을 인식하고, 두 가지를 혼동하는 평가를 거부할 가능성이 높다. 공감을 조금이라도 평가하려면 본 연구에서 학생들이 제안한 대로 튜터가 실제 임상 배치 판단을 선호할 것이다. 샤피로는 의학교육 내에서 [공감적 진료상담의 기풍]에 중점을 둔다면, 학생들은 현재 의학 문화에서 아웃그룹으로 간주되는 어렵고 도전적인 환자들에 대한 공감을 찾기 위해 더 많은 노력을 기울일 것이라고 주장한다. [공감의 미덕적 측면]을 재확인하는 것은 학생들이 숨겨진 교육과정 안에 내포된 다른 부정적인 메시지들을 극복하는데 유사하게 도움이 될 수 있다.

A paradigm-shift away from skills and towards attitudes—or perhaps better, attributes—presents possible solutions to some of the problems raised in this discussion. In the case of OSCEs, educators may reconsider the utility of assessing ‘shows’ and ‘performances’ of empathy, for ‘show’ and ‘performance’ is precisely the level the OSCE occupies in Miller's pyramid.53 Educators who regard empathy as a ‘way of being’8 are more likely to recognise that the mere show of compassion does not equate to the true act, and would reject an assessment that confuses the two.54 If empathy is to be assessed at all, our preference would be real-world clinical placement judgments made by tutors, as suggested by students in this study. Shapiro argues that if emphasis is made on committing to an ethos of empathic consulting within medical education, students would be more likely to stive to find empathy for those difficult and challenging patients who are currently regarded as outgroups in the culture of medicine.47 Reaffirming the virtue aspects of empathy may similarly help students overcome other negative messages implied within the hidden curriculum.

4.1 제한 사항
4.1 Limitations

본 연구의 주된 한계는 한 기관에 국한되어 있다는 것이다. 비록 통합 커리큘럼과 커뮤니케이션 교육이 많은 다른 서양 학교들과 비슷할 것으로 예상하지만, 가르침에 관한 일부 연구 결과는 이 학교에 특별할 수 있다. 우리는 학교가 커뮤니케이션 교육에 널리 채택된 [캘거리 캠브리지 모델]을 사용하고, 대부분의 학교에서 비슷하게 사용되는 SP와의 세션을 포함하여 초기에 대학 기반 커뮤니케이션 교육을 집중하는 관행을 기반으로 한다. OSCE를 통한 커뮤니케이션 능력 평가는 다른 기관에서도 널리 채택되고 있다. 예를 들어, HYMS 학생들은 1학년, 2학년, 3학년 때 종합 OSCE를 가졌다. LBM 방법론은 데이터 수집이 포커스 그룹에서만 이루어졌다는 것을 의미했으며, 이는 이러한 그룹의 공공성에 대해 우려하는 일부 학생들의 보다 민감한 기여를 방해했을 수 있다. 우리의 코호트는 여성이 남성보다 더 많은 공감을 보인다는 증거를 고려할 때, 여성 대 남성 비율이 3:1이었다. 이것은 또한 소견의 전달 가능성에 영향을 미칠 수 있다.

The principle limitation of this research is that it is confined to one institution. Some findings regarding teaching may be specific to this school, although we anticipate its integrated curriculum and communication teaching are similar to many other Western schools. We base this assumption on the school's use of the widely adopted Calgary Cambridge55 model for communication teaching, and the practice of concentrating university-based communication teaching in the early years, including sessions with SPs, which are similarly utilised in the majority of schools.56 The assessment of communication skill through OSCEs is also widely adopted in other institutions—for context, HYMS students had summative OSCEs in 1st, 2nd and 3rd years. LBM methodology meant data collection was exclusively from focus groups, which may have hindered more sensitive contributions from some students concerned about the public nature of these groups. Our cohort had a female to male ratio of 3:1, given the evidence that females demonstrate more empathy than males,57, 58 this may also affect the transferability of findings.

5 LBM 반사
5 LBM REFLECTIONS

의학 교육 연구에서 LBM의 첫 번째 사용이기 때문에, 우리는 방법론에 대한 간략한 반성을 제공한다.
As this is the first use of LBM has in medical education research, we offer brief reflections on the methodology.

사랑과 이별의 편지는 여기서 의인화, 은유, 과장, 심지어 시를 포함한 고조되고 비유적인 언어를 요구한다. 이 글은 더 다채롭다. 그것은 흥미와 참여를 높이며, 그렇지 않으면 추상적인 주제가 될 수 있는 것에 대한 토론을 부추긴다. 그 편지들은 또한 우리의 연구 분석에 우리를 참여시켰다. 창의적인 글쓰기는 더 풍부한 메시지를 전달하고 더 풍부한 메시지는 분석을 위한 더 풍부한 데이터로 변환됩니다. LMB는 [모든 그룹 구성원이 초기 음성을 가질 수 있도록] 하여, 조용한 구성원이 수다스러운 구성원에 의해 가려질 수 있는 포커스 그룹의 한계를 완화한다. [큰소리로 편지를 읽는 것]도 토론이 이어질 수 있는 쇄빙선 역할을 한다. 마지막으로, 편지는 포커스 그룹 내용을 보완합니다. 즉, 분석을 위한 증가된 데이터를 제공합니다.
Love and break up letters call for heightened, figurative language, here including personification, metaphor, hyperbole, even poetry. This writing is more colourful. It elevates interest and engagement, fuelling discussion around what could otherwise be an abstract topic. The letters also engaged us in our research analysis. Creative writing communicates richer messages and richer messages translate to richer data for analysis. LMB allows all group members to have an initial voice, mitigating a limitation of focus groups that quieter members may be over-shadowed by talkative ones.59 Reading letters aloud also acts as an icebreaker for the discussion to follow. Finally, the letters supplement the focus group transcripts: they provide increased data for analysis.

물론 한계가 있다. 사랑과 이별의 편지는 본질적으로 이분법적이어서 극적 대립에 초점을 맞추고 그 사이의 회색 음영을 희생시킨다. 포커스 그룹 진행자들은 이것을 유념할 필요가 있다. 진행자들은 또한 창의적인 글쓰기를 경계하고 그들의 편지를 읽는 것을 부끄러워하는 참가자들에게 민감할 필요가 있다. 실제 수준에서, 쓰기 과제는 본 연구에서 20-30분을 추가하여 포커스 그룹의 기간을 연장한다.
Of course, there are limitations. By their nature, love and break up letters are dichotomous, risking a focus on polar opposites and sacrificing shades of grey between. Focus group moderators need to be mindful of this. Moderators also need to be sensitive to participants who are wary of creative writing and embarrassed to read their letters. On a practical level, the writing task extends the duration of the focus group, adding 20-30 minutes in this study.

6 결론
6 CONCLUSION

본 연구는 의과대학 재학 중 환자에 대한 학생 공감의 질적 변화를 확인한다. 학생들은 먼저 [공감적 진술]을 배우고 나서, 그들의 의사소통 연습을 [더 자연스러운 어구 및 비언어적 표현]을 포함하도록 진화시킨다. 그러나 그들은 또한 현재의 평가 방법에 의해 악화되는 문제인 [공감적 진술을 위조하는 법]을 배운다. [연민적 의사소통의 장벽]에는 [공감 부담, 부정적인 역할 모델링, 어려운 환자에게 연민적 접근 방식을 채택하는 문제]가 포함된다. 이러한 장벽에도 불구하고, 학생들은 계속해서 공감을 미덕으로 인식하고 기술에 숙달된 임상의로부터 긍정적인 동기를 얻는다. 조사 결과를 바탕으로 교육자의 주요 요점을 제시합니다(표 3).

This study confirms qualitative changes in student empathy for patients during their time in medical school. Students first learn empathic statements and then evolve their communication practice to incorporate more natural turns of phrase and non-verbal expression. However, they also learn to fake empathic statements, a problem exacerbated by current assessment methods. Barriers to compassionate communication include empathic burden, negative role modelling and the challenges of adopting a compassionate approach for difficult patients. Despite these barriers, students continue to identify with empathy as a virtue and take positive motivation from those clinicians who demonstrate mastery of the art. Based on our findings, we include key points for educators (Table 3).



표 3. 교육자의 주요 사항
Table 3. Key points for educators

  • 의대생들은 배치와 평가 환경 모두에서 종종 [가짜 감정 표현]을 하는 것을 자유롭게 인정해야 한다.

    교육자들은 [공감적 진술의 장점과 한계]를 모두 가르쳐야 하며, 또한 [비언어적 의사소통의 중요성]을 인정해야 한다.

    의대생들은 [연민 피로]를 두려워하고, 특히 고부담 시험의 시기나 고립된 장소에서 외로움의 위험이 있을 때 [회복탄력성]을 향상시키기 위한 전략으로부터 이익을 얻을 것이다.

    교육자는 OSCE와 같이 [공감적 퍼포먼스와 진실된 상태를 혼동하는 임상 평가]를 경계해야 한다.

    학생들은 공감을 미덕으로 보고, 의학교육은 공감을 기술로 간주하고 그것을 속성, 즉 환자와 함께 있는 방식으로 다시 구상하는 것에서 벗어나 패러다임 전환을 받아들여야 한다.


    Medical students freely admit to making frequent fake empathic statements, in both placement and assessment settings.
  • Educators should teach both the merits and the limitations of empathic statements, and also acknowledge the importance of non-verbal communication.
  • Medical students fear compassion fatigue and would benefit from strategies to improve resilience, especially around the time of high stakes examinations or when at risk of loneliness in remote placements.
  • Educators should be wary of clinical assessments, like OSCEs, that confuse performances of empathy with the authentic state.
  • Students see empathy as a virtue and medical education should embrace a paradigm-shift away from regarding empathy as a skill and re-envisioning it as an attribute, a way of being with patients.

 

 


Med Educ. 2021 Mar;55(3):394-403. doi: 10.1111/medu.14403. Epub 2020 Nov 17.

How medical school alters empathy: Student love and break up letters to empathy for patients

Affiliations collapse

Affiliations

1Health Professions Education Unit, Hull York Medical School, York, UK.

2Google Inc, Mountain View, CA, USA.

3Division of Medical Education, School of Medical Sciences, Faculty of Biology, Medicine and Health, The University of Manchester, Manchester, UK.

PMID: 33128262

DOI: 10.1111/medu.14403

 

Abstract

Introduction: Medical education is committed to promoting empathic communication. Despite this, much research indicates that empathy actually decreases as students progress through medical school. In qualitative terms, relatively little is known about this changing student relationship with the concept of empathy for patients and how teaching affects it. This study explores that knowledge gap.

Methods: Adopting a constructivist paradigm, we utilised a research approach new to medical education: Love and Breakup Letter Methodology. A purposive sample of 20 medical students were asked to write love and break up letters to 'empathy for patients'. The letters were prompts for the focus group discussions that followed. Forty letters and three focus group discussions were thematically analysed.

Results: The three major themes were: art and artifice; empathic burden; and empathy as a virtue. Students were uncomfortable with the common practice of faking empathic statements, a problem exacerbated by the need to 'tick the empathy box' during examinations. Students evolved their own empathic style, progressing from rote empathic statements towards phrases which suited their individual communication practice. They also learned non-verbal empathy from positive clinician role-modelling. Students reported considerable empathic burden. Significant barriers to empathy were reported within the hidden curriculum, including negative role-modelling that socialises students into having less compassion for difficult patients. Students strongly associated empathy with virtue.

Conclusions: Medical education should address the problem of inauthentic empathy, including faking empathic s in assessments. Educators should remember the value of non-verbal compassionate communication. The problems of empathic burden, negative role modelling and of finding empathy difficult for challenging patients may account for some of the empathy decline reported in quantitative research. Framing empathy as a virtue may help students utilise empathy more readily when faced with patients they perceive as challenging and may promote a more authentic empathic practice.

자기조절학습의 리뷰: 여섯 개 모델과 네 개의 연구방향(Front Psychol. 2017)
A Review of Self-regulated Learning: Six Models and Four Directions for Research
Ernesto Panadero*

 

 

서론
Introduction

자기조절학습(SRL)은 학습의 인지적, 동기적, 감정적 측면을 이해하기 위한 핵심 개념 프레임워크이다. SRL은 학자들이 SRL과 메타인식을 구별하기 시작한 최초의 논문 이후 교육심리학에 큰 기여를 했다. 이후 SRL 이론 분야의 출판물은 개념적 발전 측면에서 증가 및 확장되었으며, 현재 SRL의 여러 모델이 존재한다. 2001년, 보카르트, 보르코프스키, 핀트리히, 윈, 짐머먼의 이론적인 리뷰가 출판되었다. 그러나 이 분야는 2001년 이후 크게 발전했다.

Self-regulated learning (SRL) is a core conceptual framework to understand the cognitive, motivational, and emotional aspects of learning. SRL has made a major contribution to educational psychology since the first papers in which scholars began to distinguish between SRL and metacognition (e.g., Zimmerman, 1986; Pintrich et al., 1993a). Since then, publications in the field of SRL theory have increased and expanded in terms of conceptual development, and there are now several models of SRL (Sitzmann and Ely, 2011). In 2001, a theoretical review was published (Puustinen and Pulkkinen, 2001) that included the most relevant models at that time–those articulated by Boekaerts, Borkowski, Pintrich, Winne, and Zimmerman. However, the field has developed significantly since 2001.

  • 이러한 진화의 첫 번째 징후는 SRL의 영향에 대한 세 가지 메타 분석이 있다는 것이다: 디그너와 뷔트너(2008년), 디그너 외 연구진(2008년), 시트만과 엘리(2011년).
  • 두 번째 지표는 교육심리학 분야에서 2001년에는 존재하지 않았던 새로운 SRL 모델이 현재 존재한다는 것이다.
  • 마지막으로, 세 번째 측면은 SRL을 평가하기 위해 확립된 다양한 방법을 제시하는 새로운 핸드북이 있다는 것이다.
  • A first sign of that evolution is that there are now three meta-analyses of the effects of SRL: Dignath and Büttner (2008)Dignath et al. (2008), and Sitzmann and Ely (2011).
  • A second indicator is that there are now new SRL models in the educational psychology field that did not exist in 2001 (e.g., Efklides, 2011Hadwin et al., 2011, in press).
  • And lastly, a third aspect is that there is a new handbook1 (Zimmerman and Schunk, 2011) that presents a variety of established methods to evaluate SRL.

이전 핸드북과 비교하여, 최근의 핸드북에는 새로운 모델을 제시하는 데 전념하는 섹션이 없으며, SRL의 특정 측면(예: 기본 도메인, 교육 문제, 방법론 문제)에 초점을 맞추고 있으며, 이는 해당 분야가 발전하여 보다 성숙한 단계에 도달했음을 보여준다. 
Compared to the previous handbook (Boekaerts et al., 2000), the recent handbook has no sections dedicated to presenting new models, being focused on specific aspects of SRL (e.g., basic domains, instructional issues, methodological issues), which shows that the field has evolved and reached a more mature phase.

따라서 SRL 모델의 개발을 기반으로 알려진 것을 비교하고 이론적 및 실제적 함의가 무엇인지 추출하여 재분석해야 할 때입니다. 따라서 본 검토의 목적은 다양한 SRL 모델을 이에 따라 분석하고 최신 기술 및 이용 가능한 새로운 경험적 데이터와 비교하는 것이다. 
It is time, then, to reanalyze what is known based on the development of SRL models by comparing them and extracting what are the theoretical and practical implications. Therefore, the aim of this review is to analyze and compare the different SRL models accordingly with the current state of the art and the new empirical data available.

방법들
Methods

포함 기준
Criteria for Inclusion

이론적, 경험적 배경이 통합된 모델만 포함이 고려되었다. 모델을 선택하는 기준은 다음과 같다.
Only models with a consolidated theoretical and empirical background were considered for inclusion. The criteria to select a model were that

  • (a) JCR 저널 또는 SRL 핸드북에 게시되어야 하므로 동료 검토를 거쳐야 한다.
  • (b) 영어로 작성되어야 한다.
  • (c) 최소 인용 수가 있어야 합니다.
  • (a) it should be published in JCR journals or SRL handbooks, thus peer-reviewed;
  • (b) it should be written in English; and
  • (c) it should have a minimum number of cites.

2010년 이전에 발표된 모델에는 최소 500개의 참조 자료가 있어야 한다. 이 모델이 2010년 이후에 출판되었다면 적어도 연간 20개의 인용구가 있어야 한다.
Models published earlier than 2010 should have at least 500 references. If the model was published after 2010, it should at least have 20 cites per year.

선택 과정
Selection Process

첫 번째 단계로 2001년 검토에 포함된 모델 중 어떤 모델이 여전히 활발히 사용되고 있는지를 분석하였다. Boekaerts, Winne, Zimmerman의 모델은 널리 사용되고 있으며 저자들은 최신 핸드북(2011)에 발표된 활발한 SRL 학자들이다. 그러나 2001년 리뷰의 다른 두 모델인 핀트리히와 보르코프스키를 더 고려해야 했다. 핀트리히는 불행히도 그의 연구를 더 발전시킬 수 없었지만, 그의 모델과 그에 기반한 설문지인 학습 동기 부여 전략 설문지(MSLQ)는 여전히 연구에 널리 사용되고 있다. 메타인식에 강한 기반을 두고 있는 보르코프스키 외 연구진(2000)의 모델은 최근 몇 년간 SRL 분야 개발에서 존재감이 떨어졌고, 주요 저자는 자신의 연구 초점을 '예외성'(예: 학습장애)으로 옮겼다. 그러므로, 그것은 제외되었다.

As a first step, it was analyzed which of the models included in the 2001 review were still actively used. The models by Boekaerts, Winne, and Zimmerman were included as they are widely used and the authors are active SRL scholars who published in the latest handbook (2011). However, the two other models from the 2001 review–Pintrich and Borkowski–needed further consideration. Pintrich was, unfortunately, not able to develop his work further (Limón et al., 2004), but his model and the questionnaire based on it, the Motivated Strategies for Learning Questionnaire (MSLQ) (Pintrich et al., 1993b), are still widely used in research (e.g., Moos and Ringdal, 2012). Borkowski et al.’s (2000) model, which has a strong basis in metacognition, has had less of a presence in the development of the SRL field in recent years, and the main author has transferred his research focus to “exceptionality” (e.g., learning disabilities). Therefore, it was excluded.

두 번째 결정은 새로운 모델을 고려하는 것이었다. 두 가지 조치가 취해졌다.
The second decision was to consider new models. Two actions were taken.

  • 첫째, 2001년부터 "자기조절학습모델"이라는 용어를 사용하여 PsycINFO에서 문헌 검색을 수행하였다.
  • 두 번째로, 나는 8명의 SRL 동료들에게 새로운 모델을 식별하도록 요청했다.
  • First, a literature search was performed in PsycINFO using the term “self-regulated learning model” from 2001 onward.
  • Second, I asked eight SRL colleagues to identify new models.

5개의 새로운 모델이 확인되었다. Efklides'(2011) 모델은 감정과 동기가 메타인지와 상호 작용하는 방식을 탐구하며, Boekaerts'와 비교하여 학생들의 하향식/하향식 처리에 대한 다른 해석을 제공하여 SRL에 대한 이해를 넓힌다. Hadwin 등의 모델은 SRL 분야에서 새로운 연구 라인이 되어온 학습 규제의 사회적 측면을 다룬다. 또한, 다음 세 가지가 고려되었다.
Five new models were identified. Efklides’ (2011) model explores how emotion and motivation interact with metacognition, and offers a different interpretation of students’ top–down/bottom–up processing in comparison to Boekaerts’, thereby broadening our understanding of SRL. Hadwin et al.’s (2011, in press) model addresses the social aspects of the regulation of learning, which has been an emerging line of research within the SRL field (Panadero and Järvelä, 2015). Additionally, three others were considered:

  • (a) Wolters(2003)는 동기부여 규제에 중점을 두고 있다.
  • (b) 아제베도 외. (2004) 이는 Winne과 동료의 작업을 기반으로 하며 SRL의 마이크로 레벨 분석을 설명한다.
  • (c) 슈미츠와 비제(2006)는 짐머만의 모델을 기반으로 몇 가지 수정을 제안한다.

  • (a) Wolters (2003), which has a strong focus on motivation regulation;
  • (b) Azevedo et al. (2004), which builds upon the work of Winne and colleagues (e.g., Azevedo and Cromley, 2004, p. 525, fourth paragraph) and describes a micro-level analysis of SRL; and
  • (c) Schmitz and Wiese (2006), which takes Zimmerman’s model as a foundation and proposes some tweaks.

이 세 가지 모델은 관련성이 있고 학자들은 SRL에 대한 중요한 경험적 연구를 수행했지만, 두 가지 이유로 포함하지 않기로 결정했다.
While these three models are relevant and the scholars have conducted important empirical research on SRL, it was decided not to include them for two reasons.

  • 첫째, Wolters는 동기 부여에 중점을 두고 있으며, SRL 구성 요소의 전체 스펙트럼을 다루지 않는다.
  • 둘째, 아제베도 외 연구진(2004)과 슈미츠와 비제(2006)는 이미 포함된 다른 두 모델(각각 윈과 짐머만)과 상당한 유사성을 가지고 있다.
  • First, Wolters has a strong focus on motivation and does not cover the whole spectrum of SRL components.
  • Second, Azevedo et al. (2004) and Schmitz and Wiese (2006) have considerable similarities with two other models that were already included (Winne and Zimmerman, respectively).

요약하면, 짐머만, 보에카르트, 윈, 핀트리치의 모델들은 최근 몇 년간의 연구를 바탕으로 새로운 렌즈로 분석될 것이다. 또한, 에프클리데스와 하드윈, 예르벨래, 밀러의 두 가지 새로운 모델이 더 확립된 모델과 비교될 것이다. 다음으로, 모델들은 시간 순서대로 논의될 것이다.
In sum, the models from Zimmerman, Boekaerts, Winne, and Pintrich, will be analyzed with a new lens based on the research of recent years. Additionally, two new models–those of Efklides and of Hadwin, Järvelä, and Miller–will be compared to those more established models. Next, the models will be discussed in chronological order.

자율 학습 모델
The Self-Regulated Learning Models

짐머만: SRL의 사회인지적 시각에 관한 연구
Zimmerman: A Socio-cognitive Perspective of SRL Grounded by Three Models

짐머만은 최초의 SRL 작가 중 한 명이다. 그는 SRL에 영향을 미치는 상호 작용을 설명하기 위한 첫 번째 시도인 1989년에 발표된 첫 번째 SRL 모델을 세 가지 다른 SRL 모델을 개발했다.
Zimmerman was one of the first SRL authors (e.g., Zimmerman, 1986). He has developed three different SRL models, being the first one published in 1989 representing what was the first attempt to explain the interactions that influence SRL.

모델의 역사와 개발
History and Development of the Models

짐머먼(2013)은 자신의 경력과 작품발전을 사회인지 이론(즉, 개인은 타인과 사회적 상호작용을 관찰함으로써 지식을 얻는다)으로 구성했다. 짐머맨의 연구는 알베르트 반두라, 테드 L. 로젠탈과 공동으로 인지 모델링 연구로부터 시작되었다. 나중에 짐머만은 개별 학습자들이 어떻게 인지 모델을 습득하고 다른 업무에서 전문가가 되는지 탐구하기 시작했다.
Zimmerman (2013)reviewed his career and the development of his work, framing it into the socio-cognitive theory (i.e., individuals acquire knowledge by observing others and social interaction). Zimmerman’s work started from cognitive modeling research in collaboration with Albert Bandura and Ted L. Rosenthal. Later Zimmerman began to explore how individual learners acquire those cognitive models and become experts in different tasks.

가장 많은 SRL 작가 중 한 명인 짐머만은 SRL의 세 가지 모델을 개발했다.
As one of the most prolific SRL writers, Zimmerman has developed three models of SRL (Panadero and Alonso-Tapia, 2014).

  • SRL의 삼원적 분석으로 알려진 첫 번째 모델(그림 1)은 SRL의 세 가지 형태의 상호 작용을 나타낸다: 환경, 행동 및 사람 수준. 이 모델은 반두라의 사회적 인식에 대한 3원적 모델 내에서 SRL을 어떻게 구상할 수 있는지를 설명한다.
  • 두 번째 모델(그림 2)은 SRL의 주기적 단계를 나타내며, 개인 수준에서 메타인지 및 동기 부여 프로세스의 상호 관계를 설명합니다. 이 모델은 2000년 핸드북의 한 장에 제시되었으며, 일반적으로 짐머만의 모델로 알려져 있다. 각 단계에 속하는 하위 프로세스가 제시되었지만, 이러한 하위 프로세스가 그림에 포함된 것은 2003년이 되어서였다. 
  • 마지막으로, Zimmerman과 Moylan(2009)에서 모델은 성능 단계의 새로운 메타인지 및 자발적 전략을 포함하여 몇 가지 조정을 거쳤다(그림 3). 최근에 Multi-Level Model로 불리는 Zimmerman이 개발한 세 번째 모델(그림 4)은 학생들이 자율규제 역량을 습득하는 네 가지 단계를 나타낸다.
  • The first model (Figure 1), known as the Triadic Analysis of SRL, represents the interactions of three forms of SRL: environment, behavior and person level (Zimmerman, 1989). This model describes how SRL could be envisioned within Bandura’s triadic model of social-cognition.
  • The second model (Figure 2) represents the Cyclical Phases of SRL, which explains at the individual level the interrelation of metacognitive and motivational processes. This model was presented in a chapter in the 2000 handbook, and it is usually known as Zimmerman’s model. There the subprocesses that belong to each phase were presented, but it was not until 2003 that these subprocesses were embedded in the figure (Zimmerman and Campillo, 2003).
  • Finally, in Zimmerman and Moylan (2009) the model underwent some tweaks (Figure 3), including new metacognitive and volitional strategies in the performance phase. The third model Zimmerman developed (Figure 4), which recently has been called the Multi-Level model, represents the four stages in which students acquire their self-regulatory competency (Zimmerman, 2000).

이 검토에서는 순환 단계 모델이 분석됩니다. 여기서 분석된 다른 저자의 모델과 동일한 수준에서 SRL 프로세스를 설명하기 때문입니다.
In this review, Cyclical Phases model will be analyzed, as it describes the SRL process at the same level as the models from the other authors analyzed here.

Figure 1

FIGURE 1. Triadic model of SRL. Adapted from Zimmerman (1989).

Figure 2

FIGURE 2. Cyclical phases model (1st version). Adapted from Zimmerman (2000).

Figure 3

FIGURE 3. Current version Cyclical phases model. Adapted from Zimmerman and Moylan (2009).

Figure 4

FIGURE 4. Multi-level model. Adapted from Zimmerman (2000).

짐머만의 주기적 위상 모형
Zimmerman’s Cyclical Phases Model

Zimmerman(2000) SRL 모델은 사전 고려, 성능 및 자기 성찰의 세 단계로 구성됩니다(그림 3 참조).
Zimmerman’s (2000) SRL model is organized in three phases: forethought, performance and self-reflection (see Figure 3).

  • [선행 사고 단계]에서 학생들은 과제를 분석하고 목표를 설정하고, 목표에 도달하는 방법을 계획하며, 많은 동기부여 신념이 과정에 에너지를 주고 학습 전략의 활성화에 영향을 미친다.
  • [수행 단계]에서, 학생들은 실제로 과제를 실행하면서, 그들이 어떻게 진행되고 있는지 관찰하고, 그 과제를 끝내기 위해 인지적으로 참여하고 동기를 부여하기 위해 많은 자기 통제 전략을 사용한다.
  • 마지막으로, [자기 성찰 단계]에서, 학생들은 그들이 어떻게 과제를 수행했는지 평가하며, 그들의 성공 또는 실패에 대한 귀인을 만든다.
  • In the forethought phase, the students analyze the task, set goals, plan how to reach them and a number of motivational beliefs energies the process and influence the activation of learning strategies.
  • In the performance phase, the students actually execute the task, while they monitor how they are progressing, and use a number of self-control strategies to keep themselves cognitively engaged and motivated to finish the task.
  • Finally, in the self-reflection phase, students assess how they have performed the task, making attributions about their success or failure.

이러한 속성은 학생들이 이후의 공연에서 과제에 접근하는 방식에 긍정적인 또는 부정적인 영향을 미칠 수 있는 자기 반응을 생성한다.
These attributions generate self-reactions that can positively or negatively influence how the students approach the task in later performances.

짐머만의 주기적 모델을 뒷받침하는 경험적 증거
mpirical Evidence Supporting Zimmerman’s Cyclical Model

짐머만의 경험적 증거에 대한 개요는 그의 경력 검토에서 찾을 수 있다. 짐머만의 경험적 연구의 특별한 특징은 보다 전형적인 학문적 기술과 함께 운동 기술을 사용한다는 것이다. 짐머만 모델의 다양한 측면을 테스트하기 위해 많은 연구가 수행되었으며, 특히 다단계 및 주기적 위상 모델이 그러하다. 짐머만은 키산타스와 클리어리와 함께 다단계 모델을 테스트하는 작업을 수행했다. 이 네 가지 스터디는 두 가지 유형으로 분류할 수 있습니다.
An overview of Zimmerman’s empirical evidence can be found in his career review (Zimmerman, 2013). A special feature of Zimmerman’s empirical research is the use of athletic skills, along with more typical academic skills. A number of studies have been conducted to test different aspects of Zimmerman’s models (Puustinen and Pulkkinen, 2001; Zimmerman, 2013), especially the Multi-level and the Cyclical phase models. Zimmerman conducted work with Kitsantas and Cleary that tested the Multi-level model (Zimmerman and Kitsantas, 1997, 1999, 2002; Kitsantas et al., 2000). Those four studies can be grouped in two types.

  • 첫째, 1997년과 1999년에 발표된 논문은 고등학생과 함께 다트 던지기, 쓰기 두 가지 다른 과제에서 결과 및 과정 목표의 차등적 효과를 연구하여 모형에 대한 지지를 찾았다.
  • 그리고 둘째, 2000년과 2002년에 발표된 논문은 다트 던지기 및 쓰기 SRL 기술 개발에 있어 서로 다른 유형의 모델을 관찰하는 효과를 연구하였다.
  • First, the articles published in 1997 and 1999 studied the differential effect of outcome and process goals with high school students in two different tasks dart throwing and writing, finding support for the model.
  • And second, the articles published in 2000 and 2002 studied the effect of observing different types of models in the development of SRL skills in dart throwing and writing.

순환 위상 모델은 일련의 네 가지 연구에서 테스트되었다.
The cyclical phase model has been tested in a series of four studies.

  • 째, Cleary와 Zimmerman(2001)은 농구에서 전문가, 비전문가, 초보자인 사춘기 소년들이 보여주는 SRL 기술을 연구한 결과, 전문가들이 SRL 동작을 더 많이 수행한 것으로 나타났다.
  • 둘째, 유사한 연구에서 Kitsantas와 Zimmerman(2002)은 배구의 전문가와 비전문가인 대학생 여성을 비교한 결과, SRL 기술이 서브 기술에서 90%의 차이를 예측하였다.
  • 셋째, 클리어리 외 연구진(2006)은 50명의 대학생을 농구 자유투로 훈련시켰다: 1상 SRL, 2상 SRL, 3상 SRL, 통제 그룹 연습 전용 및 통제 그룹 연습 없음. 결과는 선형 추세를 보였다: 더 많은 단계가 훈련될수록 참가자들의 점수가 더 좋았다.
  • 마지막으로, DiBenedetto와 Zimmerman(2010)은 과학 수업 중 51명의 고등학교 3학년생을 대상으로 높은 성취도가 Zimmerman 모델의 하위 프로세스를 더 많이 사용하는 것으로 나타났다.
  • First, Cleary and Zimmerman (2001) studied the SRL skills showed by adolescent boys who were experts, non-experts and novices in basketball, finding that experts performed more SRL actions.
  • Second, in a similar study, Kitsantas and Zimmerman (2002) compared college women that were experts and non-experts in volleyball, finding that the SRL skills predicted 90% variance in serving skills.
  • Third, Cleary et al. (2006) trained 50 college students in basketball free throws organized in five different conditions: one-phase SRL, two-phases SRL, three-phases SRL, control group practice-only and control group no-practice. The results showed a linear trend: the more phases trained the better the participants’ scores.
  • Finally, fourth, DiBenedetto and Zimmerman (2010) studied 51 high school seniors during science courses seniors finding that higher achievers showed more use of subprocesses from Zimmerman’s model.


짐머만의 모델에 대한 또 다른 중요한 연구는 베른하르트 슈미트와 동료들이 수행한 연구이다. 이미 언급했듯이, 슈미트는 짐머먼을 기반으로 한 SRL 모델을 개발했고, 쿨(2000) 모델의 영향을 받아 단계와 하위 프로세스의 이름이 변경되었다. 이 이론적 제안은 SRL에서 자기 모니터링의 역할을 크게 강조한다. 또한 Schmitz는 학습 일지의 사용과 시계열 분석으로 알려진 다양한 데이터 분석에 대한 중요한 연구를 개발했다. 그의 주요 결과는 학습 일지의 사용이 모든 SRL 단계를 향상시켜 학생들의 SRL과 성과에 영향을 미치는 효과적인 방법이라는 것이다.
Another important piece of research into Zimmerman’s model is the work performed by Bernhard Schmidt and colleagues. As already mentioned, Schmidt has developed a SRL model based on Zimmerman’s and influenced by Kuhl’s (2000) model with changes in the names of the phases and subprocesses included (Schmitz and Wiese, 2006). This theoretical proposal gives a major emphasis to the role of self-monitoring in SRL (Schmitz et al., 2011). Additionally, Schmitz has developed significant research on how the use of learning diaries and its different data analysis known as time-series analysis. His main results have been that the use of learning diaries enhances all SRL phases being an effective way to impact in students’ SRL and performance.

기기 및 측정 방법
Instruments and Measurement Methods

짐머만의 모델 우산 아래, 5개의 기구와 측정이 개발되었다.
Under Zimmerman’s model umbrella, five instruments and measurements have been developed.

  • 첫째, Zimmerman 모델에 존재하는 하위 프로세스는 부분적으로 SRLIS(Self-Regulated Learning Interview Schedule)의 검증 과정에서 발견된 결과에 기초한다. 
  • 둘째, Zimmerman은 필기 및 다트 던지기 실험 훈련 환경에서 SRL을 평가하는 절차를 개발했다. 
  • 셋째, Cleary와 Zimmerman, Kitsantas와 Zimmerman, DiBenedetto와 Zimmerman은 순환 단계 모델의 타당성을 평가하기 위해 미세 분석 측정을 개발했다. 
  • 넷째, Zimmerman은 자기효능감과 자기평가에 대한 자기조절 및 교정조치를 위해 다양한 자기효능감의 측정방법을 개발하였다. 
  • 그리고 다섯째, Zimmerman과 Martinez-Pons(1986, 1988)가 SRL의 틀에 고정시킨 Magno(2010)는 잘 확립된 두 SRL 도구인 MSLQ와 학습 및 연구 전략 인벤토리(LASSI)에 대한 기능적 상관관계를 분석하는 것으로 검증된 학술 자율규제 척도(A-SRL)를 개발했다. 
  • First, the subprocesses present in Zimmerman’s model are partly based on the results found in the validation process of the Self-Regulated Learning Interview Schedule (SRLIS) (Zimmerman and Martinez-Pons, 19861988).
  • Second, Zimmerman has developed procedures to assess SRL in experimental training settings for writing and dart throwing (Zimmerman and Kitsantas, 19971999).
  • Third, Cleary and Zimmerman (20012012), Kitsantas and Zimmerman (2002)DiBenedetto and Zimmerman (2010) developed microanalytic measures to assess the validity of the Cyclical Phases model.
  • Fourth, Zimmerman has developed different measures of self-efficacy to self-regulate (Zimmerman and Kitsantas, 20052007) and calibration measures of self-efficacy and self-evaluation (Zimmerman et al., 2011).
  • And, fifth, anchored on the framework of SRL by Zimmerman and Martinez-Pons (19861988), Magno (2010) developed the Academic Self-Regulation Scale (A-SRL) which has been validated analyzing its functional correlation against two well-established SRL instruments the MSLQ and the Learning and Study Strategies Inventory (LASSI) (Magno, 2011).

Boekaerts: 다양한 목표 로드맵(상하/하상)과 감정의 역할
Boekaerts: Different Goal Roadmaps (Top–Down/Bottom–Up) and the Role of Emotions

보에카르트(Boekaerts)의 저작은 SRL 문헌에서 가장 오래된 것 중 하나이며 1980년대 후반으로 거슬러 올라갈 수 있다. 얼마 지나지 않아 그녀는 자신의 첫 SRL 모델을 선보였다. 그녀의 연구는 목표의 역할(예: 학생들이 SRL과 관련하여 다른 유형의 목표를 활성화하는 방법)을 설명하는 데 초점을 맞췄고, 그녀는 동기 부여와 SRL을 평가하기 위해 상황별 측정을 최초로 사용했다. 또한, Boekaerts는 자기 조절과 감정 조절에 관한 임상 심리학 문헌에 대한 방대한 지식을 보여주었다.
The work by Boekaerts is also one of the earliest in the SRL literature and can be traced back to the late 1980s (e.g., Boekaerts, 1988). Shortly after she presented her first SRL model (Boekaerts, 1991). Her work has focused in explaining the role of goals (e.g., how students activate different types of goals in relation to SRL), and she was the first to use situation-specific measures to evaluate motivation and SRL. In addition, Boekaerts has demonstrated a vast knowledge of the clinical psychology literature on self-regulation and emotion regulation (see Boekaerts, 2011).

모델의 역사와 개발
History and Development of the Models

Boekaerts는 SRL의 두 가지 모델을 개발했습니다. 먼저, 그녀는 자체 규제가 다음과 같은 6가지 요소로 구분되는 구조 모델(그림 5)을 개발했습니다.
Boekaerts has developed two models of SRL. First, she developed a structural model (Figure 5) in which self-regulation was divided into six components, which are:

  • (1) 도메인 특이적 지식 및 기술,
  • (2) 인지 전략,
  • (3) 인지적 자기 조절 전략,
  • (4) 동기부여의 신념과 마음의 이론,
  • (5) 동기부여 전략,
  • (6) 동기부여적인 자기조절 전략
  • (1) domain-specific knowledge and skills,
  • (2) cognitive strategies,
  • (3) cognitive self-regulatory strategies,
  • (4) motivational beliefs and theory of mind,
  • (5) motivation strategies, and
  • (6) motivational self-regulatory strategies (Boekaerts, 1996b).

이것들은 그녀가 당시 고려했던 SRL의 두 가지 기본 메커니즘인 [인지적 및 정서적/동기적 자기 조절]을 중심으로 구성되었다. 이 모델은 주로 다음의 목적으로 사용되어 왔다.
These were organized around, what she then considered to be, the two basic mechanisms of SRL: cognitive and affective/motivational self-regulation. This model has been mainly used

  • (a) SRL의 도메인별 구성 요소에 대한 더 많은 통찰력을 얻기 위해,
  • (b) 교사들을 훈련시키기 위해,
  • (c) 연구를 위한 새로운 측정 장비를 구축한다.
  • (d) 개입 프로그램을 설계한다.
  • to (a) gain more insight into domain-specific components of SRL,
  • to (b) train teachers,
  • to (c) construct new measurement instruments for research, and
  • to (d) design intervention programs (Boekaerts, M. personal communication to author 08/06/2014).
Figure 5

FIGURE 5. Six-component model of SRL. Adapted from Boekaerts (1996b).

둘째, Boekaerts의 출판물 대부분은 두 번째 SRL 모델, 즉 [적응형 학습 모델]을 공식화하기 위해 설정되었다. 이 모델(그림 6 참조)은 90년대 초에 제시되었습니다. SRL의 역동적 측면을 설명하고, 나중에 [듀얼 프로세싱 자기조절 모델]로 발전했습니다(그림 7). 적응학습모형은 동기부여, 감정, 메타인지, 자기개념, 학습 등 다양한 심리적 틀에서 도출된 결과를 이해하기 위한 이론적 발판을 제공했다. 모델은 두 가지 [병렬 처리 모드]를 설명했습니다.

Second, most of Boekaerts’ publications were set up to formulate a second SRL model, namely, the Adaptable Learning Model. This model (see Figure 6) was presented at the beginning of the 90s (Boekaerts, 1991, 1992). It describes the dynamic aspects of SRL, and later, evolved into the Dual Processing self-regulation model (Figure 7). The Adaptable Learning Model offered a theoretical scaffold for understanding the findings from diverse psychological frameworks, including motivation, emotion, metacognition, self-concept, and learning. The model described two parallel processing modes:

  • (a) 숙달 또는 학습 모드 및
  • (b) 대처 또는 웰빙 모드
  • (a) a mastery or learning mode and
  • (b) a coping or well-being mode.

2000년 자기조절 핸드북의 한 장에서 Boekaerts와 Niemivirta(2000)는 학생들의 행동에 어떤 영향을 미치는지 시각화하기 위해 서로 다른 수치를 사용하여 목표 경로에 대한 새로운 아이디어를 제시했다. 비록 2000년에 보에카어츠는 이미 하향식 이론과 상향식 이론의 비전에 대한 몇 가지 개념을 제시했지만, 2000년 중반이 되어서야 이러한 이론적 통찰이 그녀의 모델에서 명확하게 정의되었다. 2011년 SR의 SRL 핸드북에서 Boekaerts는 [학습 과정 중 자율 규제의 다양한 목적을 지적한 이 모델의 확장 버전]을 제시했다.
In a chapter of the 2000 Handbook of self-regulation, Boekaerts and Niemivirta (2000) presented new ideas on goal paths using different figures to visualize how they influence students’ behavior (see pp. 434–435). Although, in 2000, Boekaerts had already presented some notions on her vision of top–down and bottom–up theory, it was not until mid-2000 that these theoretical insights were clearly defined in her model, which was then renamed as the Dual Processing self-regulation model (Boekaerts and Corno, 2005; Boekaerts and Cascallar, 2006). In the 2011 SRL handbook of SR, Boekaerts presented an extended version of this model, which pointed to the different purposes of self-regulation during the learning process, namely,

  • (1) 지식과 기술을 넓히는 것,
  • (2) 학습 활동에 대한 자신의 헌신을 보호하는 것, 그리고
  • (3) 자신에 대한 위협과 해를 예방하는 것.
  • (1) expanding one’s knowledge and skills,
  • (2) protecting one’s commitment to the learning activity, and
  • (3) preventing threat and harm to the self.

Boekaerts는 SRL에서 긍정적인 감정과 부정적인 감정이 수행하는 주요 역할을 강조하며, 두 가지 서로 다른 상향식 전략, 즉 [의지적 전략]과 [감정 조절 전략]을 기술하였다(그림 7; Boekaerts, 2011).
Boekaerts emphasized the key role that positive and negative emotions play in SRL, and described two different bottom–up strategies, namely, volitional strategies and emotion regulation strategies (Figure 7; Boekaerts, 2011).

Figure 6

FIGURE 6. Model of adaptable learning. Extracted from the 2000 handbook but cited there as: the original model of adaptable learning. Adapted from Boekaerts (1996a).

Figure 7

FIGURE 7. Dual processing self-regulation model. Adapted from Boekaerts (2011).

Boekaerts의 듀얼 프로세싱 모델
Boekaerts’ Dual Processing Model

[이중 처리 모델](Boekaerts and Cascalar, 2006)에서, 학생들이 어떤 목표 경로를 활성화시킬지 결정하는 데 있어 학생들의 [평가appraisals]가 중요하다. 여기서 목표는 행동을 이끄는 "지식 구조"로 간주된다.

  • 예를 들어, 만약 학생들이 그 과제가 그들의 행복에 위협적일 수 있다는 것을 인식한다면, 부정적인 인식과 감정이 촉발된다. 그런 다음 자아를 손상으로부터 보호하기 위한 전략이 지시되고, 이에 따라 학생들은 웰빙의 길로 나아간다.
  • 반면에, 과제가 학생들의 목표와 요구에 부합한다면, 그들은 그들의 역량을 증폭시키고 긍정적인 인식과 감정을 유발하며, 이에 따라 숙달/성장의 길로 나아가는 것에 관심을 가질 것이다.

Boekaerts(2011)는 또한 [숙달/성장 경로]에서 과제를 시작한 학생들이 성공하지 못할 수 있다는 단서를 발견하면, [웰빙 경로]로 이동할 수 있다고 설명한다.
In the Dual Processing model (Boekaerts and Cascallar, 2006), the appraisals made by the students are crucial to determine which goal pathway the students will activate. Here, goals are viewed as the “knowledge structures” that guide behavior.

  • For example, if students perceive that the task could be threatening to their well-being, negative cognitions and emotions are triggered. Strategies are then directed to protect the ego from damage, and thereby, students move onto a well-being pathway.
  • On the other hand, if the task is congruent with the students’ goals and needs, they will be interested in amplifying their competence, triggering positive cognitions and emotions, and thereby, moving onto the mastery/growth pathway.

 Boekaerts (2011) also explains that students who have started a task in the mastery/growth pathway may move to the well-being pathway if they detect cues that they might not be successful.

Boekaerts (2011)에 따르면, 자기조절의 목적은 세 가지가 있다.
According to Boekaerts (2011), there are three different purposes for self-regulation:

(a) 지식 및 기술 확장…
(b) 자신의 행복이 합리적인 범위 내에서 유지되도록 자신에 대한 위협과 자원 손실을 방지한다.
(c) 웰빙 경로에서 마스터 경로로 주의를 재루팅하는 활동을 사용하여 자신의 헌신을 보호합니다.

(a) expanding knowledge and skills…
(b) preventing threat to the self and loss of resources so that one’s well-being is kept within reasonable bounds…and
(c) protecting one’s commitments by using activities that re-route attention from the well-being pathway to the mastery pathway (pp. 410–411).

 

  • 첫 번째 목적은 그녀가 "톱 다운"이라고 부른 것인데, 과제 목표의 추구는 학생들의 가치, 요구, 그리고 개인적인 목표(마스터리/성장 경로)에 의해 추진되기 때문이다.
  • 두 번째 목적은 "바텀 업"이라고 불리는데, 그 전략은 자아가 손상되는 것을 막기 위해 노력하고, 학생들은 과제 목표와 개인적인 목표 사이에 불일치를 경험할 수 있다.
  • 세 번째 목적은 학생들이 자신의 전략을 웰빙에서 숙달/성장 경로로 전환하려고 할 때 발생하는데, 이는 외부(예: 교사 또는 동료의 압력) 또는 내부(예: 자기결정적 생각)의 힘을 통해 발생할 수 있다.
  • The first is what she called “top–down,” as the pursuit of task goals is driven by the students’ values, needs and personal goals (mastery/growth pathway).
  • The second purpose is called “bottom–up,” as the strategies try to prevent the self from being damaged (well-being pathway), and students may experience a mismatch between the task goals and their personal goals.
  • The third purpose occurs when students try to redirect their strategies from the well-being to the mastery/growth pathway, which may happen via external (e.g., teacher or peer pressure) or internal (e.g., self-consequating thoughts) forces.

따라서 학생들이 [부정적인 감정을 경험할 때, 웰빙 경로를 활성화하고, 상향식 전략을 사용]하기 때문에 보에카르트 모형에서 감정은 필수적이다. 이러한 관심에 따라, Boekaerts는 다양한 감정 조절 전략을 심층적으로 연구했다.
Therefore, emotions are essential in Boekaerts’ model, because when students experience negative emotions, they will activate the well-being pathway and use bottom–up strategies. Pursuant to this interest, Boekaerts has studied, in depth, the different emotion regulation strategies (see Boekaerts, 2011).

이중 처리 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting the Dual Processing Model

대부분의 경험적 지원은 Boekaerts와 그녀의 박사과정 학생들이 온라인 동기 설문지(OMQ)와 기타 구체적인 조치를 사용하여 제공했습니다. 적응형 학습 모델에 대한 그들의 연구는 그림 7의 모델의 위쪽 절반에 집중되었다. 다른 측정 도구를 사용하여 네 가지 주요 연구 영역을 식별할 수 있습니다.
Most of the empirical support was provided by Boekaerts and her Ph.D. students using the On-line Motivation Questionnaire (OMQ) – next section for more information- and other specific measures. Their work on the Model of Adaptable Learning concentrated on the top half of the model in Figure 7. Four main areas of research can be identified using different measurement tools.

  • 첫째, 시거와 보에카르트(Seegers)는 인지적 평가의 다양한 측면과 그들이 전향적, 예상적 긍정 및 부정적 감정과 학습 의도를 어떻게 결정하는지 연구하였다. 그들은 활성화된 평가의 유형에서 성별 차이를 발견했다. 또 다른 논문에서 Boekaerts(1999)는 학습 활동에 대한 학생들의 해석에 대한 이러한 과제별 지표가 능력에 대한 자기개념, 숙달 및 수행 목표의 활성화, 영역에 대한 관심과 같은 영역 척도보다 학습의도의 차이를 더 많이 설명한다는 것을 입증했다.
  • First, Seegers and Boekaerts (19931996) studied different aspects of cognitive appraisals and how they determine prospective, anticipatory positive and negative emotions and learning intentions; they found gender differences in the types of appraisals activated. In another publication, Boekaerts (1999) demonstrated that these task specific indices of the students’ interpretations of the learning activity explain more of the variance in learning intention than domain measures, such as self-concept of ability, activation of mastery and performance goals, and interest in the domain.
  • 둘째, OMQ를 이용하여 학습의도에 대한 전향적 인식과 감정의 영향을 연구하였다. 확인 요인 분석 결과, 시험된 모형의 내부 구조는 학문적 과제에 대해 불변성이었고 또한 반년 동안 안정적인 것으로 보였기 때문에, 8개의 전제 요인 중 7개가 경험적으로 구별될 수 있었다.
  • Second, the effect of prospective cognitions and emotions on learning intention was also studied using the OMQ (Boekaerts et al., 1998Crombach et al., 2003); a confirmatory factor analysis revealed that seven of the eight presupposed factors could be distinguished empirically, as the internal structure of the tested model was invariant over the academic tasks and also seemed stable over a half-year period.
  • 셋째, 잠재인식과 감정의 성별 차이를 OMQ와 40초마다 단어 문제를 수행하면서 학생들의 자신감 감정을 측정하는 신뢰와 의심 척도를 이용하여 연구하였다. 남학생과 여학생은 수학 문제, 특히 단어 문제에 다르게 참여하는 것으로 밝혀졌다. 남학생들은 여학생들보다 더 높은 자신감, 더 많은 일을 좋아하고, 더 긍정적인 감정과 더 많은 노력을 투자하려는 의지를 표현했다. 신뢰와 의심 척도를 사용한 Vermeer 외 연구진(2001)은 여학생들이 기본적으로 수학 문제를 푸는 것을 수학적 규칙을 적용하는 것으로 본다는 결론을 도출했다.
  • Third, gender differences in prospective cognitions and emotions were studied using the OMQ and the Confidence and Doubt scale -which measures students’ feelings of confidence every 40 s while they are performing word problems-, (Boekaerts, 1994Boekaerts et al., 1995Vermeer et al., 2001). It was found that boys and girls attend differently to math problems, especially word problems. Boys expressed higher confidence, more liking for the tasks, more positive emotions and more willingness to invest effort than girls. Vermeer et al. (2001) using the Confidence and Doubt scale, led to the conclusion that girls view solving math problems basically as applying mathematical rules.
  • 넷째, 메타인지적 지식을 쌓고 심층처리를 사용할 수 있는 기회를 창출하는 데 중점을 둔 네덜란드 중등직업학교에 대한 여러 개입이 수행되었다. 이 개입은 연구 초기에 이미 심층 처리 전략에 익숙하고 사용된 학생들에게 가장 잘 효과가 있는 것으로 나타났다.
  • Fourth, several interventions in Dutch secondary vocational schools were conducted that focused on building up metacognitive knowledge and creating opportunities to use deep-level processing (Rozendaal et al., 2003Boekaerts and Rozendaal, 2006). It was found that the intervention worked best for students who were already familiar with (and used) deep-level processing strategies at the beginning of the study.

Boekaerts는 또한 듀얼 프로세싱 모델과 학생들의 결과 평가, 과제 후 보고된 노력 및 특성(모델의 하단 부분)을 결정하는 요인에 대한 연구를 수행했습니다. 여기에는 두 가지 주요 연구 라인이 있습니다.

  • 첫째, Boekaerts(2007)는 구조방정식 모형을 사용하여 학생의 결과평가에 대한 역량과 가치평가의 영향을 보다 면밀히 살펴보고 보고하였으며, 과제 중 긍정정서와 부정정서가 이러한 결과변수에 미치는 영향을 탐색하였다. 그녀는 수학 숙제를 한 후 노력을 기울였다고 보고한 학생들이 처음에는 숙제를 할 수 있는 능력이 있다고 보고했고, 이것은 그 과제 동안 긍정적인 감정을 낳았다는 것을 발견했다. 처음에 작업을 평가하면 보고된 작업도 상당히 증가했습니다. 추가연구에서 숙제를 한 후 결과평가는 역량과 가치평가 모두에 긍정적인 영향을 미치는 것으로 나타났다.
  • 두 번째 작업 라인은 Neural Network Methodology(동물의 중추신경계, 보다 구체적으로 생물학적 신경망에서 영감을 받은 통계적 학습 모델 계열)를 사용하여 학생들의 작문 수행 품질(저조/중조/고성능 그룹)을 특성에 기초하여 예측할 수 있는지 여부를 조사하였다. (OMQ를 기반으로 특별히 설계된 소프트웨어 프로그램으로 측정) SR 시스템의. 신경망은 56개의 예측 변수를 기반으로 어떤 학생이 저학력, 중학력, 고학력 그룹에 속할지를 높은 정확도(범위 94와 100%)로 예측할 수 있는 것으로 나타났다.

Boekaerts has also conducted research on the Dual Processing model and the factors that determine students’ outcome assessments, their reported effort after a task, and their attributions (bottom part of the model). There are two main lines of research here.

  • First, using structural equation models, Boekaerts (2007) looked more closely at the effect of competence and value appraisals on the students’ outcome assessments and reported effort; she also explored the influence that positive and negative emotions during a task have on these outcome variables. She found that students who reported that they had invested effort after doing their mathematics homework, had initially reported that they were competent to do their homework tasks, which produced positive emotions during the task. Valuing a task initially also substantially increased the reported effort. In further research (Boekaerts et al., 2003Boekaerts, 2007), it was found that outcome assessments after doing homework were positively influenced by both competence and value appraisals.
  • The second line of work, using Neural Network Methodology (family of statistical learning models inspired by the central nervous systems of animals, more specifically biological neural networks) it was examined whether the quality of students’ writing performance (poor/mid/high performance group) could be predicted on the basis of characteristics of the SR system (measured with a specially designed software program based on the OMQ) (Cascallar et al., 2006Boekaerts and Rozendaal, 2007). It was found that neural networks could predict with high accuracy (ranging 94 and 100%) which students would be in the poor, mid, or high performance groups, based on 56 predictors.

기기 및 측정 방법
Instruments and Measurement Methods

Boekaerts는 SRL의 측정에 대한 여러 성찰문(가장 잘 알려진 Boekaerts and Corno, 2005)을 작성했으며, 네 가지 도구와 평가 방법의 작성에 참여했다.
Boekaerts has written a number of reflection papers about the measurement of SRL (the most known Boekaerts and Corno, 2005), and has participated in the creation of four instruments and assessment methods.

  • 먼저, 그녀는 "구체적인 상황에서 학습하는 민감성"을 측정하는 OMQ(Boekaerts, 1999)를 개발했다. 두 부분으로 구성되어 있습니다.
    First, she developed the OMQ (Boekaerts, 1999), which measures the “sensitivity to learn in concrete situations.” It is composed of two parts:
    • (a) 학생들은 그들의 감정, 생각, 그리고 그들이 구체적인 과제에 소비하고 싶은 노력을 스스로 보고한다.
    • (b) 과제 후에, 학생들은 그들이 어떻게 느끼는지와 그들의 속성을 보고한다.
    • OMQ를 사용한 그녀의 SRL 모델의 검증은 Boekaerts(2002)에서 확인할 수 있다.
    • (a) students self-report their feelings, thoughts and the effort they want to expend on a concrete task, and
    • (b) after the task, the students report how they feel and their attributions.
    • The validation of her SRL model with the OMQ can be found in Boekaerts (2002).
  • 둘째, 그녀는 인터랙티브 러닝 그룹 시스템(ILGS) 혁신이라고 불리는 SRL 원칙을 기반으로 네덜란드의 중등학교를 위한 교육 설계를 만들었습니다.
  • 셋째, Boekaerts는 앞서 설명한 학생들의 동기부여를 기록하는 도구를 개발했습니다.
  • 넷째, 그녀는 그러한 모델에서 높은 예측력을 찾기 위해 SRL을 위한 신경망의 구현에서 다른 학자들과 협력했다.
  • Second, she created an instructional design for secondary vocational schools in the Netherlands based on SRL principles that was called the Interactive Learning Group System (ILGS) innovation (Boekaerts, 1997Boekaerts and Minnaert, 2003).
  • Third, Boekaerts developed an instrument to record student motivation: the Confidence and Doubt Scale (Vermeer et al., 2001) – explained earlier.
  • And, fourth, she has collaborated with other scholars in the implementation of neural networks for SRL finding high predictive power in such models (e.g., Cascallar et al., 2006).

Winne과 Hadwin: 메타인지적 관점에서 SRL 탐색
Winne and Hadwin: Exploring SRL from a Metacognitive Perspective

Winne과 Hadwin의 SRL 모델은, SRL의 목표 주도 특성과 동기 부여에 대한 자기 규제 행동의 영향을 주장하면서, 자기 조절 학생이란, 주로 [(메타) 인지 전략을 사용하는 모니터링을 통하여, 자신의 학습을 능동적으로 관리하는 강한 메타인지 관점을 가진 사람]으로 인식하였다. 특히 컴퓨터 지원 학습 설정을 구현하는 연구에서 널리 사용되는 모델이다(Panadero et al., 2015b).
Winne and Hadwin’s model of SRL has a strong metacognitive perspective that recognizes self-regulated students as active and managing their own learning via monitoring and the use of, mainly, (meta)cognitive strategies (Winne, 1995, 1996, 1997; Winne and Hadwin, 1998) while asserting the goal driven nature of SRL and the effects of self-regulatory actions on motivation (Winne and Hadwin, 2008). It has been a widely used model, especially in research implementing computer supported learning settings (Panadero et al., 2015b).

모델의 역사와 개발
History and Development of the Model

Winne과 Hadwin의 모델은 정보처리이론의 영향을 강하게 받아 Efklides를 제외한 다른 SRL 모델보다 SRL의 [인지적 측면과 메타인지적 측면]을 더 자세히 탐구한다.

  • 필 윈의 초기 아이디어 중 일부는 SRL을 정보 처리와 정보 처리의 융합으로 개념화한 것으로 거슬러 올라갈 수 있으며, 버틀러와 윈은 피드백과 SRL에 대한 이론적 검토에서 내부 피드백의 개념이 주요 역할을 하며 모델의 첫 버전이 제시되었다. (버틀러와 윈의 그림 1, 1995).
  • 또한, 그들은 목표가 취할 수 있는 다양한 프로파일과 목표 목표와 현재 작업 모니터링 상태 사이의 불일치를 탐구하는 두 번째 그림을 제시하였다(Butler and Winne의 그림 2, 1995).

Winne and Hadwin’s model is strongly influenced by the Information Processing Theory (Winne, 2001; Greene and Azevedo, 2007), exploring the cognitive and metacognitive aspects of SRL in more detail than the other SRL models with the exception of Efklides’.

  • Some of Phil Winne earliest ideas that led to the model can be traced to his conceptualization of SRL as a fusion of information processing and information processed (Winne, 1995) and Butler and Winne (1995) in their theoretical review of feedback and SRL, in which the concept of internal feedback had a major role and the first version of the model was presented (Figure 1 in Butler and Winne, 1995).
  • Additionally, they presented a second figure in which they explored the different profiles a goal can take and the discrepancy between the goal aims and the current state of work monitoring (Figure 2 in Butler and Winne, 1995).

 

  • 1996년 Winne은 SRL의 차이를 설명하는 메타인지적 측면에 대한 반영과 함께 방금 언급한 두 수치가 하나로 융합된 자신의 모델의 업데이트된 버전(그림 8)을 제시했다.
  • 1997년에 그는 COPES 대본 아이디어를 제시했다.
  • 마침내 1998년에 COPES에 대한 더 자세한 내용과 더 명확한 프레젠테이션을 포함한 그의 모델의 새로운 버전이 출시되었다(그림 9).
  • In 1996, Winne presented an updated version of his model (Figure 8) in which the two just mentioned figures were fused into one, along with a reflection about the metacognitive aspects that explains the differences in SRL (Winne, 1996).
  • In 1997, he presented the COPES script ideas -see next section- (Winne, 1997).
  • Finally, in 1998, a new version of his model was released (Figure 9) including more details and a clearer presentation of COPES (Winne and Hadwin, 1998).

모델을 참조할 때 인용되는 것은 일반적으로 후자의 작업이다: Winne의 모델 대신 Winne과 Hadwin. 이 교호는 현재 SRL 커뮤니티와의 일관성을 유지하기 위해 이 검토에서도 사용되지만, 모델이 이전 연구에서 처음 제시되었다는 것을 명심하는 것이 중요하다(Winne, 1996, 1997). 또한, 이 두 저자는 일상적으로 협력하면서 2011년 SRL 핸드북의 다른 장에서 알 수 있듯이 SRL 연구 내에서 다른 경로를 따라왔다. Winne은 자신의 gStudy 및 nStudy(Winne et al., 2010)와 같은 모델의 인지적 측면을 계속 검토해왔다. 또한, 그는 프로세스를 보여주는 figure는 그대로이지만, 모델에 대한 사소한 개선 작업을 수행했습니다. Hadwin은 모델의 경험적 증거에서 협업을 계속하는 동안 협업 학습 환경에서 상황, 상황 및 동기 SRL 측면에 추가로 초점을 맞추었다. 이 작업 라인은 Järvelä 및 Miller와 협력하여 사회적 공유 규제 학습(SSRL) 모델을 제작했다. 이 섹션에서는 Hadwin의 작품이 자체 섹션을 가질 것이기 때문에 Winne의 작품에 대해 더 자세히 살펴볼 것이다.
It is usually the latter work that is cited when the model is referenced: Winne and Hadwin instead of Winne’s model. That denomination is also used in this review for now onward to keep the consistency with the SRL community, but it is important to keep in mind that the model was firstly presented in previous work (Winne, 1996, 1997). Additionally, these two authors, while collaborating in usual basis, have followed different paths within SRL research as signaled by different chapters in the 2011 SRL handbook (Hadwin et al., 2011; Winne, 2011). Winne has continue examining (meta)cognitive aspects of the model, such as his work on gStudy and nStudy (Winne et al., 2010). Furthermore, he performed minor enhancements to the model although the figure that illustrates the process remains the same (Winne, 2011). Hadwin, while continuing collaborating in the empirical evidence of the model (Winne et al., 2010; Winne and Hadwin, 2013) has additionally focused on the situational, contextual and motivational SRL aspects in collaborative learning settings. This line of work has produced the model of Socially Shared Regulated Learning (SSRL) in collaboration with Järvelä and Miller (see Hadwin, Järvelä, and Miller: SRL in the Context of Collaborative Learning). This present section will explore in more detail the work by Winne as the one by Hadwin will have its own section.

Figure 8

FIGURE 8. First version of Winne’s SRL model. Adapted from Winne (1996).

Figure 9

FIGURE 9. Current version of Winne’s SRL model. Adapted from Winne and Hadwin (1998).

윈과 해드윈의 SRL 모델
Winne and Hadwin’s Model of SRL

윈과 해드윈의 모드에 따르면, 학습은 개방적이고 재귀적이며 피드백 루프에서 이해되는 4개의 연결된 단계에서 SRL에 의해 작동된다. 다음 4단계는 다음과 같습니다(그림 9).
According to Winne and Hadwin’s model (e.g., Winne, 2011), studying is powered by SRL across four linked phases that are open and recursive and are comprehended in a feedback loop. These four phases are (Figure 9):

  • (a) 과제 정의: 학생은 수행할 과제에 대한 이해를 구한다.
  • (b) 목표 설정 및 계획: 학생들은 목표를 달성하기 위한 목표와 계획을 생성합니다.
  • (c) 학습 전술 및 전략 실행: 이러한 목표에 도달하는 데 필요한 조치의 사용.
  • (d) 메타인지적으로 적응하는 공부: 주요 과정이 완료되고 학생이 미래에 대한 동기, 신념 및 전략에 장기적인 변화를 만들기로 결정한 후에 발생합니다.
  • (a) task definition: the students generate an understanding of the task to be performed;
  • (b) goal setting and planning: the students generate goals and a plan to achieve them;
  • (c) enacting study tactics and strategies: the use of the actions needed to reach those goals; and
  • (d) metacognitively adapting studying: occurs once the main processes are completed and the student decides to make long-term changes in her motivations, beliefs and strategies for the future.


Winne은 특히 실수가 발생한 이후의 단계에서 실수가 감지될 수 있다고 강조한다.
Winne especially emphasizes that mistakes can be detected in a posterior phase to the one in which they occurred.

또한 SRL은 앞서 언급한 4단계로 수행될 수 있는 5가지 작업 측면을 구현합니다. 이러한 다섯 가지 측면은 Winne(1997)에서 처음으로 사용된 COPES 약어(즉, Carla COPES와 산술 워크시트를 함께 사용)를 사용하여 식별된다. 의 약자이다

Additionally, SRL deploys five different facets of tasks that can take place in the four phases just mentioned (Winne and Hadwin, 1998). These five facets are identified using the COPES acronym, that was used for the first time in Winne (1997) -i.e., Carla COPES with an arithmetic worksheet- (p. 399). It stands for

  • (a) 조건: 개인이 사용할 수 있는 자원과 작업 또는 환경에 내재된 제약(예: 상황, 시간)
  • (b) 운영: 학생이 SMART(검색, 모니터링, 조립, 리허설 및 번역)라고 하는 인지 프로세스, 전술 및 전략(예: 과제 수행 방법 계획)
  • (c) 제품: 운영으로 생성된 정보(예: 새로운 지식);
  • (d) 평가: 학생이 내부적으로 생성하거나 외부 출처에서 제공하는 제품과 표준 간의 적합성에 대한 피드백(예: 교사 또는 동료 피드백)
  • (e) 표준: 제품을 모니터링하는 기준(Winne and Hadwin, 1998; Greene and Azevedo, 2007) (예: 평가 기준)
  • (a) Conditions: resources available to a person and the constrains inherent to a task or environment (e.g., context, time);
  • (b) Operations: the cognitive processes, tactics and strategies used by the student that are referred to as SMART -Searching, Monitoring, Assembling, Rehearsing and Translating- (Winne, 2001) (e.g., planning how to perform a task);
  • (c) Products: the information created by operations (e.g., new knowledge);
  • (d) Evaluations: feedback about the fit between products and standards that are either generated internally by the student or provided by external sources (e.g., teacher or peer feedback); and
  • (e) Standards: criteria against which products are monitored (definitions taken from Winne and Hadwin, 1998Greene and Azevedo, 2007) (e.g., assessment criteria).

또한 Winne(2011) 모델은 과제를 계획, 수행 및 평가하는 동안 학생들의 인지적 처리가 어떻게 작동하는지 자세히 설명한다. 중요한 측면은 자체 평가 연구와 일치하는 측면을 설정, 모니터링 및 평가하기 위해 기준과 표준을 사용하는 것이다. 이 모델은 학생들이 표준과 비교하여 활동을 지속적으로 모니터링하고 과제를 수행하기 위해 전술을 사용하는 방법을 설명합니다. 한 가지 두드러진 특징은, model figure에는 감정에 대한 언급이 없고 동기 부여에 대한 암시만 있다는 것이다. 그럼에도 불구하고 Winne과 Hadwin은 SRL이 본질적으로 목표 지향적이며 Pintrich(2003)와 Wolters(2003)의 동기 조절에 대한 연구와 자신의 모델 간의 연결을 구축했다는 데 동의한다(Winne and Hadwin, 2008).
Furthermore, Winne (2011) model explains in detail how students’ cognitive processing operates while planning, performing and evaluating a task. A crucial aspect is the use of criteria and standards to set goals, monitor and evaluate, aspects which are aligned with self-assessment research (Andrade, 2010; Panadero and Alonso-Tapia, 2013). The model describes how students constantly monitor their activities against standards and use tactics to perform tasks (Winne and Hadwin, 1998). One salient feature is that, in the model figure there is no reference to emotions, and there is only an allusion to motivation. Regardless of this Winne and Hadwin also agrees that SRL is goal-driven in nature and has built connections between his model and research by Pintrich (2003) and Wolters (2003) on regulation of motivation (Winne and Hadwin, 2008).

Winne과 Hadwin의 SRL 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting Winne and Hadwin’s SRL Model

그린과 아제베도(2007)는 모델에 대한 경험적 증거를 검토했다. 이론적 검토로 제시했지만, '경험적 문헌에 대한 포괄적인 검토'를 수행하지 않았기 때문에 모델에 대한 실증적 지원을 제공하는 설득력 있는 연구(113)를 검토하였다. 검토는 모델에서 고려된 모든 측면을 다루었고 연구의 초기 범위를 벗어났을 수 있는 추론을 했다(예: 원래 모델에서 명시적으로 언급되지 않은 감정에 대한 섹션을 포함). 결론에서, 그들은 모델의 미래 연구 가능성을 언급하고 추가적인 설명이 필요한 네 가지 과제를 지적했다.

Greene and Azevedo (2007) reviewed the empirical evidence for the model. Although they presented it as a theoretical review, due to the fact that they did not perform a “comprehensive review of the empirical literature” (p. 338), they reviewed a compelling number of studies (113) that provide empirical support for the model. The review covered all the aspects considered in the model, and made inferences that may have been beyond the initial scope of the work (e.g., they included a section for emotion, which is not explicitly mentioned in the original model). In their conclusions, they stated the model’s potential for future research and pointed out four challenges that needed additional clarification.

  • 첫째, 4단계 및 외부 평가, 특히 학생들의 SRL의 장기적인 변화와 4단계 작동 방식에 대한 더 많은 세부 사항(예: SRL 활동의 산물로서의 조건 역할 설명)을 명확히 한다.
  • 둘째, 그들은 Wonne과 Hadwin의 모델이 연결 구축을 위한 참고 자료로 Wolters(2003)를 사용하여 동기부여의 규정을 통합할 것을 요구했다.
  • 셋째, Greene과 Azevedo는 SRL 기술이 평생 동안 어떻게 발전하는지에 대한 토론을 권고했다.
  • 그리고 넷째, 학생 특성(예: 학습장애)이 SRL에 어떤 영향을 미칠 수 있는지 고려하기 위해 전화를 걸었다.
  • First, phase four and external evaluations, especially clarifying long-term changes in the students’ SRL and more details on how phase four works (e.g., describing the role of conditions as products of the SRL activity).
  • Second, they made a call for Winne and Hadwin’s model to incorporate the regulation of motivation, using Wolters (2003) as a reference to build the connection.
  • Third, Greene and Azevedo recommended a discussion of how SRL skills develop over the life span.
  • And, fourth, they made a call to consider how student characteristics (e.g., learning disabilities) might impact SRL.

이후 몇 년간 윈 교수팀은 학생들의 SRL을 측정하면서 동시에 발판을 만드는 컴퓨터로 연구를 바탕으로 모델에 대한 확실한 경험적 증거를 수집할 수 있는 기반을 구축해 왔다. 이러한 내용은 다음 절에서 설명합니다. 또한 Winne은 데이터 마이닝 및 학습 분석과 SRL에 대한 적용 가능성을 모색하고 있습니다.
In the later years, Winne and his team have been building a basis for gathering solid empirical evidence on the model based on the work with computers that scaffold students’ SRL while measuring it at the same time (Panadero et al., 2015b). These will be described in the next section. Additionally, Winne has also been exploring the potential of data mining and learning analytics and their application to SRL (e.g., Winne and Baker, 2013).

기기 및 측정 방법
Instruments and Measurement Methods

Winne과 Hadwin의 모델을 기반으로 한 고전적인 측정 기구는 구축되지 않았지만, 모델을 이론적 프레임워크로 사용하여 SRL의 흔적을 측정하는 비계 도구들이 많이 있다. 그들은 추적 및 로그 데이터를 위해 학생들의 활동을 기록하는 동안 SRL의 사용이 발판화되는 컴퓨터 지원 학습 환경인 nStudy와 gStudy를 개발했다. 또한 Winne의 이전 작업을 통해 SRL 연구에 가져온 추적 데이터는 SRL의 시간적 및 순차적 분석에 대한 새로운 기회를 열어주었으며, 이는 해당 분야에 대한 유망한 새로운 통찰력을 보여주고 있다. 또한 Winne은 SRL 측정에 대한 중요한 성찰문을 썼다.

  • Winne과 Perry(2000)에서는 "즉시" 또는 "온라인" SRL 측정의 중요성을 강조하고 SRL 측정에 대한 새로운 접근 방식을 열었다.
  • Winne et al(2011)에서는 추적 데이터를 사용한 SRL 방법을 검토하였다.

No classical measurement instruments have been constructed based on Winne and Hadwin’s model, but there are a number of scaffolding tools that measure traces of SRL using the model as theoretical framework (e.g., Winne et al., 2010). They have developed nStudy and gStudy, which are computer-supported learning environments in which the use of SRL is scaffolded while students’ activities are recorded for trace and log data (Winne et al., 2010; Winne and Hadwin, 2013). Additionally, trace data which was brought to SRL research via Winne’s earlier work (Winne, 1982; Winne and Perry, 2000) has opened up new opportunities for the temporal and sequential analysis of SRL which is showing promising new insights for the field (Azevedo et al., 2010; Malmberg et al., 2013). Furthermore, Winne has written important reflection papers on SRL measurement, especially

Pintrich:SRL에서 동기 부여의 역할을 강조하고 분야의 토대를 구축함
Pintrich: Grounding the Field and Emphasizing the Role of Motivation in SRL

Pintrich의 연구는 SRL 개념 프레임워크를 명확히 하는 데 큰 기여를 했고, SRL과 동기 부여의 관계에 대한 중요한 경험적 연구를 수행했으며, 그의 설문지 MSLQ-가 계속해서 널리 사용되고 있기 때문에 현장에서 계속 중요하다.
Pintrich’s work continues to be important in the field as he made a major contribution toward clarifying the SRL conceptual framework (e.g., Pintrich and de Groot, 1990), he conducted crucial empirical work on the relationship of SRL and motivation (Pintrich et al., 1993a), and his questionnaire -MSLQ- (Pintrich et al., 1993b) continues to be widely used (Schunk, 2005; Moos and Ringdal, 2012).

역사와 모델 개발.
History and Development of the Model

Pintrich는 SRL과 동기부여의 관계를 경험적으로, 이론적으로, 그리고 동기부여와 인지 사이의 연관성 부족을 최초로 분석한 사람 중 하나이다(Pintrich, 2000). 또한 이후 메타인지와 자율규제의 차이를 강조하고 명확히 했으며 SRL의 추가 탐구가 필요한 영역을 지적했다. 모델 자체의 관점에서, SRL의 첫 번째 핸드북에 제시된 것 중 하나의 버전만 있다.
Pintrich was one of the first to analyze the relationship between SRL and motivation empirically (Pintrich and de Groot, 1990), theoretically (Pintrich, 2000), and the lack of connections between motivation and cognition (Pintrich et al., 1993a). Further, he later emphasized and clarified the differences between metacognition and self-regulation (Pintrich et al., 2000) and pointed out the areas of SRL that needed further exploration (Pintrich, 1999). In terms of the model itself, there is only one version of it, the one presented in the first handbook of SRL (Pintrich, 2000).

Pintrich의 Serial통과 번호 모델
Pintrich’s SRL Model

Pintrich(2000년)모델에 따르면, SRL 4단계는 다음과 같다.
According to Pintrich (2000) model, SRL is compounded by four phases:

  • (1)Forethought, 계획 및 활성화;.
  • (2)모니터링;
  • (3)제어;
  • (4)반응과 반영
  • (1) Forethought, planning and activation;
  • (2) Monitoring;
  • (3) Control; and
  • (4) Reaction and reflection.

그들은 각각의 규제를 위한 4개의 다른 지역:인지, motivation/affect, 행동, 컨텍스트다. 단계 지역의 조합은 SRL 프로세스에서 상당한 수의(예:사전 콘텐츠 지식 활성화 효능 판단, 행동의 self-observations)(그림 10)를 포함한 종합 사진을 제공한다. 게다가, Pintrich(2000년)는 어떻게 SRL의 서로 다른 components/areas가 서로 다른 단계에 deploy되는지 아주 상세하게 설명했다. 다음으로 서로 다른 영역이 어떻게 개념화되었는지를 간략하게 설명하겠습니다.

  • 첫 번째 영역인 [인지]의 조절 측면에서 핀트리히는 학습의 판단과 아는 느낌과 같은 메타인지 연구를 통합하였다. 이 통합은 Pintrich's에 대한 인식이 얼마나 중요한지를 강조한다.
  • 두 번째 영역인 [동기 부여와 감정]의 조절에 대해 핀트리히는 자신의 경험적 연구에 기초하여 동기 부여와 영향이 학생들에 의해 조절될 수 있다고 설명했다. 3년 후, Wolters (2003)는 더 많은 경험적 증거를 찾는 작업을 계속했다.
  • 세 번째 영역인 [행동] 조절은 반두라(1977년, 1986년, 1997년)의 연구와 짐머먼(1989년)의 트라이아딕 모델을 기반으로 한다. 이 영역에서 핀트리히는 "자신의 겉으로 보이는 행동을 통제하려는 개인의 시도"를 통합했다. 여기서 분석된 다른 SRL 모델은 그러한 영역을 이해하는 것이 없으므로, 이러한 의미에서 Pintrich의 모델을 독특하게 만든다.
  • 네 번째 영역, 핀트리치가 포함시킨 [맥락] 조절은 학생들이 "학습 맥락을 모니터링, 제어 및 규제"하려는 SRL의 측면을 다루기 때문에 포함된다.

Each of them has four different areas for regulation: cognition, motivation/affect, behavior and context. That combination of phases and areas offers a comprehensive picture that includes a significant number of SRL processes (e.g., prior content knowledge activation, efficacy judgments, self-observations of behavior) (see Figure 10). Furthermore, in that chapter, Pintrich (2000) explained in great detail how the different SRL components/areas for regulation are deployed in the different phases. Next how the different areas were conceptualized will be shortly presented.

  • First, in terms of regulation of cognition, Pintrich incorporated metacognitive research such as judgments of learning and feelings of knowing. This incorporation emphasizes how important is cognition for Pintrich’s.
  • Regarding the second area, regulation of motivation and affect, Pintrich explained that motivation and affect could be regulated by the students based on his own empirical work (Pintrich et al., 1993aPintrich, 2004). Three years later, Wolters (2003) continued this line of work finding more empirical evidence.
  • The third area, regulation of behavior, is based on the work by Bandura (197719861997) and the Triadic model by Zimmerman (1989). In this area Pintrich incorporated the “individual’s attempts to control their own overt behavior” (Pintrich, 2000, p. 466). There is no other SRL model analyzed here that comprehends such area, making Pintrich’s in this sense unique.
  • And, fourth area, the regulation of context which Pintrich included because it addresses those aspects of SRL in which the students attempt to “monitor, control and regulate the (learning) context” (p. 469).
Figure 10

FIGURE 10. Pintrich’s SRL model. Adapted from Pintrich (2000).

Pintrich의 SRL 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting Pintrich’s SRL Model

Pintrich의 모델 검증을 직접적으로 다루는 경험적 증거는 없다. 그러나 Pintrich가 SRL 모델을 기반으로 한 초기 경험적 연구인 설문지인 MSLQ의 검증에 대한 경험적 데이터가 있다. 해당 계측기는 다음 섹션에서 분석됩니다. 추가적으로, 그의 기억에 바쳐진 특별호에서, 슝크(2005)는 핀트리치가 SRL 분야에 기여한 6가지 다른 분야를 검토했다.
There is no empirical evidence directly addressing Pintrich’s model validation. However, there is empirical data on the validation of the MSLQ, questionnaire that is the initial empirical work in which Pintrich based his SRL model. That instrument will be analyzed in the next section. Additionally, in a special issue dedicated to his memory, Schunk (2005) reviewed Pintrich’s major contributions to the SRL field identifying six different areas:

  • (a) SRL에 대한 개념적 프레임워크 및 모델(이전 섹션에서 방금 설명됨)
  • (b) 목표 지향에 특별한 초점을 둔 SRL에서 동기 부여의 역할
  • (c) SRL, 동기 부여 및 학습 결과 간의 관계
  • (d) SRL에서 강의실 맥락의 역할 및 동기 부여
  • (e) 경험적 연구를 통한 SRL 개발
  • (f) SRL(MSLQ) 측정기 개발
  • (a) a conceptual framework and model for SRL (just described in the previous section);
  • (b) the role of motivation in SRL with a special focus on goal orientation;
  • (c) the relationship between SRL, motivation and learning outcomes;
  • (d) the role of classroom contexts in SRL and motivation;
  • (e) the development of SRL through empirical studies; and
  • (f) the development of an instrument to measure SRL (MSLQ).

기기 및 측정 방법
Instruments and Measurement Methods

SRL 필드에 대한 주요 기여 중 하나는 MSLQ이다. MSLQ는 15가지 척도로 구성되며 31개 항목이 있는 동기부여 부문과 50개 항목이 있는 학습전략(SRL) 부문으로 구성되며 인지, 메타인지, 자원관리 등 3가지 일반적인 척도로 세분화된다. MSLQ의 장점 중 하나는 학생들의 학습 전략 사용에 대한 자세한 정보를 제공하는 SRL과 동기 부여의 결합이다. 설문지의 두 가지 버전이 대학생과 고등학생을 위해 개발되었다. Duncan과 McKeachi(2005)와 Moos와 Ringdal(2012)에 대한 추가 정보는 MSLQ를 사용한 연구 목록을 제공했다. 보다 최근에는 두 가지 리뷰에서 MSLQ가 SRL 측정과 자기효능감 측정에서 가장 많이 사용되는 도구라는 것을 발견했다. 이것은 SRL에서 핀트리히의 작업이 매우 중요한 영향을 미친다는 것을 강조한다.

One major contribution to the SRL field is the MSLQ (Pintrich et al., 1993b). The MSLQ is composed of 15 scales, divided into a motivation section with 31 items, and a learning strategies (SRL) section with 50 items which are subdivided into three general types of scales: cognitive, metacognitive, and resource management (Duncan and McKeachie, 2005). One of the strengths of the MSLQ is its combination of SRL and motivation, which offers detailed information about students’ learning strategies use. Two versions of the questionnaire have been developed for college (Pintrich et al., 1993b) and high school students (Pintrich and de Groot, 1990). For further information on the instrument Duncan and McKeachie (2005) and Moos and Ringdal (2012) provided a list of studies that have used MSLQ. More recently, two reviews have found that the MSLQ is the most used instrument in SRL measurement (Roth et al., 2016) and in self-efficacy measurement (Honicke and Broadbent, 2016). This emphasizes the highly significant impact of Pintrich’s work in SRL.

에프클라이드: 메타 인식과 SRL 사이의 누락된 부분
Efklides: The Missing Piece between Metacognition and SRL

Efklides(2011) 모델은 메타인지 기반인 Winne과 Hadwin's를 제외하면, 다른 모델보다 메타인지 배경이 강하다. 그러나, Efklides의 모델 동기 및 영향에서 후자와 비교할 때, Efklides의 형상에서 중심적인 역할을 차지한다. 이 모델은 최근 발표되었음에도 불구하고 상당한 횟수로 인용되었다.

Efklides (2011) model has a stronger metacognitive background than the other models, except Winne and Hadwin’s which is also metacognitively based. However, when comparing with the latter in Efklides’ model motivation and affect occupy a central role in Efklides’ figure. The model has been cited a significant number of times despite being recently published.

모델의 역사와 개발
History and Development of the Model

Efklides(2011)는 2011년에 MASRL(Metacognitive and Affective Model of Self-Regulated Learning)을 제시했는데, 이는 이전에 두 개의 이론적 논문에서 발표된 그녀의 아이디어를 확장했다(Efklides, 2006, 2008). 이 모델은 저자가 말한 고전적 사회인지 이론(Bandura, 1986)을 기반으로 한다. Efklides는 던로스키와 메트칼프(2008), 아리엘 외(2009), 코리엇과 누슨(2009)이 만든 메타인지 모델과 함께 기존 SRL 모델의 영향을 받았다. 언급된 메타인지 모델과 Efklides의 차이점은 그녀의 모델이 이론적으로 이전의 SRL 모델(예: 짐머먼의 윈과 해드윈, 핀트리치 모델)을 기반으로 한다는 것이다. 또한, Efklides의 모델은 여기서 분석된 다른 SRL 모델에 추가되어 SRL에 대한 메타인지 모델의 함의를 철저히 보여준다.

Efklides (2011) presented the Metacognitive and Affective Model of Self-Regulated Learning (MASRL) in 2011, which extended her ideas previously published in two theoretical articles (Efklides, 20062008). The model is grounded in classic socio-cognitive theory (Bandura, 1986), as stated by the author herself. Efklides has been influenced by the existing SRL models, along with metacognitive models such as those created by Dunlosky and Metcalfe (2008)Ariel et al. (2009), and Koriat and Nussinson (2009). The distinction of Efklides with the metacognitive models mentioned is that hers is theoretically grounded on previous SRL models (e.g., Zimmerman’s Winne and Hadwin’s, and Pintrich’s). Additionally, Efklides’ model adds to the other SRL models analyzed here, a thorough presentation of the implications of metacognitive models for SRL.

MASRL 모델
MASRL Model

MASRL에는 두 가지 수준이 있습니다(그림 11). 첫째, SRL에 대한 가장 "전통적인" 관점으로 학생의 개인적 특성을 이해하는 사람 수준(매크로 수준이라고도 함)이 있다. Efklides의 말에 따르면, "개인 수준은 SRL 기능의 일반화된 수준을 나타냅니다. 기억 지식, 기술, 동기 및 메타인지 신념에 주로 의존하는 작업을 볼 때 작동하며 영향을 미친다."(Efklides, 2011, 페이지 10). 따라서 다음과 같이 구성된다. 
In the MASRL, there are two levels (Figure 11). First, there is the Person level-also called macrolevel-which is the most “traditional” view of SRL and comprehends the personal characteristics of the student. In Efklides’ own words: “The Person level represents a generalized level of SRL functioning. It is operative when one views a task resorting mainly on memory knowledge, skills, motivational and metacognitive beliefs, and affect” (Efklides, 2011, p. 10). Therefore, it is composed of:

  • (a) 인지,
  • (b) 동기부여,
  • (c) 자기 개념,
  • (d) 감정
  • (e) 의지,
  • (f) 메타인지 지식의 형태로 메타인지
  • (g) 메타인지 기술의 형태의 메타인지
  • (a) cognition,
  • (b) motivation,
  • (c) self-concept,
  • (d) affect,
  • (e) volition,
  • (f) metacognition in the form of metacognitive knowledge, and
  • (g) metacognition in the form of metacognitive skills.

핵심 측면은 Efklides가 이 과제에 대한 학생들의 목표를 중심으로 구성되기 때문에, [Person level][하향식]으로 간주한다는 것입니다. 다시 말해, 학생이 투자할 목표의 추진력이 "인식 처리와 노력의 양을 안내한다"는 결정이며, 이는 "과제의 인식과 요구에 대한 개인의 능력, 직무 영역에서의 자기 개념, 동기 부여 및 영향"에 기초한다.
A key aspect is that Efklides considers the Person level to be top–down because it is structured around students’ goals for the task. In other words, the thrust of the student’s goals “guides cognitive processing and the amount of effort” the student will invest, a decision based “on the interactions of the person’s competences, self-concept in the task domain, motivation, and affect, vis-à-vis the perception of the task and its demands” (Efklides, 2011, p. 12).

Figure 11

FIGURE 11. Metacognitive and affective Model of Self-Regulated Learning model (MASRL). Adapted from Efklides (2011).

두 번째 단계인 [과제 × 개인 수준](마이크로 레벨이라고도 함)은 [과제 유형]과 [학생의 특성(즉, 개인 수준)] 간의 상호 작용이 발생하는 곳이다. 메타인지 활동이 학생의 행동을 통제하기 때문에, 이 수준은 [상향식]입니다. 따라서 활동은 특정 과제의 요구 사항을 해결하는 데 중점을 두는 "데이터 중심"이 됩니다. 쉽게 말해, 학생의 주의력은 [과제를 수행하는 구체적인 메커니즘]으로 이동하고, 일반적인 학습 목표(예를 들어 요약 완료)는 보다 구체적인 목표(예를 들어 철자 오류 확인)에 포함된다. 여기서는 [마이크로 레벨 모니터링]이 주요 프로세스입니다; 동기 부여와 감정 반응은 메타인지 자원의 진화와 개인의 성과에서 오는 피드백에 따라 달라진다. 마지막으로, Efklides는 이 level에서 [네 가지 기본 기능]을 식별합니다.

The second level, the Task × Person level–also known as microlevel–is where the interaction between the type of task and the student’s characteristics –i.e., person level–takes place. This level is bottom–up, as the metacognitive activity takes control of the student’s actions, which causes activity to be “data-driven” with the focus on addressing the demands of the specific task. To put it more simply, the student’s attention moves toward the specific mechanisms of performing the task, and the general learning goal (for example, finishing a summary) is subsumed in a more specific goal (for example, checking for spelling mistakes). Here, the microlevel monitoring is the main process; motivation and affect reactions depend on the evolution of the metacognitive resources and the feedback that comes from the person’s performance – i.e., if s/he is progressing appropriately. Finally, Efklides identifies four basic functions at this level:

  • (a) 인지
  • (b) 메타인지
  • (c) 감정 
  • (d) 감정과 노력의 조절
  • (a) cognition,
  • (b) metacognition,
  • (c) affect, and
  • (d) regulation of affect and effort,

이들은 독립적으로, 수직으로, 또는 통합적으로 수평으로 개념화할 수 있다(그림 11 참조).
which can be conceptualized independently, vertically, or, in an integrative way, horizontally (see Figure 11).

[개인 수준]과 [개인 × 사용자 수준] 간의 이러한 차이는 아마도 MARSL 모델의 가장 두드러진 특징일 것이다.

  • [개인 수준]은 목표 중심적이고, 하향식인 학생들의 SRL의 [일반적 특성 지향성] 특징을 나타낸다. 이 수준에서 MASRL 모델은 짐머먼(2000)과 같은 다른 person-level-oriented models과 유사하다.
  • [과제 × 개인 수준]에서 발생하는 행동은 덜 의식적이고 사람 지향적이다. 과제 수행은 학생의 주의와 처리의 대부분을 차지하며, 행동은 데이터 중심적이고 상향식이어서 Winne(2011)과 유사성을 보인다.

This distinction between the Person level and the Task × Person level is probably the most salient feature of the MARSL model.

  • The Person level represents the general trait-oriented features of students’ SRL, which are goal-driven and top–down. At this level, the MASRL model is similar to other more person-level-oriented models, such as Zimmerman’s (2000).
  • At the Task × Person level, the actions that take place are less conscious and person-oriented: the execution of the task occupies most of the student’s attention and processing, and the actions are data-driven and bottom–up, showing similarities with Winne’s (2011).

요약하면, MASRL 모델은 거시적 수준과 미시적 수준의 상호작용을 통해 메타인지, 동기부여 및 영향 간의 관계를 상세히 설명하고, Boekaerts와 Corno(2005)가 제공한 개념화와는 다른 하향/하향적 의미를 제시한다. 중요한 것은, 이 모델은 또한 모든 인지 자원이 활동을 주도하는 가장 인지 부하가 높은 단계인 과제 실행 동안 학생들이 어떻게 수행하는지 보여준다.
In sum, the MASRL model clarifies, in detail, the relationship among metacognition, motivation, and affect via the interaction of the macro and micro levels, and presents a different conceptualization of the top–down/bottom–up implications from the one provided by Boekaerts and Corno (2005). Importantly, the model also illustrates how students perform during the task execution, the phase with the highest cognitive load where all the cognitive resources are leading the activity.

MASRL 모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting the MASRL Model

Efklides(2011)는 지난 20년간의 설득력 있는 증거를 검토하여 경험적 지원을 받은 기본 MASRL 기능을 탐구했다. 먼저, 그녀는 경험적 증거가 다루어야 할 모델의 세 가지 기본 원리를 제시했습니다.

Efklides (2011) explored the basic MASRL features that have received empirical support by reviewing a compelling amount of evidence from the last two decades. First, she presented the three basic tenets of the model that the empirical evidence needs to address:

  • (a) MASRL의 두 가지 수준(매크로 및 마이크로 수준), 과제 요구가 두 수준에 미치는 영향 및 이들 간의 상호작용 확인
  • (b) 두 수준에서의 동기 부여 및 영향의 상호 작용
  • (c) 메타인식이 두 수준에서 취하는 다른 형태들
  • (a) identifying the MASRL’s two levels (macro- and microlevel), the effects of the task demands on both levels, and what the interactions among them are;
  • (b) the interaction of motivation and affect in the two levels; and
  • (c) the different forms that metacognition takes at both levels.


그리고 나서 그녀는 메타인지, 동기, 그리고 두 수준에서 영향 사이의 상호작용을 보여주는 연구와 그들의 상호작용이 실제로 모델을 지지한다고 주장했다. 마지막으로, 그녀는 "과제 × 사람 수준에서 인지, 메타인지 및 동기/영향의 관계" 또는 "메타인지 경험에 미치는 영향"과 같은 다양한 섹션으로 분류된 이러한 측면 중 일부를 다루는 많은 연구를 제시했다.
Then she argued that research showing interactions among metacognition, motivation, and affect at the two levels and their interaction actually supports the model. Finally, she presented a large number of studies addressing some of these aspects, grouped in different sections such as “Relations of cognition, metacognition and motivation/affect at the Task × Person level” or “Effects of affect on metacognitive experiences.”

기기 및 측정 방법
Instruments and Measurement Methods

MASRL 모델의 측면을 반영하는 두 가지 계측기가 있습니다.
There are two instruments that reflect aspects of the MASRL model.

  • 먼저 Dermitzaki와 Efklides(2000)는 언어 과제에 대한 자기 개념을 측정하기 위한 설문지를 구성했다. 이 도구는 학생들의 언어 수행 능력을 자기 인식, 자기 효능감, 자존감, 그리고 다른 사람들에 의한 능력에 대한 인식의 네 가지 범주들과 비교합니다. 예를 들어, 이러한 구성 요소의 상호 작용은 MASRL 모델의 핵심 측면이며, 이는 메타 인식을 통해 개인 및 개인 × 작업 수준에서 상호 작용한다.
  • 둘째, Efklides(2002)는 인지적 처리에 대한 판단과 감정을 탐구하는 메타인지 경험 설문지를 만들었다. 본 논문에서는 메타인지 경험과 성과 간의 관계를 살펴보고, 과제 난이도가 메타인지 경험에 미치는 영향을 살펴보았다.
  • First, Dermitzaki and Efklides (2000) constructed a questionnaire to measure self-concept for a language task. This instrument compares students’ language performance against the four reported categories: self-perception, self-efficacy, self-esteem, and perception of their abilities by others. The interaction of these components is a key aspect of the MASRL model as, for example, these interact at both the Person and the Person × Task levels with metacognition.
  • Secondly, Efklides (2002) created the Metacognitive Experiences Questionnaire, which explores judgments and feelings about cognitive processing. In that paper, the relationship between metacognitive experiences and performance was explored, as well as the effect of task difficulty on metacognitive experiences.

Hadwin, Järvelä 및 Miller: 협업 학습의 맥락에서 SRL
Hadwin, Järvelä, and Miller: SRL in the Context of Collaborative Learning

Hadwin 외 연구진과 Järvelä 및 Hadwin은 다른 동료들과 함께 정보통신 기술(ICT) 및 컴퓨터-지원 협업 학습(CSCL) 설정과 같은 학습의 사회적 및 대화형 특징에 대한 규제를 설명하는 데 SRL 이론의 잠재력을 탐구했다. 이러한 특별한 목적을 가진 SRL과 메타인식의 탐구는 비교적 최근의 것으로 2003년이 최초의 경험적 증거가 발표된 해로 확인되었다. 또한, 이 모델은 "모형의 역사와 개발" 섹션에서 언급했듯이 윈과 해드윈의 1998년 모델에 의해 강한 영향을 받았다.

Hadwin et al. (2011in press) and Järvelä and Hadwin (2013), together with other colleagues (for a review, see Panadero and Järvelä, 2015), have explored the potential of SRL theory in explaining regulation in social and interactive features of learning, e.g., use of information and communication technology (ICT) and computer-supported collaborative learning (CSCL) settings. The exploration of SRL and metacognition with this particular purpose is relatively recent, with 2003 identified as the year for the first empirical evidence published (Panadero and Järvelä, 2015). Additionally, the model is strongly influenced by Winne and Hadwin’s (1998) model, as noted in Section “History and Development of the Model.”

모델의 역사와 개발
History and Development of the Model

그들의 전제 중 하나는 학습을 위한 협업과 컴퓨터 지원 협업의 장점에도 불구하고, 협업은 인지적, 동기적, 사회적 및 환경적 과제를 제기한다는 것이다. 효과적으로 협업하기 위해 그룹 구성원은 그룹 작업에 전념하고 공유된 공통점을 확립하며 과제 인식, 전략 및 목표를 협상하고 공유해야 합니다: 즉, 그들은 학습의 조절(SSRL)을 공유할 필요가 있다. SSRL의 핵심 문제는 [개인적 및 사회적 프로세스]를 기반으로 병합하며, [개개인 수준]으로 축소할 수 없다는 것입니다. 이는 SSRL이 발생할 수 있는 기회를 제공하는 상황적 여건을 포함하여 학습 상황에서 사회적 주체의 활동으로 설명된다.
One of their premises is that, despite the advantages of collaboration and computer-supported collaboration for learning (Dillenbourg et al., 1996), collaboration poses cognitive, motivational, social, and environmental challenges (Järvelä et al., 2013; Koivuniemi et al., 2017). To collaborate effectively, group members need to commit themselves to group work, establish a shared common ground, and negotiate and share their task perceptions, strategies, and goals (Hadwin et al., 2010); in other words, they need to share the regulation of their learning (SSRL). The key issue in SSRL is that it builds on and merges individual and social processes, and it is not reducible to an individual level. It is explained by the activity of the social entity in a learning situation (Greeno and van de Sande, 2007), including situational affordances that provide opportunities for SSRL to happen (Volet et al., 2009).

위에서 언급한 바와 같이, SSRL은 최근에 SRL 내에서 개발된 분야이다. 이 때문에, Hadwin, Järvelä 및 Miller에 의해 제안된 모델(이하 SSRL 모델)은 2011년 핸드북의 첫 번째 제안에서 다가오는 SRL 핸드북의 장으로 크게 변경되었다.2 최근에 통합된 두 가지 가장 큰 변화는 저자들이 공동 조절 학습(아래 정의)에 대한 관점을 명확히 하고 COPES의 영향을 모델에 통합하고 명확히 했다는 것이다.
As mentioned above, SSRL is a field recently developed within SRL. Because of this, the model proposed by Hadwin, Järvelä, and Miller (hereinafter referred to as the SSRL model) has changed significantly from their first proposition in the 2011 handbook to the chapter in the forthcoming SRL handbook.2 The two biggest changes incorporated in the latest are: the authors have clarified their perspective on what is Co-regulated Learning (definition below) and they have incorporated and clarified the influence of COPES (Winne, 1997) in their model (Hadwin et al., in press).

모델
The Model

SSRL 모델은 협업 환경에서 자율규제(SRL), 공동조절(CoRL), 공유조절(SSRL)의 세 가지 조절 모드의 존재를 제안했다(그림 12). 
The SSRL model (Hadwin et al., 2011, in press) proposed the existence of three modes of regulation in collaborative settings: self-regulation (SRL), co-regulation (CoRL), and shared regulation (SSRL) (Figure 12). 

Figure 12

FIGURE 12. Socially shared regulated learning model 1. Adapted from Järvelä and Hadwin (2013).

첫째, [협력 속 SRL]은 (다른 그룹 구성원과의 상호작용에 적응하는 것을 포함하는) 개별 학습자의 조절 행동(인지, 메타인지, 동기, 감정, 행동)을 의미한다.
First, SRL in collaboration refers to the individual learner’s regulatory actions (cognitive, metacognitive, motivational, emotional, and behavioral) that involve adapting to the interaction with the other group members.

둘째, [협력 속 공동조절CoRL]은 "(다른 학생 또는 그룹 구성원과 상호작용할 때 발생하는) 전략적 계획, 제정, 성찰 및 적응의 (학생의) 전유appropriation을 자극하는 어포던스과 제약 조건을 광범위하게 의미한다. 이 규제 수준은 그동안 사용이 일관되지 않아 현장에서 가장 논란이 많았던 분야다.

Secondly, CoRL in collaboration “refers broadly to affordances and constraints stimulating the (student’s) appropriation of strategic planning, enactment, reflection, and adaptation (occurring when in interaction with other students or group members)” (Hadwin et al., in press, p. 5). This regulatory level is the one that has been in the most dispute in the field, as its use has not been consistent (Panadero and Järvelä, 2015).

마지막으로, 세 번째 유형인 [협력 속 공유조절SSRL]은 그룹 내에서 "의도적이고 전략적이며 거래적인 계획, 과제 제정, 반영 및 적응"을 취할 때 발생한다. SSRL과 CoRL의 주요 차이점은

  • SSRL에서는 조절 조치가 "그룹 구성원 간의 일련의 거래적 교류를 통해 나타난다"는 것이지만
  • CoRL에서는 특정 그룹 구성원(들)에 의해 안내 또는 지시된다는 것이다.

Finally, the third type, SSRL in collaboration, occurs when “deliberate, strategic and transactive planning, task enactment, reflection and adaptation” are taken within a group (Hadwin et al., in press, p. 5). The key difference between SSRL and CoRL is that,

  • in the former, the regulatory actions “emerge through a series of transactive exchanges amongst group members” whilst
  • in CoRL they are guided or directed by (a) particular group member/s.

2011년 모델 버전과 향후 버전 사이의 중요한 변경 사항은 무엇입니까? 첫째, CoRL 모드는 경험적 증거를 기반으로 재개념화되었다. Hadwin 외 연구진(2011)은 세 가지 유형의 CoRL을 제안하였다.
What are the significant changes between the 2011 model version and the forthcoming version? First, the CoRL mode has been reconceptualized based on the empirical evidence (Panadero and Järvelä, 2015). Hadwin et al. (2011) proposed three types of CoRL:

  • (a) SRL 촉진을 위하여 이뤄지는 조절학습의 일시적 중재(학습자 외)
  • (b) 협업 과제에서 서로의 학습에 대한 분산된 조절, 그리고
  • (c) 사회적 환경이 학습을 함께 촉진하는 상호 작용에 초점을 맞춘 미시 분석적 접근법
  • (a) temporary mediation (by other than the learner) of regulated learning to promote SRL,
  • (b) distributed regulation of each other’s learning in a collaborative task, and
  • (c) a microanalytic approach focusing on interactions through which social environments co-regulate learning.

다가오는 제안에서, 그들은 [협력의 효과]만으로 초점을 옮겼으며, [미시 분석 접근법]에 대해 그렇게 자세히 논의하지 않았다. 또 다른 중요한 변화는 그들이 CoRL과 SSRL 모두 발생할 수 있다는 근거를 검토하면서,  "그룹들이 그들의 협업에서 서로 다른 단계를 진행하면서, SSRL은 물론이거니와, CoRL도 단독으로 발생하지 않을 것"이라고 언급했다.
In their forthcoming proposal, they have shifted the focus to the effects of collaborating alone and have not discussed the microanalytic approach in such detail. Another crucial change is that they have considered the reviewed empirical evidence that CoRL and SSRL could both occur “as groups progress through different phases on their collaboration and not always SSRL nor will co-regulation happen in isolation” (Panadero and Järvelä, 2015, p. 199).

Hadwin 외 연구진(2011)은 SSRL을 Winne과 Hadwin(1998)에서 추출한 느슨하게 시퀀싱되고 재귀적으로 연결된 4개의 피드백 루프에서 전개되는 것으로 개념화했다.

Hadwin et al. (2011) conceptualized SSRL as unfolding in four loosely sequenced and recursively linked feedback loops (Figure 13) taken from Winne and Hadwin (1998).

  • [첫 번째 루프] 동안 그룹은 내부 및 외부 작업 조건을 기반으로 공유된 작업 인식을 협상하고 구성한다.
  • [두 번째 루프]를 통해, 그룹들은 과제에 대한 공유된 목표를 설정하고 과제에 함께 접근하는 방법에 대한 계획을 세운다.
  • [세 번째 루프]에서 그룹은 전략적으로 협업을 조정하고 진행 상황을 모니터링합니다. 이 모니터링 활동을 기반으로, 그룹들은 그들의 집단 활동을 최적화하기 위해 그들의 과제 인식, 목표, 계획 또는 전략을 바꿀 수 있다.
  • [네 번째 루프]에서 그룹은 미래의 성과를 평가하고 규제한다. 본질적으로, 그룹이 SSRL에 참여할 때, 그들은 "나" 또는 "너" 수준을 벗어나, 규제 활동을 확장하여 합의된 집단 활동을 조절한다.
  • During the first loop, groups negotiate and construct shared task perceptions based on internal and external task conditions.
  • Through the second loop, groups set shared goals for the task and make plans about how to approach the task together.
  • In the third loop, groups strategically coordinate their collaboration and monitor their progress. Based on this monitoring activity, the groups can change their task perceptions, goals, plans, or strategies in order to optimize their collective activity.
  • Finally, in the fourth loop, groups evaluate and regulate for future performance. In essence, when groups engage in SSRL, they extend regulatory activity from the “I” or “you” level to regulate their collective activity in agreement (Hadwin et al., 2011).
Figure 13

FIGURE 13. Socially shared regulated learning model 2. Adapted from Hadwin et al. (2011).

다가오는 모델 제안에서, 4단계 주기는 여전히 그대로지만, 다른 레이블 아래, 이제 윈과 해드윈의 연구에서 제안된 것을 사용한다. 또한 다음과 같은 중요한 변화가 있습니다. Winne(1997)의 COPES 아키텍처는 SSRL 모델에 처음으로 도입되었습니다. 이 추가는 특히 동기 부여 및 감정에 대한 영향과 함께 세 가지 규제 모드에서 (메타) 인지 처리를 명확히 한다.
In the forthcoming model proposal, the four-phase cycle remains, but under different labels, now using the ones proposed in Winne and Hadwin’s work. Additionally, there is a crucial change: Winne’s (1997) COPES architecture is introduced for the first time in the SSRL model. This addition clarifies, especially, the (meta)cognitive processing at the three regulatory modes along with the effects on motivation and emotion (Hadwin et al., in press, Figure 1).

모델을 뒷받침하는 경험적 증거
Empirical Evidence Supporting the Model

SSRL 저자들은 그들의 모델에 대한 경험적 검증을 위해 노력해 왔다. 한편, 다른 연구자들 또한 SSRL에 대한 많은 연구를 수행했다. Panadero와 Järvelä(2015)의 CoRL 및 SSRL에 대한 검토는 세 가지 주요 결론을 도출했다.
The SSRL authors have been working toward empirical verification of their model (e.g., Järvelä et al., 2013). Meanwhile, other researchers have also conducted a growing number of studies on SSRL. A review on CoRL and SSRL by Panadero and Järvelä (2015) extracted three main conclusions.

  • 첫째, 사회적 조절의 또 다른 수준이 확인되었다:
    • CoRL이라고 불리는, 집단의 한 구성원이 앞장서는, 덜 균형 잡힌 유형;
    • SSRL이라고 불리는, 목표를 협상하고 전략을 공유하는 공동 조절 유형.
    • 이러한 이유로, 이 저자들은 CoRL과 SSRL 모드가 어떻게 서로 얽히는지 재개념화하자고 제안했는데, 이는 향후 모델의 주요 변경사항 중 하나이다.
  • 둘째, [인지적, 메타인지적, 동기적, 정서적 공유 영역에서 SSRL의 발생에 대한 경험적 증거]가 발견되었다. 이 발견은 공유 조절이 모든 SRL 영역 내에서 발생한다는 것을 보여주기 때문에 중요하다.
  • 셋째, [SSRL이 학습과 성과를 촉진할 수 있다는 증거]가 있었습니다. 또한 검토 후 발표된 새로운 연구는 모델 주변의 경험적 증거를 계속 강화했다.
  • First, different levels of social regulation were identified:
    • a less balanced type called co-regulation, in which one member of the group takes the lead; and
    • a jointly regulated type, in which goals are negotiated and strategies are shared, known as SSRL.
    • Because of this, those authors proposed to reconceptualize how the CoRL and SSRL modes intertwine, which constitutes one of the main changes in the forthcoming version of the model.
  • Secondly, empirical evidence of the occurrence of SSRL in cognitive, metacognitive, motivational, and emotional shared areas were found. This finding is important, as it shows that shared regulation happens within all SRL areas.
  • And third, there was evidence that SSRL might promote learning and performance. Additionally, new research published after the review has continued strengthening the empirical evidence around the model (e.g., Järvelä et al., 2016a,b).

기구
Instruments

현재, 자체 보고 데이터를 이용한 해당 분야의 연구가 있음에도 불구하고 SSRL 모델에 따라 고전적인 측정 도구(예: 설문지)는 개발되지 않았다. 학습의 대인관계 규제의 맥락적 특성으로 인해 SSRL을 조사하기 위한 새로운 방법론이 개발되었다. 현재 도구는 예를 들어, 집단 인식, 계획 및 평가를 촉진하기 위해 컴퓨터 지원 환경으로서 문맥에서 발판과 측정을 결합한다. 또한, 모델 저자들의 공동 노력은 학생들의 개념과 의도와 같은 주관적 데이터로 삼각측량된 객관적 데이터(예: 시선 추적, 생리학적 반응)를 포함한 다중 모드 데이터 수집을 개발하는 데 있었다.

At this time, no classical measurement instruments (e.g., questionnaires) have been developed under the SSRL model, even though there is research in the field using self-reported data (e.g., Panadero et al., 2015a). Because of the contextual nature of interpersonal regulation of learning (Vauras and Volet, 2013), new methodologies have been developed to investigate SSRL. Current instruments combine scaffolding and measures in context as, for example, a computer-supported environment to promote group awareness, planning, and evaluation (e.g., Järvelä et al., 2015). Additionally, the joint effort of the model authors has been in developing multi-modal data collections including objective data (e.g., eye tracking, physiological responses) triangulated with subjective data, such as students’ conceptions and intent (Hadwin et al., in press).

자기조절학습 모델 비교
Comparing Self-Regulated Learning Models

다음으로, 모델을 다음 범주로 비교합니다.
Next, the models will be compared in the following categories.

  • 첫째, 모델의 인용 수.
  • 둘째, 모든 모델은 서로 다른 SRL 단계와 하위 프로세스로 나뉜다. 그들은 결론을 도출하기 위해 여기서 비교된다.
  • 셋째, SRL이 탐구하는 분야는 크게 (메타)인지, 동기, 감정 등 3가지로, 6가지 모델 각각에서 이들의 위치를 분석한다.
  • 넷째, SRL 모델은 개념화의 세 가지 주요 측면, 즉 상향식/하향식, 자동성 및 컨텍스트에서 상당한 차이를 보인다.
  • First, the models’ number of cites.
  • Second, all the models are divided into different SRL phases and subprocesses. They are compared here, to extract conclusions.
  • Thirdly, there are three main areas that SRL explores; (meta)cognition, motivation, and emotion; therefore, their positioning in each of the six models is analyzed.
  • And, fourth, the SRL models present significant differences in three major aspects of conceptualization: top–down/bottom–up, automaticity, and context.

현장에서의 인용과 중요성
Citations and Importance in the Field

이 섹션을 시작하기 전에 한 마디 조언: 인용 횟수는 모델의 품질과 전적으로 관련이 없는 측면에 의해 영향을 받을 수 있는 지표입니다. 중요한 혁신은 실제로 그렇게 많은 인용문을 받지 못한 모델들에 의해 이루어질 수 있다. 그럼에도 불구하고, 몇 가지 결론을 도출하는 것은 흥미로운 지표이다. 
One word of advice before starting this section: the number of citations garnered is an indicator that can be influenced by aspects not related exclusively to the quality of the model. Important innovations can actually be made by models that have not received so many cites. Nevertheless, it is an interesting indicator to extract some conclusions from.

표 1에는 모델당 인용 횟수가 제시되어 있습니다. Efklides 및 SSRL 모델은 최근에 게시된 것처럼 총 수가 더 적습니다. 그럼에도 불구하고, 그들은 연간 인용에서 유망한 숫자를 보여주는데, 이것은 그들의 관련성을 나타낸다. Boekaerts와 Winne 및 Hadwin의 모델은 인용 횟수에 따라 두 번째 그룹을 형성합니다. Boekaerts와 Corno(2005)의 연구는 Boekaerts의 모델뿐만 아니라 Corno와 Kuhl의 모델에 대한 정보, 특히 SRL 측정에 대한 반영을 포함하고 있음을 지적하는 것이 중요하다. 따라서, 그것은 보에카르트 모델의 인용을 부분적으로 표현한 것일 뿐이지만, 그녀의 모델이 제시되는 가장 많이 인용된 논문이다. Winne과 Hadwin(1998)의 책은 그들의 모델과 관련하여 가장 많이 인용된 작품이지만, 앞서 논의된 바와 같이 그들의 작품의 원래 발표는 아니다. 마지막으로, 2000년 핸드북에 제시된 핀트리히와 짐머만의 모델은 가장 많은 인용 수를 가지고 있으며, 짐머만이 가장 많이 인용되었다. 
In Table 1, the number of citations per model is presented. The Efklides and SSRL models have a lower total number, as they were published recently. Nevertheless, they show promising numbers in citations per year, which indicates their relevance. The models of Boekaerts and of Winne and Hadwin’s models form a second group according to their number of citations. It is important to point out that Boekaerts and Corno’s (2005) study includes not only Boekaerts’ model, but also information about Corno’s and Kuhl’s models and, especially, a reflection on SRL measurement. Therefore, it is only a partial representation of citations of Boekaerts’ model, but it is her most cited paper where her model is presented. Winne and Hadwin’s (1998) book is the most cited work regarding their model, but it is not the original presentation of their work, as earlier discussed. Finally, Pintrich’s and Zimmerman’s models, both presented in the 2000 handbook, have the highest number of citations, with Zimmerman as the most cited.

Table 1

TABLE 1. Number of citations of the different SRL models main publication.

구형 모델 4종을 비교해보면, [핀트리히와 짐머먼의 모델]은 [보에카르트나 윈과 해드윈의 모델]에 비해 더 널리 사용되고 있다. 두 가지 가능성이 있는 원인이 있다.

  • 하나는 첫 번째 것이 더 포괄적이고 이해하기 쉽고 교실에서 적용하기가 쉽다는 것이다. 첫 번째 원인과 관련하여, Pintrich와 Zimmerman의 모델은 서로 다른 유형의 하위 프로세스에 대한 보다 완전한 비전을 포함하고 있다. 이 네 가지 모델 수치를 비교해 보면, 짐머만과 핀트리치는 (a) 보에카르트보다 더 구체적인 하위 과정을 제시하고 (b) 윈과 해드윈이 직접 제시하지 않는 동기부여와 감정적 측면을 포함한다는 점이 두드러진다.
  • 두 번째 원인은 Boekaerts의 모형과 Winne과 Hadwin의 모형은 직관력이 약간 떨어지기 때문이며, 정확한 적용을 위해서는 기초 이론에 대한 더 깊은 이해가 필요하다. 이것은 이 두 모델이 다른 모델보다 덜 관련이 있다는 것을 말하는 것은 아니다. 반대로, 두 가지 모두 SRL에 대한 두 가지 중요한 측면, 즉 감정 조절과 메타 인식을 심층적으로 다룬다. 

If we compare the number of the four older models, Pintrich’s and Zimmerman’s models have been more widely used in comparison to Boekaerts’ and that of Winne and Hadwin. There are two probable causes.

  • One is that the first ones are more comprehensive and easier to understand and apply in classrooms (Dignath et al., 2008). With regards to the first cause, both Pintrich’s and Zimmerman’s models include a more complete vision of different types of subprocesses. If we compare these four models figures, it is salient that Zimmerman and Pintrich (a) present more specific subprocesses than Boekaerts and (b) include motivational and emotional aspects that are not directly presented by Winne and Hadwin.
  • The second cause is that Boekaerts’ model and Winne and Hadwin’s are slightly less intuitive, and a deeper understanding of the underpinning theory is needed for a correct application. This is not to say that these two models are less relevant than the others; on the contrary, both cover in depth two critical aspects for SRL: emotion regulation and metacognition.

마지막으로, 무스와 링달(2012)은 교실에서 SRL에서 교사의 역할에 대한 검토를 통해 Zimmerman의 모델이 이러한 저자들에 의해 제안된 것처럼 교사들과 함께 일할 때 가장 도움이 될 수 있는 "강력한 설명 렌즈"를 제공하기 때문에 그 연구 분야에서 우세하다는 것을 발견했다.
To finalize, Moos and Ringdal’s (2012) review of the teacher’s role in SRL in the classroom found that Zimmerman’s model has been the predominant in that line of research, as it offers “a robust explanatory lens” which might help the most when working with teachers as proposed by these authors.

단계 및 하위 프로세스
Phases and Subprocesses

모든 모델 저자들은 SRL이 다른 단계와 하위 프로세스로 구성된 [주기적cyclical]이라는 데 동의한다. 그러나 모델은 서로 다른 단계와 하위 프로세스를 제시하며, 이를 식별함으로써 몇 가지 결론을 도출할 수 있다. 일반적으로, Puustinen과 Pulkkinen(2001)의 리뷰는 그들이 분석한 모델이 세 가지 식별 가능한 단계를 가지고 있다고 결론지었다.
All of the model authors agree that SRL is cyclical, composed of different phases and subprocesses. However, the models present different phases and subprocesses, and by identifying them we can extract some conclusions. In general terms, Puustinen and Pulkkinen’s (2001) review concluded that the models they analyzed had three identifiable phases:

  • (a) 준비, 작업 분석, 계획, 목표 활성화 및 목표 설정
  • (b) 성과, 진행 상황을 모니터링 및 제어하는 동안 실제 작업이 수행
  • (c) 평가, 학생이 미래의 성과를 반영하고, 조절하고, 적응
  • (a) preparatory, which includes task analysis, planning, activation of goals, and setting goals;
  • (b) performance, in which the actual task is done while monitoring and controlling the progress of performance; and
  • (c) appraisal, in which the student reflects, regulates, and adapts for future performances.

추가된 두 모델에서 SRL 단계의 개념화는 무엇인가? (표 2 참조).

  • 첫째, Efklides(2011)는 반복된 작업 수행 후 개인 수준이 영향을 받는다고 간주하지만, 자신의 모델에서 평가 단계를 명확하게 명시하지 않는다.
  • 둘째, 2011년 버전의 SSRL 모델은 Winne과 Hadwin의 영향을 많이 받았지만, Pintrich와 유사하면서 다른 명명을 사용하는 4가지 단계를 제시한다. 따라서 표의 SSRL 모델 분류는 Puustinen과 Pulkkinen(2001)이 Pintrich's에 대해 제안한 것과 동일하다.

What is the conceptualization of SRL phases in the two added models? (see Table 2).

  • First, Efklides (2011) does not clearly state an appraisal phase in her model, although she considers that the Person level is influenced after repeated performances of a task.
  • Second, the SSRL model in its version from 2011, although strongly influenced by Winne and Hadwin’s, presents four phases that are similar to Pintrich’s but using different labels.Therefore, the SSRL model classification in the table is the same one that Puustinen and Pulkkinen (2001) proposed for Pintrich’s.
Table 2

TABLE 2. Models’ phases.

결론은 무엇인가? 여기서 Efklides'를 제외한 모든 모델이 Puustinen과 Pulkkinen에 의해 제안된 세 단계를 중심으로 개념화될 수 있다고 하더라도 SRL 단계의 두 가지 개념화는 구별할 수 있다. 

  • 첫째, 일부 모델은 각 단계에서 발생하는 단계와 하위 프로세스 간의 더 명확한 구별을 강조한다. 짐머만과 핀트리치의 모델은 이 그룹에 속하며, 각 단계마다 매우 뚜렷한 특징을 가지고 있다.
  • 두 번째 그룹인 윈과 해드윈, 보에카르트, 에프클라이드, SSRL(향후 버전) 모델은 SRL이 재귀적 단계를 가진 "개방적" 과정이며 첫 번째 그룹처럼 구분되지 않는다는 것을 더 분명하게 전달한다. 예를 들어, Winne과 Hadwin의 figure는 각 단계와 각 단계에 속하는 과정을 명확하게 구분하지 못한다: SRL은 시간이 지남에 따라 진화하는 피드백 루프로 제시된다. Winne과 Hadwin(1998)은 이 수치에 첨부된 텍스트를 통해서만 4가지 단계를 제안하고 있음을 명확히 했다.

What can be concluded? Even if all of the models considered here except Efklides’, can be conceptualized around those three phases proposed by Puustinen and Pulkkinen, two conceptualizations of the SRL phases can be distinguished.

  • First, some models emphasize a clearer distinction among the phases and the subprocesses that occur in each of them. Zimmerman’s and Pintrich’s models belong to this group, each having very distinct features for each phase.
  • Those in the second group-the Winne and Hadwin, Boekaerts, Efklides, and SSRL (in its forthcoming version) models-transmit more explicitly that SRL is an “open” process, with recursive phases, and not as delimited as in the first group. For example, Winne and Hadwin’s figure does not make a clear distinction between the phases and the processes that belong to each: SRL is presented as a feedback loop that evolves over time. It is only through the text accompanying the figure that Winne and Hadwin (1998) clarified that they were proposing four phases.


이 독특한 차이에서 오는 한 가지 의미는 다른 모델에 따라 개입하는 방법에 있을 수 있다. 

  • 첫 번째 모델 그룹은 효과 측정이 더 실현 가능하기 때문에 [더 구체적인 개입]을 허용할 수 있다. 예를 들어, 교사가 과제를 수행하는 동안 학생 중 한 명이 동기부여 문제를 가지고 있다는 것을 인지하는 경우, 그 특정 단계에서 짐머만이 제시한 하위 프로세스(예: 자기 결과)의 일부를 적용하면 긍정적인 결과를 얻을 수 있다.
  • 반면에, 두 번째 모델 그룹은 SRL을 더 관성적으로 관련된 하위 프로세스로 구성된 더 연속적인 프로세스로 인식하기 때문에 [더 전체적인 개입]을 제안할 수 있다. 그러나 이 가설은 미래에 탐구될 필요가 있을 것이다.

One implication from this distinctive difference could be in how to intervene according to the different models.

  • The first group of models might allow for more specific interventions because the measurement of the effects might be more feasible. For example, if a teacher recognizes that one of her students has a motivation problem while performing a task, applying some of the subprocesses presented by Zimmerman at that particular phase (e.g., self-consequences) might have a positive outcome.
  • On the other hand, the second group of models might suggest more holistic interventions, as they perceive the SRL as a more continuous process composed of more inertially related subprocesses. This hypothesis, though, would need to be explored in the future.

 

(메타) 인지, 동기, 감정
(Meta)cognition, Motivation, and Emotion

다음으로 SRL 활동의 세 가지 주요 영역과 각 모델이 SRL 활동을 어떻게 개념화하는지 살펴본다. 모델의 figure에 의해 해석이 가이드된다. figure는 각 저자에게 가장 중요한 SRL 측면을 보여주기 때문이다. 앞서 언급한 세 가지 영역에 대해 서로 다른 수준에 기초한 분류가 제안되었다(표 3). 수준이 본질적으로 가까운 것이 아니라 연속체 상의 위치로 개념화되었다는 것을 명확히 하는 것이 중요하다.

Next, the three main areas of SRL activity and how each model conceptualizes them will be explored. The interpretation is guided by the models’ figures as they reveal the most important SRL aspects for each author. A classification based on different levels for the three aforementioned areas is proposed (Table 3). It is important to clarify that the levels were conceptualized, not as being close in nature, but rather, as being positions on a continuum.

Table 3

TABLE 3. Models figures comparison on cognition, motivation, and emotion.

(메타) 인식
(Meta)cognition

(메타) 인식과 관련하여 세 가지 수준이 고려된다. 첫 번째 수준에는 (메타) 인식이 강조된 모델이 포함된다. 

Three levels are considered with regard to (meta)cognition. The first level includes models with a strong emphasis on (meta)cognition.

  • 이 수준의 첫 번째 모델은 
    • 윈과 해드윈의 모델로, 주요 과정은 메타인지적이다: "메타인지 모니터링은 자신의 학습을 스스로 조절하는 관문이다.
    • Efklides의 모델은 동기부여와 정서적 측면을 포함하지만 메타인지적 측면은 작업 × 사람 수준에서 더 자세히 정의되며 더 많은 실체를 가지고 있다. 
    • 마지막으로 SSRL 모델에는 Winne과 Hadwin의 COPES 아키텍처가 포함되어 있습니다. 그러나 SSRL 2011 버전은 (메타)인식을 강조하지 않았기 때문에, 두 개의 메타인지 모델 이후에 위치하기로 결정했다. 
  • 2층에는 핀트리치와 짐머만의 모델이 있다. 
    • Pintrich(2000)는 FOKs 및 FOLs와 같은 메타인지 이론의 측면과 함께 중심적인 역할을 하는 "인식의 조절"을 통합한다. 
    • Zimmerman(2000)은 앞서 설명한 모델의 경우처럼 여러 가지 선도적인 인지/메타인지 전략을 제시하지만 동기 부여 전략보다는 강조되지 않는다. 
  • 세 번째 단계에서, 보에카르트(Boekaerts)는 자신의 그림에 (메타)인지 전략의 사용을 포함하지만, 특정 전략을 명시적으로 언급하지는 않는다.
  • The first model at this level is
    • Winne and Hadwin’s, in which the predominant processes are metacognitive: “Metacognitive monitoring is the gateway to self-regulating one’s learning” (Winne and Perry, 2000, p. 540).
    • Efklides’ model includes motivational and affective aspects, but the metacognitive ones are defined in more detail at the Task × Person level and are the ones with more substance.
    • Finally, the SSRL model includes in the forthcoming version the COPES architecture from Winne and Hadwin. However, due to the fact that the SSRL 2011 version did not emphasize (meta)cognition, it was decided to locate it after the two more metacognitive models.
  • At the second level are Pintrich’s and Zimmerman’s models.
    • Pintrich (2000) incorporates the “regulation of cognition,” which has a central role along with aspects of metacognitive theory such as FOKs and FOLs.
    • Zimmerman (2000) presents a number of leading cognitive/metacognitive strategies, but they are not emphasized over the motivational ones, as is the case for the models just discussed.
  • At the third level, Boekaerts includes the use of (meta)cognitive strategies in her figures, but does not explicitly refer to specific strategies.

동기
Motivation

2단계 분류가 제안된다.

첫 번째 수준에는 짐머만, 보에카르트, 핀트리치 모델이 있다.

  • Zimmerman 자신의 SRL 정의는 목표의 중요성을 명시하고 목표 주도 활동으로서 SRL을 제시한다. 그의 모델에서,
    • 전-사고 단계에서, 자기 동기 부여 믿음은 중요한 구성 요소이다.
    • 수행performance 단계는 원래 의지의 중요성을 나타내는 성능/의지 제어로 설명되었다. 그리고
    • 자기반성 단계에서는 자기주장이 미래의 과제를 수행하려는 동기부여에 영향을 미친다.
  • Boekaerts에 따르면, 학생들은 학습 과제와 맥락을 "해석"한 다음 두 가지 다른 목표 경로를 활성화합니다. 이러한 경로는 학생들이 활성화(또는 활성화하지 않음)하는 규제 조치를 이끄는 경로입니다. 또한 Boekaerts는 SRL의 핵심 측면으로 자신의 모델에 동기부여 신념을 포함했습니다(그림 7 참조).
  • 마지막으로, Pintrich(2000)는 또한 짐머만의 것과 유사한 측면을 고려하는 동기/영향 영역을 그의 모델에 포함시켰지만, Pintrich는 메타인식에 더 중점을 두었다. 또한 Pintrich가 SRL에서 목표지향성의 역할을 탐구한 최초의 연구를 수행했다는 점도 언급해야 한다.

A two-level classification is proposed. The Zimmerman, Boekaerts, and Pintrich models are at the first level.

  • Zimmerman’s own definition of SRL explicitly states the importance of goals and presents SRL as a goal-driven activity. In his model,
    • in the forethought phase, self-motivation beliefs are a crucial component;
    • the performance phase was originally described (Zimmerman, 2000) as performance/volitional control, which indicates how important volition is; and
    • at the self-reflection phase, self-reactions affect the motivation to perform the task in the future.
  • According to Boekaerts, the students “interpret” the learning task and context, and then activate two different goal paths. Those pathways are the ones that lead the regulatory actions that the students do (or do not) activate (e.g., Boekaerts and Niemivirta, 2000). In addition, Boekaerts also included motivational beliefs in her models as a key aspect of SRL (see Figure 7).
  • Finally, Pintrich (2000) also included a motivation/affect area in his model that considers aspects similar to those in Zimmerman’s, but Pintrich’s places a greater emphasis on metacognition. It is also important to mention that Pintrich conducted the first research that explored the role of goal orientation in SRL (Pintrich and de Groot, 1990).

두 번째 수준에는 SSRL, Efklides, Winne 및 Hadwin 모델이 포함됩니다. 

  • SSRL은 2011년 버전 그림에 동기부여를 포함시키고 협업 학습 상황에서 자신의 역할을 강조했지만 동기부여 요소를 세부적으로 구분하지는 않았다. 그럼에도 불구하고, 저자들은 그룹 차원에서 동기 부여와 그 규제에 관한 상당한 양의 연구를 수행했다.
  • 마지막으로, Winne과 Hadwin(1998)과 Efklides(2011)는 그들의 모델에 동기를 포함했지만, 그것은 그들의 주요 분석 초점은 아니다.

The second level includes the SSRL, Efklides, and Winne and Hadwin models.

  • SSRL included motivation in the 2011 version figure and emphasized its role in collaborative learning situations, but without differentiating motivational components in detail. Nevertheless, the authors have conducted a significant amount of research regarding motivation and its regulation at the group level (e.g., Järvelä et al., 2013).
  • Finally, Winne and Hadwin (1998) and Efklides (2011) included motivation in their models, but it is not their main focus of analysis.

감정
Emotion

세 가지 수준이 제안된다.

  • 첫째는 학생들의 목표에서 감정의 영향과 이것이 어떻게 두 가지 가능한 경로와 다른 전략을 활성화시키는지 강조한다. Boekaerts에게 자아 보호는 웰빙 경로에서 중요한 역할을 하며, 그러한 이유로 학생들은 대신 학습 경로를 활성화하기 위해 감정을 조절하는 전략을 갖는 것이 필수적이다.
  • 두 번째 수준에서,
    • Pintrich(2000)와 Zimmerman(2000)은 감정에 대한 비슷한 해석을 공유했다. 그들은 둘 다 학생들이 마지막 SRL 단계에서 자신의 작업을 자체 평가할 때 발생하는 반응(즉, 귀속 및 정서적 반응)에 가장 중점을 둔다. 또한 두 사람 모두 공연 중 감정을 통제하고 모니터링하는 전략을 언급했다.
      • 핀트리히는 "인식 및 모니터링"과 "관리하기 위한 전략의 선택과 적응"에 대해 논의했고,
      • 짐머만은 이미지와 자기 결과가 학생들이 긍정적인 감정을 자아내는 데 사용될 수 있다고 말했다.
      • 그럼에도 불구하고 준비단계에서는 둘 다 감정을 직접적으로 언급하지 않는다. 단, 짐머만은 자신의 사전 사고 단계에 포함된 자기효능감이 감정이나 감정 조절보다 그 단계에서 성과를 더 잘 예측할 수 있다고 주장한다.
    • SSRL 모델은 2011년 버전 그림에 감정을 포함하지만 감정 규제의 기초가 되는 하위 프로세스는 명시되지 않는다. 그럼에도 불구하고, 이러한 저자들은 협업 학습 상황이 중요한 정서적 과제를 제시한다고 분명히 주장하며, 이 문제를 탐구하는 경험적 연구를 수행했다. 
  • 마지막으로, Efklides (2011)와 Winne과 Hadwin은 SRL에서 감정의 역할에 대해 언급한다. [예를 들어, "영향은 기분과 같이 메타인지 경험에 직접적인 영향을 미칠 수 있다." (Efklides, 2011, 페이지 19, 그리고 그녀는 그것을 두 가지 수준에서 그녀의 모델에 포함시켰다.) 그러나, 그들은 감정 조절 전략에 큰 중점을 두지 않는다.

Three levels are proposed.

  • In the first one (Boekaerts, 1991Boekaerts and Niemivirta, 2000) emphasizes the influence of emotions in students’ goals and how this activates two possible pathways and different strategies. For Boekaerts, ego protection plays a crucial role in the well-being pathway, and for that reason it is essential for students to have strategies to regulate their emotions, so that they will instead activate the learning pathway.
  • At the second level, Pintrich (2000) and Zimmerman (2000) shared similar interpretations of emotions. They both put the most emphasis on the reactions (i.e., attributions and affective reactions) that occur when students self-evaluate their work during the last SRL phase. In addition, both mentioned strategies to control and monitor emotions during performance:
    • Pintrich discusses “awareness and monitoring” and “selection and adaptation of strategies to manage” (Pintrich, 2000), and
    • Zimmerman stated that imagery and self-consequences can be used by students to self-induce positive emotions (Zimmerman and Moylan, 2009).
  • Nevertheless, in the preparatory phases, neither of them mentions emotions directly. Yet, Zimmerman argues that self-efficacy, which is included in his forethought phase, is a better predictor of performance at that phase than emotions or emotion regulation (Zimmerman, B. J. personal communication with the author, 28/02/2014). The SSRL model includes emotion in its 2011 version figure (Hadwin et al., 2011), but the subprocesses that underlie the regulation of emotion are not specified. Nonetheless, these authors clearly argue that collaborative learning situations present significant emotional challenges, and they have conducted empirical studies exploring this matter (e.g., Järvenoja and Järvelä, 2009; Koivuniemi et al., 2017).
  • Finally, Efklides (2011) and Winne and Hadwin (e.g., Winne, 2011) mention the role of emotions in SRL [e.g., “affect may directly impact metacognitive experiences as in the case of the mood” (Efklides, 2011, p. 19, and she included it in her model at two levels]. However, they do not place a major emphasis on emotion-regulation strategies.

비교를 위한 세 가지 추가 영역
Three Additional Areas for a Comparison

앞서 언급했듯이 모델이 현저한 차이를 보이는 세 가지 영역이 추가로 확인되었다.
As mentioned earlier, three additional areas in which the models present salient differences were identified.

하향식/상향식(TD/BU)
Top–Down/Bottom–Up (TD/BU)


이러한 자율규제의 분류를 포함하는 첫 번째 모델은 Boekaerts와 Niemivirta(2000)였다.

  • 하향식(top-down)은 학습/과제 목표가 학생과 더 관련이 있는 숙달/성장 경로입니다. 반면에
  • 상향식(bottom-up)은 학생들이 자아 보호라고도 알려진 자아 개념(즉, 자존감)이 손상되는 것을 막기 위해 목표를 활성화하는 웰빙 경로이다.

Efklides(2011)도 이 분류를 사용하지만 다른 의미를 갖는다. 그녀에게 있어

  • [하향식 조절]은 그 사람의 특성(예: 인지 능력, 자기 개념, 태도, 감정 등)에 따라 목표가 설정될 때 발생하며, 그러한 개인적 목표에 따라 자기 조절이 지도된다.
  • [상향식 조절]은 데이터 중심일 때, 즉 과제 수행의 세부 사항(예: 과제 진행 상황 모니터링)이 학생의 행동을 지시하고 조절할 때 발생한다. 다시 말해, 학생이 과제를 수행하려고 할 때 인지 과정이 주된 초점이 된다.

The first model that included this categorization of self-regulation was Boekaerts and Niemivirta (2000).

  • Top–down is the mastery/growth pathway in which the learning/task goals are more relevant for the student. On the other hand,
  • bottom–up is the well-being pathway in which students activate goals to protect their self-concept (i.e., self-esteem) from being damaged, also known as ego protection. 

Efklides (2011) also uses this categorization, but with different implications. For her,

  • top–down regulation occurs when goals are set in accordance with the person’s characteristics (e.g., cognitive ability, self-concept, attitudes, emotions, etc.), and self-regulation is guided based on those personal goals.
  • Bottom–up occurs when the regulation is data-driven, i.e., when the specifics of performing the task (e.g., the monitoring of task progress) direct and regulate the student’s actions. In other words, the cognitive processes are the main focus when the student is trying to perform a task.

일부 암묵적 해석을 추출할 수 있지만, 다른 모델은 이 분류를 명시적으로 탐구하지 않는다. 이렇게 하면 짐머먼 모델과 윈과 해드윈 모델의 상호작용적 특성을 기반으로 한 TD/BU의 세 번째 비전이 있을 수 있습니다. 짐머먼(저자 27/02/2014)은 다음과 같이 설명했습니다.
The other models do not explore this categorization explicitly, although some implicit interpretations can be extracted. This way, there could be a third vision of TD/BU that is based on the interactive nature of Zimmerman’s model and Winne and Hadwin’s. Zimmerman (personal communication to author 27/02/2014) explained:

역사적으로, 하향식 이론은 인지적이었고 개인적인 믿음과 정신적 과정을 주로 강조해왔다(예: 정보처리 이론 대조적으로 상향식 이론은 행동적이었고 행동과 환경을 주로 강조해 왔다(예: 행동 수정 이론). 1977년 반두라(Bandura)가 사회 인지 이론을 발전시켰을 때, 그는 두 입장이 모두 절반씩 옳았다고 결론 내렸다. 그의 이론은 삼원적 묘사를 사용하여 두 관점을 통합한다. 나는 그의 공식이, 하향식이나 상향식이 아니라, 인지 과정이 양방향의 원인이 되고 행동과 환경에 의해 야기되는 상호작용주의적이라고 주장한다. SRL의 나의 순환 모델은 이러한 3원 구성 요소를 정교하게 설명하고 피드백의 반복된 관점에서 상호 작용을 설명한다. 따라서 이 모델의 변수(예: 학생의 자기 효능감 신념)는 다음 피드백 주기 동안 변경될 수 있습니다. 목표가 없는 사람들이 스포츠, 음악, 예술, 또는 학계에서 성공을 경험하고 그 과정에서 강한 목표를 개발하는 예는 셀 수 없이 많다. 인터랙티브 이론은 목표를 따르는 것만큼 목표를 개발하는 것을 강조한다.

Historically, top–down theories have been cognitive and have emphasized personal beliefs and mental processes as primary (e.g., Information Processing theories). By contrast, bottom–up theories have been behavioral and have emphasized actions and environments as primary (e.g., Behavior Modification theories). When Bandura (1977) developed social cognitive theory, he concluded that both positions were half correct: both were important. His theory integrates both viewpoints using a triadic depiction. I contend that his formulation is neither top–down [n]or bottom–up but rather interactionist where cognitive processes bi-directionally cause and are caused by behavior and environment. My cyclical model of SRL elaborates these triadic components and describes their interaction in repeated terms of cycles of feedback. Thus, any variable in this model (e.g., a student’s self-efficacy beliefs) is subject to change during the next feedback cycle…. There are countless examples of people without goals who experience success in sport, music, art, or academia and subsequently develop strong goals in the process. Interactionist theories emphasize developing one’s goals as much as following them.

Winne은 다음과 같이 말했다.
Winne (personal communication to the author 27/02/2014) stated:

나는 이 용어가 제한적이기 때문에 소개하지 않았다. SRL의 중요한 특성은 정보의 단방향 흐름이 아닌 [정보 흐름의 사이클]입니다. 어떤 주기는 사람 내부에 있고 어떤 주기는 사람과 환경의 경계를 넘나든다.
I didn’t introduce this terminology because it is limiting. A vital characteristic of SRL is cycles of information flow rather than one-directional flow of information. Some cycles are internal to the person and others cross the boundary between person and environment.


요약하자면, 짐머먼과 윈은 성능 중 피드백의 재귀적 주기가 자체 규제와 목표의 특수성에 변화를 일으키기 때문에 TD/BU가 그들의 모델에 적용 가능하다고 생각하지 않는다.
In sum, Zimmerman and Winne do not consider TD/BU to be applicable to their models, as the recursive cycles of feedback during performance generate self-regulation and changes in the specificity of the goals.

Pintrich(2000) 모델이 목표 중심이기 때문에 Efklides(2011)가 제안한 것처럼 하향식 동기 부여는 개인적 특성에서 오는 것으로 개념화된다고 가정할 수 있다. 그럼에도 불구하고, 핀트리히는 성과와 회피 목표를 내포하는 목표 지향도 포함했는데, 이는 보에카츠의 웰빙 경로, 특히 회피 목표와 관련이 있다. 따라서 TD/BU의 해석이 그의 모델에 어떤 영향을 미칠지 정확하게 식별하기는 어렵다. SSRL 모델은 아직 이 문제를 명확히 밝히지 않았지만, Winne과 Hadwin의 입장과 유사한 입장을 전제로 할 수 있다.
As Pintrich’s (2000) model is goal-driven, it could be assumed that it conceptualizes top–down motivation as coming from personal characteristics, as proposed by Efklides (2011). Nevertheless, Pintrich also included goal orientation, which implicates performance and avoidance goals, which has a connection to Boekaerts’ well-being pathway, especially avoidance goals. Therefore, it is difficult to discern with any precision what the interpretation of TD/BU would be for his model. The SSRL model (Hadwin et al., 2011) has not yet clarified this issue, though a stance similar to that of Winne and Hadwin could be presupposed.

자동성
Automaticity

SRL에서 자동성은 일반적으로 [자동 응답 패턴이 된 기본 프로세스]를 의미합니다. [(메타)인지 과정]을 가리키는 말로 자주 쓰인다. 일부 저자들은 SRL이 발생하기 위해서는 일부 과정이 자동으로 되어야 학생들이 인지 부하를 덜 가질 수 있고 전략을 활성화할 수 있다고 주장한다. 그러나, 그것은 또한 학생들의 의식 없이 일어나는 동기부여와 감정적 과정을 의미할 수도 있다. 다음으로, 자동성에 대한 다양한 관점을 설명하기 위해 이 주제에 대한 모델의 몇 가지 인용문이 제시될 것이다. Winne (2011)은 다음과 같이 말했다.

In SRL, automaticity usually refers to underlying processes that have become an automatic response pattern (Bargh and Barndollar, 1996; Moors and De Houwer, 2006; Winne, 2011). It is frequently used to refer to (meta)cognitive processes: some authors maintain that, for SRL to occur, some processes must become automatic so that the student can have less cognitive load and can then activate strategies (e.g., Zimmerman and Kitsantas, 2005; Winne, 2011). However, it can also refer to motivational and emotional processes that occur without student’s awareness (e.g., Boekaerts, 2011). Next, some quotations from the models on this topic will be presented to illustrate the different perspectives of automaticity. Winne (2011) stated:

대부분의 인지는 학습자가 그것을 하는 것에 대해 숙고하거나 그것이 어떻게 전개되는지에 대한 세밀한 세부 사항을 통제할 필요 없이 수행된다. 일부 연구자들은 그러한 인식을 "의식적이지 않은unconscious" 라고 부르지만, 나는 '암묵적implicit'이라는 명명을 선호한다. 인지 활동의 많은 부분이 암묵적이기 때문에, 학습자들은 그들의 인지를 거의 인식하지 못한다. 두 가지 조건이 있습니다.

첫째, 오류와 장애물이 발생할 때 인식은 암묵적인 것에서 명시적인 것으로 바뀔 수 있다. 

그러나 둘째, 학습자가 인지적 산물을 유형적 표현으로 추적하거나, 예를 들어 주요 아이디어에 대한 차별을 나타내는 강조를 하지 않는 한, 시간에 따른 사건에 대한 인지적 추적은 신뢰할 수 없고 일시적인 기억일 수 있다.
Most cognition is carried out without learners needing either to deliberate about doing it or to control fine-grained details of how it unfolds…Some researchers describe such cognition as “unconscious” but I prefer the label implicit…Because so much of cognitive activity is implicit, learners are infrequently aware of their cognition. There are two qualifications.

First, cognition can change from implicit to explicit when errors and obstacles arise. But, second, unless learners trace cognitive products as tangible representations -“notes to self” or underlines that signal discriminations about key ideas, for example-the track [of] cognitive of events across time can be unreliable, a fleeting memory (p. 18).

또한 Efklides(2011)는 다음과 같이 밝혔다.
In addition, Efklides (2011) indicated:

작업 × 사람 수준에서 작동하는 SRL의 개념은 [행동에 직접적인 영향을 미치는 무의식적인 자동 프로세스 및 암시적 지식]뿐만 아니라 [의식적인 분석 프로세스와 명시적 지식]이 있는 인지 아키텍처를 전제로 한다.
This conception of the SRL functioning at the Task × Person level presupposes a cognitive architecture in which there are conscious analytic processes and explicit knowledge as well as non-conscious automatic processes and implicit knowledge that have a direct effect on behavior (p. 13).


Boekaerts는 또한 자동성이 학생들이 활성화할 수 있는 다양한 경로에서 중요한 역할을 할 수 있다고 가정했다. "Bargh (1990)의 입장은 목표 활성화가 자동적이거나 의도적일 수 있다는 것이고 Bargh와 Barndollar (1996)는 일부 목표가 개인의 인식 밖에서 환경적 단서에 의해 직접 활성화되거나 촉발될 수 있다는 것을 입증했다. Pintrich(2000)는 이렇게 구체화했다: "어느 정도 수준에서, 사전 지식의 활성화 과정은, 의식적인 생각 없이 자동으로 일어날 수 있고 실제로 일어난다." 마지막으로 짐머먼과 모일런은 2009년에 다음과 같이 주장했다.
Boekaerts also assumed that automaticity can play a crucial role in the different pathways that students might activate: “Bargh’s (1990) position is that goal activation can be automatic or deliberate and Bargh and Barndollar (1996) demonstrated that some goals may be activated or triggered directly by environmental cues, outside the awareness of the individual” (Boekaerts and Niemivirta, 2000, p. 422). Pintrich (2000) specified: “At some level, this process of activation of prior knowledge can and does happen automatically and without conscious thought” (p. 457). Finally, Zimmerman and Moylan (2009) asserted:

사전 사고에 미치는 영향의 관점에서, 프로세스 목표는 전략적 계획(두 가지 주요 업무 분석 프로세스를 결합하는 것)을 포함하도록 설계되었습니다. 공부 및 연습에서, 학생들은 결국 그 전략을 자동적으로 사용할 것이다. 자동화는 긴밀한 메타인지 모니터링 없이 전략을 실행할 수 있을 때 발생합니다. 자동화 시점에서는 농구 자유투 슈터가 마지막 샷의 결과에 따라 던지기 전략을 조정할 때와 같이 자신의 개인 능력에 따라 경기력을 적응시키는 데 도움을 주기 때문에 결과 피드백의 혜택을 받을 수 있다. 그러나, 심지어 전문가들도 전략이 자동화된 후에 후속적인 어려움에 직면하게 될 것이며, 이것은 그들이 그들의 모니터링을 결과에서 프로세스로 다시 전환하도록 요구할 것이다. 
In terms of their impact on forethought, process goals are designed to incorporate strategic planning-combining two key task analysis processes. With studying and/or practice, students will eventually use the strategy automatically. Automization occurs when a strategy can be executed without close metacognitive monitoring. At the point of automization, students can benefit from outcome feedback because it helps them to adapt their performance based on their own personal capabilities, such as when a basketball free throw shooter adjusts their throwing strategy based on the results of their last shot3. However, even experts will encounter subsequent difficulties after a strategy becomes automatic, and this will require them to shift their monitoring back from outcomes to processes (p. 307).

따라서 자동성은 대부분의 모델에서 중요한 측면이다. 여기서, 성찰을 위한 세 가지 측면이 있다.
Thus, automaticity is an important aspect in the majority of the models. Here, there are three aspects for reflection.

  • 첫째, SRL에 영향을 미치는 자동 작업이 있습니다. 예를 들어, Pintrich(2000)는 사전 지식으로의 접근을 언급했고 Boekaerts(2011)는 목표 활성화에 대해 논의했다.
  • 둘째, Winne(2011)이 제안한 바와 같이, 학생들의 목표에 도달하기 위한 다수의 학습전략의 제정으로 이해될 때, 자기조절도 암묵적으로 일어날 수 있다고 가정할 수 있다. 이것은 학생들이 전략적으로 행동하기 위해 명백하고 의식적이며 목적적인 행동이 필요하지 않을 정도로 SRL 전략을 사용하는 데 있어서 매우 진보할 수 있다는 것을 의미한다. 그럼에도 불구하고, 이것은 연습이 필요하다.
  • 셋째, 일부 자동 반응, 특히 일부 감정, 심지어 일부 복잡한 감정 조절 전략은 학습에 긍정적이지 않을 수 있다. 예를 들어, Boekaerts(2011)는 웰빙 경로가 학생들이 알지 못하는 경우에도 활성화될 수 있다고 언급한다. 따라서 학생들이 이러한 부정적인 자동 과정을 인식하도록 돕는 것은 [학습 지향적인 자기조절]을 강화할 수 있는 잠재력을 가질 수 있다.
  • First, there are automatic actions that affect SRL; for example, Pintrich (2000) mentioned access to prior knowledge and Boekaerts (2011) discussed goal activation.
  • Second, we can assume that even self-regulation, when it is understood to be the enactment of a number of learning strategies to reach students’ goals, can happen implicitly, as proposed by Winne (2011). This means that students can be so advanced in their use of SRL strategies that they do not need an explicit, conscious, purposive action to act strategically. Nevertheless, this takes practice.
  • Third, some automatic reactions, particularly some emotions, and even some complex emotion-regulation strategies may not be positive for learning (Bargh and Williams, 2007). For example, Boekaerts (2011) mentions that the well-being pathways can be activated even when students are not aware. Therefore, assisting students to become aware of those negative automatic processes could have the potential to enhance self-regulation that is oriented toward learning.

맥락
Context

SSRL 모델은 맥락의 역할뿐만 아니라 사회적 영향력을 행사하여 개인의 자율규제를 촉진하는 다른 외부 출처(집단 구성원, 교사 등)의 능력이나 협력하는 동안 공동으로 규제하는 학생 집단의 능력을 강조하는데, Zimmerman(2000)은 그의 Cyclical phase model에 맥락을 포함시키지 않았고, 특정 전략 "환경 구조화"만 약간 언급하고 있다. 그러나 그의 3차원 및 다단계 모델에서 [맥락의 영향과 및 대리 학습]은 자기조절 능력 개발의 핵심이다. Boekaerts와 Niemivirta(2000)는 맥락에 대한 학생들의 해석이 다른 목표 경로를 활성화하고 이전의 경험이 학생들이 교실에서 채택하는 다양한 역할(예: 조커, 괴짜)에 영향을 미친다고 주장한다. 윈(1996년), 핀트리치(2000년), 에프클라이드(2011년) 모델의 경우 맥락은 다음과 같다.
The SSRL model emphasizes not only the role of context, but also the ability of different external sources (group members, teachers, etc.) to promote individual self-regulation by exerting social influence (CrRL) or of groups of students to regulate jointly while they are collaborating (SSRL) (Järvelä and Hadwin, 2013). Zimmerman (2000) did not include context in his Cyclical Phases model, only a minor reference to the specific strategy “environmental structuring.” However, in his Triadic and Multi-level models, the influence of context and vicarious learning is key to the development of self-regulatory skills (Zimmerman, 2013). Boekaerts and Niemivirta (2000) posits that students’ interpretation of the context activates different goal pathways and that previous experiences affect the different roles that students adopt in their classrooms (e.g., joker, geek). For Winne (1996), Pintrich (2000), and Efklides (2011) models, context is:

  • (1) 작업 요구에 적응하는 데 중요하다.
  • (2) 학생들이 상황으로부터 정보를 받고 그에 따라 전략을 조정할 때 피드백의 고리의 일부.
  • (1) important to adapt to the task demands, and
  • (2) part of the loops of feedback as students receive information from the context and adapt their strategies accordingly.

요약하면, 모든 모델은 SRL에 대한 중요한 변수로 컨텍스트를 포함한다. 그럼에도 불구하고, Hadwin, Järvelä 및 Miller의 연구를 제외하고, 다른 맥락이나 작업 맥락이 SRL에 어떻게 영향을 미치는지 탐구하는 데 다른 사람들에 의해 수행된 연구는 많지 않다.
In sum, all of the models include context as a significant variable to SRL. Nevertheless, with the exception of Hadwin, Järvelä, and Miller’s work, not much research has been conducted by the others in exploring how significantly other contexts or the task context affect SRL.

논의
Discussion

본 검토의 목적은 SRL의 교육심리모델을 비교하는 것이었다. 이 목표를 달성하기 위해 포함된 모델을 제시하고 비교했다. 다음으로, 몇 가지 최종 결론이 제시될 것이다.
The aim of this review was to compare educational psychology models of SRL. To achieve this goal, the included models have been presented and compared. Next, some final conclusions will be presented.

모델에 대한 메타분석적 경험적 증거
Meta-Analytical Empirical Evidence for the Models

모든 모델은 주요 측면 중 일부에 대한 타당성을 뒷받침하는 경험적 증거를 가지고 있다. 그러나 SRL 모델은 많은 수의 프로세스를 공유하기 때문에 경험적 증거에 상당한 중복이 있다. 예를 들어, 자기효능감은 일부 SRL 모델에서 중요한 변수입니다. 따라서 고등교육 학생의 자기효능감에 영향을 미치는 요인에 대한 반 딘터 외 연구진(2010) 검토를 고려한다면, 중요한 SRL 과정으로서 자기효능감을 강조하는 모든 모델에 영향을 미친다. 이러한 이유로, 특정 SRL 모델에 맞춘 각각의 개별 경험적 기여를 분리하여 다른 5개 모델에 적용하는 것은 매우 복잡할 것이다. 결과적으로, 분석은 SRL 분야에서 수행된 메타 분석에서 비롯되는 더 많은 횡단적 발견에 초점을 맞출 것이다.
All of the models have empirical evidence that supports the validity to some of their main aspects. However, because the SRL models share a high number of processes, there is a significant overlap in the empirical evidence. For example, self-efficacy is a crucial variable for some SRL models (e.g., Pintrich, 2000; Zimmerman, 2000). Thus, if we consider van Dinther et al. (2010) review on factors affecting self-efficacy in higher education students, it has implications for all those models that emphasize self-efficacy as a crucial SRL process. For this reason, trying to disentangle each individual empirical contribution tailored to a specific SRL model and applying it to the other five models would be very complex. As a consequence, the analysis will focus on more transversal findings, which stem from the meta-analyses conducted in the SRL field.

SRL 효과를 연구하기 위한 주요 목적으로 세 가지 메타 분석이 수행되었고 네 번째 메타 분석은 SRL 연구에 직접적인 영향을 미치는 학습 기술 개입을 탐구했다. 
Three meta-analyses have been conducted with the main aim to study SRL effects (Dignath and Büttner, 2008; Dignath et al., 2008; Sitzmann and Ely, 2011) and a fourth meta-analysis have explored learning skills interventions with direct implications for SRL research (Hattie et al., 1996).

첫째, 해티 외 연구진(1996)과 관련하여, 그들은 SRL 이론이나 모델의 미분 효과를 탐구하지 않았다. 이러한 한계에도 불구하고, 한 가지 흥미로운 결론은 다음과 같았다. "다음과 같은 훈련을 권장할 수 있다. (a) 맥락 속에서의 훈련, (b) 대상 콘텐츠와 동일한 도메인 내의 과제를 사용한 훈련, (c) 그리고 높은 수준의 학습자 활동과 메타인지 인식을 촉진하는 훈련."
First, regarding Hattie et al. (1996), they did not explore differential effects of SRL theories or models. Despite this limitation, one interesting conclusion was that: “it is recommended that training (a) be in context, (b) use tasks within the same domain as the target content, (c) and promote a high degree of learner activity and metacognitive awareness” (Hattie et al., 1996, p. 131).

반면 Dignath과 Büttner 추가 secondary-education 학생들(2008년)두번째로, Dignath의 작품은,primary-school 학생들에서 Serial통과 번호 개입의 효과를 탐험했다. 으로서 후자에서, 초등 학교 결과들에 대한 추출되는 학업 수행에 영향 크깄다 더하여 만약“개입social-cognitive 이론(B=0.33)보다는 초인지 이론에 근거하였다(참조 범주)” 높은 "만약 개입 또한 초인지(B=0.39)과 동기 strateg의 명령을 포함했다.ies(B=0.36)". 동일한 연구에서는 그와 같은 변수에 대해 중등 교육 결과를 효과 크기 더 높을 것:발견되었다.

Secondly, Dignath’s work explored the effects of SRL interventions in primary-school students (Dignath et al., 2008), while Dignath and Büttner (2008) added secondary-education students. As extracted from the latter, regarding primary school results, effects size on academic performance were higher if “the intervention was based on social-cognitive theories (B = 0.33) rather than on metacognitive theories (reference category)” plus “if interventions also included the instruction of metacognitive (B = 0.39) and motivational strategies (B = 0.36)” (p. 246). In the same study, effects sizes for secondary education results about the same variables were found to be higher:

만약 개입 초인지 반사(B=0.82)나 동기 전략에 집중했다“만약 개입 초인지 이론적 배경(참조 범주)보다는social-cognitive(B= -1.41)또는 동기 이론에(B= -0.97)기반을 두고 있다.”+"보다는 인지 전략(참조 범주)에 있었지만,highe(B=0.56).개입보다는 초인지 인지 전략 촉진을 위한 R(우편 246)(B= -0.64)".
“if the intervention was based on metacognitive theoretical background (reference category) rather than on social-cognitive (B = -1.41) or motivational theories (B = -0.97)” plus “if the intervention focused on metacognitive reflection (B = 0.82) or motivation strategies (B = 0.56) rather than on cognitive strategies (reference category), but higher for interventions promoting cognitive rather than metacognitive strategies (B = -0.64)” (p. 246).

Sitzmann과 일리(2011년)에 의한 지난 메타 분석, 어떻게 어른들은 두가지 설정:고등 교육과 일터 학습을 규제하고 영화에 초점을 맞추었다. 로 Dignath와 동료들 거 이 저자들, 진행으로 Serial통과 번호 이론적 배경을 포함하지 않았다. 하지만 그들은 이 논평의 목적에 적용되는 세가지 중요한 결과를 뽑아 냈다.
The last meta-analysis, by Sitzmann and Ely (2011), focused on how adults regulate their learning in two settings: higher education and the workplace. These authors did not include the SRL theoretical background as a moderator, as Dignath and colleagues did. However, they extracted three key results that apply to the aim of this review.

  • 첫째, 저자들은 [더 많은 SRL 이론에 포함된 구인일수록 학습에 더 강한 영향을 미치는 구인]들이라는 것을 발견했다.
  • 둘째, 실증 결과의 겹치는 부분은 [여러 모델들 사이에 상당히 유의한 관계들이 있음]을 나타내다.
  • 셋째,"자기 조절 과정의 대부분, 학습, 목표 수준, 끈기, 노력과 긍정적인 관계를 가지며, 자기 효능감은 가장 강력한 효과를 보인다. 이들 네 개의 구인이 인지 능력과 학습 전 지식을 통제한 후 학습에 분산의 17%를 차지했다."
  • First, the authors found that the constructs that there were included in more SRL theories were the ones that had stronger effects on learning (p. 433).
  • Second, the overlap of the empirical results indicates that significant relationships exists between the different models.
  • Third, “most of the self-regulatory processes exhibited positive relationships with learning, goal level, persistence, effort, and self-efficacy having the strongest effects. Together these four constructs accounted for 17% of the variance in learning after controlling for cognitive ability and pre-training knowledge” (p. 438).

세 가지 주요 결론들 이 4meta-analyses에서 추출할 수 있다.
Three main conclusions can be extracted from these four meta-analyses.

  • 첫째, SRL은 학습에 영향을 미치는 결정적 요인을 묶어주는 강력한 우산이며, 동시에 그 요인들의 관계를 설명하는 포괄적 프레임워크이다.
  • 둘째, SRL 개입은 적절하게 설계되면, 학생들의 학습을 향상시키기 위한 성공적 방법이다.
  • 셋째, SRL 개입은 학생들의 교육수준에 따른 차등적 효과를 갖는다.
  • First, SRL is a powerful umbrella to anchor crucial variables that affect learning, offering, at the same time, a comprehensive framework that explains their interactions.
  • Second, SRL interventions are successful ways to improve students’ learning, if properly designed.
  • Third, SRL interventions have differential effects based on the students’ educational level.

 

  • [사회인지 이론에 기초한 자기조절학습 개입]은 초기 교육 단계(예: 초등)에서 사용될 때, 그리고 학생과 교사를 위한 프레임워크가 제공될 때 더 높은 영향을 미친다. 사회 인지적 모델이 더 포괄적이고 이해하기 쉽기 때문에 이런 일이 일어날 수 있다는 가설이 제기되었다. 또한 이러한 모델에는 동기부여와 정서적 측면이 포함되어 있어 초등교육 중 학업성취도가 더욱 두드러진다. 
  • 더 성숙한 학생(즉, 중등교육 학생)에 관해서는, 그들은 더 많은 [메타인지적 측면을 포함한 개입]으로부터 더 많은 이익을 얻는다. 이것은 아마도 더 구체적인 전략을 사용해야 하는 인지적으로 까다로운 작업의 성능이 증가했기 때문일 것이다. 따라서 이러한 교육수준에서 메타인지모형이 더 높은 영향을 미친다는 가설을 세울 수 있었다. 
  • 마지막으로 고등교육과 직장연수생의 결과는 발견된 4대 예측 변수인 목표수준, 지속성, 노력, 자기효능감이 유의미한 동기부여 가치를 가지고 있으며, 모두 사회인지 이론에서 이해되고 있음을 보여준다. 
  • Self-regulated learning interventions that are grounded in socio-cognitive theory (Bandura, 1986) have a higher impact when used at earlier educational stages (e.g., primary), and when a framework is provided for students and teachers (Dignath et al., 2008). It has been hypothesized that this probably happens because socio-cognitive models (e.g., Zimmerman, 2000) are more comprehensive and easier to understand (Dignath et al., 2008). In addition, these models contain motivational and emotional aspects, which are more salient for academic performance during primary education (Dignath et al., 2008).
  • When it comes to more mature students (i.e., those in secondary-education), they benefit more from interventions including more metacognitive aspects (Dignath and Büttner, 2008). This is probably due to the increased performance of cognitively demanding tasks in which it is necessary to use more specific strategies (Dignath and Büttner, 2008). Therefore, it could be hypothesized that metacognitive models (e.g., Efklides, Winne, and Hadwin) would have a higher impact at this educational level.
  • Finally, the results from higher education and workplace trainees (Sitzmann and Ely, 2011) show that the four biggest predictors that were found—goal level, persistence, effort, and self-efficacy—have a significant motivational value and are all comprehended in the socio-cognitive theory.

이러한 결과는 리처드슨 외 연구진(2012)의 결과와 일치한다.
These results align with those of Richardson et al. (2012), who found that

  • (a) 자기 효능감이 가장 높은 예측 변수였고
  • (b) 목표 설정 전략은 노력 조절을 강화합니다.
  • (c) 다면적인 개입이 더 효과적일 수 있다.
  • (a) self-efficacy was the highest predictor,
  • (b) goal-setting strategy boosts effort regulation, and
  • (c) multifaceted interventions may be more effective (pp. 375–376);


그리고 Robbins et al(2004)의 결과와 함께, GPA에 대한 최고의 예측 변수는 [학업 자기효능감과 성취 동기]였다. 따라서, 개입이 [동기부여와 정서적 측면(즉, 자기 결정과 목표 설정)]을 목표로 한다면 고등교육 학생들은 더 나은 결과를 얻는 경향이 있는 것으로 보인다. 따라서 동기와 감정에 중점을 둔 모델이 더 높은 영향을 미칠 수 있다는 가설을 세울 수 있다. 그럼에도 불구하고 고등교육 학생에 대한 결론은 초중등교육과 마찬가지로 서로 다른 SRL 모델(즉, 이론적 배경) 개입을 명시적으로 비교하는 메타 분석에 기초하지 않는다는 점을 강조하는 것이 중요하다. 

and with the results of Robbins et al. (2004), where the best predictors for GPA were academic self-efficacy and achievement motivation. Therefore, there seems to be a tendency for higher education students to have better results if the interventions are aiming at motivational and emotional aspects—i.e., self-efficacy and goal setting. It could, thus, be hypothesized that models with an emphasis on motivation and emotion (e.g., Boekaerts, Pintrich, and Zimmerman) might have a higher impact. Nevertheless, it is important to emphasize that the conclusions regarding higher education students are not build on meta-analyses that explicitly compared different SRL models (i.e., theoretical backgroud) interventions as are the ones for primary and secondary education.

마지막으로, 디그너트와 동료 메타 분석가들로부터 또 다른 흥미로운 발견이 있었다. 그들은 그룹 활동을 포함한 SRL 개입이 초등 학생들에게는 해롭지만 중등교육 학생들에게는 긍정적인 영향을 미친다는 것을 발견했다. 이러한 결과는 초등교육에서 SSRL 모델 개입의 구현이 주의 깊게 수행되어야 긍정적인 효과를 극대화할 수 있음을 시사한다. 또한 그룹 작업의 양이 증가하는 중등 및 고등 교육에서 SSRL 개입이 필요할 수 있다.
Finally, there was another interesting finding from Dignath and colleagues meta-analyses. They found that SRL interventions, including group work, were detrimental for primary students but that they had positive impact in secondary education students (Dignath and Büttner, 2008). This finding implies that the implementation of SSRL model interventions should be carefully conducted in primary education to try to maximize positive effects. Additionally, SSRL interventions might be needed in secondary and higher education, where the amount of group work increases.

교육적 의미
Educational Implications

네 가지 교육적 함의가 논의될 것이다. 

첫째, 학업성취도에 영향을 미치는 심리적 상관관계(예: 자기효능감, 노력조절, 미루기)를 살펴본 결과, 이러한 상관관계 대부분은 SRL 모델에 포함된다는 결론이다. 또한, SRL 개입은 학생들의 학습을 촉진한다. 따라서, 첫 번째 의미는 학생들의 학습을 극대화할 수 있는 방법을 이해하기 위해 교사들은 SRL 이론과 모델에 대한 교육을 받을 필요가 있다는 것이다. 개입하는 데는 세 가지 방법이 있다. 

  • 첫째, 예비역 교사들은 그들의 미래 직장 적응을 위한 교육학적 훈련을 받아야 한다. 예비 서비스 교사들을 대상으로 수행된 많은 연구가 있지만, 그들이 일을 시작할 때 그러한 훈련의 최종 결과를 탐구하는 종단 연구가 필요하다. 
  • 둘째, 재직 중인 교사들도 SRL에 대한 교육을 받아야 하는데, 이는 그들이 대부분 복무 전 준비 기간 동안 받지 못했기 때문이다. 
  • 셋째, 교사는 그 자신도 학습자로서 SRL 전문성을 얻어야 하는데, 이는 교사의 지식과 교육 기술에 영향을 미치기 때문이다.

Four educational implications will be discussed. First, if we examined the psychological correlates (e.g., self-efficacy, effort regulation, procrastination) that influence academic performance (Richardson et al., 2012), the conclusion is that the vast majority of these correlates are included in the SRL models. Additionally, SRL interventions promote students’ learning (Dignath et al., 2008; Rosário et al., 2012). Therefore, a first implication is that teachers need to receive training on SRL theory and models to understand how they can maximize their students’ learning (Paris and Winograd, 1999; Moos and Ringdal, 2012; Dignath-van Ewijk et al., 2013). There are three ways of intervening.

  • First, pre-service teachers should receive pedagogical training for their future adaptation to the workplace. There is a significant number of studies conducted with pre-service teachers (e.g., Kramarski and Michalsky, 2009Michalsky and Schechter, 2013), however, there is need for longitudinal studies exploring the final outcomes of such training when they start working.
  • Second, in-service teachers also need to receive training on SRL, as they most probably did not receive any during their pre-service preparation (Moos and Ringdal, 2012).
  • Third, teachers should gain SRL expertize themselves as learners, as this will impact their knowledge and pedagogic skills (Moos and Ringdal, 2012).

두 번째 의미는 다른 교육 수준에서 SRL을 가르치는 방법과 관련이 있다. 서로 다른 모델들은 서로 다른 교육 수준에서 더 잘 작동한다. 게다가, 다른 리뷰는 서로 다른 교육 수준 교사들은 예상하지 못한 방향에서 SRL의 다른 접근 방식 사용을 보여 준다. 이 저자들이 발견:
A second implication relates to how to teach SRL at different educational levels. Different models work better at different educational levels (Dignath and Büttner, 2008). Furthermore, another review shows that teachers at different educational levels used different approaches to SRL (Moos and Ringdal, 2012), but not in the expected direction. These authors found that:

  • (a)고등 교육 선생님들이 과목 내용에, SRK 비계를 위해서 제한된 기회를 제공하고 집중하는 경향이 있다.
  • (b)중등 학교 교사지만 SRL 의 관점에서 명료한 지시 사항을 공식화하지 않는다이며 이 기회를 갖고 있다.
  • (c)초등 학교 교사들 더 SRL 관행을 실행하고 있다.
  • (a) higher education teachers tend to focus on the course content, providing limited opportunities for scaffolding SRL;
  • (b) secondary teachers offer more of those opportunities but do not formulate explicit instructions in terms of SRL; and
  • (c) primary teachers implement more SRL practices.

따라서 SRL 연구가 다른 교육 수준에서 SRL의 구현에 대해 말하는 것과 교사들이 교실에서 실제로 하는 것 사이에는 불일치가 있다. 이것은 이전의 시사점으로 되돌아간다. 더 많은 교사 교육이 필요하지만, 개입은 SRL 모델의 차별적 효과를 고려하도록 조정될 필요가 있다.

There is, therefore, a misalignment between what SRL research says about its implementation at different educational levels (Dignath and Büttner, 2008), and what teachers actually do in their classroom (Moos and Ringdal, 2012). This brings us back to the previous implication: more teacher training is then needed, however, it needs to be tailored so that the interventions take the differential effects of SRL models into account.

세번째 의미 배움에 대한 학생들의 행동을 이끌어내는 환경을 만들어 내는 데 관계가 있다. 모든 SRL 모델은 SRL을 목표-유도적이라고 보며, 그래서 학생들의 목표가 최종적인 자기조절적 행동을을 유도한다. 그러나 Boekaerts(2011)의 주장처럼 학생들은 학습 지향적이지 않은 목표(웰빙 경로)를 활성화하고, 결과적으로 회피 목표(예: 시험을 놓친 척)를 향한 자기조절을 하게 될 수 있다. 교사들이 학습 목표에 도움이 되는 교실 환경을 조성할 수 있는 방법을 탐구하는 일련의 연구가 있다. 교육자들 학습을 촉진하기 위해 SRL 대한 학습 교실 분위기를 극대화할 필요가 있다.
A third implication is related to creating environments that leads students’ actions toward learning. All of the models consider SRL as goal-driven, so students’ goals direct their final self-regulatory actions. However, as Boekaerts (2011) argues, students also activate goals not oriented to learning (well-being pathway) and, as a consequence, students might self-regulate toward avoidance goals (e.g., pretending they are sick to miss an exam) (Alonso-Tapia et al., 2014). There is a line of research that explores how teachers can create a classroom environment that is conducive toward learning goals (Meece et al., 2006; Alonso-Tapia and Fernandez, 2008). Educators need to maximize the learning classroom climate for SRL to promote learning.

넷째, SRL 기술의 발달적 접근은 더 학습에 유용합니다. 우리는 이미 SRL 기술이 연습, 피드백 및 관찰을 통해 시간이 지남에 따라 발전한다는 것을 알고 있습니다. 우리는 또한 인지 부하 이론이 주장하는 바와 같이 학생들이 새로운 과제를 수행할 때 높은 인지 부하를 경험한다는 것을 알고 있다. 인지 부하의 영향을 최소화하기 위해 교육 환경을 설계하는 방법에 대해 우리가 알고 있는 것을 고려한다면, SRL 기술의 발달적 접근법이 선택되어야 한다. 이러한 접근 방식은 짐머만의 다단계 모델에서 공식화된 SRL 획득을 위한 네 가지 단계를 고려할 것이다. 관찰, 에뮬레이션, 자기 제어(자동성 포함) 및 자기 조절. 이 접근법은 SRL 기술 개발을 극대화할 것이며 SRL의 중요한 프로세스인 자체 평가를 위해 제안되었다.

Fourth, a SRL skill developmental approach is more beneficial for learning. We already know that SRL skills develop over time with practice, feedback, and observation (Zimmerman and Kitsantas, 2005). We also know that students experience a high cognitive load when performing novel tasks, as claimed by cognitive load theory (Sweller, 1994). If we consider what we know on how to design instructional environments to minimize the impact of cognitive load (Kirschner, 2002), then a SRL skill developmental approach should be chosen. Such an approach would consider the four stages for acquisition of SRL, formulated in Zimmerman’s Multi-Level model (Zimmerman and Kitsantas, 2005): observation, emulation, self-control (including automaticity), and self-regulation. This approach will maximize SRL skill development and has been proposed for self-assessment, which is a crucial process for SRL (Panadero et al., 2016).

미래 연구 라인
Future Research Lines

향후 4개 노선이 논의될 예정이다.

첫째, SRL에 대한 경험적 증거와 학습과 학업성취도 상관관계에 대한 메타분석적 증거의 연관성을 요구해야 한다. 이미 주장했듯이 SRL 모델은 포괄적인 모델입니다. 따라서 모델의 검증은 다음 중 하나를 필요로 하기 때문에 복잡해진다. 

  • (a) 매우 많은 수의 변수를 사용하여 하나의 연구를 수행하거나 
  • (b) 더 좁은 접근 방식으로 여러 연구를 수행합니다. 

그러나 향후 연구가 이전의 메타 분석과 SRL 모델 타당성 연구의 결론을 결합한다면, 우리는 SRL에 대한 이해를 높이고 훨씬 더 구체적인 SRL 모델의 차등 효과를 테스트할 수 있을 것이다. 메타분석적 연구와 일차적 연구 연구를 결합하려는 이러한 시도는 모든 SRL 영역을 포함하고 기존 모델을 상호 연결하는 SRL의 메타 모델의 구축으로 이어져야 한다. 예비 시도는 시츠만과 엘리(2011)에서 찾을 수 있지만, 더 많은 개발이 필요하다.

Four future lines will be discussed.

First, a call for a connection between the empirical evidence on SRL and meta-analytic evidence of correlates of learning and academic performance should be issued (e.g., Hattie et al., 1996; Richardson et al., 2012). As already argued, SRL models are comprehensive models. Therefore, the validation of the models becomes complex, as it requires either

  • (a) conducting one study with a very large number of variables, or
  • (b) conducting a number of studies with a narrower approach.

However, if future research combines conclusions from previous meta-analyses (e.g., Hattie, 2009) and SRL models validational studies, we could advance our understanding of SRL and test even more specific SRL models’ differential effects. This attempt to combine meta-analytic and primary research studies should lead to the construction of a meta-model of SRL, including all SRL areas and interconnecting the existing models. A preliminary attempt can be found in Sitzmann and Ely (2011), however, it needs to be developed further.

둘째, SRL의 구체적인 작동 방식을 이해하기 위해 보다 세밀한 연구도 실시되어야 한다. SRL 모델은 프로세스의 꽤 구체적인 그림을 제공하지만, 여전히 SRL 메커니즘(예: 자기반사가 작동하는 방식, 속성으로 이어지는 상호 작용)을 더 정확하게 이해해야 할 필요가 많다. 이것은 이상한 변수를 제어하는 견고한 실험 설계를 통해 달성될 수 있다.
Second, more fine-grained studies should also be conducted to understand how the specifics of SRL work. Although SRL models provide a quite specific picture of their processes, there is still much needed to understand SRL mechanisms more precisely (e.g., how self-reflection works, interactions that leads to attributions). This could be achieved through solid experimental designs controlling for strange variables.

셋째, 특히 직장 내 성인에게 SRL이 어떻게 적용되는지에 대한 평생 SRL 기술개발에 대한 종단적 연구가 필요하다. 정규 교육 기간 동안 SRL 개발에 대한 상당한 양의 연구가 있다. 그러나 상당한 기간을 포함하는 종단 연구를 추가로 구현하고 성인 생활에서 SRL의 역할을 강조할 필요가 있다. 후자의 관점에서, 우리의 요구는 새로운 SRL 모델을 개발하는 것보다 먼저 사용 가능한 모델이 유효한지 테스트하는 것이다. 또한 SRL에 대한 보다 구체적이고 짧은 기간 동안의 개발에 초점을 맞춘 보다 종단적인 연구가 필요하다. 예를 들어, 특정 중요한 학년(예: 대학교 1학년)에 초점을 맞춘 연구입니다. 학습 일기에 대한 연구는 세로 방향으로 정보를 추출할 수 있는 매우 유망한 연구 흐름이다. 
Third, longitudinal research on the development of SRL skills throughout the life span is needed, especially regarding how SRL applies to adults in their workplace (Sitzmann and Ely, 2011). There is a compelling amount of research on SRL development during formal education years (Paris and Newman, 1990; Ley and Young, 1998; Núñez et al., 2013). However, we need to further implement longitudinal studies that cover a significant amount of years, and emphasize the role of SRL in adult life. In terms of the latter, our call would be to first test if the available models are valid, rather than developing a new SRL model (Sitzmann and Ely, 2011). Additionally, more longitudinal research on SRL, which focuses on its development during more specific and shorter periods of time, is needed. For example, studies that focus on one specific crucial academic year (e.g., first year of university). The research on learning diaries (Schmitz et al., 2011) is a very promising stream of research that allows for extraction of information in a longitudinal manner.

넷째, SRL 프로세스에 대한 새로운 통찰력은 SRL 측정의 최근 개발에서 나올 것이다. SRL 연구에 컴퓨터를 도입하는 것은 SRL을 측정하는 것뿐만 아니라 SRL의 발판을 마련하기 위해 유망한 결과를 보여주고 있다. 이것은 앞으로 몇 년 동안 더 맞춤형 개입과 학습 환경을 제공할 것이며, 이는 기존의 지식 본체에 통합되어야 한다.
Fourth, new insights into SRL processes will come from recent developments in SRL measurement (Panadero et al., 2015b). The introduction of computers in SRL research, not only to measure but also to scaffold SRL, is showing promising results. This will provide more tailored interventions and learning environments over the coming years, which should be integrated into the existent body of knowledge.

결론
Conclusion

자기조절학습은 학생들의 학습에 영향을 미치는 변수를 이해할 수 있는 우산을 제공하는 넓은 분야이다. 지난 20년 동안 SRL은 교육심리학 연구의 주요 분야 중 하나가 되었으며, 현재 이 분야의 발전은 관련성이 지속될 것이라는 신호이다. 이 검토에서 나온 한 가지 결론은 SRL 모델이 연구자와 실무자가 추가로 고려해야 할 측면인 다양한 상황과 모집단에서의 개입에 유익하다는 것이다. 또한 SRL 모델은 다양한 연구 영역(예: 감정 조절, 협업 학습)을 다루므로 연구자가 연구 목표와 초점에 더 적합한 영역을 활용할 수 있다. 연구자들과 교사들이 그들의 개입을 더 효과적으로 조정할 수 있기 때문에 모델의 레퍼토리를 갖는 것은 풍요롭다. 마지막으로, 저는 새로운 세대의 연구자들이 새로운 접근법, 조치, 그리고 물론 SRL 모델을 개발하는 데 앞장서거나, 이미 존재하는 것을 계속 검증할 것을 요청하고 싶습니다. 이러한 미래 발전은 SRL에 대한 우리의 이해와 연구가 수행되는 수단의 변화를 촉진해야 한다.

Self-regulated learning is a broad field that provides an umbrella to understand variables that influence students’ learning. Over the last two decades, SRL has become one of the major areas of research in educational psychology, and the current advances in the field are a signal that its relevance will continue. One conclusion from this review is that the SRL models are beneficial for interventions under different circumstances and populations, an aspect that need to be further considered by researchers and practitioners. Additionally, SRL models address a variety of research areas (e.g., emotion regulation, collaborative learning) and, therefore, researchers can utilize those that better suit their research goals and focus. Having a repertoire of models is enriching because researchers and teachers can tailor their interventions more effectively. Finally, I would like to issue a call for a new generation of researchers to take the lead in developing new approaches, measures, and, of course, SRL models—or to continue validating the ones that already exist. These future advances should promote changes in our understanding of SRL and the means through which research is conducted.

 


 

 

Front Psychol. 2017 Apr 28;8:422. doi: 10.3389/fpsyg.2017.00422. eCollection 2017.

A Review of Self-regulated Learning: Six Models and Four Directions for Research

Affiliations collapse

Affiliation

1Departamento de Psicología Evolutiva y de la Educación, Facultad de Psicología, Universidad Autónoma de MadridMadrid, Spain.

PMID: 28503157

PMCID: PMC5408091

DOI: 10.3389/fpsyg.2017.00422

Free PMC article

 

Abstract

Self-regulated learning (SRL) includes the cognitive, metacognitive, behavioral, motivational, and emotional/affective aspects of learning. It is, therefore, an extraordinary umbrella under which a considerable number of variables that influence learning (e.g., self-efficacy, volition, cognitive strategies) are studied within a comprehensive and holistic approach. For that reason, SRL has become one of the most important areas of research within educational psychology. In this paper, six models of SRL are analyzed and compared; that is, Zimmerman; Boekaerts; Winne and Hadwin; Pintrich; Efklides; and Hadwin, Järvelä and Miller. First, each model is explored in detail in the following aspects: (a) history and development, (b) description of the model (including the model figures), (c) empirical support, and (d) instruments constructed based on the model. Then, the models are compared in a number of aspects: (a) citations, (b) phases and subprocesses, (c) how they conceptualize (meta)cognition, motivation and emotion, (d) top-down/bottom-up, (e) automaticity, and (f) context. In the discussion, the empirical evidence from the existing SRL meta-analyses is examined and implications for education are extracted. Further, four future lines of research are proposed. The review reaches two main conclusions. First, the SRL models form an integrative and coherent framework from which to conduct research and on which students can be taught to be more strategic and successful. Second, based on the available meta-analytic evidence, there are differential effects of SRL models in light of differences in students' developmental stages or educational levels. Thus, scholars and teachers need to start applying these differential effects of the SRL models and theories to enhance students' learning and SRL skills.

Keywords: emotion regulation; learning strategies; metacognition; motivation regulation; self-regulated learning; self-regulation; shared regulation of learning; socially shared regulated learning.

수행능력이 저조한 학생들도 행동-중-성찰 시에는 통찰력이 있다(Med Educ, 2017)
Low performing students have insightfulness when they reflect-in-action
Mike Tweed,1 Gordon Purdie1 & Tim Wilkinson2

 

서론
Introduction

현재의 전문 의료 실무 모델, 즉 학부 의료 교육은 자기 조절, 자기 평가 및 자기 모니터링에 의존한다. 정확한 자체 평가와 자체 모니터링은 의료 전문가의 자기 조절에 필수적이다.

  • 자기 평가는 전반적인 성과에 대한 누적 평가로 간주될 수 있는 반면,
  • 자기 모니터링은 그 순간의 성과와 관련이 있다.

The current model of professional medical practice, and therefore undergraduate medical education, relies on self-regulation, self-assessment and self-monitoring.1-9 Accurate self-assessment and self-monitoring are vital to health care professionals' self-regulation.

  • Self-assessment can be considered as a cumulative evaluation of overall performance, whereas
  • self-monitoring relates to performance in the moment.6910 

[행동-중-성찰]로서의 [자체 모니터링]은 일상 업무에 authentic하다.

  • 임상의가 결정을 내릴 때, 그들은 옳다는 것에 대한 적절한 확신을 가질 필요가 있다.
  • 올바른 진단 또는 관리를 결정하지 못하면 환자에게 해를 끼칠 수 있으며 과소평가된 위험이 될 수 있습니다.
  • 더 나쁜 것은 [잘못된 행동]이 [높은 확실성]으로 유지되는 상황이다. 진단 오류는 병원 실무에서 발생하는 부작용의 10%에 기초한다. 진단 오류의 74~96%가 일부 인지적 요인을 포함하고 있는 것으로 보고되었다.
  • [인지 오류]는 모든 수준에서, 그리고 다양한 방식으로 임상의에 의해 발생한다.
  • 임상의는 그들이 환자의 진단 또는 최적의 치료라고 믿는 것을 고려한다.
  • 그런 다음 그들은 자신의 결정을 정당화하기 위해 도움을 구할 필요가 있는지 아니면 추가 정보를 구할 필요가 있는지 결정한다.
  • 임상 실무에서 의사결정에 대한 부적절한 확실성의 정도는 부작용과 환자 위해를 초래할 수 있다. 따라서 보건의료 전문가나 학생을 평가할 때, [응답에 대한 확실성]을 고려하는 것은 잠재적 가치가 있다.  

Self-monitoring as reflection-in-action is authentic to daily practice.5, 6, 9 

  • When clinicians make decisions, they need to have an appropriate certainty of being correct.1112 
  • Failure to decide on the correct diagnosis or management can lead to patient harm and is probably an underestimated risk.13 
  • Worse is the situation where an incorrect action is held with high certainty. Diagnostic error underlies 10% of adverse events in hospital practice.14 It is reported that 74–96% of diagnostic errors include some cognitive factors.
  • Cognitive errors are made by clinicians at all levels and in different ways.14 
  • Clinicians consider what they believe to be the patient's diagnosis or optimal treatment.
  • They then decide whether they need to seek assistance or additional information in order to justify their decisions.15 
  • In clinical practice, an inappropriate degree of certainty regarding a decision has the potential to lead to adverse outcomes and patient harm.16-18 Therefore, when assessing health care professionals or students, there is potential value in considering their certainty in their responses.19-21

[자신의 결함에 대해 잘 알지 못하는 사람들]은 [자신의 결정이 옳다는 확신]을 부적절하게 가질 수 있으며, 따라서 실수를 하기 쉽다. 일반 문헌의 상당 부분이 있으며, 의료 문헌은 기술이 낮은 사람들도 자신의 성과에 대해 덜 인식하고 있다는 것을 발견한다: ‘the unskilled are unaware’. 이는 숙련도가 낮은 사람들이 자신의 행동을 반성하고 스스로 바로잡을 수 없기 때문일 수 있다. 그러나 성적이 낮은 응시자는 성적이 좋은 또래와 마찬가지로 객관식 질문 응답 시간, 질문 플래그 지정 및 응답 변화를 분석할 경우, 실제로 '그 순간에in the moment' 성찰한다. 이는 형식이 [성찰과 자기 평가의 결과]에 영향을 미칠 수 있음을 시사한다. 
Those who are less aware of their deficiencies can have inappropriately high certainty that their decisions are correct,22-24 and are therefore more prone to error.25 There is a significant body of general literature 23, 25-30 and health care literature31-33 that finds that those with less skill are also less aware of their performance: ‘the unskilled are unaware’. This could be because the less skilled cannot reflect on their actions and self-correct. However, lower performing candidates, like their higher performing peers, do actually reflect ‘in the moment’ if multiple-choice question response time, flagging questions and changing response are analysed.8 This suggests the format may influence the results of reflection and self-assessment.34

[자기 평가의 정확성]을 결정하는 것은 임상 실습에서 자가 모니터링에 대한 모든 것이 진짜인 것은 아니지만 다양한 방법으로 달성되었다. 예를 들어, 정확할 확률을 추정하는 것은 적절하지 않을 수 있으며, 복잡한 의료 결정과 같은 일부 상황에서는 [확실성의 서면 서술자]가 선호될 수 있다. 환자와 관련된 결정을 내리는 임상의는 일반적으로 확률로 정확할 가능성에 대해 스스로 반성하지 않는다. 즉, 임상의는 '내가 70% 맞을 것 같다'고 생각하지 않는다. 대신, 그들은 [더 많은 정보나 도움이 필요한지] 고려할 수 있다. 이와 같이 의료 전문가 실무에서 일부 측정은 자체 모니터링을 위해 다른 측정보다 더 적절하다. 예를 들어, 반응이 정확할 확률을 추정하는 대신 도움을 구하는 것을 가리키는 확실성 설명자는 임상 실습과 더 유사하다. 마찬가지로 '찾아봐야 할 때'나 '타인에게 양보해야 할 때'와 같은 자기감시 수단을 일상적 실천에서의 [행동-중-성찰]로 보는 것이 더 적절할 수 있으며, 이러한 방법은 이전에 시범적으로 시행된 적이 있다. 이러한 발전은 임상 실무에 정통한 설명자를 사용하는 경우 일반적으로 평가가 더 정확하다는 연구 결과와 일치한다. 
Determining accuracy of self-assessment has been achieved in a variety of ways, not all of which are authentic to self-monitoring in clinical practice. For example, estimating the probability of being correct may not be appropriate35 and written descriptors of certainty may be preferable in some situations,36 such as in complex health care decisions.37 A clinician making a decision related to a patient generally does not self-reflect on his or her likelihood of being correct as a probability. In other words, a clinician does not consider ‘I'm likely to be 70% correct’. Instead, they might consider whether more information or assistance is needed. As such, within health care professional practice, some measurements are more appropriate than others for self-monitoring.5, 9 For example, certainty descriptors that refer to seeking assistance,37 as opposed to estimating a probability that a response is correct,9, 38 are more analogous to clinical practice. Likewise, looking at measures of self-monitoring such as ‘when to look it up’ or ‘defer to others’ as reflection-in-action in daily practice may be more appropriate,5, 6 and such methods have previously been piloted.19, 21 These developments are also consistent with the finding that assessments in general are more accurate if descriptors are used that are authentic to clinical practice.39

[reflection-in-action]에 의해 계층화된 확실성을 포함함으로써 [실제와 유사authentic to practice]한 평가 시스템은 형식의 무작위 제어 시험을 포함한 연구 프로젝트의 맥락에서 가능하다는 것이 입증되었다. 그러나 연구 프로젝트 상황에서의 응답은 [과정 평가in-course assessment]에서 응시자가 어떻게 응답하는지 반영하지 못할 수 있다.
An assessment system that is authentic to practice, by including certainty, stratified by reflection-in-action, has proven possible in the context of a research project, including a randomised controlled trial of formats.19, 21 However, responses in the setting of a research project may not reflect how candidates would respond in an in-course assessment.

자체 모니터링 능력과 정확성 사이의 연관성을 살펴보는 데 있어 추가 고려 사항은 해당 코호트의 능력 범위와 관련이 있다. 그러나 의과대학에서는 높은 능력을 가진 학생 코호트가 미리 선발된다. 그러므로 그들이 '미숙함'의 정도는 명확하지 않다.
A further consideration in looking at the association between ability and accuracy of self-monitoring, relates to the range of ability of the cohort in question.40 Within medical school classes, however, the cohort is preselected as having high ability. Therefore the extent to which they are ‘unskilled’ is not clear.

따라서 본 연구를 안내하는 개념적 프레임워크는 이러한 이전 연구를 바탕으로 하고 다음을 제안합니다. 

  • (i) [자체 모니터링 척도]가 평가 속성에 반영되어야 하는 [바람직한 실천 속성]임을 확인한다. 
  • (ii) [자체 모니터링의 측정방식]authentic practice와 관련이 있어야 한다. (즉, 질문의 문구는 그러한 판단이 임상 실무에서 어떻게 발생하는지와 관련되어야 한다.) 
  • (iii) 의과대학에서는 학생 간 능력이 균질하므로, 다른 그룹의 연구 결과가 의과대학 학생에게 적용되지 않을 수 있음을 의미한다.

The conceptual framework guiding this study therefore draws on these previous studies and suggests:

  • (i) that measures of self-monitoring are desirable attributes of practice that should be reflected in attributes of assessment
  • (ii) that the manner in which self-monitoring is measured needs also to relate to authentic practice (i.e. the wording of the question needs to relate to how such judgements occur in clinical practice); and
  • (iii) that the homogeneous nature of the abilities of individuals within medical school classes means the findings in other groups may not be applicable to medical students.

progress test 상황에서는 전 학년 학생들이 같은 시험 문제를 동시에 출제하는 것이 일반적이다. 학생들이 그 과정을 통과함에 따라 그들의 능력과 그에 따라 점수가 향상될 것으로 기대된다. 그러므로 하나의 progress test에는 다양한 범위의 경험과 능력을 가진 학생들이 동일한 시험을 본다. 이는 경험 수준에 따라 반응을 비교할 수 있는 기회를 제공합니다. 또한, 우리 기관에서 사용하는 progress test는 확실도 수준을 요구한다. 이러한 요인은 학생 경험과 학생 능력에 따라 계층화된 확실성과 정확성 수준 사이의 연관성을 탐구할 수 있는 독특한 기회를 제공한다.
In the setting of a progress test, it is usual for students from all years to sit the same examination questions at the same time. It is expected that as students pass through the course their ability and therefore scores will improve.41 Therefore for any given progress test there are students with a diverse range of experiences and abilities sitting an identical test. This provides an opportunity to compare responses according to levels of experience. Furthermore, the progress test used in our institution also asks for levels of certainty. These factors provide a unique opportunity to explore associations between levels of certainty and levels of correctness, stratified by student experience and by student ability.

이것은 객관식 질문(MCQ) 진행 테스트에서 행동 중 반영으로 설명되는 응답에 대한 후보 확실성의 첫 번째 사용이다. 이 연구는 두 가지 질문을 해결하기 위해 시작되었습니다. 

  • (i) 응답 확실성과 정확성 사이에는 어떤 관계가 있습니까? 
  • (ii) 이러한 확실성과 정확성의 측정은 연도 그룹 및 능력에 따라 어떻게 달라집니까?

This is the first use of candidate certainty regarding responses, described by reflection-in-action, in a multiple-choice question (MCQ) progress test. This research set out to address two questions.

  • (i) What is the relationship between response certainty and correctness?
  • (ii) How do these measures of certainty and correctness vary with year group and ability?

방법
Method

설정
Setting


오타고 의과대학의 의학 학위 과정은 6년 과정으로 4개의 뚜렷한 부분으로 나뉘어져 있다.

  • 첫번째는 일반적인 보건의료과학의 해이다.
  • 이것은 단일 캠퍼스에서 2학년과 3학년으로 이어진다.
  • 이후 학생들은 지리적으로 분리된 세 개의 캠퍼스 중 하나에서 4학년과 5학년 과정을 밟는다.
  • 마지막 해는 교육생 인턴(TI)의 해로, 학생들은 많은 다른 건강 관리 지역에 퍼져 있다. 비록 TI가 아직 학생이지만, 그들은 감독 아래 다양한 임무를 수행하는 건강 관리 팀의 구성원이다.

2-5학년 학생들은 모두 progress test를 보아야 한다.

The Medicine degree course at the University of Otago Medical School is a 6-year course that is divided into four distinct sections.

  • The first is a common health science year.
  • This is followed by years 2 and 3 at a single campus.
  • Following this, the students undertake years 4 and 5 at one of three geographically separate campuses.
  • The final year is a Trainee Intern (TI) year, with students spread across many different health care locations. Although TIs are still students, they are members of health care teams undertaking a variety of duties under supervision.

All students in Years 2–5 are expected to sit the progress test.

경과검사
Progress test

진도 테스트는 1년에 두 번 온라인으로 제공됩니다. 각 테스트는 무작위로 전달되는 150개의 MCQ로 구성됩니다. 각 MCQ는 스템, 질문 과제 및 5-16가지 옵션을 통합한다. 그 내용은 과정을 마칠 때까지 어느 시점에나 핵심 커리큘럼의 모든 측면과 관련이 있다.
The progress test is delivered online twice per year. Each test is made up of 150 MCQs delivered in random order. Each MCQ incorporates a stem, question task and a range of 5–16 options. The content is related to any aspects of the core curriculum at any point through to the completion of the course.

이 시험은 시험 조건 하에서 실시되지 않으며 학생들은 시험을 치를 수 있는 2주간의 기간이 있다. 학생들은 참고자료를 찾아보지 않고 시험에 참여하고 도전하도록 권장되지만, [확실성 응답certainty response]을 사용하여 이를 인정한다. 각 질문에 따라 학생들은 설명자를 기준으로 확실도 등급을 완성합니다(표 1).
This test is not administered under examination conditions and the students have a 2-week window to undertake the test. The students are encouraged to engage with and undertake the test without seeking resources, but acknowledge this by the use of the certainty response. Following each question the students complete a certainty rating based on descriptors (Table 1).

개별 시험에서 학생 개개인이 획득한 점수는 능력 부족을 벌하는 데 사용되지 않는다. 다만 정답 수가 찍어서맞출 확률(chance) 이하이거나, 시험 시간이 적은 학생(문항당 평균 20초 미만)은 개인적 교육 참여도에 대해 고려해보아야 할 수 잇으므로, 해당 학생진도위원회에 보고한다.
The score achieved by an individual student on an individual test is not used to penalise a lack of ability. However, students whose number of correct answers is at or less than chance or who spend little time on the test (a mean of < 20 seconds per question) are reported to the relevant student progress committee as this may inform consideration of their degree of engagement in personal education.

채점에 따라 각 연도 그룹의 최소 기준은 정답의 총 수를 기준으로 설정되었습니다.42 최소 기준은 피드백의 일부로 학생들에게 제공됩니다.

  • 모든 학생들에게 주어지는 추가 피드백에는 [학년별 각 확실도 수준에 따른 정답 비율]이 포함되어 있었다.
  • 개별 학생에게 주어지는 피드백에는 [커리큘럼 분야 또는 영역 분류에 따라, 각 확실도 수준에 따른 정답 비율]이 포함되었다.

2015년의 시험은 두 개의 다른 문제 풀로 구성되었다.
Minimum standards for each year group were set following the scoring, based on total number of correct answers.42 The minimum standards are given to students as part of their feedback.

  • Additional feedback given to all students included means of proportion correct for each level of certainty by year group.
  • Individual feedback included proportion correct for each level of certainty and proportion correct by curriculum discipline or domain categorisation.

The tests in 2015 were made up of two different pools of questions.

분석.
Analysis

혼합 모형 로지스틱 회귀 분석을 사용하여 확실도 수준, 검정 번호, 연도 그룹, 정답 수가 검사 시 표준보다 높거나 낮거나 이러한 요인 간의 모든 가능한 교호작용에 대한 항을 사용하여 모든 개별 문항에 대해 정답의 로그 확률을 모델링했습니다. 이 모형에는 학생과 모든 예측 변수, 그리고 학생과의 교호작용에 대한 랜덤 항이 포함되어 있습니다(학생이 1년 그룹에만 속해 있기 때문에 연도 그룹과 관련된 항은 제외). sas 9.4(SAS Institute Inc., Cary, North Carolina, 미국)의 글림믹스 절차를 사용하였다. 
A mixed model logistic regression analysis was used to model the log odds of being correct for any individual question with terms for level of certainty, test number, year group, number correct being above or below standard on examination and all possible interactions between these factors. The model included random terms for student and all of the predictors, and their interactions, with student (except those involving year group, as students were only in one year group). The glimmix procedure of sas 9.4 (SAS Institute Inc., Cary, North Carolina, USA) was used. 

결과.
Results


1차 시험 응시자는 1114명으로, 이 중 2학년 290명(정답 30.8%, 기준 67명), 3학년 279명(정답 36.6%, 기준 26명), 4학년 260명(정답 42.5%, 기준 14명), 5학년 285명(정답 280명)이었다.47.2%의 정확도, 5는 표준 이하).
2차 시험 응시자는 1114명으로, 이 중 2차 시험 287명(정답 31.2% 이하 73명), 3차 시험 272명(정답 232명, 정답 36.4% 이하 40명), 4차 시험 266명(정답 41.6% 이하 16명), 5차 시험 289명(정답 285명 이상 285명)이었다.
48.1%의 정확도, 4는 표준 이하). 

Test 1 was sat by 1114 students, of whom 290 were in Year 2 (223 were above the standard of 30.8% correct, 67 below the standard), 279 were in Year 3 (253 were above the standard of 36.6% correct, 26 below the standard), 260 were in Year 4 (246 were above the standard of 42.5% correct, 14 below the standard) and 285 were in Year 5 (280 were above the standard of 47.2% correct, 5 below the standard).
Test 2 was sat by 1114 students, of whom 287 were in Year 2 (214 were above the standard of 31.2% correct, 73 below the standard), 272 were in Year 3 (232 were above the standard of 36.4% correct, 40 below the standard), 266 were in Year 4 (250 were above the standard of 41.6% correct, 16 below the standard) and 289 were in Year 5 (285 were above the standard of 48.1% correct, 4 below the standard).

각 확실도 수준에 따른 MCQ 보기의 수는 거의 차이가 없었다(모든 확실도 수준에 대해 중위 6, 사분위간 범위 5-8). 전체적으로 51%의 경우, 정답을 맞추었고, 85%는 높은 확실성, 65%는 중간 정도, 38%는 낮은 확실성, 32%는 확실성이 없었다.
There was little difference in the number of MCQ options for each level of certainty (median 6, interquartile range 5–8 for all levels of certainty). In total, on 51% of occasions the questions were answered correctly, 85% with high certainty, 65% with moderate, 38% with low and 32% with no certainty.

혼합 모형 로지스틱 회귀 분석은 희소 데이터 때문에 4차 교호작용에 대해 가능하지 않으므로 교호작용이 포함되지 않았습니다. 모든 [3차 교호작용]이 있는 모형에서 확실도*테스트*표준, 확실성*연도 그룹*표준 및 검정*연도 그룹*표준 교호작용이 유의하지 않았으므로(각각 p = 0.30, 0.92, 0.43) 모형에서 제거되었습니다. 후속 모델인 Test*Standard와 Year group*Standard 교호작용은 유의하지 않았으며(각각 p = 0.20, 0.18)
The mixed-models logistic regression analysis was not possible for the four-way interaction because of sparse data, and hence the interaction was not included. In the model with all three-way interactions, Certainty*Test*Standard, Certainty*Year Group*Standard and Test*Year group*Standard interactions were not significant (p = 0.30, 0.92, 0.43, respectively) and so were removed from the model. In the subsequent model Test*Standard and Year group*Standard interactions were not significant (p = 0.20, 0.18, respectively) and were removed from the model.

결과 로지스틱 모형(표 2)에서 확실도*테스트*학년 그룹, 확실성*기준(위/아래)테스트*학년 그룹 상호작용이 유의했습니다(각각 p < 0.0001, p < 0.0001, p = 0.001). 모델은 주어진 테스트, 표준 및 연도 그룹(표 3)의 각 확실도 수준에 대한 정확성에 대한 승산비(OR)를 계산하는 데 사용되었다. OR은 2학년 학생들이 [기준 이하]이고, [답안에 대한 확신이 없는 질문]에 대해 계산되었다.
In the resulting logistic model (Table 2) the Certainty*Test*Year group, Certainty*Standard and Test*Year group interactions were significant (p < 0.0001, p < 0.0001 and p = 0.001, respectively). The model was used to calculate odds ratios (ORs) for correctness for each level of certainty given test, standard and year group (Table 3). The ORs were calculated relative to questions answered by Year 2 students who were below standard and had no certainty in their answers.

 

가장 경험이 부족하고 가장 낮은 수행자인 시험 1의 2학년 최소 기준 미달자를 포함한 모든 그룹, 표준 및 시험 번호의 경우, 확실도가 증가할 때마다 정확할 확률이 유의하게 증가하였다(모든 p < 0.0001).e all p < 0.01).
For all groups, allowing for year group, standard and test number, including Year 2 students who were below the minimum standard for Year 2 on Test 1, the most inexperienced and lowest performers, there were significant increases in the odds of being correct with each increasing level of certainty (all p < 0.0001, except from no to low certainty where all p < 0.01).

낮은 확률과 불확실한 확률에 대한 OR은 1.15(95% 신뢰 구간 [CI], 1.03–1.29)로 표준보다 낮았다(p = 0.02). 중간 대 낮은 확실성에 대한 OR은 1.15(95% CI, 1.03–1.27) 더 높았다(p = 0.009). 높은 확실성 대 중간 확실성의 경우 OR은 1.09배(95% CI, 0.94–1.25)로 유의하게 다르지 않았다(p = 0.26). 예를 들어, 2학년의 경우 표준보다 낮은 확률과 높은 확실성의 OR은 2.20/1.38(표 3) = 1.59로 표준 1.39(표 3)보다 1.15배 높다. 표 전체에 동일한 비율이 적용되므로, 이는 학년별 그룹 및 확실도 수준에서 확인할 수 있습니다.
The ORs for low versus no certainty were 1.15 (95% confidence interval [CI], 1.03–1.29) higher for those above the standard than those below (p = 0.02). The ORs for moderate versus low certainty were 1.15 (95%CI, 1.03–1.27) higher (p = 0.009). For high certainty versus moderate certainty the ORs were not significantly different at 1.09 times higher (95%CI, 0.94–1.25) (p = 0.26). For example, for year 2, the OR for low versus no certainty above the standard is 2.20/1.38 (Table 3) = 1.59, which is 1.15 times higher than for below the standard 1.39 (Table 3). As the same ratio applies throughout the table, this can be seen across year groups and levels of certainty.

논의
Discussion

우리는 [정답 확률이 확실성의 수준과 강하게 연관되어 있다]는 발견에 의해 결정되는 자체 모니터링의 정확성의 증거를 발견했다. 또한, 이전 연구와 달리, 우리는 [가장 정확할 가능성이 가장 낮은 학생]들, 특히 저학년 그룹에 있는 학생들, 가장 경험이 적은 학생들, 그리고 기준 이하의 성과를 가진 학생들에서도 그러한 정확한 자기 모니터링이 존재한다는 것을 발견했다. 표준 이하와 위의 OR을 비교할 때 낮은 확실도와 낮은 확실도, 낮은 확실도 또는 중간 정도의 확실도 사이에서 OR이 약간 증가했다.
We have found evidence of accuracy of self-monitoring as determined by the finding that the odds of being correct are strongly associated with the levels of certainty. Furthermore, and unlike previous work, we have found such accurate self-monitoring present even in those students who were least likely to be correct, specifically those in the earliest year group, those with the least experience and those with performance below standard. There was a small increase in the OR between no to low certainty and low to moderate certainty, but not moderate to high certainty, when comparing those below and above the standard.

[순간순간의moment-by-moment 성찰]을 장려하는 평가 형식은 자신의 한계에 대한 인식을 자극할 수 있다. 우리는 이러한 측정이 중요한 문헌과 달리 잘 수행되는 이유 중 하나가 [확실성 질문의 문구와 형식]이 임상 실습에 더 authentic했기 때문일 수 있다고 가정한다. 구체적으로, 문구는 정확할 가능성을 추정하기보다는 '찾아볼 때' 또는 '다른 사람에게 양보할 때'를 언급하였다. 응답 척도는 인지적 구조를 반영할 때 가장 잘 작동하는데, 이 경우 행동 중 반영을 목표로 하고 도움을 요청할 필요성과 관련이 있다. 확실성 설명자의 표현은 반응 및 의미를 변경할 수 있습니다. 안전하고 효과적인 임상 성과를 보장하기 위해서는 일상적 실무에서 반사를 다루는 평가가 더 중요할 수 있다.
Formats of assessment that encourage moment-by-moment reflection can stimulate awareness of limitations.9 We postulate that one of the reasons these measures perform well, and contrary to a significant body of literature,23, 25-33 could be that the wording and format of the certainty questions were more authentic to clinical practice. Specifically, the wording referred to ‘when to look it up’ or ‘defer to others’ rather than estimating a likelihood of being correct. Response scales work best when they reflect cognitive structuring,39 which in this case was targeted at reflection-in-action and tied to the need to ask for assistance. The wording of certainty descriptors can alter responses and therefore meanings.34, 43 An assessment that addresses reflection-in-action in daily practice could be more important for ensuring safe and effective clinical performance.5


연구 결과에 대한 대안적인 설명은 코호트와 하위 그룹은, 심지어 표준 이하의 성능을 가진 사람들조차도, 다른 요인 때문에 자기 모니터링의 증거를 보여주었다는 것이다. 이러한 요소에는 다음과 같은 것들이 포함될 수 있다.

  • 일반적인 프로세스가 자기 모니터링 용어보다는 자기 반성을 장려한다. 
  • 또는 의학적 학위 및 자체 모니터링 능력에 따라 선택된 이러한 학생 집단에게 고유한 요인.

An alternative explanation for the findings is that the cohort and subgroups, even those with performance below standard, demonstrated evidence of self-monitoring because of other factors. These factors may include:

  • the general process encouraged self-reflection, rather than specifically the self-monitoring terminology; or
  • a factor specific to these cohorts of students, selected according to the medical degree, and their ability to self-monitor.

기준 이하의 학생과 비교하여 기준 이상의 학생이 확실도 수준에 따라 정답을 맞출 OR이 작게 증가함을 고려할 때, [기준 이상above standard의 수행자]에 대한 자기 모니터링의 일부 개선이 발생할 수 있다. 그러나 자기 모니터링은 [기준 이하below standard]의 수행자에 대해서도 명백하다.
Given the small increase in the OR of being correct between levels of certainty for those above compared with those below standard, it could be that some improvement in self-monitoring occurs for those performing above standard; however, self-monitoring is apparent even for those performing below standard.

이 연구의 강점은 경험과 성과에 의해 정의된 하위 그룹 내에 충분한 수험자 수가 있는 데이터 세트에 대해 반사 작용으로 확실도 수준을 사용하여 정확성의 정확도를 탐구하는 첫 번째 분석이라는 것을 포함한다. 두 개의 서로 다른 테스트 관리에서 분석을 반복하고 동일한 결과를 찾으면 결과의 일반화 가능성이 높아집니다. 
The strengths of this study include that this is the first analysis, to our knowledge, to explore the accuracy of correctness using levels of certainty as reflection-in-action, for a dataset where there are sufficient examinee numbers within subgroups defined by experience and performance. Repeating the analysis across two separate administrations of a test, and finding the same results, increases the generalisability of the findings.

[도움의 필요성을 인정]한다면 외부 인지적 지원의 역할을 인식할 수 있다. 이 응답 형식에서 생성된 추가 정보는 학생 학습을 안내하고 학생 진행에 대한 결정을 안내할 수 있습니다. 비록 우리는 학생들이 일반적으로 정확한 자기 모니터링을 보인다는 것을 발견했지만, 이것을 덜 할 수 있는 특이치 학생들이 있을 수 있다. 이러한 학생들을 식별하고 추적하며, 그들의 결과를 다른 평가와 비교하고 학습에 미치는 영향을 평가하는 것은 미래 탐구 영역이다. 특히, 현재 연구는 단일 학년도 안에서 확인한 스냅샷을 보고했지만, 시간이 지남에 따라 응답 패턴이 분명해질 수 있다. 우리는 잘못된 정보를 높은 수준의 확실성으로 보유하는 소규모 학생 그룹을 식별할 수 있는 잠재적 이점이 있다고 제안한다.
Acknowledging the need for assistance recognises the role of external cognitive support.15 The extra information generated from this response format can guide student learning and can guide decisions on student progress. Although we have found that the student cohorts generally show accurate self-monitoring, there may well be outlier students who are less able to do this. Identifying and following such students, comparing their results with other assessments and evaluating any effect on learning, are areas for future exploration. In particular, the current study reports a snapshot within a single calendar year, but over time response patterns may become apparent. We suggest that there is potential benefit in being able to identify the small group of students who hold erroneous information with high levels of certainty.

정답 숫자를 가지고 합격 또는 불합격 결정을 내리는 데 사용되는 평가에는 [행동 중 성찰의 설명자]에 의해 정의된 확실성이 포함될 수 있다. 주어진 시점에서 학생 확실성과 관련된 단일 응답 집합은 특히 과정 초기에 충분한 증거로 간주되지 않을 수 있다. 그러나 피드백과 반영하고 개선할 시간에도 불구하고 지속되는 대응 패턴은 주목할 만하다.
Certainty defined by descriptors of reflection-in-action could be included in assessments where the numbers correct are used to inform pass or fail decisions. A single set of responses relating to student certainty, at a given point in time, might not be considered sufficient evidence, especially early in a course; however, a concerning pattern of response that persists despite feedback and time to reflect and improve might become noteworthy.

[실무와 맞는 평가]를 만드는 것은 의학 교육에서 지속적인 도전이다. 우리의 [지식 테스트]가 그러한 [전문적인 관행과 병행되도록 보장]하는 것은 [authentic한 응답의 형식과 표현을 개발]하는 데 도움이 된다. 이 시험 형식은 학생들의 반응이 다른 형식과 다르다는 것을 보여줄 뿐만 아니라, 전문적인 실습에서 기대와 일치한다.
Making assessments authentic to practice is an enduring challenge in medical education. Ensuring our tests of knowledge parallel such professional practice is aided by developing formats and wording of responses that are authentic. This test format not only shows that student responses are different from other formats, but is aligned with expectations in professional practice.

결론들
Conclusions

[행동-중-성찰 설명자]는 실무에 authentic하며, 학생들의 응답에 대한 확실성을 문서화하는 더 나은 방법입니다. 심지어 확실성 수준과 무관하게, 정답을 맞출 가능성이 낮을 [저학년 그룹과 수행능력 저조 그룹의 학생들]도 확실성이 증가함에 따라 정답률이 증가함을 보여주었다. 실제 자체 모니터링에 적합한 reflection-in-action 설명자를 사용하면 능력이 낮은 사람들이 적절한 확실성을 확인할 수 있다.
Reflection-in-action descriptors are authentic to practice and a better way to document students' certainty in their responses. Even students in lower year groups and lower performance groups who were less likely to be correct for any given level of certainty, still demonstrated an increase in correctness with increasing certainty. Using reflection-in-action descriptors, which are authentic for self-monitoring in practice, enables those of lower ability to confirm their appropriate certainty.

 

 


 

Med Educ. 2017 Mar;51(3):316-323. doi: 10.1111/medu.13206. Epub 2017 Jan 12.

Low performing students have insightfulness when they reflect-in-action

Affiliations collapse

Affiliations

1School of Medicine and Health Sciences, University of Otago, Wellington, New Zealand.

2School of Medicine and Health Sciences, University of Otago, Christchurch, New Zealand.

PMID: 28084033

DOI: 10.1111/medu.13206

Abstract

Context: Measuring appropriateness of certainty of responses in a progress test using descriptors authentic to practice as reflection-in-action builds on existing theories of self-monitoring. Clinicians making decisions require the ability to accurately self-monitor, including certainty of being correct. Inappropriate certainty could lead to medical error. Self-assessment and certainty of assessment performance have been measured in a variety of ways. Previous work has shown that those with less experience are less accurate in self-assessment, but such studies looked at self-assessment using methods less authentic to clinical practice. This study investigates how correctness varies with certainty, allowing for experience and performance.

Methods: Students in Years 2-5 were certain of their responses to two iterations of a progress test during one calendar year. Analyses compared correctness for certainty of response, test number, student year cohort and performance level, defined by criterion scores.

Results: The odds of a correct response increased with student certainty for all subsets allowing for year group and ability, including student subsets with less experience and subsets in lower-performance groups.

Conclusion: Unlike previous work showing poorer accuracy of self-assessment for those with less experience or ability, we postulate that our finding of similar increases in correctness with increasing certainty even in the less experienced and lower performance groups, relates to certainty descriptors being worded in a way that is authentic to clinical practice, and in turn related to reflection-in-action.

교육적 퀄리티의 지속적 개선 - 퀄리티 문화 촉진: AMEE Guide No. 147 (Med Teach, 2022)
Continuous enhancement of educational quality – fostering a quality culture: AMEE Guide No. 147
Renee E. Stalmeijer , Jill R. D. Whittingham , Guy W. G. Bendermacher , Ineke H. A. P. Wolfhagen, Diana H. J. M. Dolmans and Carolin Sehlbach

 

서론
Introduction

내부 품질 보증의 목적
Aims of internal quality assurance

[내부 품질 보증(IQA)]은 교육 기관이 교육 품질을 제어, 모니터링, 개선 및 향상시키기 위해 시행하는 일련의 활동과 프로세스로 설명할 수 있다. IQA는 교육 관리와 조직의 일상적인 관행에 필수적일 뿐만 아니라, 조직 내 교육 관행이 표준(즉, 외부 품질 보증)에 부합한다는 인증 기관에 대한 증거를 제공한다. 본 AME 가이드에서는 IQA 실무에 대해 중점적으로 설명합니다.
Internal quality assurance (IQA) can be described as the set of activities and processes implemented by educational organisations to control, monitor, improve and enhance educational quality. IQA is not only essential to the day-to-day practices of educational management and organisation, but also provides evidence towards accrediting bodies that the educational practices within an organisation are up to standard (i.e. external quality assurance). This AMEE Guide specifically focuses on IQA practices.

교육 기관 내에서 IQA의 목적을 논의할 때 많은 다른 개념들이 사용된다. 이러한 개념은 종종 서로 다른 함축적 의미와 정의에 주목하지 않고 상호 교환적으로 사용됩니다.

  • IQA의 목적이 품질 관리인 경우, 교육 기관은 교육 프로그램의 결과가 [미리 결정된 표준에 부합하는지 여부]를 확인하려고 한다(Harvey 2004-2021).
  • 교육 품질 모니터링은 교육 기관이 제공하는 교육의 [품질을 보장하기 위해 시행하고 있는 절차]를 더 많이 말한다(Harvey 2004-2021).
  • 품질 개선은 종종 [어떤 것이 '표준에 부합하는지'(이전에는 특정 표준에 미달했던 곳)]를 확인하기 위해 시행 중인 프로세스를 말합니다(Williams 2016).
  • Williams(2016)는 품질 향상이라는 용어가 학생들의 [학습 경험을 증가시키는 의도적이고 지속적인 과정]을 기술한다고 제안한다.

Many different concepts are used when discussing the aims of IQA within educational organisations. These concepts are often used interchangeably without noting different connotations and definitions that are attached to them.

  • When the aim of IQA is quality control, educational organisations want to check whether the outcomes of an educational programme are conform predetermined standards (Harvey 20042021). 
  • Monitoring educational quality refers more to the procedures that an educational organisation has in place to ensure the quality of education provided (Harvey 20042021).
  • Quality improvement often refers to processes in place to ensure that something is ‘up to standard’ (where it previously was below a certain standard) (Williams 2016).
  • Williams (2016) suggests that the term quality enhancement describes the deliberate and continuous process of augmenting students’ learning experiences (QAA 2003).

품질 관리, 모니터링, 개선 및 향상은 모두 IQA의 중요한 목표입니다. 그러나 각 개념에는 고유한 표준과 프로세스가 있습니다. 따라서, 교육 기관은 IQA의 어떤 목표를 향해 노력하고 있는지, 그리고 그러한 목표를 달성하기 위한 올바른 프로세스가 마련되어 있는지 여부를 고려해야 합니다. 

Quality control, monitoring, improvement and enhancement are all important goals of IQA. However, each concept comes with its own standards and processes. Therefore, an educational organisation needs to consider which goals of IQA it is striving towards and whether the right processes are in place to attain them.

선의의 부작용 – 균형 추구
Adverse effects of good intentions – seeking balance

교육 품질의 '관리being in control'와 건전한 IQA 시스템 보유는 인증 기관의 중요한 관심 분야이다(EUA 2009). 그러나 결과적으로 [품질 보증]은 '먹이가 필요한 짐승' 즉 체크 표시가 필요한 관료적 상자의 목록으로 간주될 위험이 있다(Newton 2000). Harvey와 Stensaker(2008)는 품질관리 데이터의 지속적인 생성이 직원 및 학생의 요구와 단절되어 실제로 교육 향상과 향상을 저해한다는 신호를 보냈다. 궁극적으로, 교육의 질 [모니터링]의 중요성을 소홀히 하지 않으면서도, IQA의 핵심에는 [향상enhancement]이 있어야 한다는 Kleijnen et al(2014)의 연구에 참여한 교사들의 목소리처럼, 질 관리 및 개선이 모두 필요하다. 간결성을 위해, 본 가이드는 [모니터링 및 강화monitoring and enhancement]에 대해 설명합니다.

  • [모니터링]은 IQA의 [제어 및 모니터링 목표]를 모두 다루고,
  • [향상enhancement]은 IQA의 [개선 및 향상 목표]를 모두 다루룰 것이다.


‘Being in control’ of educational quality and having a sound IQA system are important areas of attention for accreditation bodies (EUA 2009). As a consequence, however, quality assurance runs the risk of being considered a ‘beast that requires feeding: a list of bureaucratic boxes that needs to be ticked (Newton 2000). Harvey and Stensaker (2008) signalled that the continuous generation of quality control data has often been disconnected from staff and students’ needs which actually inhibited educational improvement and enhancement. Ultimately, both quality control and improvement are needed, as also voiced by teachers participating in a study by Kleijnen et al. (2014) who acknowledged that enhancement should be at the core of IQA without neglecting the importance of monitoring educational quality. For brevity purposes, this guide will from here on out speak of monitoring and enhancement where

  • monitoring covers both control and monitoring goals, and
  • enhancement covers the improvement and enhancement goals of IQA.

양질의 문화 구축
Building a quality culture

유럽 대학 협회(EUA)는 [퀄리티 문화]의 개념을

  • '영구적으로 품질을 향상시키려는 조직 문화'이며, 두 가지 뚜렷한 요소로 특징지어진다
    • [문화적/기술적 요소]: 퀄리티에 관한 가치, 신념, 기대 및 헌신
    • [구조/관리 요소]: 퀄리티를 향상시키고 개별 노력을 조정하는 것을 목표로 하는 정의된 프로세스

The European University Association (EUA) coined the concept of quality culture as

  • ‘an organisational culture that intends to enhance quality permanently and is characterised by two distinct elements:
    • a cultural/psychological element of shared values, beliefs, expectations and commitment concerning quality and
    • a structural/managerial element with defined processes that enhance quality and aim at coordinating individual efforts’ (EUA 2006, p. 10).

퀄리티 문화의 개념은 [IQA 시스템 및 프로세스]뿐만 아니라, 공유된 교육 가치, 유연성, 개방성, 소유의식 및 집단 헌신을 육성하려는 의도를 포착합니다. 퀄리티 문화는 다음에 도움이 된다.

  • 개인의 개선 노력을 조정하고,
  • 상호 기대를 형성하며,
  • 집단 책임을 자극함(EUA 2006).

이러한 요소와 평가 프로그램 간의 시너지를 통해 [지속적인 교육 향상]이 일상적인 교육 실습에 포함되게 됩니다.
The notion of quality culture captures the intention to nurture shared educational values, flexibility, openness, a sense of ownership, and a collective commitment – alongside IQA systems and processes (Sursock 2011; Bendermacher et al. 2020). A quality culture is considered to help

  • coordinate individual improvement efforts,
  • shape mutual expectations, and
  • stimulate a collective responsibility (EUA 2006).

It is through a created synergy between these elements and evaluation programmes that continuous educational enhancement becomes embedded in the everyday teaching practice (Ehlers 2009; Blouin 2019).

이 AMEE 가이드
This AMEE guide

이전의 [가이드 29번]은 [프로그램 평가의 역사]를 살펴보고, 윤리적인 질문을 포함하여 평가 시스템을 설계할 때 물어봐야 하는 다양한 질문 세트를 설명했습니다. Goldie의 제안을 바탕으로 제작된 [67번 가이드]는 [교육 프로그램(과정 수준에서 커리큘럼에 이르기까지)이 변화를 가져왔는지 여부]를 결정하는 데 사용할 수 있는 일반적인 평가 모델의 개요를 제공합니다. 즉, 교육 프로그램의 성과에 초점을 맞추는 것이다.
An earlier AMEE Guide, number 29, (Goldie 2006) looked into the history of programme evaluation and described various sets of questions one needs to ask when designing a system of evaluation, including ethical questions. Guide number 67 (Frye and Hemmer 2012), built on the suggestions by Goldie and provided an overview of common evaluation models which can be used to determine whether an educational programme (ranging from the level of course to curriculum) has brought about change, i.e. focusing on the outcomes of an educational programme.

본 AMEE 가이드는 [퀄리티 문화] 개념을 사용하여, 교육의 IQA에 대한 [포괄적인 접근 방식]을 구축하는 데 초점을 맞추고 있습니다. 우리는 교육 기관이 IQA에 정보를 제공하는 프로세스와 시스템을 최적화하는 동시에 지속적인 교육 퀄리티 향상에 대한 인식과 헌신을 촉진하기 위해 사용할 수 있는 관행(그림 1 참조)을 설명한다. 다음 단락에서는 보건전문교육 분야의 사례를 활용하여 보건전문교육의 질 높은 문화발전이 어떻게 육성될 수 있는지 설명하고자 한다. 우리가 설명하는 관행은 본질적으로 위계적이지 않으며, 그것들을 사용하는 과정에 실질적인 선형성이 없다는 것에 주목하는 것이 중요하다. 조직의 퀄리티 문화를 정의하고 창조하려면, [모든 측면에 동시]에 주의를 기울여야 합니다.

This AMEE Guide focuses on building a comprehensive approach to IQA of education by using the concept of quality culture (EUA 2006; Ehlers 2009; Blouin 2019). We describe practices (see Figure 1) that educational organisations can use to optimise the processes and systems informing IQA while simultaneously fostering the awareness of and commitment to continuous enhancement of educational quality (Bendermacher et al. 2017). Throughout the following paragraphs, we will use cases from the field of health professions education, to illustrate how quality culture development in health professions education can be nurtured. It is important to note that the practices we describe are not hierarchical in nature and that there is no real linearity to the process of employing them. Defining and creating an organisational quality culture requires simultaneous attention to all aspects.

 

우리의 관점 – 반사성
Our perspective – reflexivity

이 가이드는 '태스크포스 프로그램 평가'라는 제목의 마스트리히트 대학교 보건의학과 생명과학부(FHML)의 IQA 전문가 그룹의 관점에서 작성되었습니다. Task Force는 관련 이해 관계자들과 협력하여 FHML 내의 모든 교육 프로그램의 교육 품질을 모니터링하고 향상시킬 책임이 있습니다. 이 책임은 다음과 같이 수행됩니다.

  • (1) 표준화된 기기를 통해 유효하고 신뢰할 수 있는 데이터 수집을 보장
  • (2) 양적 및 질적 연구 방법론의 혼합을 통해 교육의 질에 대한 심층 연구를 수행
  • (3) 관련 이해 관계자에게 교육 품질 보증에 대한 교수진 개발 제공
  • (4) FHML 내에서 프로그램의 지속적인 품질 향상을 위한 대화를 자극

This guide is written from the perspective of an expert group on IQA at Maastricht University, Faculty of Health Medicine and Life Sciences (FHML) entitled ‘task force programme evaluation’. The task force is, in collaboration with relevant stakeholders, responsible for monitoring and enhancing educational quality of all educational programmes within FHML. This responsibility is executed by

  • (1) ensuring valid and reliable data collection through standardized instruments,
  • (2) executing in-depth studies on educational quality through a mix of quantitative and qualitative research methodologies,
  • (3) providing faculty development on educational quality assurance to relevant stakeholders, and
  • (4) stimulating a dialogue towards continuous quality enhancement of the programmes within FHML.

본 AMEE 가이드의 저자들은 모두 보건전문교육대학원 소속 연구원으로 교육과학(RS, IW, DD), 교육심리학(JW), 보건과학(CS), 정책 및 관리(GB) 분야에서 경력을 가지고 있다. 또한 저자(GB) 중 한 명은 [퀄리티 문화]의 개념을 전문적으로 다루는 정책 자문위원으로 그의 연구를 통해 질문화의 개념을 더욱 탐구했다. 우리는 모든 보건 전문 교육 학교가 유사한 전담팀을 고용하는 것은 아니며 때로는 프로그램 평가의 과제가 한 개인의 어깨에 달려 있을 수 있다는 것을 알고 있다. 그럼에도 불구하고, 우리는 우리의 경험, 연구 및 통찰력이 교육 품질 보증에 관련된 모든 사람에게 필요한 지침과 지원을 제공하기를 바란다.

The authors of this AMEE Guide are all researchers within the School of Health Professions Education and have backgrounds in educational sciences (RS, IW, DD), educational psychology (JW), health sciences (CS), and policy and management (GB). In addition, one of the authors (GB) is a policy advisor who specializes specifically in the concept of quality culture and, through his research, has further explored the concept of quality culture. We are aware that not all health professions education schools employ similar task forces and that sometimes the task of programme evaluation may rest on the shoulders of a single individual. Nevertheless, we hope that our experiences, research and insights provide the necessary guidance and support to anyone involved in educational quality assurance.

퀄리티 문화 육성 – 우리는 무엇을 위해 노력하고 있는가?
Fostering a quality culture – what are we striving for?

기본 목표 및 가치 논의 및 결정
Discuss and determine underlying goals and values

퀄리티란 무엇인가?
What is quality?

IQA가 어떤 목표를 가지고 있는지 고려할 때, 해결해야 할 중요한 질문은 '우리가 품질을 말할 때 무엇을 의미하느냐'이다.; 종종 잊혀지는 것은 퀄리티는 보는 사람의 눈에 달려 있다는 것이다. 이로 인해 '퀄리티란 무엇인가'라는 질문에 대해 한 조직 내에서 여러 이해 관계자가 서로 다른 개념을 갖게 될 수 있습니다. 하비와 그린(1993)은 품질에 대한 다섯 가지 다른 개념을 정의하였다: 우수성, 완벽성/우수성, 목적에 맞는 가치, 비용 대비 가치, 혁신. excellence, perfection/consistency, fit-for-purpose, value for money, and transformation

When considering what goals IQA has, an important question to address is ‘what do we mean when we say quality?’; what is often forgotten is that quality lies in the eye of the beholder. This may result in multiple stakeholders within a single organisation having different conceptions when it come to the question ‘what is quality?’. In their seminal work Defining Quality, Harvey and Green (1993) discerned five different conceptions of quality:

  • excellence,
  • perfection/consistency,
  • fit-for-purpose,
  • value for money, and
  • transformation.

질을 ['목적 적합']을 위해 노력하는 것으로 보는 것은, 예를 들어, 교육 목표를 달성하고 졸업생들이 일정한 기준을 통과하도록 보장하는 것을 필요로 한다. 그러나, IQA는 [변혁]의 관점에서 학생들에게 어느 정도 '가치가 추가되었는가'와 학생들에게 권한이 부여되었는지empowered를 판단하기 위해 노력할 것이다. 본 AME 가이드의 범위 밖에서는 각 정의에 대해 자세히 설명하지만, 독자들은 이러한 품질 개념을 숙지할 것을 권장합니다. 이러한 개념에 익숙해지면 교육 기관 내의 이해관계자들이 어떤 정의를 중시하고 그 전경을 논할 수 있는 어휘를 제공할 것이다. 

Seeing quality as striving for fit-for-purpose requires, for example, ensuring that educational goals are attained and that graduates pass a certain standard. Through the lens of quality as transformation, however, IQA would be striving to determine to what extent ‘value has been added’ to the student and that students have been empowered. Although it is outside of the scope of this AMEE Guide to go into depth on each definition, we encourage readers to familiarise themselves with these conceptions of quality. Familiarity with these conceptions will provide a vocabulary through which stakeholders within an educational organisation can discuss which definition(s) they value and foreground.

우리는 교육 기관들은 [늘 서로 다른 유형의 품질을 동시에 달성하는 것을 목표로 할 것]이라고 믿는다. 교육 기관의 순위를 보장하는 것과 비교하여 프로그램의 재정finances이 제대로 되어 있는지 생각해 보십시오. 따라서, 우리는 독자들이 퀄리티에 대해 그들 자신의 조직에 있는 관련 이해 관계자들과 토론할 것을 강력히 권고한다. 왜냐하면, 조직 내에서 IQA의 목표를 정의하는 것과 마찬가지로, 어떤 품질 개념을 가지고 있는지는 다음에 대한 방향과 지침을 제공할 것이기 때문이다.

  • IQA를 위한 도구와 절차를 설계하는 방법
  • 어떤 이해 당사자가 참여해야 하는지
  • 품질 문화를 형성하는 방법

We believe that educational organisations will always be aiming to attain different types of quality simultaneously. Imagine ensuring that the finances of a programme are in order versus ensuring the ranking of an educational organisation. Therefore, we strongly advise readers to discuss with relevant stakeholders in their own organisation what quality means to them. Because, just like defining the aims of IQA within your organisation, the conception(s) of quality that are held will provide direction and guidance on

  • how to design instruments and procedures for IQA,
  • which stakeholders to involve and
  • how to shape a quality culture.

[IQA의 목표퀄리티의 개념에 대한 인식의 불일치]는 생산적인 품질 문화를 구축하는 과정을 방해할 수 있다. 왜냐하면, [퀄리티]를 [목적적합성에 따라 inform하는 과정]은 [퀄리티]를 [변혁에 따라 inform하는 과정]과 다르기 때문이다.
Misalignment in perceptions about goals of IQA and conceptions of quality may thwart the process of building a fruitful quality culture as the processes that inform quality as fit-for-purpose are different to those informing quality as transformation.

어떤 양질의 문화?
Which quality culture?

퀄리티 문화는 기관이 처음부터 개발해야 하는 것도 아니며, '이상적인' 퀄리티 문화도 없다는 것을 깨닫는 것이 중요하다.즉, 각 기관은 [이미] 외부의 발전에 어떻게 반응하는지를 결정하고, 내부적인 협력을 촉진하기 위해 노력하는 특정한 종류의 퀄리티 문화를 보유하고 있다. 또한 퀄리티 문화는 품질 관리를 다루는 조직의 [맥락과 발전 단계]에 의해 영향을 받습니다. 예를 들어,

  • IQA 시스템을 설정하는 초기 단계에 있는 교육 기관은 우선 교육 품질을 모니터링하고 제어하는 데 집중함으로써(즉, 절차와 표준을 설치 또는 미세 조정하는 것) 가장 큰 이익을 얻을 수 있다.
  • 최소 기준이 충족되는지 여부를 모니터링하는 강력한 시스템을 이미 구축한 조직은 조직의 환경 변화에 대처하는 동시에 지속적인 개선으로 초점을 전환할 수 있습니다.


It is important to realise that a quality culture is not something that institutions have to develop from scratch and also that there is no such thing as ‘the ideal’ quality culture. That is, each institution already possesses a certain kind of quality culture which determines how that institution reacts to external developments, and attempts to foster internal collaborations (Bendermacher 2021). Moreover, a quality culture is influenced by the organisation’s context and its developmental phase in dealing with quality management (Harvey and Stensaker 2008). For instance,

  • educational organisations who are in the early stages of setting-up their IQA system would probably benefit most from first focusing on monitoring and controlling educational quality (i.e. to install or fine-tune procedures and standards).
  • Those organisations who already have established a robust system which monitors whether minimum criteria are met, can shift their focus towards continuous enhancement while addressing changes in the organisation’s environment.

조직 문화 평가 지수(상자 1 참조)에 대한 논의와 같은 성찰 연습은 이해 관계자가 자신의 핵심 가치를 공개하는 데 도움이 될 수 있습니다. 이 논의는 이러한 가치와 조직 절차 간의 더 나은 조정으로 이어지는 전략과 솔루션을 형성하는 데 도움이 될 수 있습니다. 이러한 성찰과 대화는 또한 강조를 '일이 잘 되어가고 있는가'에서 '옳은 일이 되어가고 있는가'로 바꾸는 데 도움이 될 수 있다(Cartwright 2007).
Reflection exercises like discussing the Organisational Culture Assessment Index (see Box 1) can aid stakeholders to disclose their core values. This discussion can help shape strategies and solutions that lead to a better alignment between these values and organisational procedures (Berings and Grieten 2012). Such reflections and dialogues can also help to alter the emphasis from ‘whether things are being done well’, to ‘whether the right things are being done’ (Cartwright 2007).

품질 문화 구축 – 구조 및 관리 구성요소
Building a quality culture – structural & managerial components

[정기적인 데이터 유입] 없이는 IQA 시스템이 존재할 수 없다. 이것은 IQA의 목표를 해결하는 데 도움이 되고, 이해 당사자들이 프로그램의 품질을 모니터링하고 향상시킬 수 있도록 정보를 제공한다. 이 제도가 품질문화 강화에 기여할 수 있도록 하기 위해서는 다음과 같은 측면을 고려할 필요가 있다:

  • 도구의 설계와 삼각 측량, 
  • 이해관계자의 참여, 
  • IQA의 사이클릭한 특성.

No system of IQA can exist without a regular influx of data that helps to address the goals of IQA and provides input for stakeholders to monitor and enhance the programme’s quality. To ensure that this system contributes to strengthening the quality culture, the following aspects need to be considered:

  • the design and triangulation of instruments,
  • involvement of stakeholders, and
  • the cyclical nature of IQA.

도구의 설계 및 삼각 측량
Design & triangulation of instruments

설계에 교육 원리 포함
Incorporating educational principles in design

IQA는 교육 활동이나 과정과 같은 [커리큘럼을 구성하는 핵심 구성 요소]에 맞춰져야 하며, 학습과 교육에 대한 [이론과 문헌에 확고하게 기반]을 둔 평가 도구를 구축해야 한다. 즉, 평가 도구의 항목은 문헌이 교육 프로그램의 질을 결정하는 것으로부터 파생되어야 한다. IQA 도구의 설계가 이러한 [교육 원리]에 기초하는 경우, 이는 서로 다른 이해관계자가 실행할 수 있는 데이터 수집 결과의 가능성을 증대시킬 것이다. [교육 원리]는 [교육 프로그램이 효과적인 방법과 이유에 대한 사고 방식]으로 정의될 수 있다(그림 2). 평가하려는 교육 과정이나 프로그램의 성격에 따라 여러 교육 원칙이 적용될 수 있습니다. Box 2에서는 두 가지 예를 제공합니다.

  • (1) 문제 기반 학습을 평가하기 위한 구성주의 학습의 원칙, 그리고 
  • (2) 임상 교육을 평가하기 위한 인지적 견습.

IQA should be geared towards the key components that make up a curriculum, such as educational activities or courses, and should build evaluation instruments firmly grounded in theories and the literature on learning and teaching (Frick et al. 2010). In other words, the items of an evaluation instrument must be derived from what the literature has shown determines the quality of an educational programme. If the design of IQA instruments is based on these educational principles, this will augment the chances of outcomes of data collection being actionable by the different stakeholders (Bowden and Marton 1999; Dolmans et al. 2011). Educational principles can be defined as a way of thinking about how and why an educational program is effective (Figure 2). Depending on the nature of the curriculum or the programme you want to evaluate, multiple educational principles might apply. In Box 2, we provide two examples (1) principles of constructivist learning to evaluate problem-based learning, and (2) cognitive apprenticeship to evaluate clinical teaching.

도구를 설계할 때 [교육 원리]가 중요하다는 사실 외에도, 교육이 고도로 [맥락 특이적]이라는 사실, 즉 이론적 원칙에 기초했을 때, 무엇이 제대로 작동할 것인지는, 맥락적 차이뿐만 아니라 특정 목적과 대상 그룹에 따라 다를 수 있다는 사실도 고려해야 한다. 결과적으로, 가급적 이론적 지침에 기초한 도구의 설계는 여전히 [커스터마이제이션의 문제]로 남아 있다. 목표와 기기가 사용되는 상황에 따라 기기를 지속적으로 조정하고 조정하는 것이 중요합니다.

In addition to the fact that educational principles are important to keep in mind when designing an instrument, it is essential to also consider the fact that education is highly context-specific, i.e. what might work, based on theoretical principles, might differ dependent on the particular aims and target groups as well as contextual differences (Hodges et al. 2009; Kikukawa et al. 2017). As a consequence, the design of instruments, which is preferably based on theoretical guidelines, remains a matter of customisation. It is important to continuously adapt and align your instruments, depending on what your aims are and the context in which the instruments are being used.

  

도구의 삼각 측량
Triangulation of instruments

[IQA의 목적]에 따라 [평가하려는 프로그램의 측면]과 [입력이 필요한 이해 관계자의 도구 설계 요구 사항]이 변경됩니다.

  • 주된 목적이 [책무성 목적]을 위해 [품질을 통제하고 모니터링하는 것]이라면, 대다수의 모집단에서 표준화된 요인 집합에 대해 [타당하고 신뢰할 수 있는 데이터를 수집하는 것]이 우선된다. 이 목표는 데이터 수집에 대한 [정량적 접근법]을 보장한다.
  • 교육의 [질 개선과 향상]에 초점을 맞출 때, 필요한 정보는 본질적으로 [풍부하고 기술적]이며, 보다 [정성적]이어야 하며, 이를 통해 교육을 개선하고 향상시키는 방법에 대한 명확하고 구체적인 의견을 찾을 수 있어야 한다. 교육의 질이 다차원적이고 학습환경이 복잡하기 때문에 이를 측정하기 위해서는 [양적 방법과 질적 방법을 병행]하는 것이 좋다. 설문지, 인터뷰, 강의실 관찰, 문서 분석 및 포커스 그룹이 모두 일반적으로 사용됩니다. 

Depending on the aims of IQA, the aspects of the programme you are trying to evaluate and the stakeholders whose input you need, requirements for instrument design change.

  • When the primary aim is to control and monitor quality for accountability purposes, collecting valid and reliable data for a standardised set of factors from the majority of the population takes precedent (Dolmans et al. 2011). This goal warrants a quantitative approach to data collection.
  • When the focus is on the improving and enhancing of educational quality, the information that is needed should be rich, descriptive and more qualitative in nature so that clear and specific input can be found on how to improve and enhance education. Since educational quality is multidimensional and learning environments are complex, it is recommended to combine both quantitative and qualitative methods to measure it (Cashin 1999). Questionnaires, interviews, classroom observations, document analysis and focus groups are all commonly used (Braskamp and Ory 1994; Seldin 1999).

예를 들어, 먼저 대규모 정량적 학생 설문지를 관리하여 과정의 전반적인 강점과 약점을 파악할 수 있습니다. 그런 다음 후속 질적 초점 그룹은 이러한 데이터에 대해 자세히 설명하고 더 명확한 관점에 배치할 수 있다. 품질 문화를 구축하려면 교육 프로그램의 품질에 대한 전체적인 개요를 제공하고 모니터링 또는 개선 목적에 정보를 제공할 수 있는 데이터를 수집하기 위해 다양한 도구와 절차의 삼각측량이 필요하다.
For instance, one could first evaluate a course by administering a large-scale quantitative student questionnaire to bring into focus the course’s overall strengths and weaknesses. Subsequent qualitative focus groups can then elaborate on these data and place them in a clearer perspective. Building a quality culture requires triangulation of different instruments and procedures to provide a holistic overview of the quality of an educational programme and to collect data that may inform either monitoring or enhancement purposes.

모든 관련 이해관계자 참여
Involving all relevant stakeholders

이해당사자
Identifying stakeholders

지속적인 품질 향상 시스템을 설계할 때 다양한 이해 관계자가 참여해야 합니다. '퀄리티는 보는 사람의 눈에 달려 있다'는 것과 평가가 이루어지는 맥락을 고려해야 하기 때문에, 각 이해관계자는 전체적인 평가 프로그램을 제공하기 위해 교육적 질에 대한 자신의 관점을 추가하도록 초대되어야 한다. 이해 관계자를 식별하기 위해 다음과 같은 질문을 고려할 수 있다.

  • '이 교육의 수혜자는 누구인가?' 
  • '누가 이 교육을 가르치고 관리하는 데 관여하고 있는가?' 
  • 누가 이 교육의 효과를 판단할 수 있습니까? 

When designing a system of continuous quality enhancement various stakeholders need to be involved. Since ‘quality is in the eye of the beholder’ and we need to consider the context in which evaluations take place, each stakeholder should be invited to add their perspective on educational quality to render a holistic programme of evaluation (Harvey and Stensaker 2008). To identify stakeholders one may consider questions like

  • ‘Who are the recipients of this education?’
  • ‘Who are involved in teaching and managing this education?’
  • ‘Who can judge the effectiveness of this education?’.

일단 관련 이해당사자가 확인되면,

  • 그들이 어떻게 그리고 어떤 도구를 통해 관여할 수 있고,
  • 어떤 측면과 교육 수준을 가장 잘 평가할 수 있는지에 대한 문제가 발생하고,
  • 이어서 그들을 참여시키고 접근하는 최적의 타이밍에 대한 질문이 뒤따른다.

Once relevant stakeholders are identified, the question arises of

  • how and through which instruments they can be involved,
  • what aspects and level of education they can best evaluate,
  • followed by the question of best timing of involving them and approaching them.

맥락과 시기에 따라, 각 이해당사자는 교육의 질을 높이는 과정에서 제공할 수 있는 기여뿐만 아니라 자신의 [위치적situated 지식]과 [실제 경험]을 가질 수 있다. 이러한 모든 질문은 적절한 개입이 제도, 인증 또는 심지어 문화적 표준에 따라 다른 형태를 취할 수 있으므로 이해관계자가 관여할 지역적 맥락에 비추어 고려할 필요가 있다.
Depending on context and timing, each stakeholder might have their own situated knowledge and lived experience as well as contribution to offer in the process of enhancing educational quality (Kikukawa et al. 2021). All these questions need to be considered within the light of the local context in which stakeholders will be involved as appropriate involvement may take different shapes depending on institutional, accreditation or even cultural standards.

주요 이해관계자 참여
Involving key stakeholders

[학생]들은 교육의 소비자로서 QA 과정에 중요한 이해관계가 있다고 여겨지기 때문에 전통적으로 과정 평가를 받아왔다. '경험이 풍부한 전문가'로서 과정, 워크샵 또는 교사 성과와 같은 개별 [교육 기관에 대한 상세하고 자세한 정보를 제공]할 수 있습니다. 이 데이터는 검증된 설문지를 통해 양적으로 그리고 인터뷰와 포커스 그룹을 통해 질적으로 수집될 수 있다. 서로 다른 데이터(숫자와 서술, 일반적이고 구체적)가 생성될 수 있지만, 전체적으로 학생들의 관점을 포함하면 [커리큘럼이 설계된 방식]과 비교해서 [커리큘럼이 실제로 실행되는 방식]에 대한 통찰력을 제공할 수 있다. 여기에는 인식된 강점과 개선점을 포함한다. 양질의 문화를 강화하기 위해 학생들은 [교육과 제도적 의사결정에 참여]할 수 있다.

Students have traditionally been subjected to course evaluations, for, as the consumers of education, they are considered to have a crucial stake in the QA process (Coates 2005; Marsh 2007). As ‘experienced experts’, they can provide detailed, information on distinct educational entities such as a course, workshop or teachers’ performance. This data can be collected both quantitatively through validated questionnaires and qualitatively through interviews and focus groups. Although different data might be generated (numeric and narrative, generic and specific), as a whole, involving students’ perspectives can provide insight into the way the curriculum is put into practice compared to how it has been designed, including perceived strong points and points for improvement. To strengthen a quality culture students can also be involved in education and institutional decision-making.

  • 예를 들어, 그들은 학생 평가 위원회(SEC)에서 활동하거나 학생 대표로서 관리 기관의 교수진 및 프로그램 조정자와 함께 일할 수 있다. 이러한 학생들은 종종 이미 콘텐츠 전문 지식을 얻고, 교수진과 공유 언어를 개발하며, 잠재적인 권력 관계를 극복하는 방법을 배웠다. 
  • They can, for instance, serve on a student evaluation committee (SEC) (Stalmeijer et al. 2016) or, as student representatives, join faculty and programme coordinators on management bodies (Elassy 2013; Healey et al. 2016). These students often already have gained content expertise, developed a shared language with faculty, and learned how to overcome potential power relations.

교육 관행에 관한 [설계, 구현 및 의사 결정]에 있어 학생들의 보다 신중한 참여를 향한 강한 움직임이 있다. 이는 디자인 기반 연구, 참여형 디자인, 공동 창작, 공동 디자인, 학생 목소리, 학생-직원 파트너십, 변화 주체로서의 학생, 학생 참여 및 학생 권한 부여와 같은 다양한 학생 참여 접근 방식에 반영됩니다. 교육(디자인) 과정에 학생들의 적극적인 참여를 강화함으로써 [교직원과 학생 모두의 교수와 학습을 동시에 개선]하는 것이 목적이다. 이러한 접근 방식은 단순히 학생들의 목소리에 귀를 기울이는 것을 넘어 학생들이 교사 및 교육 관리와 적극적으로 협력할 수 있도록 하는 데 초점을 맞추고 있다는 점을 강조하는 것이 중요하다. 이러한 접근 방식을 통해 학생과 교직원은 파트너십을 형성하고, 공동 창작 및 (재)디자인 교육을 할 수 있습니다.

There is a strong movement towards more deliberate involvement of students in the design, implementation and decision making regarding educational practices (e.g. Bovill et al. 2016). This is reflected in different, approaches to student participation like design-based research, participatory design, co-creation, co-design, student voice, student–staff partnership, students as change agents, student engagement, and student empowerment (Seale 2009; Anderson and Shattuck 2012; Bovill et al. 2016). By intensifying the active engagement of students in the educational (design) processes, the aim is to simultaneously improve teaching and learning of both faculty and students (Bovill et al. 2016). It is important to stress that this approach goes beyond just listening to student voices; the focus is on empowering students to actively collaborate with teachers and educational management (Bovill et al. 2011). Through this approach students and staff can form partnerships, co-create, and (re-)design education (Martens et al. 2019; 2020).

학생들의 입력만이 통찰력이 있을 수 있는 것이 아니라, 평가 과정에 [교직원]을 초대하는 것은 실제 teaching 및 조직적인 측면에 대한 훌륭한 통찰력을 줄 수 있고, 동시에 buy-in와 헌신을 증가시킬 수 있다. 교직원은 대부분 과정과 훈련 프로그램을 개선하기 위한 평가 데이터의 사용자이지만, 평가 응답자가 되어 IQA에 기여할 수도 있다. 또한 교육 활동 중 또는 교육 활동 종료 시 관찰된 헛점pitfalls이나 조직 과제를 평가하기 위해 teaching staff를 구조적으로 포함할 수 있다.

  • 예를 들어, PBL 사례 평가에 PBL 튜터, 교육 활동의 정렬에 대한 강의 및 워크샵 제공자 또는 프로그램 평가에서 자신의 역할을 수행하는 멘토를 참여시키는 것을 고려하십시오(박스 3 참조).

[메타 수준]에서, 교수진은 또한 프로그램 평가 절차의 평가에 참여할 수 있다. 코스 코디네이터의 성과에 대한 공식적인 평가 데이터가 없음을 고려하여, 과목 책임교수course coordinators는 피드백 대화와 성찰 또는 보고 세션에 참여할 수 있도록 교직원들을 적극적으로 초대할 수 있다. 또한, 교육 인력이 (일부) IQA 접근 방식을 공동 설계할 수 있도록 권한을 부여함으로써, 이러한 관행과 필요한 후속 조치에 대한 교사들의 참여가 더욱 증가할 수 있다(Bendermacher 2021).

Not only students’ input can be insightful, inviting faculty into the evaluation process can give great insight into practical teaching and organizational aspects and simultaneously increase buy-in and commitment. While faculty is mostly the user of evaluation data to improve courses and training programmes, they can also become evaluation respondents and thereby contribute to IQA. Teaching staff could also be included structurally during or at the end of an educational activity to evaluate observed pitfalls or organizational challenges.

  • As an example, consider involving PBL tutors in the evaluation of PBL cases, lectures and workshop providers on the alignment of their educational activities, or mentors in fulfilling their roles in programmatic assessment (see Box 3).

On a meta-level, faculty can also be engaged in the evaluation of programme-evaluation procedures. Considering the absence of formal evaluation data for course coordinators’ performance, course coordinators could actively invite faculty to engage in feedback dialogues and reflection or debriefing sessions. Moreover, by empowering teaching staff to co-design (part of the) IQA approaches, their involvement in these practices and their required follow-up might be further increased (Bendermacher 2021).

 

학생들의 [미래 고용주]는 또한 IQA의 중요한 이해당사자이다.

  • 직업 현장의 대표들은 졸업생들에 대해 어떻게 생각하는가? 
  • 취업 현장에 참여하는 학생들은 필요한 기술, 지식 및 태도를 잘 준비하고 갖추고 있는가? 
  • 교육과정이 노동력의 요구를 반영하고 있는가? 

고용주는 새로운 커리큘럼을 설계할 때 대화나 설문지를 통해 임시로 상담받거나 인턴십, 커리큘럼 또는 동문 평가 동안 학생들의 성과를 논의하기 위해 더 정기적으로 상담받을 수 있다.
The future employers of students are also important stakeholders in IQA:

  • how do representatives from the work field feel about the graduates?
  • Are students joining the work field well-prepared and equipped with the required skills, knowledge and attitudes?
  • Does the curriculum reflect the needs of the workforce?

Employers could be consulted ad-hoc in dialogue or through questionnaires when designing a new curriculum or on a more regular basis to discuss students’ performance during internships or curriculum or alumni evaluations.

[동문]들은 평가 설문지를 통해 [프로그램에서 놓친 영역]과 [가르치고 훈련한 역량이 자신의 경력(선택)에 어느 정도 도움이 되었는지]에 대한 귀중한 정보를 제공할 수 있다. 이는 교육과정 재설계에 직면할 때 특히 통찰력이 있을 수 있으며, 이는 구조적인 차원에서 동문들의 참여가 필요하지 않음을 나타낸다.
Alumni can provide valuable information through evaluation questionnaires about areas they missed in the programme and the extent to which the competences taught and trained have helped them in their career(choice). This can be particularly insightful when facing a curriculum redesign, indicating that involvement of alumni is not required on a structural level.

이와 유사한 맥락에서, [고객이나 환자]는 학생들의 현장진출 준비성이나 교육의 질 향상에 대해 그들의 관점에서 조명할 수 있다(Romme et al. 2020). 이것은 교육을 설계하는 맥락일 수 있지만, 모의 환경이나 임상 순환 중에 학생들의 성과에 대한 피드백을 초대하는 것을 통해서도 가능하다. 그러나 이를 위해서는 검증된 설문지의 개발과 사용, 전력 역학에 대한 인식 및 성과 평가 제공과 관련된 개별 환자 선호도에 대한 존중이 필요하다.
In a similar vein, clients or patients can shed light on students’ preparedness to enter the field or on educational quality improvement from their perspective (Romme et al. 2020). This can either be in the context of designing education but also through inviting their feedback on student’s performance in a simulated setting or during clinical rotations. This, however, requires the development and use of validated questionnaires, awareness of power dynamics and respect for individual patient preferences concerning the provision of performance evaluation (Sehlbach et al. 2020).

 

체계적이고 구조적이며 통합된 IQA에 대한 주기적인 접근 방식
A cyclical approach to IQA – systematic, structural and integrated

IQA 관행에 의해 생성된 데이터가 지속적인 교육 품질 향상으로 이어지도록 하기 위해, IQA는 (1) 체계적이고 (2) 구조적이며 (3) 통합적인 실천으로 특징지어지는 [주기적 과정]을 필요로 한다(그림 3).
To ensure that data generated by IQA practices results in continuous improvement of educational quality, IQA requires a cyclic process characterised by practices that are (1) systematic, (2) structural and (3) integrated (Dolmans et al. 2003) (Figure 3).

[체계적]이라는 것은 커리큘럼의 [모든 중요한 교육 설계 요소]가 [다양한 평가 도구와 절차]에 의해 다루어지고 포괄된다는 것을 의미한다. 체계적인 것은 이해관계자의 참여에도 적용된다. 예를 들어, PBL 커리큘럼을 평가하려면 강의, 실습, 튜토리얼 그룹 미팅, PBL 튜터의 질, 평가의 질, 학생들의 수행 등 각 과정의 다양한 측면에 대한 정보가 필요합니다. 이 정보는 학생, 강사, 교사, PBL 튜터, 코스 코디네이터와 같은 과정에 관련된 이해 관계자에 의해 제공되어야 합니다.
Systematic implies that all important educational design elements of a curriculum are addressed and covered by a variety of evaluation instruments and procedures (Dolmans et al. 2003). Systematic also applies to the involvement of stakeholders. For example, evaluating a PBL curriculum requires information about various aspects of each course: lectures, practicals, tutorial group meetings, the quality of PBL tutors, the quality of the assessment and performance of students. This information should be provided by the stakeholders involved in the course: students, lecturers, teachers, PBL tutors, course coordinators.

[구조적]이라는 것은 정기적인 간격의 주기적 평가의 중요성을 지적한다(Dolmans et al. 2003). 이러한 간격의 빈도는 평가되는 측면의 중요도에 따라 결정해야 한다(그림 3). 예를 들어, 2학년이 지난 후 과정의 질이 안정되었다면, 평가 피로를 피하기 위해 2년에 한 번만 프로그램의 일부를 심층적으로 평가하기로 결정할 수 있다. 이러한 관행이 명확하고 합의된 것이 중요하다. 정책 문서를 통해서 다음을 전달해야 한다.

  • 활동 유형(예: 설문지, 포커스 그룹 등), 
  • 활동 목적(예: 모니터 대 강화) 
  • 활동 빈도(예: 정기적인 간격, 임시 평가 회피) 
  • 커리큘럼 수준(예: 과정 수준 대 커리큘럼 수준) 및 
  • IQA와 관련된 관련 이해관계자(예: 책임자)

Structural points to the importance of periodic evaluation at regular intervals (Dolmans et al. 2003). Frequency of these intervals should be determined based on the importance of the aspect being evaluated (Figure 3). For instance, if after two academic years the course quality has stabilised, one may decide to evaluate parts of the programme in depth only once in 2 years to avoid evaluation fatigue (Svinicki and Marilla 2001). It is important that these practices are clear and agreed upon. Policy documents should communicate the

  • different activities (e.g. questionnaire, focus groups etc.),
  • purposes (e.g. monitor versus enhance), frequency
  • of activities (e.g. regular intervals, avoid ad-hoc evaluations),
  • levels of curriculum (e.g. course level versus curriculum level) and
  • relevant stakeholders (e.g. responsibilities) involved in IQA.

마지막으로, IQA 관행은 [통합적]이어야 해야 하며, 이는 관련 이해 관계자가 교육 품질을 모니터링하고 향상시키는 데 있어 [자신의 책임을 인식하고 구체화한다는 것]을 의미한다. 교육 기관은 IQA 프로세스에 발언권을 부여함으로써 이해관계자의 적극적인 참여를 가능하게 해야 한다. 또한 조직은 [개선 계획]이 [개발, 구현 및 평가]되고, 이 [프로세스가 정기적으로 투명하게 논의되는지 확인]해야 합니다. 전반적으로, IQA 활동이 [조직의 정규 업무 패턴에 통합]될 때, 이는 지속적인 주기적 과정과 지속적인 교육 품질 향상에 기여할 것이다.
Finally, IQA practices should be integrated, meaning that relevant stakeholders are aware of and give shape to their responsibilities within monitoring and enhancing educational quality (Dolmans et al. 2003). Educational organisations should enable active involvement of stakeholders by giving them a voice in the IQA process. Furthermore, organisations need to ensure that improvement plans are developed, implemented and evaluated, and that this process is discussed regularly and transparently. Overall, when IQA activities are integrated in the organisation's regular work patterns, this will contribute to a continuous cyclical process and continuous enhancement of educational quality.

양질의 문화 구축 – 문화적, 심리적 요소
Building a quality culture – cultural & psychological components

IQA 목적을 위해 수집된 데이터가 모든 이해 관계자가 지속적으로 교육의 질을 향상시키겠다는 약속을 인식하고 느끼는 퀄리티 문화에 확실히 반영되기를 원한다면, 몇 가지 요소에 대한 관심이 필요하다.

  • 성찰과 대화를 자극하는 것
  • 교수개발과 실천공동체를 가능하게 하여 이해 관계자를 지원하는 것
  • 퀄리티 문화를 육성하는 리더십

If we want to ensure that the data collected for IQA purposes will indeed feed into a quality culture in which all stakeholders are aware of and feel commitment towards continuously enhancing educational quality, several components require attention:

  • the extent to which reflection and dialogue are stimulated,
  • supporting stakeholders through faculty development and enabling communities of practice, and
  • leadership that fosters a quality culture.

교육의 질에 대한 성찰과 대화의 자극
Stimulating reflection and dialogue regarding educational quality

성찰 자극
Stimulating reflection

[교육의 퀄리티에 관한 데이터를 갖는 것]이 [자동적으로 교육의 질 향상]으로 이어지지는 않는다. 이론적인 원칙에 입각한 평가 설계를 바탕으로 이론적으로 근거가 있는 풍부한 데이터가 생성되지만, 상황별적이고 보다 실행 가능한 연구도 해당 데이터의 수신자가 교육 품질을 향상시키는 활동으로 데이터를 번역하는 데 도움이 필요할 수 있음을 보여줍니다. 종이와 행동 사이에는 긴 길이 있을 수 있다. 데이터를 행동으로 변환하는 것은 다른 방식으로 자극될 수 있다. [대조적인 평가 데이터]를 제공함으로써 조치를 취할 수 있다.

  • 예를 들어, 과정의 평가 결과를 보고할 때, 과정의 평가 결과 옆에 상대적 평가 데이터(예: 다른 과정과의 비교, 전년도 과정과의 비교)를 보고하는 것을 고려할 수 있습니다(상자 4 참조). 
  • 이와 유사하게, 그러나 개별 교사에게 피드백을 제공하는 경우, 해당 교사에 대한 실제 학생 평가와 함께 교사들에게 자기 평가를 작성하도록 요청하고 이러한 결과를 제시하면 해당 교사에게 개선해야 할 부분에 대한 추가적인 통찰력을 제공할 수 있다.

Having data on educational quality does not automatically lead to enhancement of education quality (Richardson and Placier 2001; Hashweh 2003). Although grounding the design of your evaluation in theoretical principles will generate rich data that is theoretically grounded, context-specific and more actionable (Bowden and Marton 1999) research also demonstrates that the recipients of that data, may need help translating the data to activities that will enhance educational quality (Stalmeijer et al. 2010; Boerboom et al. 2015; van Lierop et al. 2018). There may be a long road between paper and action. Translating data to action may be stimulated in different ways. Action may be spurred by providing contrasting evaluation data.

  • For example, when reporting evaluation results of a course, one can consider to report relative evaluation data (e.g. comparison with other courses, with the course results of the previous year) next to the evaluation results of a course (see Box 4).
  • Similarly, but in the case of providing feedback to individual teachers, asking teachers to fill out a self-assessment and presenting these results next to actual student evaluations of the teacher in question could provide the teacher in question with added insights of areas to improve in.

 

임상교사들이 이러한 자기평가 효과에 대해 인터뷰를 한 결과, 특히 자기평가와 학생평가 사이에 부정적인 불일치가 변화에 대한 강력한 자극으로 경험된 것으로 나타났다. 그러나 같은 연구에서 임상 교사들은 피드백의 특정 측면을 행동으로 옮기는 데 도움이 필요하다고 지적했다. 예를 들어, 교수들은 [학생들이 학습 목표를 세우는 것을 돕는 것]에 어려움을 겪었고, 이에 대한 추가적인 코칭을 요청했습니다. 또한, 평가 데이터가 부정이나 방어 같은 감정적 반응을 일으킬 수 있다는 증거가 있어 데이터에 대한 논의가 필수적이다. 반 리에로프 외 연구진(2018)은 임상 교사들이 자기 평가와 학생 평가에 대해 논의하는 동료 그룹 성찰 회의를 도입하여 임상 교사들을 위한 코칭을 실험했다. 이 연구는 또래 집단 성찰 회의가 임상 교사들이 개선 계획을 수립하는 데 도움이 된다는 것을 발견했다.

Clinical teachers being interviewed about the effect of this self-assessment indicated that especially negative discrepancies between their self-assessment and the evaluations of students were experienced as a strong impetus for change (Stalmeijer et al. 2010). However, in the same study, clinical teachers indicated needing help to translate certain aspects of the feedback to action. For example, they had a hard time helping students to formulate learning goals and requested additional coaching. Furthermore, there is evidence that evaluation data may cause emotional reactions like denial or defensiveness (DeNisi and Kluger 2000; Sargeant et al. 2008; Overeem et al. 2009) making discussion of the data essential. van Lierop et al. (2018) experimented with coaching for clinical teachers by introducing peer group reflection meetings in which clinical teachers would discuss their self-assessments and student evaluations. The study found that the peer group reflection meetings assisted clinical teachers in formulating plans for improvement.

대화.
Dialogue

교육의 질을 지속적으로 향상시키려면, 수집 중인 데이터가 개선 이니셔티브에 inform하고, 교육 조직의 [모든 계층과 구조에 의해 논의되는 것]이 중요하다. 마찬가지로 [조직적 대화organizational dialogue]도 퀄리티 보증quality assurance으로서 조직 [프로세스 내에 구조적으로 포함되어야] 한다. 그렇지 않으면 평가 결과에 따라 적절한 조치를 취하지 않고, 정보의 정글이 될 위험이 있습니다. 그러기 위해서는 평가는 커리큘럼의 여러 수준(예: 과정, 사무직, 연도, 학사)의 의제에 대한 반복적인 주제가 되어야 한다. 평가 활동에 대한 [공개적 대화]는 교육 기관의 여러 수준에 대해 조정자가 수립한 실행 계획에 의해 inform되어야 한다. 이러한 실행 계획의 구현과 평가는 정기적으로 논의되어야 한다. 성과가 지속적으로 교육 개선에 효과적으로 활용될 수 있도록 공개적으로 논의되어야 한다. 즉, judgemental하지 않으면서, 결과와 성과를 논하는 방법을 평가하고, 개선을 지원하는 건설적인 언어에 초점을 맞춘다. 이러한 방식으로 대화는 개선 목적을 위한 평가 데이터의 사용을 향상시킬 것이다(Kleijnen et al. 2014). 이 대화의 기회를 창출하는 것은 [구조적 특성structural character]을 띠어야 하는데, 이는 이러한 논의가 [정해진 빈도]로 조직되고, [모든 관련 이해 관계자가 참여]한다는 것을 의미한다. 예를 들어, 코스 코디네이터는 반성 세션 동안 교사 및 학생 대표와 평가 보고서를 논의하고, 구체적인 실행 계획을 수립하고, 구조적으로 이러한 계획의 이행 및 평가에 타임라인을 첨부할 수 있습니다. 더 큰 규모로 (Griffin 및 Cook 2009) 강의에서 평가 결과와 개선 계획을 제시함으로써 학생들을 교육 품질의 적극적인 소유자로 만들 수 있습니다. 학생을 토론의 일부로 만드는 것은, 학생들이 그들의 [참여 결과를 보고, 교수진의 의견을 듣고, 의견을 교환할 수 있는 기회]만 주어진다면, 평가 절차에 참여할 수 있는 추가적인 인센티브를 제공할 것이다.

To ensure continuous enhancement of educational quality, it is important that the data which is being collected informs improvement initiatives and is discussed by all layers and structures of the educational organisation. The organisational dialogue should similarly be structurally embedded within the organisational process as quality assurance. Otherwise it may run the risk of becoming a jungle of information without appropriate steps being taken to act on the evaluation results. To do so, evaluation should be a recurring topic on the agenda of different levels in the curriculum (e.g. course, clerkship, year, bachelor). This open dialogue about the evaluation activities should be informed by action plans formulated by coordinators on the different levels of the educational organisation. Implementation and evaluation of these action plans should be discussed regularly. Results must be discussed openly so that they can be used effectively to improve education continuously (Dolmans et al. 2011; Bendermacher et al. 2020). That is, avoiding judgemental, assessing way of discussing results and performances, instead focus on constructive language supporting improvement. In this way, dialogue will enhance the use of evaluative data for improvement purposes (Kleijnen et al. 2014). Creating opportunities for this dialogue should take on a structural character, meaning that these discussions are organised with a set frequency and involving all relevant stakeholders. For example, course coordinators can discuss evaluation reports with teachers and student representatives during reflection sessions (van der Leeuw et al. 2013), formulate specific plans for action and attach a timeline to implementation and evaluation of these plans on a structural basis. On a larger scale, students can be made active owners of educational quality by presenting evaluation results and plans for improvement during (online) lectures (Griffin and Cook 2009). Making them a part of the discussion will provide students with an extra incentive to participate in evaluation procedures if they see the results of their participation and are afforded the opportunity to be heard by faculty and exchange views (Griffin and Cook 2009; Healey et al. 2015).

 

교수진 개발 및 실무 커뮤니티를 통한 이해관계자 지원
Supporting stakeholders through faculty development and communities of practice

품질 보증에 관한 교수 개발
Faculty development on quality assurance

QA 과정에서 적극적으로 참여하는 이해관계자에게 [교수 개발]을 제공하는 것은 교육의 질에 관한 데이터가 효과적으로 교육의 질 향상에 번역될 수 있도록 하기 위해 사용될 수 있는 또 다른 전략이다. 품질 보증 프로세스 내에서 특정(그룹) 이해관계자가 갖는 역할에 따라 교수진 개발 워크숍에서 다양한 측면을 다룰 수 있다. 예를 들어, FHML에서는 학생 평가 위원회(SEC)교육 프로그램 위원회(EPC)의 구성원을 위한 연간 워크숍을 제공한다. SEC는 보통 10-12명의 학생들로 구성되어 있으며, 그들의 목표는 교육 활동에 대한 질적 데이터를 생성하고 교수 팀과 결과에 대해 논의하는 것이다. 연례 워크숍에서 SEC 회원들은 자신의 역할을 효과적으로 수행하는 방법에 대한 지침을 받는다(박스 5).

Providing faculty development for stakeholders actively involved within the process of quality assurance, is another strategy that may be employed to ensure that data on educational quality can be effectively translated to enhancement of educational quality. Depending on the role that a certain (group of) stakeholder(s) has within the process of quality assurance, different aspects can be addressed during faculty development workshops. For example, at FHML we provide yearly workshops for members of the student evaluation committees (SEC) (Stalmeijer et al. 2016) and the educational programme committees (EPC). The SEC, usually comprise 10–12 students, and their goal is to generate qualitative data on educational activities and to discuss outcomes with teaching teams. In a yearly workshop, members of the SEC are provided with guidelines on how to effectively fulfil their role (Box 5).

EPC 회원들에게는 또 다른 연례 워크숍이 제공된다네덜란드에서는 각 대학 프로그램에 EPC가 의무화되어 있다. EPC는 직원 및 학생 대표가 섞여 있으며, 프로그램 수준에서 교육 품질을 전반적으로 모니터링하는 역할을 한다. EPC는 [시험 규정과 그 시행, 교육 예산, 교육 혁신, IQA 시스템 등과 같은] 교육 문제에 대해 요청하거나 자발적으로 조언을 제공할 수 있다. 연례 워크숍(상자 5 참조) 동안 EPC 구성원은 공동으로 교육을 받고 교육 품질 보증 과정에서 자신의 역할에 대한 활발한 토론에 참여한다.

Another yearly workshop is provided to members of the EPC. In the Netherlands, each university programme is mandated by law to have an EPC. An EPC consists of a mix of staff and student representatives and is tasked with overall monitoring of educational quality at the programme level. The EPC can give advice, either on request or on their own initiative, on education matters like examination regulation and its implementation, education budget, educational innovation, and the system of IQA. During the yearly workshop (see Box 5) EPC members are trained jointly and involved in an active discussion about their role in the process of educational quality assurance.

실천 공동체
Communities of practice

CoP(Community of Practice)는 '중첩된 지식 기반, 공통 관행 및 상호 기업mutual enterprise에 초점을 맞춘 [신념, 가치, 역사 및 경험의 집합]을 [공유하고 발전]시키는 [개인들의 지속적이고 지속적인 사회적 네트워크]'로 정의할 수 있다.

  • CoP(Community of Practice)의 설립은 [혁신을 위한 전문 지식과 아이디어의 교환]을 촉진하기 때문에 교육을 더욱 향상시킬 수 있습니다.
  • CoP는 [모범 사례를 공유]하는 등의 방법으로 직원이 [새로운 관점 및 개선 기회]를 얻는 데 도움이 됩니다.
  • CoP는 특히 [퀄리티 문화의 심리적 차원을 육성]하는 것과 관련이 있다. CoP는 교수와 학습의 가치, 일상적인 업무 경험과 과제에 대한 성찰, 교사 정체성 구축이 중심이 되는 [환경을 형성]한다.
  • CoP의 [건설적인 동료 피드백 프로세스]와 [상호 전문직업적 및 사회적 지원 제공]은 주인의식을 개발하는 것과 교육 향상에 대한 책임감을 느끼는 사이의 관계를 균형 있게 유지하는 데 도움이 됩니다.
  • CoP의 [개방적이고 종단적인 특성]은 그들의 성공에 필수적이다. CoP는 단순히 이미 고도로 관련되고 교육에 헌신하는 사람들로 구성된 임시적 그룹을 만드는 것을 넘어서야 한다.

A Community of Practice (CoP) can be defined as a ‘persistent, sustaining, social network of individuals who share and develop an overlapping knowledge base, set of beliefs, values, history, and experiences focused on a common practice and/or mutual enterprise’ (Barab et al. 2002, p. 495).

  • The establishing of communities of practice (CoPs), can further educational enhancement as they foster an exchange of expertise and ideas for innovation (de Carvalho-Filho et al. 2020).
  • CoPs facilitate staff in gaining new perspectives and opportunities to improve, e.g. by means of sharing good practice.
  • CoPs are specifically relevant for the nurturing of the psychological dimension of a quality culture; they form an environment in which the valuing of teaching and learning, reflection on daily work experiences and challenges, and teacher identity building is central (Cantillon et al. 2016).
  • Constructive peer feedback processes in CoPs, and the offering of mutual professional and social support help to balance the relation between developing a sense of ownership and feeling accountable for educational enhancement (Bendermacher et al. 2020).
  • An open and longitudinal character of CoPs is essential to their success; they should go beyond the mere establishment of a temporal group of those already highly involved and committed to education.

FHML에서 우리는 저널 클럽, 교육 혁신이 제시되고 논의되는 월간 회의, 참가자들이 동료들과 경험을 공유하도록 명시적으로 초대되는 과정 조정자를 위한 종단 리더십 훈련과 같은 CoP를 자극하기 위한 몇 가지 활동을 조직한다. 우리는 교수 개발 목적으로 CoP를 구현하는 방법에 대한 영감을 얻기 위해 Carvalho-Filho와 동료들의 12가지 팁을 추천한다.
At FHML we organise several activities aimed at stimulating CoPs like journal clubs, monthly meetings in which educational innovations are presented and discussed, and a longitudinal leadership training for course coordinators in which participants are explicitly invited to share experiences with their colleagues. We recommend the twelve tips by Carvalho-Filho and colleagues (2020) for inspiration on how to implement a CoP for faculty development purposes.

퀄리티 문화를 육성하는 리더십
Leadership that fosters a quality culture

학생과 교직원의 목소리를 중시하기 위해, 교육 지도자들은 교육의 질에 대한 토론을 촉진하고, 또한 조직 내의 다른 사람들에게 귀를 기울이고 반응함으로써 차이를 만들 수 있습니다. Bland 등이 수행한 검토 결과, 성공적인 교육과정 개발을 위한 바람직한 [리더십 행동]은 [개방적인 커뮤니케이션 환경을 조성]하는 것 외에도, 적극적이고 참여적이며 문화적/가치에 영향을 미치는 행동과 관련이 있는 것으로 나타났다(Bland 등). 2000). 즉, 성공적인 리더는 협업을 촉진하고, 계획된 변화에 비추어 가치를 공유하며, 신뢰를 구축하고 참여를 촉진합니다.

To value the voice of students and staff members, educational leaders can make a difference by facilitating debate about the quality of education (Sursock 2011), but also by listening and being responsive to others within the organisation (Knight and Trowler 2000). A review conducted by Bland et al, indicated that, in addition to creating an open communication climate, favourable leadership behaviours for successful curriculum development concern assertive, participative and cultural/value-influencing behaviours (Bland et al. 2000). That is, successful leaders promote collaboration, share values in the light of the envisioned change, and build trust and facilitate involvement (Bland et al. 2000).

Bendermacher et al(2021)은 퀄리티 문화를 육성하기 위한 그들의 노력에서, 조직 내에서 다양한 수준에서 행동하는 리더들은 [다양한 도전에 직면한다]고 강조했습니다.

  • [상급 관리 수준]에서 리더는 일반적으로 퀄리티 문화가 뿌리내리는 데 필요한 규칙, 정책, 책임 및 책임과 관련된 '정치적', '전략적' 및 '구조적' 문제를 다룬다. 교육 리더십은 [현재의 구조와 시스템]과 [직원 가치] 사이의 균형을 잡는 것을 의미하며, [자원을 위한 연합 구축, 협상 및 중재]를 필요로 한다. 이를 위해 교육 리더들은 기관 내에서 [강력한 관계와 네트워크]를 구축하고 협력과 상호작용을 촉진하기 위해 노력해야 한다.
  • 조직적인 meso 또는 micro 수준에서 일하는 리더들은 [교육 내용의 직접적인 개선]에 더 많이 참여하고, [팀 학습을 촉진]하는 데 더 집중하는 것으로 보인다. 

Bendermacher et al. (2021) highlighted that in their efforts to nurture a quality culture, leaders acting at different levels within the organisation face various challenges.

  • On the higher management level, leaders typically deal with ‘political’, ‘strategic’ and ‘structural’ issues which concern rules, policies, responsibilities and accountability, needed for a quality culture to take root. Educational leadership entails a balancing of present structures and systems with staff values and requires coalition building, negotiation and mediating for resources (Bolman and Deal 2003). To this end, educational leaders should work to build strong relationships and networks within the institution and stimulate collaboration and interaction (O’Sullivan and Irby 2011).
  • Leaders working on the organisational meso, or micro level appear to be more engaged in the direct improvement of the educational content and focus more on facilitating team learning.

보건 전문직 교육에서 [복잡한 조직 구조와 학제간 협력]이라는 새로운 경향은 리더의 영향력이 점점 더 [간접적인 형태]로 행사되게 한다. 교육의 질 향상에 대한 리더의 영향은 점점 더 [공유되고 협력적이며 분산된 접근 방식]을 통해 나타나고 있다. 따라서, 리더는 '강인한' 리더에게 교육의 질적 향상에 대한 책임을 전가하는 대신 동기부여자, 멘토, 촉진자 역할을 할 것으로 기대되며, 보건직 교육의 리더십은 [개별 직원의 감독, 지도, 지원]을 넘어서, 보다 [광범위한 집단적인 것]으로 바뀌고 있다.

Complex organisational structures and emerging trends of interdisciplinary collaboration in health professions education, cause the influence of leaders to be exerted more and more in indirect ways (Meeuwissen et al. 2020; Bendermacher et al. 2021). The influence of leaders on educational quality enhancement is increasingly being manifested through shared, collaborative and distributed approaches (e.g. McKimm and Lieff 2013; Sundberg et al. 2017; Sandhu 2019). Hence, instead of attributing responsibility for educational quality enhancement to ‘strong’ leaders, leaders are expected to be motivators, mentors, and facilitators and leadership in health professions education is changing from individual staff supervision, guidance, and support to a focus on the broader collective.

보건 전문 교육 기관의 지식 집약적 환경에서 교육 지도자와 기타 교직원은 [조직 문제에 대한 의미와 해결책을 함께 구성]합니다. 보건직 교육에서의 리더십은 [다층적]이기 때문에, (의학) 학교 위계구조의 현실 안에서 [동시에 리더이자 팔로워]가 될 수 있다. 더욱이, 학계는 단순한 리더십 수혜자가 아니라 공동창조를 통해 다른 이들의 리더십을 주도하고 조직 발전에 영향을 미칠 수 있다.
In the knowledge-intensive setting of health professions education institutes, educational leaders and other teaching staff members co-construct meaning and solutions to organisational issues (Tourish 2019). As leadership in health professions education is multi-layered, within the reality of (medical) school hierarchies, one might be a leader and a follower at the same time (McKimm and O’Sullivan 2016). Moreover, instead of being mere leadership recipients, academics can steer the leadership of others and impact organisational developments through co-creation (Uhl-Bien et al. 2014).

교육 리더가 양질의 문화 발전과 IQA를 최대한 활용할 수 있도록 지원하는 개입으로는 리더를 양성하여 성찰, 전문성 및 지식 공유를 자극하고, 리더를 학습하여 교사 팀의 안전과 신뢰 관계를 배양하고, 리더의 상황 민감성을 강화하는 것이 포함된다. 보건 전문직 교육은 여러 스타일을 결합할 수 있고 다양한 이해 관계자의 목표와 야망을 통합할 수 있는 리더에게 가장 잘 제공됩니다.
Interventions that can aid educational leaders to make the most out of quality culture development and IQA include: training leaders to stimulate reflection, expertise, and knowledge sharing, learning leaders to foster safety and trust relations in teacher teams, and strengthen leader’s situational sensitivity (Hill and Stephens 2005; Edmondson et al. 2007; Nordquist and Grigsby 2011). In order to continuously enhance, health professions education is best served with leaders who are able to combine multiple styles and who are able to coalesce different stakeholder goals and ambitions (Lieff and Albert 2010).

결론
Conclusion

본 AMEE 가이드는 '품질 문화'의 개념을 사용하여 교육 기관이 IQA가 자주 제기하는 '체크박스' 연습에서 벗어나도록 도울 수 있는 다양한 관행에 대해 설명했습니다. 우리는 이것이 쉬운 작업이라고 주장하는 것이 아니다. 지속적인 교육의 질 향상은 많은 사람들의 기여를 필요로 하는 진정한 팀의 노력이다. 품질 문화의 체계적/관리적 측면과 문화적/심리적 측면을 창출하는 데 필요한 관행을 다루어(그림 1 참조) 본 AMEE 가이드가 교육 품질에 이해관계가 있는 모든 사람들에게 영감과 방향을 제공하기를 바랍니다.

Using the concept of ‘Quality Culture’ this AMEE Guide has described various practices that can aid educational organisations in moving beyond the ‘tick-box’ exercises that IQA practices often evoke. We are not claiming that this is an easy task. Continuous enhancement of educational quality is a veritable team effort requiring the contribution of many. By addressing practices needed to create the systematic/managerial and cultural/psychological aspects of a quality culture (see Figure 1), we hope this AMEE Guide provides inspiration and direction for all those with a stake in educational quality.

 


Med Teach. 2022 Apr 25;1-11. doi: 10.1080/0142159X.2022.2057285. Online ahead of print.

Continuous enhancement of educational quality - fostering a quality culture: AMEE Guide No. 147

Affiliations collapse

Affiliation

1School of Health Professions Education, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands.

PMID: 35469546

DOI: 10.1080/0142159X.2022.2057285

Abstract

Internal quality assurance (IQA) is one of the core support systems on which schools in the health professions rely to ensure the quality of their educational processes. Through IQA they demonstrate being in control of their educational quality to accrediting bodies and continuously improve and enhance their educational programmes. Although its need is acknowledged by all stakeholders, creating a system of quality assurance has often led to establishing a 'tick-box' exercise overly focusing on quality control while neglecting quality improvement and enhancement. This AMEE Guide uses the concept of quality culture to describe the various dimensions that need to be addressed to move beyond the tick-box exercise. Quality culture can be defined as an organisational culture which consists of a structural/managerial aspect and a cultural/psychological aspect. As such this AMEE Guide addresses tools and processes to further an educational quality culture while also addressing ways in which individual and collective awareness of and commitment to educational quality can be fostered. By using cases within health professions education of both formal and informal learning settings, examples will be provided of how the diverse dimensions of a quality culture can be addressed in practice.

Keywords: Internal quality assurance; programme evaluation; quality culture.

 

질적연구에서 성찰성(reflexivity)의 실용적 가이드: AMEE Guide No. 149 (Med Teach, 2022)
A practical guide to reflexivity in qualitative research: AMEE Guide No. 149
Francisco M. Olmos-Vegaa , Renee E. Stalmeijerb , Lara Varpioc and Renate Kahlked

 

 

서론
Introduction

질적 연구가 보건전문교육(HPE) 장학금(Varpio and Meyer 2017)에서 신뢰를 얻으면서 엄격한 연구 과정에 대한 현장의 이해가 다듬어졌다. 이러한 방향에서, [연구 엄격성]에 대한 마커는 정량적 연구에서 일반적으로 사용되는 마커와는 근본적으로 다르다. 많은 [정량적 연구]는 연구자 "편견"으로부터 가능한 한 자유로운 근본적인 진실을 밝히기 위해 노력하는 반면, [정성적 연구]는 주관성에 의존한다(Rees et al. 2020). 질적 연구자들은 [주관성]이 그들의 연구를 어떻게 형성shapes하는지 설명하기 위해 [반사성]에 관여한다. 반사성은 [참여자의 경험과 사회적 관행의 지저분한 부분]을 반영하는 [실세계 데이터를 생성하는 복잡한 작업] 속에서, [미묘한 윤리적 결정을 내리고 소통]하는 연구자의 능력과 관련이 있다. 

As qualitative research has gained credibility in health professions education (HPE) scholarship (Varpio and Meyer 2017), the field’s understanding of rigorous research processes has been refined. In this orientation, markers for research rigor are fundamentally different from those commonly used in quantitative research (Tracy 2010; Varpio et al. 2017). Whereas much of quantitative research strives to reveal (or at least approximate) fundamental truths that are as free as possible from researcher “bias” (Young and Ryan 2020), qualitative research depends on subjectivity (Rees et al. 2020). Qualitative researchers engage in reflexivity to account for how subjectivity shapes their inquiry. Reflexivity is tied to the researcher’s ability to make and communicate nuanced and ethical decisions amid the complex work of generating real-world data that reflect the messiness of participants’ experiences and social practices (Finlay 2002a).

즉, 연구자의 주관적 관점(또는 "편견")은 질적 연구 과정과 근본적으로 얽혀 있다. 그리고 연구자의 관점은 많은 긍정적인 영향을 미치지만, 반사성에 주의를 기울이지 않는 것은 질적 연구를 통해 구축된 지식과 그것과 관련된 지식에 부정적인 영향을 미칠 수 있다. 예를 들어, 참가자와 면접관 사이의 [예상치 못한 권력 역학]을 설명하지 못하면, 일부 참가자가 말하기 불편하게 느끼는 [개인적인 세부 사항을 공개해야 한다는 부담]을 느끼거나, [침묵해야한다고 느끼]면서, 경험의 온전함을 공유하지 못하게 되는 상황이 발생할 수 있다. 이러한 경우 참여자가 피해를 입고 데이터 품질이 저하될 수 있습니다. 반사성에 참여하는 것은 연구자들이 그러한 함정을 피하는 데 도움이 될 수 있다.

In other words, their subjective perspective (or “bias”) is fundamentally intertwined with qualitative research processes. And while the researcher’s perspective has many positive impacts, failure to attend to reflexivity can negatively impact the knowledge built via qualitative research and those connected to it. For example, failing to account for unexpected power dynamics between participant and interviewer can lead to situations where some participants feel pressured to disclose personal details that they are not comfortable talking about, or feel silenced, preventing them from sharing the fullness of their experience. In such cases, participants can be harmed and data quality suffers. Engaging in reflexivity can help researchers avoid such pitfalls (Finlay 2002a).

불행하게도 반사성은 종종 많은 사람들에 의해 모호하게만 이해되고, 결과적으로 대부분의 질적 출판물에서 제대로 다루어지지 않는다. 이 모호성은 몇 가지 문제에 매핑될 수 있다. 예를 들어, 반사성에 대한 [많은 정의]가 있으며, 각각의 정의는 서로 다른 핵심 이슈를 뒷받침한다. 결과적으로 반사성 문헌과 이를 적용하기 위한 [무수한 방법]을 탐색하는 것은 많은 연구자들에게 어려운 과제이다. 또한 반사성은 주관성을 중시하는 방향으로 고정되어 있으며, 그 의미가 연구과정을 통해 능동적으로 구성되기 때문에, 연구자가 연구에 미치는 영향을 탐구할 필요가 있다(Varpio et al. 2021). 이러한 방향은 역사적으로 HPE에서 영향력을 행사해 온 [양적 연구와 관련된 후기실증주의적 가정]과 배치된다. 이러한 문제를 고려할 때, 반사성이 무엇이고 그것을 어떻게 사용하는지를 이해하는 데 있어서 HPE 학자들은 종종 불확실성의 안개 속에서 길을 잃는 것은 놀라운 일이 아니다. 그럼에도 불구하고, 이러한 불확실성에도 불구하고, 반사성이 질적 연구의 필수적인 측면이라는 인식이 증가하고 있어(Barrett et al. 2020), 많은 연구자들이 주저하며 반사성 물 속으로 들어간다. 우리는 반사성에 대한 미묘한 정의를 설명하고 이용 가능한 구체적인 반사 관행의 예를 제공하는 것이 HPE 학자들이 엄격한 질적 연구를 개발하고 소통하는 데 도움이 될 수 있다고 믿는다.
Unfortunately, reflexivity is often only vaguely understood by many and, as a result, is poorly addressed in most qualitative publications. This ambiguity can be mapped to several issues. For instance, there are many definitions of reflexivity, each foregrounding different key issues (Schwandt 2014). As a result, navigating the reflexivity literature and the myriad of methods for applying it is a difficult task for many researchers (D’Cruz et al. 2005; Finlay and Gough 2008). Furthermore, reflexivity is anchored in an orientation that values subjectivity and requires researchers to explore their influence on research, as its meaning is actively constructed through the research process (Varpio et al. 2021). This orientation runs counter to the post-positivist assumptions, tied to quantitative research, that have historically held sway in HPE (Varpio et al. 2017). Given such issues, it is not surprising that HPE scholars are often lost in a fog of uncertainty when it comes to understanding what reflexivity is and how to use it. And yet, despite this uncertainty, there is increasing recognition that reflexivity is an essential aspect of qualitative studies (Barrett et al. 2020), so many researchers hesitantly wade into the reflexivity waters. We believe that delineating a nuanced definition of reflexivity and offering examples of the concrete reflexive practices available can help HPE scholars to develop and communicate rigorous qualitative research.

이 AMEE 가이드에서 우리는 그 목표를 달성하기를 희망한다. 이를 위해 반사성이 무엇을 의미하고 수반하는지 명확히 하고, 연구를 수행하고 전파하는 동안 반사성에 관여하는 구체적인 방법을 제시한다. 우리는 HPE 연구원들이 반사성에 대해 직면하는 가장 일반적인 몇 가지 문제에 답한다. 

  • 반사성이란 무엇인가? 
  • 그것의 목적은 무엇입니까? 
  • 어떤 유형의 반사성이 HPE 연구에서 중요합니까? 
  • 내 HPE 연구에서 반사성을 연습하기 위해 어떤 전략을 사용할 수 있을까? 
  • 원고에서 반사성을 어떻게 전달합니까? 
  • 반사성에 대한 가장 흔한 비판은 무엇인가?

In this AMEE Guide, we hope to achieve that goal. To that end, we clarify what reflexivity means and entails, and we offer specific methods of engaging in reflexivity while conducting and disseminating research. We answer some of the most common challenges HPE researchers face vis-a-vis reflexivity:

  • What is reflexivity?
  • What are its purposes?
  • What types of reflexivity are important in HPE research?
  • What strategies can I use to practice reflexivity in my HPE research?
  • How do I communicate reflexivity in my manuscript?
  • What are the most common critiques of reflexivity?

반사성이란 무엇인가?
What is reflexivity?

반사성에 대한 많은 다른 정의가 존재하며, 그 결과 연구원들은 반사성이 무엇인지, 어떻게 하는지는 말할 것도 없고, 종종 확신하지 못하게 된다. 사용 가능한 다양한 정의를 존중하고 그 사이의 차이를 인식하는 반사성에 대한 포괄적인 정의를 구성하기 위해 반사성에 명시적으로 초점을 맞춘 출판물에 대한 정성적 방법론 문헌을 검색했다. 그런 다음 일치성을 식별하기 위해 귀납적으로 분석했습니다. 표 1은 아래에 제공된 정의에 통합된 일부 설명의 예를 보여 줍니다. 그런 다음 이러한 결과를 종합하여 다음과 같은 포괄적인 정의를 개발했습니다.

Many different definitions of reflexivity exist, and, as a result, researchers are often left unsure of what reflexivity is, let alone how to do it. To construct a comprehensive definition of reflexivity that both respected the variety of definitions available and appreciated the differences between them, we searched the qualitative methodological literature for publications focused explicitly on reflexivity. We then inductively analyzed them to identify congruences. Table 1 provides examples of some of the descriptions we encountered, which are incorporated in the definition provided below. We then synthesized these findings to develop the following comprehensive definition:

반사율(Reflexivity)은 연구자들이 [자신의 주관성과 맥락]이 [연구 과정]에 어떤 영향을 미치는지 [스스로 의식적]으로 [비판하고, 감정하고, 평가]하는 [지속적이고 협력적이며 다면적]인 실천의 집합이다.
Reflexivity is a set of continuous, collaborative, and multifaceted practices through which researchers self-consciously critique, appraise, and evaluate how their subjectivity and context influence the research processes.

우리의 정의는 반사성이 [연구 노력의 전체 기간]에 걸쳐 확장되는 [지속적인 과정]이라는 것을 강조한다.

  • 우리는 반사성의 [공유적이고, 협력적인 성격]을 강조한다. 반사성이 가장 효과적이려면 [연구팀 역학에 통합]되어야 한다.
  • 우리는 또한 반사성의 [다면적인 본성]을 강조한다; 그것은 수행 중인 연구에 영향을 미치는 [개인적, 대인적, 방법론적 및 맥락적 요인]에 대한 비판적인 관심을 포함한다.

우리는 이러한 반사성의 복합 프레임이 HPE의 정성적 연구에 종종 존재하지 않는다는 것을 인식한다. 우리 분야에서는 각 협력자의 주관성을 설명하면서, [개인적인 측면]을 강조하는 경향이 있다. 우리는 반사성이 더 넓고 미묘하기 때문에 우리의 정의와 적용은 그 이질성과 복잡성을 반영하도록 수정되어야 한다고 주장한다.

Our definition highlights that reflexivity is an ongoing process that extends across the entire duration of a research endeavor.

  • We emphasize its shared and cooperative nature; reflexivity must be integrated into the research team dynamic to be most effective.
  • We also stress the multifaceted nature of reflexivity; it involves critical attention to personal, interpersonal, methodological, and contextual factors that influence the study being conducted.

We recognize that this composite framing of reflexivity is not often present in HPE’s qualitative research. In our field, we have tended to highlight the personal aspect, describing each collaborator’s subjectivity. We contend that reflexivity is broader and more nuanced, so our definition and application must be revised to reflect that heterogeneity and complexity.

우리가 제안하는 반사성 정의는 연구자 주관성(예: 주관주의, 사회구성주의)을 수용하는 연구 방향에 고정되어 있다. 우리는 반사성이 연구 프로젝트에서 [객관성이 결여된 것에 대한 사과]라고 생각하지 않는다. 구성주의의 관점에서, 목표는 정확하거나 공정한 표현을 달성하는 것이 아니다. 이는 불가능하며, 바람직하지도 않다(리스 외 2020). 대신, 우리는 반사성을 [주관성을 존중하고 가치있게 여기는 것]에 뿌리를 두고 있다고 생각한다. 그것은 연구를 존재하게 하는 서로 얽힌 개인적, 대인관계적, 방법론적, 맥락적 요소들의 중요성을 질적 연구자들이 어떻게 설명하느냐의 일부이다.

The reflexivity definition we propose is anchored in orientations to research that embrace researcher subjectivity (e.g. subjectivism, social constructionism). We do not conceive reflexivity as an apology for the lack of objectivity in a research project. From a constructionism perspective, the goal is not to achieve an accurate or impartial representation; this is neither possible nor desirable (Rees et al. 2020). Instead, we conceive of reflexivity as rooted in a respect for and a valuing of subjectivity. It is part of how qualitative researchers account for the significance of the intertwined personal, interpersonal, methodological, and contextual factors that bring research into being.

반사성의 목적은 무엇인가?
What are the purposes of reflexivity?

연구자들이 반사성에 관여할 때 가지고 있는 여러 가지 다른 목표들이 있는데, 여기에는 주관성의 영향을 중화시키고, 이를 인정하며, 설명하거나, 또는 이를 활용하는 것이 포함된다(Gentles et al. 2014). 이러한 목적은 연구자들이 그들의 [정체성, 맥락, 연구 사이의 관계]에 대해 생각할 수 있는 다른 방법을 가리킨다.
There are several different goals held by researchers when they engage in reflexivity, including neutralizing the influence of their subjectivity, acknowledging it, explaining it, or capitalizing on it (Gentles et al. 2014). These purposes point to different ways researchers might think about the relationships between their identity, context, and research.

연구자 주관성의 영향을 [중화]시키는 위치에 있을 때, 반사성은 빈 서판tabula rasa으로 접근하려는 연구자의 시도를 의미한다. 즉, 새로운 현상을 연구하기 위한 [객관적 거리]의 관점인 빈 슬레이트를 채택한다. 예를 들어, 이 중화 작업은 초월 현상학에서 "브라케팅"을 통해 접근된다. [괄호치기]는 연구자들이 자신의 연구에 영향을 미칠 수 있는 자신의 모든 측면(예: 기존 이론, 개인적 견해 등에 대한 지식)을 제쳐두려고 시도하는 과정이다. 이러한 중화 노력은 질적 연구의 일부 분야에 여전히 존재한다. 예를 들어,

  • 근거이론은 원래 후기 실증주의에 기반을 두고 있었고, 연구자들은 관점이나 사전 지식이 전혀 없는 '빈 서판'으로서 연구에 참여하도록 장려되었다(Glaser와 Strauss 2017).
  • 초월 현상학은 연구자의 관점을 '브래킷'하고 연구 과정에 미치는 영향을 제거하고자 했다. 

When it is positioned to neutralize the impact of researcher subjectivity, reflexivity refers to the researchers’ attempts to take a tabula rasa approach—i.e. to adopt a blank slate, a perspective of objective distance from which to study a phenomenon afresh. This neutralizing work is, for example, approached in transcendental phenomenology via “bracketing” (Gearing 2004; Neubauer et al. 2019). Bracketing is a process through which researchers attempt to set aside any aspects of themselves (e.g. knowledge of pre-existing theories, personal views, etc.) that might influence their study (Neubauer et al. 2019). This neutralizing effort is still present in some branches of qualitative research. For example,

  • grounded theory was originally grounded in post-positivism, and researchers were encouraged to come to their research as a ‘blank slate’ with no perspective or prior knowledge whatsoever (Glaser and Strauss 2017).
  • Transcendental phenomenology sought to ‘bracket’ the researcher’s perspective and eliminate (as far as possible) its influence on the research process (Neubauer et al. 2019).

그러나 이러한 관점은 [연구자의 영향력을 완전히 무력화하려는 목표]는 [문제적이고 심지어 불가능하다]고 보는 현대 질적 연구자들의 선호에서 크게 벗어났다. 예를 들어, 인류학자들은 신선하고 무관심한 눈으로 문화를 볼 수 있는 외부 연구자로 자신들을 설정하려고 시도한 적이 있다(Paradis and Sutkin 2017). 그러나 현대 인류학자들은 이러한 [무력화 시도]가 연구자를 연구 집단과 동떨어진, [연구참여자보다 위에 서 있는 중립적인 관찰자]로 배치함으로써, 연구자와 참여자 사이의 [위계 구조를 활성화]시켰다는 것을 인정한다. 따라서 이러한 발전과 다른 정성적 방법론에 걸친 발전에 따라 반사성의 [중화적 목적]은 남겨두고 떠날 것이다.

However, this perspective has largely fallen out of favor with modern qualitative researchers who see the goal of utterly neutralizing researcher influence as problematic and even impossible (Levasseur 2003; Pillow 2003). To illustrate, anthropologists once attempted to frame themselves as outsider-researchers who could see a culture with fresh, indifferent eyes (Paradis and Sutkin 2017). However, modern anthropologists now acknowledge that these neutralizing attempts galvanized a hierarchy between researcher and participant by positioning researchers as neutral observers who stood apart from and above the studied population, and comprehended truths inaccessible to their participant-subjects (Pillow 2003; Marcus 2011; Holmes 2020). Thus, in line with these developments and those across other qualitative methodologies, we leave behind the neutralizing purpose of reflexivity.

중화시키는 것을 넘어서면서, 반사성의 주된 역할은 [주관성을 인정하는 것]으로도 간주되어 왔다. 이러한 목적을 염두에 두고 반사성은 [연구자의 주관성이 연구 노력의 각 단계에 영향을 미쳤음을 분명히 하는 것]으로 생각된다(Russell과 Kelly 2002). 그러나 단순히 이러한 영향을 인정하는 것만으로는 데이터, 참가자, 상황 또는 연구자에 대한 영향을 설명할 수 없습니다. 따라서, 우리는 반사성의 목적을 [오로지 연구자의 영향력을 인정하는 것]으로 설정하는 것은 그것의 약한 개념화라고 주장한다.
Moving beyond neutralizing, the primary role of reflexivity has also been seen as acknowledging subjectivity. With this end in mind, reflexivity is conceived of as making explicit that researcher subjectivity has influenced each step of the research endeavor (Russell and Kelly 2002). However, simply acknowledging this influence does nothing to elucidate the effect of that influence on the data, participants, context, or researcher. Therefore, we contend that framing the purpose of reflexivity solely as acknowledging researcher influence is a weak conceptualization of it.

일부 학자들은 반사성의 목적이 연구자가 조사에 미치는 [영향을 설명하는 것]이라고 주장한다. 이 방향에서는, 그들의 [연구에 대한 그들의 영향력을 깊이 생각하고 설명하는 것]이 연구자들이 연구 finding에서 다음의 두 가지를 향상할 수 있게 한다.

  • 확인 가능성(다른 연구자가 결과를 확인할 수 있는 정도) 및 
  • 전송 가능성(결과를 다른 설정에 적용할 수 있는 정도)

그러나 반사성의 목적이 단순히 연구자의 영향력을 설명하는 데 그칠 때, 우리는 [주관성의 잠재적 가치를 제한할 위험]이 있으며, 종종 ["편견"의 렌즈를 통해 그들의 주관성을 고백하는, 사과하는 입장]에 빠지게 된다. 따라서 반사성을 설명하는 접근법explaining reflexivity은 질적 연구의 목표를 훼손하는 '내 탓이로소이다mea culpa' 선언로 전락할 수 있다.
Some scholars, attempting to extend beyond acknowledgement, have proposed that reflexivity’s purpose is to explain the researcher’s impact on the investigation. In this orientation, thinking through and explaining their influence on their research enables researchers to enhance the

  • confirmability (the degree to which the results could be confirmed by other researchers) and
  • transferability (the degree to which the results can be applied to other settings) of the findings (Koch and Harrington 1998; Malterud 2001).

However, when reflexivity’s purpose stops at simply explaining researchers’ influence, we risk limiting the potential value of subjectivity, often falling into an apologetic stance, confessing their subjectivities through the lens of “bias.” Thus, the approach to explaining reflexivity can devolve into mea culpa statements that undermine the goals of qualitative research (Lingard 2015).

마지막으로, 많은 현대의 질적 연구자들은 [주관성을 활용하고 데이터 생성의 필수적인 부분으로 간주]하기 위해 노력한다. 이 연구원들은 연구 과정에서 [주관성이 지워질 수 없다]고 가정할 뿐만 아니라, 그러한 노력이 연구에 해롭다고 믿는다. 이러한 관점에서 볼 때 [연구자의 영향력]은 [무력화]되거나, 단순히 [인정]되거나 [설명]될 수 있는 것이 아니다. 반대로 주관성은 모든 인간 상호작용의 생산적인 결과이므로, [데이터와 결과를 적극적으로 공동 구성하는 자산]이 될 수 있다(Finlay 2002a; Koopman et al. 2020). 이러한 방향에서 반사성은 [연구자의 지식과 정체성을 활용하는 수단]이다. 
Finally, many contemporary qualitative researchers strive to capitalize on their subjectivity and consider it an integral part of data generation (Finlay 2002b; Charmaz 2014; Koopman et al. 2020). These researchers not only assume that subjectivity cannot be erased from the research process, they believe that such efforts are detrimental to the research. From this perspective, a researcher’s influence is not something to be neutralized, merely acknowledged, or explained away. On the contrary, since subjectivity is a productive result of all human interaction, it can be an asset to actively co-construct data and results (Finlay 2002a; Koopman et al. 2020). In this orientation, reflexivity is a means of capitalizing on the researcher's knowledge and identities.

질적 연구에서 반사성의 중심적 역할을 추진한 두 가지 요인은 [연구의 사회적, 정치적 함의를 고려한 프로젝트의 확산]과 [참여적 방법론]의 부상이었다. 질적 연구의 참여적 접근법에는 [연구 참여자를 공동 연구자로 참여]시키는 데 공통점을 차지하는 다양한 방법론이 포함된다. 참여형 연구에서 [연구자와 참여자 모두 반사적인 존재]로 확인된다. 여기에는 프로젝트 라이프사이클 전체에 걸쳐 [연구자와의 반사적 대화에 참여자가 참여하는 것]이 포함되며, 이는 연구자가 데이터에 대한 해석에 맞서고 수정하며 연마하도록 한다(Smith 1994). [연구자와 참여자 주관성]을 활용한다는 아이디어는 이후 참여적 연구 방법을 넘어 확장되었으며, 우리는 모든 질적 방법론에서 반사성을 향상시킬 수 있다고 주장한다.

Two factors that propelled the central role of reflexivity in qualitative research were the proliferation of projects that considered research's social and political implications and the rise of participatory methodologies (England 1994; Kuehner et al. 2016; Koopman et al. 2020). Participatory approaches in qualitative research include a range of methodologies that occupy common ground in enlisting participants as co-researchers (Finlay 2002b). In participatory research, both the researcher and the participants are identified as reflexive beings (Bergold and Thomas 2012). This includes involving participants in a reflexive dialogue with the researchers and among themselves throughout the lifecycle of the project, which pushes the researcher into confronting, modifying and honing their interpretations of the data (Smith 1994). The idea of capitalizing on researcher and participant subjectivities has since expanded beyond participatory research methods and, we argue, can enhance reflexivity in any qualitative methodology.

연구자들이 반사성에 참여하기 위해 사용할 수 있는 오리엔테이션은 무엇인가?
What Orientations can researchers use to engage in reflexivity?

이러한 다른 반사성 목적을 염두에 두고, 우리는 이제 연구원들이 이용할 수 있는 반사성의 유형을 구별할 수 있다. 질적 방법론자들은 다양한 반사율 유형을 제안했지만, HPE 내 또는 그 이상에서는 어느 것도 두드러지지 않았다. 이 AME 가이드에서는 월시(2003)의 접근법이 연구 프로젝트의 수명과 관련된 광범위하고 포괄적인 반사 관행 유형을 구성하기 때문에 제시한다. 우리는 각 반사율이 연구자의 목표에 따라 다른 형태를 취할 수 있기 때문에 각 반사율에 대한 설명을 위에서 설명한 목적과 통합한다. 
With these different reflexivity purposes in mind, we can now differentiate between the types of reflexivity available to researchers. Qualitative methodologists have proposed various reflexivity typologies (Finlay 2002a; Walsh 2003; D’Cruz et al. 2005), though none have gained prominence within HPE or beyond. In this AMEE Guide, we present Walsh’s (2003) approach since it constitutes a broad and comprehensive typology of reflexive practices relevant throughout the life of a research project. We integrate our description of each type of reflexivity with the purposes described above because each reflexivity can take a different shape depending on the researcher’s goals.

월시와 같은 유형론은 반사성에 대한 더 넓은 이해에 다음으로서 포함되어야 한다.

  • 추상적 개념(위에서 제공한 정의와 목적 참조)으로서,
  • 연구 프로젝트 및 원고의 한 부분(다음 섹션의 적용 원리 참조)으로서,

월시에 따르면, 반사 과정에는 4개의 겹치고 상호작용하는 차원이 있다: 개인적, 대인관계적, 방법론적, 맥락적. 이러한 과정을 가능한 한 유형적이고 쉽게 적용할 수 있도록 하기 위해, 우리는 우리의 연구 중 하나를 사용하여 각 유형의 반사성이 연구 프로젝트에서 어떻게 나타날 수 있는지와 연구자들이 각각에 대해 어떤 질문을 할 수 있는지 보여줄 것이다. 우리는 이 연구를 Box 1에 요약한 다음 Walsh의 각 치수를 설명한 후 반사성이 어떻게 적용될 수 있는지 설명한다.

Typologies such as Walsh’s need to be embedded within a broader understanding of reflexivity,

  • as an abstract concept (see definition and purposes provided above) and
  • as a part of a research project and manuscript (see application principles in the sections to follow).

According to Walsh, there are four overlapping and interacting dimensions of reflexive processes: personal, interpersonal, methodological and contextual. To make these processes as tangible and easily applicable as possible, we will use one of our studies (Olmos-Vega et al. 2018) to demonstrate how each type of reflexivity might manifest in a research project and what questions researchers might ask themselves concerning each. We summarize this study in Box 1 and then illustrate how reflexivity can be applied after describing each of Walsh's dimensions.

개인적 반사성
Personal reflexivity

개인 반사성(Box 2)은 연구자가 [상황, 참가자 및 데이터]에 대한 [기대, 가정, (의식적 및 무의식적) 반응]을 [성찰]하고 [명확히] 할 것]을 요구한다. 연구자의 참여는 연구과정의 중요한 측면으로서 분석되고 해석되어야 한다. 개인 반사성에 참여하는 것은 각 조사자의 [배경과 훈련]을 공개하는 것 이상의 것이어야 한다. 연구자의 [이전 경험과 동기]가 프로젝트 전반에 걸쳐 내린 [결정에 어떤 영향을 미칠 수 있는지]에 대한 설명을 포함해야 한다(Finlay 2002b), 그러한 영향이 긍정적이든 부정적이든 또는 둘 다에 대한 설명을 포함해야 한다. 개인적 반사성은 조사 기간 동안 지속적으로 발생해야 하며 프로젝트의 모든 측면(즉, 프로젝트의 개념부터 연구 결과까지)과 상호 연관되어야 한다
Personal reflexivity (Box 2) requires researchers to reflect on and clarify their expectations, assumptions, and conscious and unconscious reactions to contexts, participants, and data (Walsh 2003; Dowling 2006; Gentles et al. 2014). The researcher’s participation is a significant aspect of the research process that should be analyzed and interpreted. Engaging in personal reflexivity should go beyond disclosing each investigator’s background and training; it should include descriptions of how the researcher’s prior experiences and motivations might influence the decisions made throughout the project (Finlay 2002b), whether that influence is positive, negative, or neither. Personal reflexivity ought to occur continuously across the duration of the investigation and should be interwoven with all aspects of the project—i.e. from the project’s conception to research outputs.

또한, 개인적 반사성은 [연구가 연구원들에게 미치는 영향]을 다루어야 한다. 개인적 반사 운동에 참여하는 것은 강력한 학습 경험이 될 수 있다; 그것은 연구자의 관행을 재구성하고 다른 종류의 변화를 촉진할 수 있다. 그러나 잠재적으로 부정적인 영향을 고려하는 것도 필수적이다. 예를 들어, 참가자들과 상실과 슬픔에 대해 토론하는 것은 그러한 경험을 공유하는 연구자들에게 강렬한 감정을 촉발할 수 있다(Rowling 1999).
Additionally, personal reflexivity should address the impact of the research on the researchers (Mauthner and Doucet 2003; Finefter-Rosenbluh 2017). Engaging in a personal reflexive exercise can be a powerful learning experience (Mann et al. 2009); it can reshape a researcher’s practices and catalyze other kinds of change (Finlay 2002a; Koopman et al. 2020). However, it is also essential to consider potentially negative impacts; for example, discussing loss and grief with participants may trigger intense emotions for researchers who share those experiences (Rowling 1999).

 

대인 반사성
Interpersonal reflexivity


대인적 반사성(Box 3)은 [연구과정을 둘러싼 [관계]가 [맥락, 관련자 및 결과]에 어떤 영향을 미치는지] 나타낸다(Walsh 2003). 이들 중 가장 중요한 것은 [연구자와 참가자 사이의 관계]일 것이다. 대인 반사성에 대한 사려 깊은 접근은

  • [참가자의 고유한 지식과 관점]을 [인식recognize]하고, [감사appreciate]하며,
  • (이 지식과 관점이) 연구 과정에 미치는 영향에 [주의를 기울이는attending to] 것을 포함한다. —예: 질문을 해석하는 방법. 

반대로, [참가자들에 의해 공유된 정보와 통찰력]은 [연구자들의 결정과 결과]에 직접적인 영향을 미칠 것이다. 그러나 이러한 인식과 감상은 [중립적인 공간]에서 비롯된 것이 아니다. 대인 반사성은 반드시 작동 중인 [권력 역학]에 대한 분석을 포함해야 한다(Finlay 2002a). 이러한 역학관계는 결코 보편적이거나 고정된 것은 아니지만, 연구자들은 종종 참여자와의 관계 속에서 권력 위치를 차지한다.

  • 참여자의 관점의 [해석자]로서,
  • "타당한" 정보로 간주되는 것의 [결정권자]로서,
  • 널리 인정받는 [자격의 보유자]로서 

Interpersonal reflexivity (Box 3) refers to how the relationships surrounding the research process influence the context, people involved, and results (Walsh 2003). Likely the most significant of these are the relationships between researchers and participants. A thoughtful approach to interpersonal reflexivity involves

  • recognizing and appreciating participants' unique knowledge and perspectives and
  • attending to their impacts on the research process—e.g. how they interpret our questions.

Conversely, the information and insights shared by participants will directly influence researchers’ decisions and results. However, this recognition and appreciation do not stem from a neutral space; interpersonal reflexivity must include an analysis of the power dynamics at play (Finlay 2002a). Though these dynamics are by no means universal or fixed, researchers often occupy power positions relative to participants, as the

  • interpreters of their views,
  • arbiters of what counts as “valid” information, and
  • holders of widely recognized credentials.

따라서 [데이터]는 [연구자와 참여자 간의 고유한 권력 관계의 산물]로만 이해될 수 있다. 이와 관련하여 대인반사성은 [맥락적 반사성(아래에서 논의함)]과 중첩되며 연구 맥락에서 미묘한 힘의 감상이 필요하다. 이 역학을 인정하는 목적 중 하나는 참가자와 데이터에 미치는 영향을 완화하거나 관리하는 것일 수 있다.

Thus, data can only be understood as a product of the unique power relationship between researcher and participants (England 1994; Finlay 2002b; Pillow 2003; Burns et al. 2012). In this regard, interpersonal reflexivity overlaps with contextual reflexivity (discussed below) and requires a nuanced appreciation of power in the research context. One of the aims of acknowledging this dynamic might be to temper or manage its influence on participants and data.

대인적 반사성의 또 다른 차원은 [연구팀 구성원들 사이의 관계]가 어떻게 전개되고 연구에 영향을 미치는지를 포함한다. 반사적인 연구 협력이란 다음을 포함한다.

  • 팀 구성원의 동기, 기대 및 가정 간의 상호 작용에 대한 능동적이고 지속적인 탐구
  • 이러한 관점과 역학이 어떻게 활용되거나 관리될 수 있는지를 조사
  • (연구자의 패러다임과 관점의 차이를 포함하여) 주요 연구 이슈에 대한 의견 차이를 반영하고 문서화

Another dimension of interpersonal reflexivity includes how the relationships among the research team members unfold and impact the research (Barry et al. 1999; Russell and Kelly 2002). Reflexive research collaboration involves

  • active and ongoing exploration of the interplay between team members' motivations, expectations, and assumptions,
  • while examining how these perspectives and dynamics can be leveraged or managed.
  • It also includes reflecting on and documenting disagreements on main research issues, including differences in researchers’ paradigms and perspectives (Leggatt-Cook et al. 2011). 

이러한 유형의 대인 반사성에 참여하는 것은 연구팀의 [모든 구성원들이 참여하는 협력적인 노력]이다.
Engaging in this type of interpersonal reflexivity is a collaborative effort involving all members of the research team.

 

 

방법론적 반사성
Methodological reflexivity

세 번째 유형의 반사성은 방법론적 반사성(Box 4)으로, 연구자들은 방법론적 결정의 뉘앙스와 영향을 비판적으로 고려한다. 그것은 종종 연구자들의 [패러다임 지향]에 대한 사려 깊은 고려로 시작된다(Walsh 2003). 패러다임은 연구 노력에 inform하고, 연구 과정 전반에 울려 퍼지며reverberates, 결과에 영향을 미치는 세계관이다. [패러다임을 선택하거나 인정하는 것]은 [특정한 가능성을 열고 배제하는 것]을 의미하므로, [방법론적 반사성을 사용하는 것]은 [선택된 패러다임이 연구에 부과하는 경계를 이해하는 것]을 의미한다(Raven 2006). 

The third type of reflexivity is methodological reflexivity (Box 4), where researchers critically consider the nuances and impacts of their methodological decisions. It often begins with thoughtful consideration of researchers’ paradigmatic orientation(s) (Walsh 2003). A paradigm is a worldview that informs research efforts and, as such, reverberates throughout the research processes and impacts results (Varpio and MacLeod 2020). Choosing or acknowledging a paradigm entails opening and foreclosing particular possibilities, so using methodological reflexivity implies understanding the boundaries that a chosen paradigm imposes upon the research (Raven 2006).

연구 초기부터, 연구자들은 [방법론적 선택]을 [패러다임과 이론적 또는 개념적 틀에 맞추는 것]에 대해 반사적일 필요가 있다. 연구자들은 또한 질적 조사가 풍부한 맥락에 내재되어 있고 반응적이라는 것을 기억해야 하며, 이것이 [방법론적 의사 결정이 연구 과정의 초기에 설정되어서는 안 되는 이유]이다. 대신, 반사적 연구자들은 지속적으로 결정을 내리고, 데이터나 예기치 못한 상황에 대응한다(Varpio et al. 2020). 따라서 방법론적 반사성은 이러한 [결정의 의미]에 초점을 맞추고, [윤리적이고, 엄격하며, 패러다임적으로 정렬되도록 하는 것]을 의미한다.

At the outset, researchers need to be reflexive about aligning their methodological choices with their paradigm and theoretical or conceptual framework (Varpio et al. 2020). Researchers must also remember that qualitative inquiry is embedded in and reactive to rich contexts, that is why methodological decision making should not be set at the beginning of the research process. Instead, reflexive researchers are constantly making decisions and reacting to their data or unforeseen circumstances (Varpio et al. 2020). Thus, methodological reflexivity means focusing on the meaning of these decisions and ensuring that they are ethical, rigorous, and paradigmatically aligned.

 

문맥 반사율
Contextual reflexivity

반사성의 마지막 유형은 맥락적 반사성(Box 5)이며, 이는 [문화적, 역사적 맥락에서 특정 프로젝트를 위치시키는 것locating]을 의미한다(Walsh 2003). 그것은 [연구 질문과 연구자의 대답]이 [가정과 실천이라는 사회적 분야]에 [어떻게 포함되어embed 있고, 어떻게 영향을 받는지] 강조한다. 맥락적 반사성은 또한 연구가 의도하였거나 의도하지 않은 방식으로 수행되어지면서 [사회 분야를 어떻게 변화시키는지] 이해하는 것을 수반한다. 윤리적 연구는 [그 연구가 일어나는 맥락에 긍정적으로 영향을 미치기를 추구]한다; 새로운 통찰력은 참여자들의 연구에 대한 성찰이나 참여가 그들의 실천과 맥락에 어떻게 영향을 미치는지로부터 생성될 수 있다.

The last type of reflexivity is contextual reflexivity (Box 5); it refers to locating a particular project in its cultural and historical context (Walsh 2003). It highlights how the research questions and their answers are embedded in and influenced by a social field of assumptions and practices (Naidu and Sliep 2011). Contextual reflexivity also entails understanding how research transforms the social field in which it is conducted in ways that are both intended and unintended (Smith 1994; Reid et al. 2018). Ethical research seeks to positively impact the contexts in which it takes place; new insights can be generated from how participants’ reflections or engagement in the study affects their practices and context (Bishop et al. 2002).

 

내 연구에서 반사성을 어떻게 활용할 수 있을까?
How can I harness reflexivity in my research?

이러한 반사적 목적과 유형을 실행에 옮기기 위해서는 계획과 구체적인 실천이 필요하다. 반사성이 여러 차원으로 구성된 지속적인 과정이라는 점을 감안할 때, 선택할 수 있는 여러 가지 실천이 있다는 것은 놀라운 일이 아니며, 그 중 많은 실천이 연구 과정 전반에 걸쳐 사용될 수 있다. 아래에 제시된 방법은 [반사적 글쓰기]와 [협업적 성찰]이라는 두 가지 주요 우산 아래에 있습니다. 
Putting these reflexivity purposes and types into action requires planning and concrete practices. Given that reflexivity is an ongoing process comprised of multiple dimensions, it is not surprising that there are several practices to choose from, many of which might be used throughout the research process (Finlay and Gough 2008). The methods we present below fall under two main umbrellas – reflective writing and collaborative reflection.

[반사적 글쓰기]는 아마도 반사성에 대한 가장 잘 알려진 접근법일 것이다. 연구자 메모, 필드 노트, 기타 연구 과정의 어느 시점에서 발생하는 서면 또는 기록된 성찰과 같은 문서 형태를 포함한다.

  • 저널링은 연구자의 관점과 연구 과정에 대한 가정에 의도를 가져오는bring intention 데 사용될 수 있다.
  • 메모 및 필드 노트는 다음을 위해 사용할 수 있습니다.
    • 참가자와 그 데이터에 영향을 미치는 중요한 대인관계 역학을 문서화한다.
    • 결정을 기록하고 조사하며 분석적 통찰력의 순간에 주의를 환기하고 구축한다(Birks et al. 2008).
    • 연구 활동에 영향을 미치거나 영향을 받을 수 있는 맥락의 측면에 주의를 환기한다(Lempert 2007).

일관되고 사려깊게 받아들인다면, 이러한 과정들은 연구 과정에서 작용하는 [가정, 결정, 맥락 및 권력 역학]을 조사하는 애매한 과정일 수 있는 의도를 가져오는 필수적인 도구가 될 수 있다. 또한, 그들은 기초를 제공하고 연구자들의 지식과 생각의 차이를 강조할 수 있다(Mruck and Mey 2019).

Reflexive writing is perhaps the best-known set of approaches to reflexivity. It includes forms of documentation such as researcher memos, field notes, and other written or recorded reflections occurring at any point in the research process.

  • Journaling might be used to bring intention to the researchers’ perspectives and assumptions to the research process (Watt 2007; Ortlipp 2008; Mruck and Mey 2019).
  • Memos and field notes might be used
    • to document critical interpersonal dynamics impacting participants and their data;
    • to record and probe decisions and to call attention to and build on moments of analytic insight (Birks et al. 2008); or
    • to call attention to aspects of context that may impact or be impacted by the study activities (Lempert 2007).

When taken up consistently and thoughtfully, these processes can be an essential tool to bring intention to what can be a nebulous process of examining the assumptions, decisions, contexts, and power dynamics at play in the research process. Additionally, they can provide a foundation and highlight gaps in the researchers' knowledge and thinking (Mruck and Mey 2019).

두 번째 반사 전략 세트는 [협업]을 중심으로 한다. 자신의 사각지대를 찾아내는 일은 어렵다. 당신은 당신이 볼 수 없는 것을 어떻게 보나요? 협력적 반사성은 질적 연구자들이 연구팀으로부터 격리되어 반사성에만 관여하는 경우가 거의 없다는 것을 인정한다. 대신, 연구 협력자들은 종종 가정과 결정에 대한 어려운 질문을 하기 위해 서로에게 의존한다. [가정]은 [같은 가정을 공유하지 않는 다른 사람들의 관점]에서 볼 때 가정이 가장 명백해지기 때문에, 연구팀에 대한 관점의 다양성과 훈련은 반사성과 참가자와의 협력적(또는 적어도 대화적) 관계에 매우 유익할 수 있다(Barry et al. 1999). 그러나 [파워 다이내믹스]는 개방적인 의사소통을 위협할 수 있다. 따라서 연공서열과 지위고하를 막론하고 [팀 내]에서, 그리고 [팀원과 참가자 사이]에 윤리적이고 엄격한 연구를 위한 [상호 책임의 확고한 기반]과 [상호 책임의 문화]를 구축하는 것이 필요하다. 이러한 관계는 모든 사람이 가정과 결정에 의문을 제기할 수 있는 공간을 허용한다(Linabary et al. 2020).
The second set of reflexivity strategies is centered on collaboration. The task of uncovering one’s blind spots is challenging. How do you see what you cannot see? Collaborative reflexivity acknowledges that qualitative researchers rarely engage in reflexivity alone, in isolation from the research team; instead, research collaborators often rely on each other to ask difficult questions about assumptions and decisions (Bieler et al. 2021). Because assumptions become most evident when viewed from the point of view of others who do not share them, diversity of perspectives and training on a research team can be quite beneficial for reflexivity as well as a collaborative (or at least dialogic) relationship with participants (Barry et al. 1999). However, power dynamics can threaten open communication. Thus, building a solid foundation of trust and a culture of mutual responsibility for ethical and rigorous research within a team and between team members and participants, regardless of seniority and status, is necessary. Such relationships allow space for all to question assumptions and decisions (Linabary et al. 2020).

협업과 반사적 글쓰기는 상호 배타적인 전략이 아니다. 예를 들어, 팀 반사적 대화는 개인 또는 그룹 반사적 글쓰기와 공동작업에 기초할 수 있다. 우리는 또한 전략이 하나 이상의 반사율을 다룰 가능성이 있다는 것에 주목한다. 따라서 이 모든 것을 단일 프로젝트에 적용할 필요가 없으며, 이 목록은 결코 완전하지 않습니다. 대신, 우리는 반사성을 연습하는 구체적이고 실용적인 방법을 보여주기 위한 예시로 이러한 전략을 제공한다.

Collaboration and reflexive writing are not mutually exclusive strategies–for example, team reflexive dialogue may be grounded in individual or group reflective writing and collaboration. We also note strategies are likely to address more than one type/dimension of reflexivity. Thus, there is no need to apply them all into a single project, and this list is by no means exhaustive. Instead, we offer these strategies as exemplars to demonstrate concrete and practical ways to practice reflexivity.

서사 자서전
Narrative autobiography

[서사적 자서전]은 처음에는 autoethnography을 둘러싼 방법론 문헌에서 개발되었지만, 어떤 프로젝트에서든 개인적인 반사성을 다룰 수 있는 강력한 자료이다. 이러한 성찰적 글쓰기에 대한 접근에서, 연구자들은 그들의 배경과 연구 프로젝트를 수행하게 된 동기에 대해 자유롭게 글을 쓰며, 연구에 영향을 미칠 수 있는 구체적인 인생 경험을 기록한다. 연구원들은 그들의 [개인적인 경험]이 참가자들의 이야기accounts에 대한 연구자 자신의 이해에 어떻게 영향을 미칠 수 있는지, 그리고 이러한 통찰력이 잠재적으로 결과를 형성할 수 있는 방법에 대해 성찰하는 것을 목표로 한다. 우리는 서술의 저자가 간과할 수 있는 문제를 발견하기 위해 [적어도 한 명의 다른 연구 팀원과 이 이야기를 공유할 것]을 제안한다. 궁극적으로, 이 연습은 연구자들이 관계 형성을 방해할 수 있는 문제를 분리함으로써 참여자들과의 상호작용을 준비하는 데 도움이 될 것이다. (예: 민감한 주제에 대한 가정). 연구를 구상하는 동안 및 데이터 생성 중에 이 연습을 수행하는 것이 좋습니다. 서술적 자서전은 연구자의 첫 메모 또는 반사적 저널의 항목 중 하나가 될 수 있다.

The narrative autobiography was initially developed in the methodological literature surrounding autoethnography (Ellis 2004), but it is a powerful resource to tackle personal reflexivity in any project. In this approach to reflective writing, researchers write freely about their background and the motives that led them to conduct their research project, recording specific life experiences that might influence the research. Researchers aim to reflect on how their personal experiences might influence their understandings of participants' accounts and how these insights could potentially shape results (Koopman et al. 2020). We suggest sharing this narrative with at least one other research team member to unearth issues that the author of the narrative might overlook. Ultimately, this exercise will help researchers prepare for interactions with participants by disentangling issues that might hinder rapport building (e.g. assumptions on sensitive topics) (Gentles et al. 2014). We suggest doing this exercise while conceiving the study and during data generation. Narrative autobiography can serve as one of the researcher’s first memos or entries in a reflexive journal (Watt 2007; Barrett et al. 2020).

자체면접수
Self-interview

[연구 프로토콜 작성]에는 연구자가 [데이터를 생성하는 방법]을 구체화하는 것이 포함되며, 이는 종종 인터뷰나 포커스 그룹을 위한 특정 질문을 생성하는 것을 수반한다. 우리는 내부자로 간주될 수 있는 연구 팀원들이 그들 [자신이 만든 질문에 대답해보고, 주제에 대한 그들의 가정을 반영할 것]을 추천한다. 연구원들은 [자체 인터뷰]를 수행하거나, [다른 연구 팀원의 인터뷰]를 받을 수 있었다. 이러한 자체 인터뷰는 연구자들이 개인적인 경험과 그들의 주제에 대한 견해를 형성한 이론과 연구를 탐구할 수 있는 좋은 기회이다(Crawley 2012). 자체 인터뷰는 연구자들이 주제에 대한 [자신의 경험]을 [참가자들의 경험]과 지속적으로 비교할 수 있도록, 상세히 기록되고 분석될 수 있다. 이 연습은 초기 연구 프로토콜을 개발한 후 데이터 생성 전 또는 데이터 생성 중에 수행하는 것이 가장 좋습니다. 연구원들은 심지어 그들의 신념이 연구를 통해 어떻게 진화했는지 이해하기 위해 한 번 이상 자체 인터뷰를 할 수도 있다.
Writing the study protocol includes specifying how the researcher will generate data, which often entails creating specific questions for interviews or focus groups. We recommend those research team members who could be considered insiders to answer their questions and reflect on their assumptions about the topic. Researchers could conduct a self-interview or be interviewed by another research team member (Koopman et al. 2020). These self-interviews are an excellent opportunity for researchers to explore personal experiences and the theories and research that have shaped their views on their topic (Crawley 2012). Self-interviews can be transcribed and analyzed in detail to enable researchers to constantly compare their experiences of the topic to those of the participants (Gentles et al. 2014). This exercise might be best conducted after developing the initial study protocol and before or during data generation. Researchers may even conduct self-interview more than once to understand how their beliefs have evolved throughout the study.

 

독자 반응 연습
Reader-response exercise

이 연습은 [연구자의 가정]이 [참여자와의 상호작용]에 어떤 영향을 미칠 수 있는지를 다룬다(Mauthner와 Doucet 2003). [독자 반응]은 [데이터 분석 중]에 수행되며, 연구자가 [자신의 배경 및 개인 이력과 관련하여 참여자 accounts에 어떻게 반응하고 해석하는지를 나타내는 코드 레이어]를 포함시키는 것이다. 이 연습 전에 [서술형 자서전]이나 [자기 인터뷰]를 해 연구자들이 그들의 [개인적인 반사적 자세를 이미 인식하도록 하는 것]이 도움이 된다. 이 연습은 반사 메모와 짝을 이뤄 코딩 연습 후 반응과 해석을 심층적으로 분석한다. 이러한 반응들은 또한 저널 또는 다른 형태의 성찰적 글쓰기의 기사의 기초를 형성할 수 있다. 이 분석은 연구자와 참여자 사이의 힘 역학이 참여자의 계정과 연구자의 반응에 어떤 영향을 미칠 수 있는지에 초점을 맞출 수 있다.
This exercise addresses how the researchers' assumptions might affect their interactions with participants (Mauthner and Doucet 2003). Reader response is conducted during data analysis and involves including a layer of codes representing how researchers react to and interpret participants accounts in relation to their background and personal history (Gilligan et al. 1990). It is helpful to have done a narrative autobiography or a self-interview before this exercise so that the researchers are already aware of their personal reflexive stance. This exercise is paired with reflexive memos to analyze reactions and interpretations in-depth after the coding exercise. These reactions may also form the basis of entries in a journal or other form of reflective writing. The analysis may focus on how the power dynamics between researcher and participant could have influenced both participants’ accounts and researchers’ reactions.

조직화된 팀 성찰적 토론
Structured team-reflexive discussion

연구자들이 협력적 반사성을 자극하는 데 도움이 될 수 있는 한 가지 연습은 [팀-반사적 토론]이다. 이 연습 동안 각 팀 구성원은 배리 외 연구진(1999)이 제안한 것과 같은 개인적인 반사적 질문에 답하기 위해 반성적 글쓰기에 참여한다.

One exercise that can help researchers to spark collaborative reflexivity is the team-reflexive discussion. During this exercise, each team member engages in reflective writing to answer personal reflexive questions such as those proposed by Barry et al. (1999):

  • 제 경험이 프로젝트 참여를 어떤 식으로 형성할 수 있을까요?
  • 질적 연구에 대해 어떤 경험을 했는가?
  • 질적 연구에 대한 나의 지향점은 무엇인가?
  • 이 프로젝트에서 어떤 결과가 나올 것으로 예상하나요?
  • 데이터를 분석할 때 선호하는 이론은 무엇입니까?
  • 그 연구에서 내가 가진 지분은 무엇인가? 내가 그것을 통해 무엇을 얻기를 바라는가?
  • 내가 두려워하는 것은 무엇인가?
  • In what way might my experience shape my participation in the project?
  • What experiences have I had with qualitative research?
  • What is my orientation to qualitative research?
  • What results do I expect to come out of this project?
  • What theories do I tend to favor while analyzing data?
  • What is my stake in the research? What do I hope to get out of it?
  • What are my fears?

그런 다음 모든 답변이 팀 내에서 공유되고 논의됩니다. 이것은 연구 내에서 각 팀 구성원의 위치와 이 앙상블이 결과에 어떤 영향을 미칠 수 있는지를 이해하는 강력한 방법입니다. 우리는 이 연습이 잠재력을 극대화하기 위해 연구 과정 초기에 수행하는 것이 최선이라고 믿는다. 그러나 프로젝트 전반에 걸쳐 팀 미팅에서 정기적으로 논의해야 하는 주제가 많을 것입니다.

All answers are then shared within the team and discussed. This is a powerful way to understand each team member’s position within the research and how this ensemble could impact the results. We believe it is best to conduct this exercise early in the research process to maximize its potential. However, many topics will likely need to be discussed regularly in team meetings throughout the project.

멤버 반사
Member reflection

협력적 반사적 연습은 [연구 참가자와의 협업]을 포함할 수 있다(그리고 그래야 한다). 초기의 질적 작업은 "회원 확인member checking"을 데이터의 진실 또는 정확성을 검증하는 방법으로 보았다. 그러나 보다 최근에는 질적 연구자들이 자료와 해석이 맥락에 맞게 구성되고, 참여자들이 다시 참여하게 되면 관점을 바꾸거나 새로운 해석을 추가할 수 있다는 점을 고려하여, 참여자들과 다른 이해당사자들과의 "checking in"에 대한 좀 더 미묘한 접근법으로 "member reflection"을 채택하고 있다. 이 접근 방식은 연구가 가장 신뢰할 수 있으려면credible, [참여자나 지식 사용자에게 돌아가서, 그들의 맥락과 아이디어에 대한 우리의 초기 해석을 기반으로 그들과 협력]해야 한다가정에 기초한다. 이러한 프로세스에는

  • 협력과 피드백을 위해 참가자에게 [원시 데이터 및 연구자 해석을 전송]하거나,
  • 참가자가 결과에 응답할 수 있도록 [후속 인터뷰 또는 포커스 그룹을 예약]하는 것이 포함될 수 있다.

Collaborative reflexive practice can (and likely should) involve collaboration with participants. Early qualitative work saw “member checking” as a way to validate the truth or accuracy of data (Varpio et al. 2017). However, more recently, qualitative researchers have taken up “member reflection” as a more nuanced approach to “checking in” with participants and other stakeholders, taking into account that data and interpretations are constructed in context, and participants may change their perspective or add new interpretations when they are re-engaged (Tracy 2010; Ravenek and Rudman 2013). This approach is built on the assumption that our research is most credible if we return to participants or knowledge users to work with them to build on our earlier interpretations of their contexts and ideas. Such processes can involve

  • sending participants the raw data and/or researcher interpretations for collaboration and feedback (Birt et al. 2016), or
  • booking follow-up interviews or focus groups to allow participants to respond to results.

[윤리적]측면에서, 이러한 반사적 과정은 [참가자들에게 그들의 말이 어떻게 해석되는지에 대한 발언권을 제공]하여, 그들이 자신을 대표하고, 연구 결과에 의미 있게 기여할 수 있도록 한다. 예를 들어, 연구자는 [후속 인터뷰follow-up interview]를 수행하여, 연구가 연구 주제에 대한 [참가자들의 견해를 어떻게 변화시켰는지], 또는 그들의 [실천이 어떻게 영향을 미쳤는지]를 탐구할 수 있다. 이 도구는 일반적으로 초기 데이터가 생성된 후 연구의 후반 단계에서 수행되지만 동시 데이터 생성 및 분석 과정에서 발생할 수 있습니다. 참여자 참여에 대한 보다 급진적인 접근방식은 참여적 연구 설계를 사용하여 연구 라이프사이클 전체에 걸쳐 지식 사용자와 참여자를 참여시킬 수 있다.

Ethically, these reflexive processes offer participants a say in how their words are interpreted, ensuring that they can represent themselves and contribute meaningfully to research findings. For example, researchers could conduct follow-up interviews to explore how the research has changed participants' views on the study subject or how their practices have been influenced (Naidu and Sliep 2011). This tool is generally done in the later stages of the research once initial data has been generated, though it could occur throughout concurrent data generation and analysis. More radical approaches to participant engagement might use participatory research designs to engage knowledge users and participants throughout the research lifecycle fully (Finlay 2002b).

반사 원고를 어떻게 쓰죠?
How do I write a reflexive manuscript?

우리가 우리의 연구에 반사성을 위한 전략을 통합함에 따라, 우리는 또한 반사적 연구의 뉘앙스가 빛을 발할 수 있도록 하는 강력한 보고 관행을 향해 노력해야 하며, 연구자들의 관점과 결정에 대한 투명성을 통해 연구의 신뢰성을 전달해야 한다. 본 안내서를 작성하기 위한 자극의 일부는 원고에서 반사성 문장을 읽고, 검토하고, 쓴 우리의 실망스러운 경험에서 비롯된다. 많은 경우 반사성에 대한 보고는 "연구자의 특성 및 반사성"과 같은 짧은 문단에 국한된다. 이런 반사성 섹션은 (개인적인 반사성의 복잡성을 탐구하기보다는) 본문의 이 부분들은 각 저자의 소속과 연구 방향에 대한 [짧은 전기적인 진술]이 된다. 반사성을 위한 또 다른 문제 있는 글쓰기 전략이 한계 부분에서 나타났는데, 여기서 저자들은 주관성이 어떻게 그들이 객관적인 연구에 참여하는 것을 방해했을 수 있는지 한탄한다(Lingard 2015).

As we integrate strategies for reflexivity in our research, we must also work toward robust reporting practices that enable the nuances of reflexive research to shine through, communicating the work’s credibility through transparency around the researchers’ perspectives and decisions. Part of the impetus for writing this Guide stems from our own disappointing experiences reading, reviewing, and writing reflexivity statements in manuscripts. In many cases, reporting on reflexivity is isolated to a short paragraph such as “researcher characteristics and reflexivity.” Instead of this reflexivity section delving into the intricacies of personal reflexivity, these portions of the text become short biographical statements of each author's affiliation and research orientation. Another problematic writing strategy for reflexivity has emerged in the limitations section, where the authors lament how their subjectivity may have prevented them from engaging in objective research (Lingard 2015).

[별도의 단락]을 통해 반사성을 보고하거나, [데이터에 대한 연구자의 영향에 대한 사과]로 보고하기보다는, 효과적인 보고가 되려면 [연구 과정 전반에 연구자의 주관성을 수용하고 걸쳐 결정의 뉘앙스를 다루어야 한다]고 제안한다. 월시의 유형학은 원고 전체에 짜여진 반사적 보고 관행을 구조화하는 데 도움이 될 수 있으며, 독자는 연구를 형성한 관행과 의사 결정을 살펴볼 수 있는 기회를 제공한다. 그러나 단어 수 제한, 특히 HPE 저널에 제출된 원고의 경우 연구자가 모든 연구 결정 뒤에 숨겨진 미묘한 사고와 팀워크를 보고할 여유가 없을 수 있다는 것을 인식한다. 따라서 대신, 우리는 연구 과정에서 [가장 큰 영향을 미친 결정과 역학]에 초점을 맞추고 개인, 대인관계, 방법론 및 맥락적 차원을 강조할 것을 권고한다.
Rather than reporting reflexivity via a discreet paragraph or as an apology for the researcher’s influence on the data, we suggest that effective reporting should embrace researcher subjectivity and address the nuances of decisions throughout the research process. Walsh’s typology can be instrumental in structuring reflexive reporting practices woven throughout the manuscript, offering the reader an opportunity to journey through the practices and decision-making that shaped the study. However, due to word count limitations, particularly for manuscripts submitted to HPE journals, we recognize that researchers may not have the luxury of reporting the nuanced thinking and teamwork behind every research decision. So instead, we recommend focusing on decisions and dynamics that were most impactful in the research process, highlighting personal, interpersonal, methodological, and contextual dimensions.

서론
Introduction

서론은 연구자들이 자신들의 주장과 핵심 아이디어를 제시하는 공간이다. 따라서, 연구자는 그들의 [패러다임, 이론적 또는 개념적 프레임워크, 그리고 연구 질문 또는 목적 사이의 정렬을 명확히 함]으로써 반사성을 보여줄 수 있다. 여기에는 연구자들의 [패러다임과 이론적 전제를 투명하게 하는 것]이 포함되며, 독자는 이 입장이 결과에 어떤 영향을 미치는지 이해할 수 있다. 연구에 참여한 사람들의 패러다임적 입장을 명확하게 파악함으로써 독자는 그러한 맥락에서 결과를 이해하고 평가할 수 있다. 게다가, 연구원들은 그들이 사용하는 언어가 어떻게 [모순된 메시지]를 만들 수 있는지 알아야 한다. 예를 들어, 연구자들은 서론에서 [구성주의적 입장]을 취하고 있다고 진술하면서, 정작 다른 섹션의 데이터에서 "편견 완화" 또는 "발견"을 의미하는 것에 대해 이야기하여, "발견"할 수 있는 진실이 있다는 경쟁적인 후기 실증주의적 믿음을 보이는 모수이 있다.
The introduction is a space where researchers lay out their arguments and core ideas. Thus, they can demonstrate reflexivity by articulating alignment between their paradigm, theoretical or conceptual framework, and research questions or purpose. This includes being transparent about the researchers’ paradigmatic and theoretical presuppositions, allowing the reader to understand how this stance influences the results (Varpio and MacLeod 2020). Having a clear picture of the paradigmatic stances of those involved in the research, the reader can understand and evaluate the results in that context. Additionally, researchers should be aware of how the language they use can create contradictory messages. For example, researchers might state in the introduction that they are taking a constructivist stance but then talk about “mitigating bias” or meaning “emerging” from the data in other sections, suggesting a competing post-positivist belief that there is a truth that can be “uncovered” (Varpio et al. 2017).

방법
Methods

모든 원고의 방법 섹션은 저자들의 [반사적 관행에 대한 가장 자세한 내용]을 제공할 것이다. 개인적 반사성과 관련하여, 우리는 [연구자의 배경과 관점을 상세히 설명]하는 섹션이 강력한 반사 운동을 구성한다고 생각하지 않는다. 대신, 우리는 연구자들에게 [그들의 관점이 연구에 어떤 영향을 미쳤는지], 그리고 그러한 [관점을 어떻게 활용했는지] 설명함으로써 강력한 개인적 반사성을 보여줄 것을 요구한다. 이러한 설명은 방법에 대한 설명에만 국한될 필요는 없으며, 원고 전체에 걸쳐 수행할 수 있다.
The methods section of any manuscript will likely offer the most detail about authors’ reflexive practices. Regarding personal reflexivity, we do not believe sections detailing researchers' backgrounds and perspectives constitute a robust reflexivity exercise. Instead, we call on researchers to demonstrate a robust sense of personal reflexivity by explaining how their perspectives impacted the study and how they capitalized on those perspectives. Such descriptions need not be limited to the description of methods; instead, they can be carried throughout the manuscript.

[대인관계 관점]에서, 반사성은 참여자와 연구자, 그리고 연구팀 내에서 [권력 차이와 역학]을 논의함으로써 입증될 수 있다. 또한 저자는 모집, 데이터 생성, 분석 및 구성원 반영에서 이러한 역학을 어떻게 고려했는지 논의해야 한다. 윤리적으로, 연구자들은 익명성과 기밀성에 관한 참가자의 선호에 어떻게 주의를 기울였는지 논의해야 한다.
From an interpersonal perspective, reflexivity can be demonstrated by discussing the power differentials and dynamics between participants and researchers and within the research team. Authors should also discuss how these dynamics were considered in recruitment, data generation, analysis, and member reflection (Shulman 1990). Ethically, researchers should discuss how they attended to participants’ preferences around anonymity and confidentiality.

[방법론적 반사성]은 방법론적 결정이 어떻게 이루어졌는지에 대한 투명성을 수반한다. 방법론적 반사성은 연구 결정과 절차를 주의 깊게 설명하고 이러한 결정이 어떻게 그리고 왜 내려졌는지에 주의를 기울임으로써 해결된다. 예를 들어, "우리는 12개의 면접에서 포화를 이루었다"라고 쓰는 것보다, 반사적 보고는 [어떻게 연구자가 자신의 데이터나 분석이 연구의 목적에 충분하다고 결정하였는지에 대해 더 투명할 것]을 요구한다(Mason 2010). 

Methodological reflexivity entails transparency around how methodological decisions were made. Methodological reflexivity is addressed by carefully describing study decisions and procedures and attending to how and why these decisions were made. For example, rather than writing “we achieved saturation at 12 interviews,” reflexive reporting requires the researchers to be more transparent about how they decided that their data or analyses were sufficient for the purposes of their study (Mason 2010).

마지막으로, [맥락적 반사성]은 특히 현장에서 시간을 포함하지 않는 연구에서 종종 간과된다. 맥락 반사성을 입증하고 그들의 발견을 정당화하기 위해, 연구자들은 [어떻게 자신의 맥락을 알게 되었는지]를 명확히 해야 한다.

  • 맥락에 대한 그들의 관계는 무엇인지
  • 어떻게 연구자가 맥락의 뉘앙스에 대한 이해를 심화시키고, 어떻게 그 지식을 데이터에 활용하려고 노력했는가.

우리가 위에서 언급한 바와 같이, 연구는 긍정적이거나 부정적으로 맥락에 어떻게 영향을 미쳤는지에 대한 정보도 포함할 수 있다.

Finally, contextual reflexivity is often overlooked, particularly in studies that do not involve time in the field. To demonstrate contextual reflexivity and legitimate their findings, researchers should articulate how they came to know their context—

  • what their relationship is to the context and
  • how they sought to deepen their appreciation of its nuances and capitalize on that knowledge in their data.

As we noted above, they may also include information on how the research impacted the context, either positively or negatively.

 

결과.
Results

결과 섹션은 종종 엄격하게 데이터를 제시하는 곳으로 간주됩니다. 그러나, 우리는 연구자들의 목소리와 해석이 결과 및 토론 섹션과 밀접하게 연관되어 있다고 주장한다. 즉, 결과는 스스로 "발현"하지 않고 대신 구성되고 해석됩니다(Varpio et al. 2017). 따라서, 연구자들은 다음을 명확히 함으로써 반사성을 보여줄 수 있다. 

  • 제시하는 데이터가 어디에서 왔는지,
  • 어떻게 해석되었는지, 
  • 어떻게 사용되고 있는지

이러한 유형의 반사성을 달성하기 위한 전략에는 결과에서 [참가자 인용문]과 [연구자의 설명]의 [균형]에 대해 논의하거나(Homes 2020), 데이터 세트에서 조사 결과가 대표되는representative 정도를 입증하는 것이 포함될 수 있다.

Results sections are often thought of as strictly data presentation. However, we contend that the researchers' voices and interpretations are intimately connected to the results and discussion sections; in other words, the results do not “emerge” by themselves but are instead constructed and interpreted (Varpio et al. 2017). Thus, researchers can demonstrate reflexivity by clarifying

  • where the data they present came from,
  • how it was interpreted, and
  • how it is being used.

Strategies for achieving this type of reflexivity might involve discussing the balance of participant quotes and researchers’ description in the results (Holmes 2020), or demonstrating the extent to which findings are representative across a data set.

논의
Discussion

결과 섹션과 마찬가지로, 논의는 연구자들의 적극적인 해석 작업과 그들의 발견을 더 넓은 문헌에 위치시키기 위한 노력을 반영해야 한다. 그러나 이것은 단순히 [연구자들의 해석을 확인하는 수단을 찾는 작업]이 되어서는 안 된다. 대신, 우리는 [연구자들의 해석에 도전할 수 있는 문헌의 측면을 찾고 제시하는 것]이 중요한 개인적이고 방법론적인 반사 작업을 구성한다고 주장한다.
Like the results section, the discussion should reflect researchers’ active interpretive work and efforts to situate their findings in the broader literature. However, this should not simply be an exercise of finding means of confirming the researchers' interpretations. Instead, we argue that seeking out and presenting aspects of the literature that might challenge researchers’ interpretations constitutes important personal and methodological reflexive work.

아마도 무엇보다도, 많은 사람들이 후기 실증주의적 기대에 부응하고자, 작아 보일 수 있는 작은 표본 크기나 연구의 맥락적 특수성에 대해 사과하면서 연구 한계에 대한 진부한 보고를 끝내버리고 싶어한다. 그보다, 한계는 독자들이 연구 결과의 다른 맥락으로의 전이가능성을 평가하는 데 특히 중요한 연구 인구와 맥락의 측면에 대한 통찰력을 제공할 수 있다.
Perhaps most of all, we would like to end trite reporting of study limitations that seek to meet post-positivist expectations, offering apologies for a small sample size that may seem small or for the study’s contextual specificity. Instead, limitations can offer insights into the aspects of the study population and context that are particularly important to help readers assess the transferability of the study’s findings to other contexts.

반사성에 대한 비판은 무엇인가?
What are the criticisms of reflexivity?

반사실행의 배후에 있는 좋은 의도에도 불구하고, 우리는 반사실행을 둘러싼 일부 비판에 눈을 감아서는 안 된다. 이러한 비판을 해결함으로써, 우리는 연구자가 이러한 잠재적 문제를 기회로 전환하는 데 필요한 이해를 갖추는 것을 목표로 한다.
Despite the good intentions behind the practices of reflexivity, we must not close our eyes to some of the criticism surrounding reflexivity as a practice. By addressing these criticisms, we aim to equip the researcher with the necessary understanding to transform these potential problems into opportunities (Finlay and Gough 2008).

나르시시즘과 같은 반사성
Reflexivity as narcissism

연구자들은 개인의 반사성에 좁게 초점을 맞추고, 반사성을 (그들의 배경, 가정, 위치 결정 및 행동이 연구 과정에 어떤 영향을 미치는지에 대한) 비판적 자기 인식의 과정으로만 정의할 때, 참여자의 목소리를 꺾어버릴overpowering 위험이 있다(Week 1999). Week(1999)는 이러한 위험을 자기애의 한 형태로 분류하고(p. 894), '재미있는 통찰력과 반사적인 계정에서의 자기 집중성 사이의 얇은 경계' 를 만들 수 있다며 [개인 반사성의 한계]를 지적했습니다: 

Researchers run the risk of overpowering the voice of the participant (Weick 1999) when they narrowly focus on personal reflexivity and define reflexivity solely as a process of critical self-awareness, reflecting on how their background, assumptions, positioning, and behavior impact the research process (Finlay and Gough 2008). Weick (1999) labelled this risk as a form of narcissism (p. 894) and pointed to the limitations of personal reflexivity as it can create a thin line between interesting insights and self-indulgence in reflexive accounts (Nadin and Cassell 2006).

따라서, 반사적인 연습에서, 우리는 연구원들이 [참가자들의 목소리를 잃지 않을 것]을 권고한다. 이는 앞서 설명한 것처럼 [결과 섹션]을 작성할 때 특히 관련이 있는데, 연구자가 [참가자의 인용문]과 [결과에 대한 설명] 사이의 균형을 잘 확인해야 하기 때문이다(Holmes 2020). 또한, 개인적, 대인적, 방법론적, 그리고 상황적 반사성을 연습하는 것은 반사성과 그것이 강화하고자 하는 연구에 더 균형 잡힌 접근을 만드는 데 도움이 될 것이다.

Therefore, in their reflexive practices, we encourage researchers not to lose sight of the participants’ voices. This is especially pertinent when writing the results section, as we explained earlier, as researchers need to ascertain a good balance between participant quotes and their description of the results (Holmes 2020). Also, practicing personal, interpersonal, methodological, and contextual reflexivity will aid in creating a more balanced approach to reflexivity and the research it aims to strengthen.

특권으로서의 반사성
Reflexivity as privilege

반사성은 용기 있는 행동이다. 연구자는 그들의 가정과 연구에 대해 잠재적으로 불편한 진실과 마주할 필요가 있다. 어떤 사람들에게는 이러한 [불편한 진실을 인정하고 토론하는 것]이 다른 사람들보다 더 용이할affordable 수 있다. Mauthner와 Doucet(2003)은 어떻게 박사과정을 이수하고, 학문적 지위를 확보하고, 각 분야에서 자리를 잡았는지를 돌아보며 데이터 분석에서 혼란과 모호함을 고백할 수 있는 안전감을 조성하였다. [신진 연구자]들은 [혼란과 모호성을 인정하는 것]이 타인의 평가에 매우 취약해지는 상황에서, 연구자로서의 신뢰성과 기술에 좋지 않은 영향을 미칠 수 있다고 걱정할 수 있다. 이와 같이, 연구 과정의 [불확실성과 실수에 초점을 맞춘 반사성을 정상화normalize]하는 데 다음의 것이 도움이 될 수 있다.

  • 연구팀 내 반사성 실천에 대한 공개 대화,
  • 선임 연구원의 취약성 모델링,
  • 연구 네트워크 내 반사성에 대한 논의

Reflexivity is an act of bravery: the researcher needs to confront themselves with potentially uncomfortable truths about their assumptions and their research. Admitting to and discussing these uncomfortable truths might be more affordable for some than for others. Mauthner and Doucet (2003) reflect on how completing their PhD’s, securing academic positions, and becoming established in their respective fields created a sense of safety that enabled them to confess confusions and ambiguities in their data analysis. Newer researchers may worry that admitting confusion and ambiguity could reflect poorly on their credibility and skills as researchers at a time when they are very vulnerable to the assessments of others. As such,

  • an open dialogue about the practice of reflexivity within the research team,
  • modelling of vulnerability by senior researchers, and
  • discussions about reflexivity within research networks

...might help normalize reflexivity centered on uncertainty and mistakes in research processes.

끝없는 거울의 전당으로서의 반사성
Reflexivity as a never-ending hall of mirrors

반사성을 연습하는 데는 유일한 방법이 없다. 연구자의 인식론적 입장에 따라 반사성의 다른 측면이 다른 측면보다 우선할 수 있다(Day 2012). 우리 역시 린치(2000)처럼 반사성을 질적 연구를 수행하는 데 있어 '피할 수 없는 특징'으로 보고 있지만, 반사성을 과도하게 사용하는 것은 '거울의 전당'에 갇힌 것과 같다고 할 수 있다. 하나는 다음과 같은 질문을 제기한다. 
우리가 언제 충분한 반사율을 보였습니까? 언제 끝나요? 특히 반사성을 프로젝트의 라이프사이클 전체에 걸쳐 계속되는 엄격한 연구의 특징으로 본다면, 실망스럽게도 대답은 '절대 끝나지 않는다'일 수 있습니다
There is no one way to practice reflexivity. Depending on the epistemological stance of the researcher, different aspects of reflexivity might be foregrounded over others (Day 2012). Although we, like Lynch (2000), see reflexivity as an ‘unavoidable feature’ in performing qualitative research, overdoing reflexivity might be likened to being stuck in a ‘hall of mirrors’ (Lynch 2000). One poses the questions: When have we done enough reflexivity? When does it end? The disheartening answer might be ‘never,’ especially if we see reflexivity as a hallmark of rigorous research that continues throughout the projects’ lifecycle.

그러나 [반사율 연습의 충분성]을 확인하는 방법은 [최종 원고를 검토하는 것]이다. 청중에게 명확한 메시지를 전달하기 위해, 연구원들은 다음을 해야 한다.

  • [연구 질문]과 [연구의 이론적 및 개념적 근거] 사이의 정렬을 주시한다.
  • [방법론적 선택]에 대한 명확한 정당성을 제공한다.
  • [방법 섹션]에 연구 맥락에 대한 명확한 설명을 제시한다.
  • [결과 섹션]에서 참가자와 연구자의 목소리를 균형 있게 조정한다.

구체적인 관행과 투명한 보고에 토대를 둔다면, [거울을 보는 것]이 [에셔 그림에 갇힌 것]처럼 느낄 필요가 없다(Lynch 2000).

However, a way to check the sufficiency of reflexivity practices is to examine the final manuscript. To convey a clear message to the audience, researchers need to

  • keep sight of the alignment between the research question and the study’s theoretical and conceptual grounding,
  • provide clear justification for their methodological choices,
  • put forth a clear description of the research context in the methods section, and
  • balance the participant and researcher voices in the results section (Day 2012).

When grounded in concrete practices and transparent reporting, looking in the mirror does not have to feel like you are stuck in an Escher painting (Lynch 2000).

저자 개인 반사성
Authors personal reflexivity

우리는 사려 깊은 질적 연구 과정에 대한 상호 열정 때문에 이 가이드에 왔습니다. 우리는 엄격한 질적 작업을 수행하는 데 관심이 있는 HPE 연구원들이 이용할 수 있는 반사성에 대한 이론적 및 실용적인 지침의 부족으로 어려움을 겪었다. 따라서 우리는 반사성에 관한 문헌에 대해 중립적인 입장을 취하려고 시도하지 않았다. 대신, 본 가이드는 효과적인 반사적 실천을 중심으로 한 우리의 지식과 믿음의 결합과 우리가 보는 문헌의 표현을 나타냅니다. 
We came to this Guide because of a mutual passion for thoughtful qualitative research processes. We were troubled by a lack of theoretical and practical guidance on reflexivity available to HPE researchers interested in doing rigorous qualitative work. Thus, we did not attempt to take a neutral stance regarding the literature on reflexivity. Instead, this Guide represents a combination of our knowledge and beliefs around effective reflexive practice and a representation of the literature as we see it.

우리 팀은 국제기구와 학제간 프로그램을 통해 질적 연구에 대한 전문성을 키워왔기 때문에 우리의 관점에 많은 차이가 있다. 그러나, 우리 모두는 주관주의 또는 사회 구성주의 패러다임 내에서 연구를 포지셔닝하고, 반사성에 대한 우리의 입장은 이러한 관점을 깊이 반영한다. 이 안내서에 사용된 언어는 이러한 관점을 명시적으로 식별합니다. 올모스-베가 박사는 마스트리히트 대학에서 HPE 박사 학위를 받은 마취과 의사입니다. 그는 학생들이 사회문화적, 사회적 물질적 이론을 이용하여 직장에서의 사회적, 물질적 상호작용을 통해 어떻게 배우는지 연구한다. 그는 연구 프로젝트를 감독하기 시작한 이후 질적 연구에 관심이 있는 연구자들이 사용할 수 있는 반사성에 대한 명확한 지침이 없어 좌절감을 느꼈다. 이 좌절감이 마침내 그를 이 안내서를 쓰게 만들었다. Stalmeijer 박사는 마스트리히트 대학에서 HDE 박사 학위를 받은 교육학자입니다. 그녀는 교육의 질적 관리에 대한 배경과 인지적 견습 이론을 이용한 임상 교사 평가에 초점을 맞춘 박사 학위를 가지고 있다. 그녀는 현재 사회문화 이론을 사용하여 직장 학습과 지도를 연구하고 직장 학습 중에 존재하는 전문직 간 역학을 전경화하는 데 초점을 맞추고 있다. Varpio 박사의 박사 학위는 수사학에 중점을 두고 있으며, 그녀의 HPE 경력은 과학 철학에 대한 세심한 주의와 그러한 철학이 연구 실천에 어떻게 영향을 미치는지에 기초하고 있다. 이러한 배경과 질적 HPE 연구원으로서의 활발한 연구를 고려할 때, 그녀는 반사성을 포함한 다양한 연구 패러다임과 방법론에 걸쳐 엄격함을 유지하는 기본 원칙을 명확히 할 필요가 있다고 주장한다. 칼케 박사는 맥마스터 대학교, 앨버타 대학교, 브리티시 컬럼비아 대학교에서 교육학 박사 학위를 취득했다. 그녀는 사회문화 이론과 비판 이론(예: 비판적 인종 이론)의 분과를 사용하여 훈련생 및 의사 기관과 의료 시스템의 사회 정의에 대한 연구를 수행한다. 그녀는 참여자의 목소리를 부각시킬 수 있는 새로운 연구 전략에 열정을 가지고 있으며, 그녀의 작품의 사회 정의 목표를 위협하는 권력 역학을 관리한다. 이러한 관점은 대인관계 반사성에 대한 그녀의 견해를 깊이 알려준다. Dr. Kahke, Varpio 및 Stalmeijer는 석사 및 박사 수준의 대학원생들에게 질적 연구 방법론을 가르치고 그들의 교수 실습에 반사성에 대한 논의를 통합한다. 우리 팀의 경험은 이 가이드를 형성했고, 우리는 이 연구와 작성 과정에 도움을 주었고, 이는 우리의 연구와 교육 실습에서 반사성에 대한 우리의 이해를 다시 형성했습니다. 이 기사가 우리의 집단적 전문성과 주관성으로부터 이익을 얻는다는 것을 인정하기 위해, 우리는 이 원고 전체에 1인칭 복수 "우리"와 "우리"를 사용한다.
Our team developed expertise in qualitative research through international institutions and interdisciplinary programs; thus, there are many differences in our perspectives. However, we all position our research within subjectivist or social constructionist paradigms, and our stances on reflexivity deeply reflect this perspective. The language used in this Guide explicitly identifies this perspective. Dr Olmos-Vega is an anesthesiologist with a PhD in HPE from Maastricht University. He studies how students learn through social and material interactions in the workplace using sociocultural and socio-material theories. Since he started supervising research projects, he felt frustrated by the lack of a clear guide to reflexivity that could be used by researchers interested in qualitative research. This frustration finally drove him to write this Guide. Dr Stalmeijer is an educationalist with a PhD in HPE from Maastricht University. She has a background in quality management of education and her PhD focused on the evaluation of clinical teachers using Cognitive Apprenticeship theory. She currently studies workplace learning and guidance using sociocultural theories and focuses on foregrounding the interprofessional dynamics present during workplace learning. Dr Varpio’s doctoral degree is in English, focusing on rhetoric; her HPE career has been built on careful attention to philosophies of science and how those philosophies impact research practices. Given this background and her active work as a qualitative HPE researcher, she advocates for the need to clarify the foundational principles that uphold rigor across different research paradigms and methodologies—including reflexivity. Dr Kahlke holds a PhD in Education and trained at McMaster University, the University of Alberta, and the University of British Columbia. She uses sociocultural theory and branches of critical theory (such as Critical Race Theory) to conduct her research on trainee and physician agency and social justice in healthcare systems. She has a passion for novel research strategies that can highlight participant voices and manage power dynamics that threaten the social justice aims of her work. This perspective deeply informs her views on interpersonal reflexivity. Drs. Kahlke, Varpio, and Stalmeijer teach qualitative research methodology to graduate students at both Masters and PhD levels and incorporate discussions on reflexivity in their teaching practice. Our team’s experience shaped this Guide, and we benefited this research and writing process, which reshaped our understandings of reflexivity in our research and teaching practice. To acknowledge that this article benefits from our collective expertise and subjectivities, we use the first-person plural “we” and “our” throughout this manuscript.

결론
Conclusion

이 AME 가이드에서는 반사성에 대한 명확하고 통일된 정의를 발전시켰습니다. 우리는 독자들에게 그것들을 해결하기 위한 도구와 전략을 제공하는 동시에 반사성의 여러 측면을 탐구했다. 우리는 이 가이드가 질적 연구에 관심이 있는 사람들에게 반사성 연습에 대한 간단한 접근법을 제공할 수 있다고 믿는다. 그것은 또한 그들의 학생들과 멘티들을 질적인 연구의 세계에 소개하고 싶어하는 연구 감독관들을 위한 교육 도구로 사용될 수 있을 것이다. 마지막으로 본 가이드를 통해 HPE 분야에서 엄격하고 고품질의 표준을 홍보하여 질적 연구에 대한 관심이 높아지고 있는 것을 공고히 할 수 있는 기반을 마련하고자 한다. 이 가이드를 마무리하기 위해 다음과 같은 네 가지 테이크홈 메시지를 제공합니다. 
In this AMEE Guide, we have advanced a clear and unified definition of reflexivity. We have explored multiple facets of reflexivity while giving readers tools and strategies to address them. We believe this Guide can provide a straightforward approach to reflexivity practice for those interested in qualitative research. It could also be used as a teaching tool for research supervisors who want to introduce their students and mentees to the world of qualitative research. Finally, we hope that we promote rigorous, high-quality standards in the HPE field through this Guide, cementing a solid foundation to consolidate the growing interest in qualitative research. To close this Guide, we would like to provide four take-home messages:

  • 연구 설계의 모든 측면에 포함시켜 반사성을 위한 공간과 시간을 만듭니다. 반사율을 실현하기 위한 도구와 전략을 포함하는 반사율 계획을 수립한다. 불행하게도, 반사성은 집중적인 데이터 생성과 분석을 완료해야 하는 압박이라는 긴급한 문제에서 종종 상실된다. 그러나 무분별한 결정은 질적 연구의 무결성을 위협하고, 문서의 부족은 뉘앙스와 반사적 연구에 대한 보고 능력을 손상시킨다.
  • 협업 내에 반사성을 포함시킨다. 반사성은 사려 깊고 협력적인 방법으로 도전적인 가정과 결정에 의존한다. 이를 위해서는 팀들이 상호 관계를 구축하고 의사 결정과 데이터를 함께 씨름할 시간이 필요합니다.
  • 다양한 유형의 반사성을 탐색합니다. 당신의 연구에 대인관계, 방법론, 문맥 유형을 포함하기 위해 개인적인 반사성을 넘어 모험하라. 각 유형의 뉘앙스를 탐색하고 특정 패러다임과 방법론에 따라 심층적으로 탐색할 반사성 측면을 결정합니다.
  • 당신의 주관성을 수용하라; 기본 목표로서의 객관성을 버리고 의미 있는 반사성 연습을 통해 당신의 주관성의 힘을 받아들인다. 반사율은 제한이 아니다; 그것은 당신의 연구에 있어 자산이다.
  • Make space and time for reflexivity by embedding it in all aspects of study design; construct a reflexivity plan that includes tools and strategies to actualize reflexivity. Unfortunately, reflexivity often gets lost in the pressing issues of intensive data generation and pressure to complete analyses. However, thoughtless decisions threaten the integrity of qualitative research, and lack of documentation impairs the ability to report on nuanced and reflexive research.
  • Embed reflexivity within collaborations; reflexivity relies on challenging assumptions and decisions in thoughtful and collaborative ways. To do this, teams need time to build rapport and grapple with their decisions and data together.
  • Explore different types of reflexivity; venture beyond personal reflexivity to include interpersonal, methodological and contextual types in your study. Explore each type's nuances and decide which reflexivity aspect to explore in-depth according to your specific paradigm and methodology.
  • Embrace your subjectivity; abandon objectivity as a foundational goal and embrace the power of your subjectivity through meaningful reflexivity practices. Reflexivity is not a limitation; it is an asset in your research.

Med Teach. 2022 Apr 7;1-11. doi: 10.1080/0142159X.2022.2057287. Online ahead of print.

A practical guide to reflexivity in qualitative research: AMEE Guide No. 149

Affiliations collapse

Affiliations

1Anesthesiology Department, Pontificia Universidad Javeriana, Bogotá, Colombia.

2Department of Educational Development and Research, School of Health Professions Education, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, the Netherlands.

3Department of Medicine and Center for Health Professions Education, Uniformed Services University of the Health Sciences, Bethesda, Maryland, USA.

4Division of Education and Innovation, Department of Medicine and Scientist, McMaster University, Hamilton, Canada.

PMID: 35389310

DOI: 10.1080/0142159X.2022.2057287

Abstract

Qualitative research relies on nuanced judgements that require researcher reflexivity, yet reflexivity is often addressed superficially or overlooked completely during the research process. In this AMEE Guide, we define reflexivity as a set of continuous, collaborative, and multifaceted practices through which researchers self-consciously critique, appraise, and evaluate how their subjectivity and context influence the research processes. We frame reflexivity as a way to embrace and value researchers' subjectivity. We also describe the purposes that reflexivity can have depending on different paradigmatic choices. We then address how researchers can account for the significance of the intertwined personal, interpersonal, methodological, and contextual factors that bring research into being and offer specific strategies for communicating reflexivity in research dissemination. With the growth of qualitative research in health professions education, it is essential that qualitative researchers carefully consider their paradigmatic stance and use reflexive practices to align their decisions at all stages of their research. We hope this Guide will illuminate such a path, demonstrating how reflexivity can be used to develop and communicate rigorous qualitative research.

Keywords: Reflexivity; qualitative methods; qualitative research.

 

보건전문직교육을 위한 인공지능(NAM Perspect. 2021)
Artificial Intelligence for Health Professions Educators
Kimberly Lomis, MD, American Medical Association; Pamela Jeff ries, PHD, RN, FAAN, ANEF, Vanderbilt School of Nursing; Anthony Palatta, DDS, EdD, PalattaSolutions; Melanie Sage, PHD, MSW, University at Buff alo School of Social Work; Javaid Sheikh, MD, MBA, Weill Cornell Medicine-Qatar; Carl Sheperis, PhD, MS, Texas A&M University-San Antonio; and Alison Whelan, MD, Association of American Medical Colleges

 

 

행동을 향한 요청
A Call to Action

인공지능(AI)은 이미 미국 생활의 많은 측면에 영향을 미치고 있으며, 건강 유지와 건강 관리 전달을 극적으로 변화시킬 준비가 되어 있다. 보건 전문가의 업무를 알리기 위해 이용할 수 있는 [정보의 폭발]은 그것을 효과적으로 처리할 수 있는 각 개인의 능력을 초과한다[1]. 자신의 [개인적 능력을 강화하기 위해 집단적 지식을 사용하는 법]을 배우는 것이 미래의 건강 제공자와 과거의 건강 제공자를 구별할 것이다. AI는 정통한 제공자를 대체하지 않고 보완함으로써 이러한 진화를 가능하게 할 것이다. 모든 보건직 종사자는 AI 도구를 활용하여 환자와 인구의 관리를 최적화할 수 있는 기회를 갖는다.

Artificial intelligence (AI) is already impacting many facets of American life and is poised to dramatically alter the maintenance of health and the delivery of health care. The explosion of information available to inform the work of health professionals exceeds each individual’s capacity to process it effectively [1]. Learning to wield collective knowledge to augment their own personal abilities will distinguish the health provider of the future from the health provider of the past. AI will help enable this evolution by supplementing—not supplanting—the savvy provider. All health professions have an opportunity to leverage AI tools to optimize the care of patients and populations.

2019년, 국립 의학 아카데미는 의료 분야의 인공지능이라는 제목의 특별 간행물을 발간했다. 희망, 과대광고, 약속, 위험[2]. 학습 건강 시스템의 비전을 지원하기 위해 저자들은 다음과 같이 말했다. "의사, 간호사 및 기타 임상의, 데이터 과학자, 의료 관리자, 공중 보건 공무원, 정책 입안자, 규제 기관, 의료 서비스 구매자 및 환자가 AI 및 기계 학습에서 혁명의 기본 개념, 현재 상태 및 향후 영향을 이해할 필요가 있습니다."[3] 이 원고는 이전의 특별 간행물을 보완하고 보건 전문 교육(HPE) 커뮤니티에 대한 조치 촉구 역할을 하기 위한 것입니다. 교육자들은 이제 AI의 가능성을 활용하거나 잠재적인 위험을 탐색할 준비가 되지 않은 의료 인력을 만들 위험을 감수해야 한다.

In 2019, the National Academy of Medicine released a Special Publication titled Artificial Intelligence in Health Care: The Hope, the Hype, the Promise, the Peril [2]. Intended to support the vision of a learning health system, the authors addressed “the need for physicians, nurses, and other clinicians, data scientists, health care administrators, public health officials, policy makers, regulators, purchasers of health care services, and patients to understand the basic concepts, current state of the art, and future implications of the revolution in AI and machine learning.”[3] This manuscript is intended to complement the prior Special Publication and serve as a call to action to the health professional education (HPE) community. Educators must act now to incorporate training in AI across health professions or risk creating a health workforce unprepared to leverage the promise of AI or navigate its potential perils.

AI의 개요와 의료에서의 응용
Overview of AI and its Applications in Health Care

현재 및 미래 학습자의 교육을 지도하기 위해 [AI에 대한 자신의 이해]를 높이는 것은 HPE의 리더들에게 책임이 있다. 교육적 의미에 대한 후속 논의를 뒷받침하기 위해 간략한 개요가 여기에 제공됩니다(이전 특별 간행물은 더 자세한 정보를 제공합니다).
It is incumbent on leaders of HPE to enhance their own understanding of AI in order to guide the training of current and future learners. A brief overview is provided here to anchor the subsequent discussion of educational implications (the prior Special Publication provides more detail).

AI는 다양한 방법과 기능을 포괄하는 포괄적 용어이다. "하이프"의 많은 부분은 사람처럼 기능할 수 있는 강력한 컴퓨터의 공상 과학에 초점을 맞추고 있다. 훨씬 덜 흥미진진한 [좁은 AI], 즉 단일하고 구체적인 작업을 지원하는 도구 개발이 2021년 AI의 실제 현실이다. AI에 대한 다른 용어로는 알고리즘, 머신러닝, 신경망 등이 있다. 알고리즘은 AI의 중심에 있으며 계속해서 정교해지고 있다[4]. "무엇을 해야 하는지 배우도록" 설계된 알고리즘의 목표는 컴퓨터가 각 단계마다 코딩 지침을 받지 않고 행동할 수 있도록 하는 것이다. 감지하고, 생각하고, 행동하는 기계는 몇 십 년 전만 해도 상상할 수 없었던 방식으로 의료에 영향을 미칠 것이다[2]. 그림 1은 의학 분야와 관련된 AI의 다양한 측면을 개략적으로 보여줍니다.
AI is an umbrella term encompassing multiple methods and capabilities. Much of the “hype” is focused on the science fiction vision of a powerful computer capable of functioning like a human being. The much less exciting narrow AI, or the development of a tool to support a single, specific task, is the actual reality of AI in 2021. Other terms for AI include algorithms, machine learning, and neural networks. Algorithms are at the center of AI and are continually growing in sophistication [4]. Designed to “learn what to do,” the goal of algorithms is to enable computers to act without being given coding guidance for each and every step. Machines that sense, think, and act will impact health care in ways that were unimaginable a few short decades ago [2]. Figure 1 outlines various aspects of AI as they relate to the field of medicine.

 

[희망과 약속]은 증거 기반 관행을 뒷받침하는 광범위한 데이터를 포착하고 처리하기 위한 AI의 활용에 있다. 적절하게 활용된다면, AI는 의료의 접근성, 저렴성 및 품질을 높일 것이며, 환자 데이터의 개인 정보 보호 및 보안을 강화할 수 있는 잠재력을 가지고 있다. 반복적인 작업 및 관리 정보 처리(문서 부담 등)를 오프로드하면, 의료제공자는 창의적인 사고 프로세스에 집중하고, 환자에게 보다 직접적으로 주의를 기울일 수 있다. 의료 분야에서 AI의 잠재적 역할을 완전히 분류하는 것은 본 문서의 범위를 벗어나지만, Matheny et al(표 1 참조)이 제공한 예는 분야와 직업에 걸친 응용 프로그램을 보여준다[2]. AI 도구를 파트너로 받아들이는 것은 전체 의료 시스템과 그 안에 있는 개인에 대한 증강된 지능을 초래할 것이다.
Hope and promise lie in the utilization of AI to capture and process extensive data supporting evidence-based practice. If properly leveraged, AI will increase access, affordability, and quality of health care, and has the potential to enhance privacy and security of patient data. Offloading repetitive tasks and administrative informational processing (such as documentation burdens) frees providers to focus on creative thought processes and attend more directly to their patients. It is beyond the scope of this document to fully catalog potential roles for AI in health care, but examples provided by Matheny et al (see Table 1) demonstrate applications across disciplines and professions [2]. Embracing AI tools as partners will result in augmented intelligence of the entire health care system and the individuals within it.

새로운 기술에는 잠재적인 위험이 있다. 헬스케어를 형성한 이전 기술과 비교했을 때, AI의 근본적인 차이점은 진화 능력이다. 일부 AI 도구는 특정 작업을 완료하도록 프로그래밍된 규칙 기반입니다. 그러나 [AI의 장점]은 대규모 데이터 세트에 대한 노출을 통해 도구를 훈련할 수 있다는 것이며, 이를 통해 AI는 데이터 내에서 작업을 완료하는 자체 방법을 식별할 수 있다. 현재 이러한 데이터 기반 툴은 대부분 애플리케이션 시점에 잠겨locked 있습니다. 즉, 과거 데이터를 사용하여 만들어진 공식에 새로운 데이터를 적용하여 분류한다. 그러나 일부는 지속적으로 학습할 수 있습니다. 도구가 점점 더 많은 데이터에 노출되면, 작업을 처리하는 방법도 수정될 수 있습니다. 

There is potential peril in any new technology. Compared to prior technologies that have shaped health care, a fundamental difference of AI is its capacity to evolve. Some AI tools are rules-based, programmed to complete a specific task. But an advantage of AI is the ability to train a tool via exposure to a large dataset, allowing AI to identify within the data its own method to complete a task. Currently, many such data-based tools are locked at the point of application; using past data, they apply a formula to categorize new data. But some are set to learn continuously: as the tool is exposed to more and more data, it may modify how it addresses the task.

적응 학습 능력은 AI의 경이로움이자 위협이다. 외과의사가 손을 흔들 때 수술 기구가 변형되는 것과 유사하게, 지속적인 AI 도구는 생산량과 성능을 비판적으로 평가할 때 의료 전문가의 주의를 필요로 한다. AI 도구의 설계 및 적용에 대한 인간의 기여는 이미 미국 의료 시스템에 침투한 것과 동일한 편향으로 가득 차 있으며, 그러한 편향은 면밀히 모니터링하지 않으면 AI에 의해 증폭될 수 있다[5]. 따라서 AI 도구의 부상은 임상 추론 및 증거 기반 의학과 같은 분야에서 [인간의 과실을 인정할 필요성]을 상기시키면서 기존 보건 전문가 훈련에 영향을 미친다. 현재 AI 개발의 상당 부분은 경제적 동인과 기업의 이해관계에 의해 형성되고 있다. 의료 제공자들은 [환자와 지역사회의 요구에 대한 옹호자]로서의 역할을 하기 위해 정보를 얻어야 한다. 모든 의료 제공자는 [약속을 극대화하고 위험을 완화]하기 위해 AI에 대한 기본적인 이해가 필요하다.

The ability for adaptive learning is simultaneously the wonder and threat of AI. Analogous to a surgical instrument morphing in the surgeon’s hand as they wield it, continuous AI tools require vigilance from health professionals in critically appraising their outputs and performance. Human contribution to the design and application of AI tools is fraught with the same bias already infiltrating U.S. health care systems, and such bias could be amplified by AI if not closely monitored [5]. The rise of AI tools thus has implications for existing health professions training, reminding of the need to acknowledge human fallibility in areas such as clinical reasoning and evidence-based medicine. Currently, much of AI development is shaped by economic drivers and corporate interests; health providers must be informed to serve as advocates for the needs of patients and communities. All health providers need foundational understanding of AI in order to maximize the promise and mitigate the peril.

AI는 효과적인 [전문직 간 협업 관행]을 가속화할 수 있는 큰 잠재력을 가지고 있다. AI는 [전문적 정체성의 닻]을 [특정 지식의 기금 보유]에서 [해당 정보에 접근, 평가 및 적용하는 전문성]으로 전환하면서 제공자 역할의 근본적인 변화를 촉진할 것이다. 각 제공자는 더 넓은 범위의 정보를 이용할 수 있지만, 각 직업의 고유한 관점은 해당 정보의 의미 있는 적용에 필수적인 것으로 남아 있을 것이다. 학습 조직을 지원하고 건강 시스템을 지속적으로 개선하기 위해 [전문직 간 렌즈]는 AI의 효과적인 교육을 개발하는 데 중요하다[6].

  • "교육자, 의료 시스템 리더 및 정책 입안자 간의 [조정된 계획]은 최적의 학습 환경과 효과적인 의료 인력을 만들기 위한 전제 조건입니다(Cox and Naylor, 2013). [조정된 계획]을 위해서 교육자는 의료 시스템의 지속적인 재설계 노력을 인식해야 하고, 의료 시스템 리더가 유능한 의료 인력을 교육하고 훈련하는 현실을 인식해야 합니다."[7].

AI holds great potential to accelerate effective interprofessional collaborative practice. AI will spur a fundamental alteration in provider roles, shifting the anchor of professional identities from the possession of a specific fund of knowledge toward expertise in accessing, assessing, and applying that information. A greater breadth of information will be available to each provider, but the unique perspectives of each profession will remain essential in the meaningful application of that information. To support a learning organization and continuously improve the health system an interprofessional lens is critical to developing effective education in AI [6].

  • “Coordinated planning among educators, health system leaders, and policy makers is a prerequisite for creating an optimal learning environment and an effective health workforce (Cox and Naylor, 2013). Coordinated planning requires that educators be cognizant of health systems’ ongoing redesign efforts, and that health system leaders recognize the realities of educating and training a competent health workforce” [7].

일부 의료 전문가들은 AI 도구의 개발, 구현 및 진화에 있어 [의료 제공자의 중요한 영향력]을 제공하기 위해 AI를 직업의 초점으로 삼고 광범위한 훈련을 추구할 것이다. 그러나 이 행동 요구는 [모든 의료 전문가]의 준비에 초점을 맞추고 있다. 즉, 일상적인 치료 제공에 다양한 AI 도구를 활용할 사람들을 준비시키는 것이다. 의료 전문가들은 비판적 추론과 데이터 분석의 원칙이 이미 의료 훈련의 기본이라는 점에서 AI를 업무에 통합하는 방법을 성공적으로 학습하는 데 유리하다.

  • "AI 미래의 의료 종사자들은 정보 시스템을 사용하고 상호 작용하는 방법을 배워야 할 것이다. 이를 위해서는 다음을 알아야 한다. 
    • 정보 검색 및 통합,
    • 통계 및 근거 기반 의학에서 평가의 기초 교육,
    • 진단 성능 측정의 관점에서 예측 모델의 해석[2]. "

AI가 도구라기보다는 동료로 인식될 수 있기 때문에, 이러한 상호 작용은 제공자의 태도 변화를 요구할 것이다. HPE의 리더들은 모든 제공자들이 AI의 책임 있는 배치에 기여할 수 있도록 긴급히 행동해야 한다.

Some health professionals will make AI a focus of their careers and will pursue extensive training in order to provide the critical influence of health care providers in the development, implementation, and evolution of AI tools. This call to action, however, focuses on the preparation of all health care professionals — those who will utilize a variety of AI tools in their routine provision of care. Health professionals are at an advantage to successfully learn how to incorporate AI into their work, in that principles of critical reasoning and data analysis are already fundamental to health care training.

  • “Health care workers in the AI future will need to learn how to use and interact with information systems, with foundational education in information retrieval and synthesis, statistics and evidence-based medicine appraisal, and interpretation of predictive models in terms of diagnostic performance measures” [2].

Such interactions will demand an attitudinal shift in providers, as AI may be perceived more as a colleague than a tool. It is imperative that leaders of HPE urgently act to ensure that all providers are positioned to contribute to the responsible deployment of AI.

동시에 교육자가 교육 과정 자체 내에서 강력한 AI 도구를 활용할 가능성이 있다. 교육 프로그램과 관련된 [행정적 부담]은 AI에 의해 상쇄될 수 있으며, 이는 교육자들이 그들의 작업의 더 창의적이고 관계적인 측면에 집중할 수 있게 한다. 특히 흥미로운 점은 경력을 통해 각 전문가의 교육을 강화할 수 있는 기회이다. "정밀의학"과 유사하게, 교육자들은 훈련과 평가를 개인화하기 위해 데이터를 활용함으로써 "정밀 교육"을 육성할 수 있다. 데이터는 교육 자원의 전략적 배치를 알리고 실습과 교육 간의 연결을 강화할 수 있으며, 교육자는 적절한 도구 개발을 옹호할 수 있습니다.
Simultaneously, there is potential for educators to exploit powerful AI tools within the process of education itself. Administrative burdens associated with educational programs could be offset by AI, freeing educators to focus on more creative and relational aspects of their work. Particularly intriguing is the opportunity to enhance the education of each professional throughout one’s career. Analogous to “precision medicine,” educators can foster “precision education” by leveraging data to individualize training and assessment. Data can inform the strategic deployment of educational resources and strengthen the link between practice and education, and educators can advocate for the development of appropriate tools.

따라서 이 원고는 보건 전문 교육자들이 현재 고려해야 하는 이중성, 즉 [AI에 대한 훈련]의 필요성과 [훈련에서 AI의 역할]을 다룬다.
This manuscript thus addresses the duality that health professions educators must consider now: the need for training in AI and the role of AI in training.

 

보건 전문 교육에 AI를 통합하는 것에 대한 망설임 해소
Addressing Hesitance to Incorporating AI into Health Professions Education

이 원고의 저자는 다양한 교육 현장에서 그리고 보건 분야의 청중들과 함께 AI에 대한 더 나은 훈련을 옹호할 기회를 가졌다. 투명한 방식으로 직접 다루어야 하는 그러한 논의에서 많은 의구심이 제기되었다. 회의론은 이러한 행동 요구를 부정할 수 없다. 실제로 AI에 대한 많은 우려는 [학습자를 위한 더 많은 적절한 교육]을 강력히 주장한다[8,9].
The authors of this manuscript have had the opportunity to advocate for better training in AI in various educational venues and with audiences across health professions. Many doubts have been raised in those discussions, which warrant addressing directly in a transparent manner. Skepticism cannot negate this call to action; indeed, many of the concerns about AI argue all the more for appropriate education of learners [8,9].

인공지능에 대한 두려움은 로봇이 창조자를 추월하는 디스토피아 사회로 이어지며 공상 과학 소설을 통해 불멸로 이어졌고, 일부 사람들은 AI의 위험이 그 이점보다 훨씬 크다고 믿게 되었다. 의료 및 HPE 내에서 AI에 대한 우려는 더 구체적이며, 따라서 더 쉽게 해결되어야 한다. 일반적인 경악의 주제에는 다음이 있다.

  • 잠재적인 일자리 감소에 대한 우려,
  • 전통적인 "전문가" 역할에 대한 위협,
  • 기존 정보 기술 및 전자 건강 기록(EHR) 시스템에 AI를 통합하기 위한 전략의 부족,
  • 데이터 수집 및 분석에 관해 잘 훈련된 팀의 부족,
  • AI가 결정이 완전히 투명하지 않은 "블랙박스"인 임상 도구인 것에 대한 우려

Fear of AI leading to a dystopian society where robots overtake their creators has been immortalized through science fiction, leading some to believe that the dangers of AI far outweigh its benefits [10]. Within health care and HPE, concerns about AI are more specific, and therefore should be more readily addressed. Common topics of consternation include

  • concerns for potential job loss,
  • threats to the traditional “expert” role,
  • a lack of strategies for integrating AI into current information technology and electronic health record (EHR) systems,
  • shortage of a well-trained team in data collection and analysis [11], and
  • concerns about AI being a clinical tool that is a “black box” in which decisions are not fully transparent.

AI의 기본 전제는 보건 전문가와 교육자의 업무를 [대체하는 것]이 아니라 [보완하는 것]이다. 이 개념을 오해하는 것은 변화에 대한 보다 근본적인 저항과 함께 실제와 교육에서 AI에 대한 망설임의 주요 원인이다. AI가 무엇이고 할 수 있거나 할 수 없는지에 대한 지식의 부족은 이러한 저항에 기여한다. 방사선학과 병리학의 의학 분야는 이러한 점들을 예시한다. 연구는 알고리즘이 악성 종양을 식별하는 데 있어 방사선사를 능가한다는 것을 입증했지만, 그것은 AI가 방사선사를 대체할 가능성보다는 도구로서의 AI의 가치에 더 많은 것을 말해준다[12]. 사실, 인공지능 시스템은 방사선 이미지를 읽고 해석하는 것과 같은 특정 작업을 수행하도록 설계되었다. 방사선과 의사는 또한 AI를 통해 생산된 여러 접점을 통합하고, 다른 건강 전문가와 상담하며, 환자와 상호 작용할 것으로 기대된다. — 이 모든 것은 인간과 인간의 상호 작용을 위해 가장 적절하게 설계된 역할이다.

The basic premise of AI is to supplement, not supplant, the work of health professionals and educators. Misunderstanding this concept is a primary cause of hesitancy around AI, in practice and in education, along with a more fundamental resistance to change. A lack of knowledge of what AI is and can or cannot do contributes to this resistance. The medical disciplines of radiology and pathology exemplify these points. Studies have documented that algorithms outperform radiologists in identifying malignant tumors, but that speaks more to the value of AI as a tool rather than the likelihood that AI will replace radiologists [12]. In fact, AI systems are designed to accomplish specific tasks like reading and interpreting radiographic images; radiologists are also expected to integrate multiple touch points produced through AI, consult with other health professionals, and interact with patients — all of which are roles most appropriately designed for human-to-human interaction.

다른 건강 직업의 예로는 [정신 건강 관리와 관련된 AI]의 발전이 있다. AI는 전 세계 정신 건강 전문가의 심각한 부족을 해결하기 위해 활용되고 있다. 임상적으로 입증된 인지행동치료(CBT) 챗봇 플랫폼인 Worebot은 AI를 사용하여 사용자와 치료 동맹을 형성하고 개별 제시 증상을 기반으로 CBT 접근 방식을 채택한다[13].
Examples from other health professions include advances in AI related to mental health care. AI is being utilized to address the critical shortage of mental health professionals throughout the world. Woebot, a clinically proven Cognitive Behavioral Therapy (CBT) chatbot platform, uses AI to form a therapeutic alliance with the user and adapts the CBT approach based on the individual presenting symptoms [13].

정신 건강에서 임상적으로 입증된 또 다른 AI 구현은 테스Tess로, 사용자의 행동 변화를 촉진하기 위해 교육, 대화 및 치료 접근 방식을 채택한다[14]. 테스는 전 세계적으로 1천9백만 명 이상의 사람들에 의해 이용되었다. 수백만 명의 사람들이 정신 건강 전문가의 업무를 보완하기 위해 AI를 사용하고 있지만, 역량 영역은 AI 접근 방식과 관련하여 실무자가 필요로 하는 지식 기반을 반영하거나 기존 AI 사용의 치료 과정에 필요한 통합을 반영하기 위해 업데이트되지 않았다. 딥 러닝 및 고급 데이터 분석과 같은 AI의 특정 애플리케이션은 의료 전문가의 대체자로 간주되지 않고 파트너 및 협력자로 간주될 수 있다[15]. AI가 제공자를 대체하는 것이 아니라, AI를 활용하는 제공자가 그렇지 않은 제공자를 대체할 것이다.
Another clinically proven AI implementation in mental health is Tess, which employs educational, conversational, and therapeutic approaches to foster behavior change in the user [14]. Tess has been used by more than 19 million people worldwide. While millions of people are using AI to supplement the work of mental health professionals, competency domains have not been updated to reflect the knowledge base that practitioners need in relation to AI approaches or to reflect the needed integration of existing AI usage into the treatment process. Certain applications of AI, like deep learning and advanced data analytics, could be viewed as partners and collaborators and not feared as displacers of health care professionals [15]. AI will not replace providers, but providers who leverage AI will replace those who do not.

이미 보건 분야 전반에 걸쳐 [과부하가 걸린 커리큘럼]은 학습자를 위해 AI에 추가 역량을 추가하는 것에 대한 저항을 불러일으킨다. 촘촘한 커리큘럼은 학생들의 복지와 교직원의 번아웃에 영향을 미친다. 그러나 모든 진화하는 의료 영역과 마찬가지로 [AI가 기존 콘텐츠와 어떻게 관련되는지 결정]하고, [모든 콘텐츠 영역에 대해 향후 practice에 미치는 상대적 영향을 평가]하는 것이 향후 경로를 식별하기 위해 중요할 것이다. 보건 분야의 새로운 정보가 기하급수적으로 증가함에 따라, "정보 과부하"는 학생들과 교육자들의 정신의 인지 및 정신적 능력을 계속해서 압도하고 있다. 이러한 모순이 커짐에 따라 교육에 대한 보건 전문 교육자들의 생각이 바뀌었고, 현재와 같은 오랜 "정보 획득" 모델이 아닌 "지식 관리"에 학습을 다시 집중해야 한다는 요구가 제기되었습니다. 여기서 아이러니한 점은 AI를 보건직의 과목으로 추가하고 교육과정을 관리하는 도구로 추가하면 실제로 교육과정 부담을 줄일 수 있다는 것이다. 일부 생물의학 및 임상 지식을 AI 알고리듬으로 마이그레이션함으로써 교육자는 보건 전문 교육과정에 더 많은 숨통을 틔우고 학생과 교직원의 실제 경험에 주입할 수 있다[16,17].
The already overloaded curriculum across health professions creates resistance to adding additional competencies in AI for learners. The dense curriculum has implications for students’ well-being and faculty burnout. But, as with all evolving areas of medicine, determining how AI relates to existing content and weighing the relative impact of all areas of content on future practice will be critical in order to identify paths forward. As new information in the health professions continues to exponentially grow, “information overload” continues to overwhelm the cognitive and mental capacity of students’ and educators’ minds. This growing incongruence has led to a shift in health professions educators’ thinking regarding instruction, with calls to refocus learning on “knowledge management” rather than the current and long standing “information acquisition” model. The irony here is that the addition of AI as a subject in health professions and as a tool to manage the curriculum can actually reduce curricular load. By migrating some biomedical and clinical knowledge to AI algorithms, educators can instill more breathing room into health professions curricula and into the lived experiences of students and faculty [16,17].

AI에서 교육과정을 만들고 전달할 수 있는 [적절한 전문성을 갖춘 교수진의 부족]도 우려된다. 교육 프로그램과 보건 시스템의 전문가들 사이의 새로운 관계를 개발하는 것이 출발점을 제공할 수 있다. 교육과정 감독을 담당하는 보건직 교직원은 인공지능과 수학적 모델링, 결정론 등 주제에 대한 디지털 활용능력을 향상시켜야 할 것이며, 그만큼 교직원의 육성이 우선돼야 한다. 마찬가지로, 교육 과정을 개선하기 위해 AI를 가장 잘 활용할 수 있는 지식과 기술의 부족과 그러한 도구를 개발할 수 있는 자원의 부족은 진전을 방해한다.
There is also concern about a lack of faculty with the appropriate expertise to create and deliver curricula in AI. Developing new relationships between the educational program and experts in the health system may offer a starting point. Health professions faculty members responsible for curricular oversight will need to improve their digital literacy regarding AI and topics such as mathematical modelling and decision theory, and as such, faculty development must be a priority. Similarly, a lack of knowledge and skills to best utilize AI to enhance the process of education and lack of resources to develop such tools stymies progress.

예측 분석을 위해 AI와 머신러닝을 사용하거나 작업량을 상쇄하는 보건 전문 강사는 [빅데이터와 알고리즘의 편향]과 관련된 유익성과 위해성 모두에 대해 교육을 받아야 한다. 마이크로소프트의 봇 테이Tay의 예는 감독되지 않은 기계 학습에 대한 경고적인 이야기이다. "대화적 이해"를 위한 실험으로 설계된 Tay는 공개적으로 AI 트위터 사용자로 자리매김했다. 24시간 이내에 해커들은 혐오와 인종차별적 댓글로 시스템을 압도했고, Tay는 데이터 입력을 반영한 메시지를 쏟아냈다[18]. 학생과 교육자는 AI가 정체된 기능이 아니며 지속적으로 분석, 평가 및 업데이트되어야 한다는 것을 깨달아야 한다. 인공지능 알고리즘의 효율성은 인간이 수집한 데이터에 의해 영향을 받기 때문에 무의식적인 편견이 의도하지 않게 통합될 수 있다. 이전에 수행된 연구는 과소 대표되고 소외된 그룹이 전통적으로 데이터 세트에서 제외되었기 때문에 AI 파생 결과에 편견을 추가할 수 있다[19]. AI 교육은 보건 전문가들이 자신의 무의식적 편견을 이해하고 보건 전문가에 대한 불신의 역사가 있는 소외된 집단에게 AI가 지원하는 의사 결정을 설명하는 데 도움이 되는 기술을 개발하는 데 매우 중요하다.

Health professional instructors who use AI and machine learning for predictive analytics or to offset their workloads must be educated on both the benefits and the risks regarding bias in big data and algorithms. The example of Microsoft’s bot Tay is a cautionary tale of unsupervised machine learning. Designed as an experiment in “conversational understanding,” Tay was established as an openly AI Twitter user. Within 24 hours, hackers overwhelmed the system with hateful and racist comments, leading Tay to spew messages reflective of its data input [18]. Students and educators must realize that AI is not a stagnant function and must be constantly analyzed, evaluated, and updated. Because the efficacy of AI algorithms is impacted by the data collected by humans, unconscious biases can be incorporated unintentionally. Previously conducted research can also add biases to AI-derived outcomes because underrepresented and marginalized groups have traditionally been excluded from datasets [19]. Education in AI is critical so that health professionals understand their own unconscious biases and develop the skills to help explain AI-supported decision making to marginalized groups that have a history of mistrust with and in the health professions.

[AI의 잠재적인 부정적인 영향에 대한 우려]와 [교육 조정을 실행할 수 있는 자원의 부족]은 교육자들이 지금 이 과제를 해결해야 한다고 주장한다. 교육자는 모든 제공자가 환자를 돌보고 보호해야 할 전문적인 의무를 이행할 수 있도록 하는 교육을 제공하는 것이 필수적이다. 인공지능의 추가 개발과 통합은 일부 교육자들의 두려움이나 우려 때문에 멈추지 않을 것이다. 보건 분야와 컴퓨터 과학자들 사이의 대화를 촉진하고 파트너십을 개선하면 현실적이고 유용하며 효과적으로 적용되는 기술의 개발이 가능해질 것이다. 중요한 것은, 현재 교육받고 있는 학생들과 학습자들인 건강 직업의 미래는 HPE와 실습에서 AI에 대한 더 긍정적인 수용을 보여주었다. 방사선과 레지던트들을 대상으로 실시한 연구에 따르면, 대다수의 학생들은 AI가 방사선과학을 혁신(77%)하고 개선(86%)할 것이라는 데 동의한 반면, 인간 방사선과 의사가 교체될 것이라는 진술(83%)에는 동의하지 않는 것으로 나타났다. 3분의 2 이상이 AI가 의료 훈련에 포함되어야 한다는 필요성에 동의했다(71%) [20]. 보건 전문 교육자들이 안전하고 양질의 환자 치료를 제공하기 위해 학습자가 임상 환경에서 AI의 사용을 이해하고 지원할 수 있도록 포지셔닝해야 할 때이다.

Concerns about potential negative impacts of AI and a lack of resources to implement educational adjustments argue all the more for educators to tackle this challenge now. It is imperative that educators provide training that empowers all providers to fulfill their professional duty to care for and protect patients. The further development and incorporation of AI will not stop due to the fears or concerns of some educators. Promoting a dialogue and improving partnerships between the health disciplines and computer scientists would enable the development of realistic, usable, and effectively applied technology. Importantly, the future of the health professions, the students and learners being educated now, have demonstrated a more positive acceptance of AI in HPE and practice. A study conducted with radiology residents showed that a majority of students agreed that AI will revolutionize (77 percent) and improve (86 percent) radiology, while disagreeing with statements that human radiologists will be replaced (83 percent). More than two-thirds agreed with the need for AI to be included in medical training (71 percent) [20]. The time is right for health professions educators to position their learners to understand and support the use of AI in the clinical setting with the intent to provide safe, quality patient care.

따라서 보건 전문 교육자들은 보건 및 의료 제공에서 AI의 출현의 두 가지 측면을 고려해야 한다.

  • 보건 전문가들이 그들의 일을 잘하기 위해 어떤 AI 교육이 필요할까?
  • 보건 전문가의 교육을 개선하기 위해 AI 기능을 어떻게 활용할 수 있습니까?

Thus, health professions educators must consider two aspects of the emergence of AI in health and health care delivery:

  1. What training in AI will health professionals need to do their jobs well?
  2. How can AI capabilities be leveraged to improve the training of health professionals?

 

AI 교육
Training in AI

앞서 언급했듯이, 이 원고의 범위는 모든 제공자의 기본적 요구를 고려하는 것이지, [AI 개발을 전문으로 선택할 사람들]의 요구를 개략적으로 설명하는 것이 아니다. 모든 분야가 이 과정에서 비교적 초기 단계이고 AI가 발전함에 따라 직업 간 업무 관계가 바뀔 가능성이 높기 때문에 AI 훈련은 전문 교육 접근에 무르익었다. 서로에 대해, 서로에게서, 그리고 함께 배우는 것은 보건 전문가들이 위험을 예측하고 완화하고 AI의 가능성을 증폭시킬 수 있는 풍부한 관점을 추가한다. 다음 영역은 AI에 대한 교육에서 다루어야 할 핵심 요소를 요약한다.

As mentioned previously, the scope of this manuscript is to consider foundational needs of all providers, not to outline the needs of those who will choose to specialize in AI development. Training in AI is ripe for interprofessional educational approaches because all fields are relatively early on in this process and the relationships of work across professions will likely shift as AI advances. Learning about, from, and with one another adds rich perspectives that will enable health professions to anticipate and mitigate perils and amplify the promise of AI. The following domains outline key elements to be addressed in education about AI.

 

정보 오버로드
Information Overload

역사적으로 [정보의 획득, 정보의 합성 및 적절한 적용]은 의료 전문가의 훈련을 특징지었다. EHR, 이미징, 생체인식, 멀티오믹스 및 센서를 통한 원격 모니터링의 [데이터가 폭발적으로 증가]하기 때문에, 이러한 데이터의 분석을 관리하는 데는 정교한 알고리즘의 적용이 점점 더 필요하다. 기존 커리큘럼은 더 이상 지식 관리와 기계 학습 및 데이터 분석의 효과적인 활용이 필요한 진화하는 요구에 의료 전문가를 대비시킬 수 없습니다[16]. 또한 훈련생은 사람들이 행동을 적응하고 건강한 생활방식을 선택하는데 도움이 되는 여러 디지털 도구(예: Apple Watch는 수면 평가를 포함한 다양한 생리학적 측정치를 수집할 수 있음)를 사용하여, 상세하고 개인화된 데이터를 수집할 수 있기 때문에, 정밀 건강에 점점 더 초점을 맞출 수 있도록 준비해야 한다. [정보 과부하]라는 이 과제를 명시적으로 명명하는 것은 보건 전문가 학습자들이 AI 지원과 지속적인 학습의 필요성을 이해하는 데 도움이 된다.

Historically, acquisition of information, its synthesis, and proper application has characterized health care professionals’ training. Due to the explosion of data from EHRs, imaging, biometrics, multi-omics, and remote monitoring via sensors, managing analyses of such data increasingly requires application of sophisticated algorithms. Traditional curricula can no longer prepare health professionals for the evolving needs that require knowledge management and effective utilization of machine learning and data analytics [16]. In addition, trainees need to be prepared for an increasing focus on precision health due to the ability to gather detailed, personalized data using multiple digital tools (e.g., an Apple Watch can collect various physiological measurements including sleep assessment) that will help people adapt their behavior and make healthy lifestyle choices. Explicitly naming this challenge of information overload helps health professions learners understand the need for AI support and for their own continual learning.

 

인공지능의 기반
Foundations in AI

모든 제공자는 [AI가 무엇인지, AI가 어떻게 작동하는지, 그리고 현재 실행 중인 다른 형태의 기술과 어떻게 다른지에 대한 근본적인 이해]가 필요하다. 보건 전문가의 업무에 AI가 적용되는 다양한 방법에 대한 일반적인 이해는 훈련의 초기 단계에서 적절합니다. 주어진 분야에서 발전함에 따라, 자신의 분야에서 사용되는 더 구체적인 응용 분야에서 추가적인 훈련이 필요할 것이다. [규제 및 윤리적 문제]를 포함하여 [AI 애플리케이션을 감독oversight]하는 제공자의 역할을 이해하는 것은 이러한 새로운 도구가 [약속을 최적화하고 잠재적 위험을 최소화]하는 방식으로 사용되도록 보장하는 [집단적 전문적 의무]를 충족하는 데 도움이 될 것이다.
All providers need a fundamental understanding of what AI is, how it works, and how it differs from other forms of technology currently in practice. A general understanding of various ways in which AI is applied to the work of health professionals is appropriate at early stages of training; as one advances in a given field, additional training will be needed in more specific applications used in one’s discipline. Understanding the provider’s role in oversight of AI applications, including regulatory and ethical concerns, will aid in meeting the collective professional obligation to ensure that these new tools are used in a manner that optimizes their promise and minimizes potential perils.

 

새로운 역량
New Competencies

최근 문헌은 HPE에 통합될 AI의 훈련 요소에 대한 제안을 제공한다. 맥코이 외 [21] 광범위한 역량을 다음과 같이 설명한다.

의료 전문가들이 의료 서비스 제공에서 수행해야 하는 새로운 역할:

  • 평가자: 주어진 임상 상황에 [테크놀로지 활용이 적합한 시점]이 언제이며, 의미 있는 결과를 위해 [필요한 입력이 무엇인지]를 평가할 수 있는 능력
  • 해석가: 오류, 편향 또는 임상적 부적절성의 잠재적 원인을 아는 것을 포함하여, 합리적인 정확도로 지식과 기술에 대한 해석
  • 소통가: 환자 및 기타 의료 전문가가 [이해할 수 있는 방식]으로 결과 및 기본 프로세스 전달

더 넓은 전문적 맥락에서 AI를 이해할 수 있는 역량:

  • 스튜어드십: 환자 데이터에 대한 책임 있는 스튜어드(지킴이)가 되어 공급자와 환자 간의 기본적인 신뢰를 보장합니다.
  • 어드보커시: 데이터 보안 및 개인 정보 보호와 관련된 위험 이해—의료 제공자는 [윤리적이고 공정한 시스템] 개발 및 배치를 옹호할 준비가 되어 있어야 합니다.

Recent literature offers suggestions regarding the elements of training in AI to be incorporated into HPE. McCoy et al. [21] describe broad competencies as:

New roles that health professionals must assume in delivering care:

  • Evaluator: Being able to evaluate
    • when a technology is appropriate for a given clinical context and
    • what inputs are required for meaningful results
  • Interpreter: Interpretation of knowledge and skills with a reasonable degree of accuracy including knowing potential sources of error, bias, or clinical inappropriateness
  • Communicator: Communication of results and underlying process in a way that patients and other health professionals can understand

Competencies for understanding AI in a broader professional context:

  • Stewardship: Be a responsible steward for patient data to ensure basic trust between provider and patient
  • Advocacy: Understand the risks around data security and privacy—health care providers must be equipped to advocate for the development and deployment of ethical and equitable systems

McCoy 등과 Law 등은 [기본적인 컴퓨터 프로그래밍 기술]에 대한 보건 전문가의 명시적 훈련, 소프트웨어 설계의 모범 사례에 대한 이해, 그리고 새로운 도구를 실무에 통합하는 방법을 구상하는 능력에 대한 추가적인 필요성을 주장한다[20, 21]. [프로그래밍 훈련]이 모든 보건 전문직 학생들에게 필요한 것은 아니지만, 그들 모두는 알고리즘 개발 및 유지보수의 모범 사례와 한계에 대한 근본적인 이해가 필요하다.
McCoy et al. and Law et al. argue for the additional need for explicit training of health professionals in fundamental computer programming skills, an understanding of good practices in software design, and the ability to envision how to incorporate new tools into practice [20, 21]. Training in programming may not be indicated for every health professions student, but all of them need a fundamental understanding of best practices in, and limitations of, algorithmic development and maintenance.

 

역량을 폭넓게 고려
Considering Competency Broadly

인공지능에 대한 지식을 넘어, 보건 직업에 필요한 다른 역량 영역도 영향을 받을 것이다. AI가 제공자의 작업을 대체하지 않고 보완할 것이라는 것을 받아들이는 것은 제공자가 AI와 효과적으로 협력하기 위해 필요한 질적 속성에 대한 신속한 고려가 보증되고 필요하다. 예를 들어, AI가 임상적 만남에 통합됨에 따라, 보건 전문직 학생들은 진료 전달의 중요한 휴머니즘 요소를 유지하기 위해 [새로운 의사소통 기술과 전문성에 대한 훈련]이 필요하다. 기술에 민첩하면서도 환자와 효과적으로 연결할 수 있는 전문가를 준비하기 위해 명확한 의사소통, 공감 배양, 건강 옹호 및 협업과 같은 기술에 대한 강조가 점점 더 필요할 것이다[22, 23]. 의사소통, 공감 및 배려를 촉진하려면 더 많은 관심과 전문지식이 필요합니다 [24]. 많은 사람들, 그리고 아마도 가장 많은 지노 윅맨에게 귀속된 인용구를 참조하기 위해, "예측 가능한 것을 체계화하라, 그러면 당신은 예외적인 것을 인간화할 수 있다."  이런 '하이테크, 하이 터치' 방식이 인기를 끌고 있는 것으로 보인다. 2016년 미국 의과대학 협회 자료에 따르면, 의과대학의 94%가 필수 또는 선택 과목을 제공하여 학생들이 다양한 환자의 요구를 더 잘 이해할 수 있도록 포지셔닝하는 등 지난 몇 년 동안 [의학 인문학 훈련]이 지속적으로 증가해왔다[25].

Beyond knowledge of AI, other competency domains necessary for health professions will be impacted as well. Accepting that AI will supplement, not supplant, the work of providers, prompt consideration of the qualitative attributes that providers need to partner effectively with AI is both warranted and necessary. For example, as AI is incorporated into clinical encounters, health professions students need training in new communication skills and professionalism to retain the critical humanist elements of care delivery. Increased emphasis on skills such as clear communication, empathy cultivation, health advocacy, and collaboration will be increasingly needed to prepare professionals who can connect effectively with patients while being facile with technology [22, 23]. Fostering communication, empathy, and caring will require more attention and expertise [24]. To reference a quote that is attributed to many, but perhaps most to Gino Wickman, “Systemize the predictable, so you can humanize the exceptional.” Such a “high tech, high touch” approach seems to be gaining popularity. According to 2016 Association of American Medical Colleges data, training in medical humanities has consistently increased during the past few years, with 94 percent of medical schools offering either required or elective courses positioning students to better understand the needs of diverse patients [25].

 

기존 콘텐츠 재고
Rethinking Traditional Content

AI의 출현은 또한 [전통적인 콘텐츠의 영역을 새로운 방식으로 다룰 필요가 있다는 증거]를 제시한다. 의사 결정 시 임상의가 이용할 수 있는 [정보의 확산은 개인 제공자의 처리 능력을 초과]했다. 인공지능은 집단지식으로 개인의 역량을 강화함으로써 도움을 줄 수 있다. 이는 최근 수십 년 동안 [인간 진단 오류의 현실]에 대한 인식 증가를 반영한다[26]. 비슷하게, 사회는 건강 관리를 포함한 모든 시스템에 스며드는 [구조적 편견]을 수용하고 있다. 앞서 언급했듯이, 많은 사람들은 AI가 이미 존재하는 편견을 증폭시킬 수 있는 위험을 빠르게 지적하는데, 이는 인간의 편견과 건강의 기존 구조적 결정 요인에 대한 더 강력한 훈련을 주장한다. 그러므로 건강 전문직 학생들은 메타인식(인간이 어떻게 생각하고 결정을 내리는지에 대한 이해)에 대한 더 깊은 훈련이 필요하다. 

The emergence of AI also presents evidence that traditional areas of content may need to be addressed in new ways. The proliferation of information available to clinicians at the time of decision making has exceeded the processing capacity of an individual provider; AI can assist by augmenting one’s individual capabilities with collective knowledge. This reflects increasing acknowledgment over recent decades of the realities of human diagnostic error [26]. Similarly, society is coming to terms with the structural biases that permeate every system, including health care. As noted previously, many are quick to point to the risk that AI could amplify bias that already exists, which argues for stronger training around human bias and existing structural determinants of health. Health professions students thus need deeper training in metacognition — an understanding of how humans think and make decisions.

역사적 편견을 인식하고 극복하려면 체계적인 훈련 프로그램이 필요하다[27]. AI는 기존 데이터 세트를 활용하기 때문에 건강 데이터의 [체계적이고 역사적인 편견, 오류 및 누락]을 강조하기 위한 추가 교육이 필요하다. 의료 전문가들은 데이터 품질을 보장하는 책임을 수용하도록 교육받아야 한다. 모든 제공자는 환자와 지역사회에 대한 정보 수집(그리고 더 중요하게는 문서화)에 기여한다. [책임 있는 문서화 프로세스에 관한 교육]과 [EHR에 대한 적절한 기여]는 AI가 의존하는 데이터 세트를 강화할 것이다. 마지막으로, 임상의는 특정 환경과 특정 모집단에서 AI 응용 프로그램의 관련성을 결정할 때 건강 및 건강 관리의 맥락에 대한 이해를 적용할 수 있도록 학습해야 한다.

Systematic training programs are required to become aware of and to overcome historical biases [27]. Because AI draws on existing datasets, additional training is needed to emphasize systematic and historical biases, errors, and omissions in health data. Health professionals must be trained to embrace responsibility for ensuring data quality. All providers contribute to the collection of — and, importantly, the documentation of — information about patients and communities. Education in responsible documentation processes and appropriate contribution to EHRs will strengthen the datasets on which AI relies. Finally, clinicians must be taught to apply an understanding of contexts of health and health care when determining the relevance of AI applications in a particular milieu and for particular populations.

 

전문직 간 역할 전환
Shifting Interprofessional Roles

HPE는 [전문직 간 관행 패턴의 변화]를 예상해야 한다. 의료 제공자가 되는 것이 무엇을 의미하는지에 대한 비전은 [개인이나 주어진 공동체의 요구에 정보를 접근하고 평가하고 적용]하는 데 있어 [정보의 개별 책임자]에서 [시스템 사고 전문가]로 이동할 것이다. 각 제공자는 데이터 입력이 치료 및 치료를 안내하는 AI 출력에 영향을 미친다는 것을 배우는 것이 중요하다. 인공지능으로 연결된 [웨어러블 기기]는 예방과 관리 전달을 점점 더 통합할 것이다. 디지털 건강 리터러시 훈련은 특정 보건 직업의 관점에서 그러한 데이터에 대한 이해를 촉진하는 동시에, 그러한 정보가 다른 보건 직업과 더 넓은 보건 시스템의 전문지식에 어떻게 적합한지를 인식하는 데 필요하다. 스마트 기술 모니터링을 통해 환자 스스로 수집한 데이터는 각 진료 제공자가 제출한 데이터를 보완한다. 보건 전문 인력 양성은 환자 및 제공자와의 파트너십의 맥락에서 학생들이 전통적인 "질병 중심의 의학"에서 건강 증진으로 패러다임 전환에 대비할 필요가 있다. 의료 제공자가 데이터 과학자 및 기타 디지털 전문가와 협력하기 때문에 [전문직 간 팀의 구성]이 변경될 것이다[28]. 팀의 역할은 딥 러닝 알고리즘을 기반으로 한 더 건강한 선택과 의사 결정으로 개인들을 안내하는 보다 [간-전문직적 사람 중심의 접근 방식interprofessional person-centered approach]으로 전환될 것이다. 따라서 교육자들은 팀이 의사 결정을 유도하기 위해 데이터 기반 알고리즘에 점점 더 많이 의존함에 따라 [데이터 편향, 생명윤리적 과제 및 책임에 대한 영향]을 인식할 수 있는 [전문직간interprofessional 학습 기회]를 개발해야 한다[28]. 

HPE must anticipate shifts in interprofessional practice patterns. The vision of what it means to be a health care provider will move away from individual stewards of information toward systems-thinking experts in accessing, assessing, and applying information to the needs of an individual or a given community. It is critical that each provider be taught that data inputs impact AI outputs that guide care and treatment. Wearable devices connected by AI will increasingly integrate prevention and care delivery. Training in digital health literacy is needed to promote understanding of such data from the lens of a specific health profession, but also in recognizing how such information fits within the expertise of other health professions and the broader health system. Data collected by patients themselves through smart technology monitoring will supplement data submitted by each care provider. Health professions training needs to prepare students for the paradigm shift from the traditional “disease-oriented medicine” to promotion of wellness in the context of a partnership with patients and providers. The composition of the interprofessional team will be altered, as health care providers will collaborate with data scientists and other digital experts [28]. The role of the team will shift toward a more interprofessional person-centered approach, guiding individuals toward healthier options and decision making based on deep learning algorithms. Educators must thus develop interprofessional learning opportunities to recognize data biases, bioethical challenges, and implications for liability as teams increasingly rely on data-driven algorithms to drive decision making [28].

다른 유형의 사람이 보건 전문가로서 성공할 수도 있다. 의료 팀의 동료 구성원으로부터든 AI 도구로부터든 외부 인풋을 수용하도록 제공자를 위치시키는 [개인적 겸손personal humility]의 가치에 대한 인식이 증가하면, [강력한 개인적 지식personal knowledge]를 가치있게 여기던 전통적인 것과의 균형을 맞춰야 한다. 건강전문 학습자를 대상으로 AI와 머신러닝의 위험과 이점에 대해 함께 교육하는 것은 학생들이 건강전문팀의 일원이 되면서 공유지식의 체계를 구축할 것이다. 
It may be that a different type of person will succeed as a health professional. An increasing recognition of the value of personal humility that positions a provider to accept external input, whether from fellow members of the care team or from AI tools, must balance a traditional value for strong personal knowledge. Educating health professions learners together on the risks and benefits of AI and machine learning will set up a system of shared knowledge as students become members of the health professional team.

 

윤리적 및 전문적인 영향
Ethical and Professional Implications

[AI에 대한 윤리적 및 규제적 감독oversight]에 참여하는 보건 전문가의 의무도 교육의 대상이 되어야한다고 주장한다. 미국에서는 의료 기관의 의사 결정자들이 AI가 의학을 개선할 것이라고 얼마나 확신하느냐는 질문을 받았을 때, 약 50%가 치명적인 오류를 일으키고, 운영상의 결함이 있으며, 충족되지 않은 기대를 낳을 것이라고 우려했다[29]. 영국에서는 성인 인구의 63%가 AI를 통한 건강관리 개선을 위해 개인 데이터를 제공하고 허용하는 것에 대해 불편함을 느끼고 있다. 제공자가 [데이터 보호 요구사항, 환자 개인 정보 보호 및 기밀성]을 이해하고 모니터링하도록 보장하고, [편향된 샘플링을 최소화]하며, [AI 개발자가 이러한 노력을 다루는 투명한 의사소통 및 조치를 제공할 것을 요구]하도록 교육을 개발해야 한다[29]. 의료 분야에서 인공지능의 침투가 증가함에 따라 어떤 추가 역량이 필요한지, 역사적 역량이 어떻게 조정되어야 하는지를 명확히 하기 위해 전문 교육자 간 추가적인 협업이 필요할 것이다. 

The duty of health professionals to engage in ethical and regulatory oversight of AI also argues for targeted education. In the United States, when decision makers at health care organizations were asked how confident they were that AI would improve medicine, roughly 50 percent feared that it will produce fatal errors, have operational flaws, and produce unmet expectations [29]. In the United Kingdom, 63 percent of the adult population is not comfortable with providing and allowing personal data to be used to improve health care through AI. Training must be developed to ensure that providers understand and monitor data protection requirements, patient privacy, and confidentiality, as well as minimize bias sampling and demand that AI developers provide transparent communication and actions addressing these endeavors [29]. Further collaboration among interprofessional educators will be necessary to clarify what additional competencies are needed and how historical competencies must be refined in light of increasing penetrance of AI in health care.

 

AI 인 트레이닝
AI in Training

보건 전문 학습자가 향후 작업에 AI 도구를 활용할 수 있도록 준비하는 것 외에도, 교육자들은 교육 과정을 개선하기 위해 AI의 엄청난 잠재력을 고려해야 한다. 아래에 설명된 여러 예는 AI를 활용하는 것이 훈련의 연속에 걸쳐 교수와 학습에 대한 혁신적인 접근법을 어떻게 추진할 수 있는지를 보여주는 이미 등장했다. 
In addition to preparing health professions learners to utilize AI tools in their future work, educators should consider the tremendous potential of AI to improve the process of education. Multiple examples, which are laid out below, have already emerged that show how leveraging AI can propel innovative approaches to teaching and learning across the continuum of training.

관리 부담 완화
Easing Administrative Burdens

정보는 교육 시스템과 개별 보건 전문가의 학습 요구를 인식하고 해결하는 능력에 매우 중요합니다. 그러나 교육 시스템에는 중요한 행정적 측면이 있다. 제공자의 문서 부담을 줄이기 위한 AI의 임상 적용과 마찬가지로, AI를 활용하면 학생과의 직접적인 상호 작용과 HPE의 혁신을 진전시키기 위한 보다 창의적인 활동을 위한 대역폭을 확보할 수 있다. 예를 들어, 조지아 공과대학교[30]는 온라인 교육에 대한 역량을 확대하려고 노력했지만, 지도자들은 교사 보조(TA)에 대한 수요가 공급을 초과할 것이라고 인식했다. TA에 대한 많은 질문이 더 깊은 학습 문제에 초점을 맞추기보다는 본질적으로 관리적이라는 것을 식별하여, 그들은 TA의 기능을 할 AI 애플리케이션인 질 왓슨Jill Watson을 개발했다. 질은 간단한 질문들을 빠르게 해결하는 데 성공했고 인간 교육자들에게 언급될 필요가 있는 더 발전된 문제들을 인식할 수 있었다. 기능을 최적화하기 위해 지속적인 개선이 진행 중입니다. 
Information is critical to educational systems and their ability to recognize and address the learning needs of individual health professionals. However, there are significant administrative aspects to educational systems. Akin to the clinical application of AI to reduce a provider’s burden of documentation, leveraging AI could free bandwidth for direct interactions with students and for more creative activities to advance innovation in HPE. As an example, the Georgia Institute of Technology [30] sought to expand its capacity for online education, but leaders recognized that the demand for teaching assistants (TAs) would exceed supply. Identifying that many questions for TAs are administrative in nature rather than focused on deeper learning issues, they developed an AI application, Jill Watson, to function as a TA. Jill was successful in quickly addressing simple questions and was able to recognize more advanced issues that needed to be referred to human educators. Ongoing refinement is under way to optimize functionality.

또 다른 예는 뉴욕 대학 그로스만 의과대학에서 왔다. 이 학교가 모든 등록 학생들에게 전액 장학금을 수여할 것이라고 발표되자 지도자들은 이미 명성이 자자한 이 프로그램에 대한 신청이 급증할 것으로 예상했다. 그들은 1,000명 이상의 이전 입학자들의 입학 지원 기록에서 추출한 53개 변수의 데이터 세트를 개발했고 의대에서의 후속 성공과 상관관계가 있는 요인을 식별하기 위해 분석을 수행했다. 빅 데이터 접근 방식은 후속 애플리케이션의 처리를 강화하여, 국가적으로 입학 절차에 공통되는 사전 편향을 완화하도록 의도적으로 설계된 방식으로 초기 전형 시점에 보다 holistic measures를 통합했다[31]. 다른 용도는 PubMed가 색인화한 관련 연구 기사를 분류하고 전문 프로그램 지원자 수를 줄이고 학습 능력과 동기 부여에 따라 클래스를 나누는 것과 같은 특정 활동을 자동화함으로써 교사와 학자의 업무량을 완화했다[32]. 

Another example comes from the New York University Grossman School of Medicine. Upon the announcement that the school would award full-tuition scholarships to all enrolled students, leaders anticipated a surge in applications to the already prestigious program. They developed a dataset of 53 variables extracted from the admissions applications records of more than 1,000 previous matriculants and performed an analysis to identify factors correlated with subsequent success in medical school. Their big data approach enabled enhanced processing of subsequent applications, incorporating more holistic measures at the point of initial screening in a manner intentionally designed to mitigate prior biases common to admissions processes nationally [31]. Other uses have similarly eased the workload of teacher-scholars by triaging relevant research articles indexed by PubMed and automating certain activities like narrowing the number of applicants for specialized programs and dividing classes based on competencies and motivation to learn [32].

 

콘텐츠 제공 및 적응형 학습 지원
Delivery of Content and Enabling Adaptive Learning

콘텐츠 전달에 적용되는 AI는 다음과 같은 목표를 가지고 적응형 학습과 평가를 가능하게 한다. 

  • "잘 훈련된 휴먼 튜터가 학생들에게 지원, 지도를 제공하고, 학생의 답변을 해석하고, 토론에 대한 더 많은 대화를 장려하는 것의 이점을 제공한다."[33]. 

예를 들어, BRCA Gist라고 알려진 AI 애플리케이션은 유방암의 유전적 위험에 대한 학습을 지원하는 데 유용한 것으로 밝혀졌다[34]. 유전자 검사를 진행할지 여부를 환자가 직접 결정하도록 돕기 위해 개발된 이 도구는 복잡한 AI 애플리케이션을 활용하여 대화 방식으로 상호 작용하는 아바타를 만들고 환자의 텍스트 응답에 대한 응답을 조정하는 것을 포함한다. 마치 자신이 환자인 것처럼 시스템과 상호 작용하도록 선택한 학생들은 유전적 위험에 대한 선언적 지식이 증가했음을 보여주었다. 교육 프로그램에서 이러한 기술을 사용하면 교육자가 학생들이 노출되는 사례의 혼합을 확대하고, 시스템의 즉각적인 피드백과 함께, 대화형 방식으로 새로운 개념을 발견할 수 있는 기회를 제공할 수 있습니다. 학습 과정은 더 이상 시간과 장소에 얽매이지 않고 대신 "견습생" 튜터형 경험을 제공한다. 보건 분야의 수행 트레이너는 존재하며 필요한 과외를 성취하는 것으로 밝혀져 전통적인 교실에서 배우는 것보다 더 높은 수행 점수를 얻는다.

As applied to content delivery, AI enables adaptive learning and assessment with the goal of

  • “serve[ing] the benefits of a well-trained human tutor providing students support, guidance, interpreting student answers and encouraging more dialogue on the discussion” [33].

For example, an AI application known as the BRCA Gist has been found to be beneficial in supporting learning about genetic risk in breast cancer [34]. Developed to help patients navigate the personal decision whether to pursue genetic testing, this tool involves leveraging complex AI applications to create avatars that interact in a conversational manner, adjusting responses to the patient’s text replies. Students selected to interact with the system as if they were a patient demonstrated increased declarative knowledge of genetic risk. Use of such technology in educational programs would enable educators to expand the mix of cases that students are exposed to and provide the opportunity to discover new concepts in an interactive manner with prompt feedback from the system. The learning process is no longer bound by time and place and instead offers an “apprenticeship” tutor-type experience. Performance trainers in the health professions exist and are found to achieve the tutoring needed, resulting in higher performance scores than learning in the traditional classroom.

 

정보 및 피드백 제공
Providing Information and Feedback

AI는 또한 고등 교육에서도 [개별화된 피드백을 제공]하고, [학습 경로를 구축]하며, [비용을 절감]하는 데 사용되었다[35]. 비록 그것이 인간이 하는 일을 바꾸겠지만, 그것은 인간 교사들을 대체하지 않을 것이다. 한 사례에서, 컴퓨터 과학 석사 학생의 한 교수가 TA로 학생들과 함께 작업하도록 교사 로봇을 설계하여, 동시에 여러 학생을 위해 하루 종일 온라인 질문에 신속하게 답변했다[18]. 이러한 모델은 어떤 학생이 온라인 수업 활동에 참여도가 낮은 참여자가 될 것인지 예측하는 데 사용되었으며 과정 내내 추가 지원이 필요할 가능성이 높다[36]. 이것은 특히 Massive Open Online Cources를 실행할 때 유용할 수 있습니다. 또한 많은 보건 전문가 프로그램은 임상 학습 환경에서 피드백을 컴파일하고 표시하기 위해 대시보드를 도입했다. AI 도구를 레이어링layering하면 데이터 수집 부담을 간소화할 수 있으며, 필요한 특정 피드백과 이를 제공할 수 있는 위치에 있는 감독자에 대한 우선순위를 알릴 수 있다. 
AI has also been used in higher education to provide individualized feedback, build learning pathways, and decrease costs [35]. It will not replace human teachers, although it will change the work that humans do. In one case, a professor of computer science’s master’s students designed a teacherbot to work with students as a TA, promptly answering online questions at all hours of the day for multiple students simultaneously [18]. Such models have been used to predict which students will be low-engagement participants in online class activities and are likely to require additional assistance throughout the course [36]. This could be especially valuable when running Massive Open Online Courses. Additionally, many health professions programs have instituted dashboards to compile and display feedback from the clinical learning environment. Layering AI tools could streamline the data collection burden, signaling priorities regarding what specific feedback is needed and which supervisors could be in a position to provide it.

 

역량 기반 평가 및 개별화된 학습 경로 지원
Supporting Competency-Based Assessment and Individualized Learning Pathways

어떤 보건 분야의 학습자도 다양한 사전 교육 및 인생 경험을 통해 교육을 받게 되며, 따라서 그들의 진정한 교육 요구는 다양하다. 최근 HPE에 대한 역량 기반 접근법에 대한 관심은 학습의 대용으로서 시간에 대한 전통적인 의존보다, [학습 결과를 모니터링]하는 데 더 큰 관심을 강조한다. 역량 기반 접근법은 각 학습자에 대한 풍부한 프로그램 평가 데이터에 의존한다. 이상적으로, 각 보건 전문 학습자는 복잡한 임상 시스템 내에서 다양한 감독자에 의해 평가된다. 기대치에 대한 어느 정도 표준화가 필요하지만, 성과에 대한 감독관 관점의 다양성은 풍부하다. 역량 기반 접근 방식의 구현에 대한 역사적 장벽은 풍부한 성능 증거를 관리하고, 이를 시각화 및 해석하여 미래의 학습을 알리는 과제였다. 일부 의과대학의 예비 연구[37-39]는 과정과 시간에 걸쳐 있는 [프로그램 평가]와 [개별화된 성과 대시보드의] 힘을 입증하지만, 이러한 프로그램은 여전히 [인간 처리 능력]에 의해 제한된다. AI를 적용하여 성능 증거에서 일관된 신호를 식별하여 추가 진단 평가 또는 학습 경험을 유도할 수 있다. AI는 [정밀의학]과 마찬가지로 개인의 수행 동향을 파악하고 개별화된 학습 경로를 지원하기 위한 권고안을 제시함으로써 [정밀 교육]이 가능해진다. 
Learners in any health profession come to their training with a rich diversity of prior educational and life experiences, and as such, their true educational needs vary. Recent interest in competency-based approaches to HPE emphasizes greater attention to monitoring learning outcomes over traditional reliance on time as a proxy for learning. Competency-based approaches rely on rich programmatic assessment data about each learner. Ideally, each health professions learner is assessed by a variety of supervisors within a complex clinical system. Some standardization of expectations is necessary, yet there is richness in this diversity of supervisor perspectives on performance. A historical barrier to implementation of competency-based approaches has been the challenge of managing a wealth of performance evidence, visualizing and interpreting it in a manner that informs future learning. Preliminary work at some medical schools [37-39] demonstrates the power of programmatic assessment and individualized performance dashboards that span courses and time, but these programs are still limited by the capacity of human processing. AI could be applied to identify consistent signals in performance evidence that in turn would steer additional diagnostic assessments or learning experiences. Akin to precision medicine, AI enables precision education by identifying individual performance trends and making recommendations to support individualized learning pathways.

 

지속적인 전문성 개발의 스트림라이닝
Streamlining Continual Professional Development

지속적인 교육은 모든 보건 직업의 근본적인 측면이지만, 의미 있는 지속적인 전문성 개발 또한 이러한 맞춤화의 부족으로 인해 어려움을 겪었으며, 각 제공자의 실제 관행과 잘 맞지 않는다. 최근 미국 의료 전문 위원회(American Board of Medical Specialty)는

  • "학습을 지원하고, 지식과 기술 격차를 식별하며, 전문의diplomates가 최신 상태를 유지하도록 돕는 종단 및 기타 혁신적인 형성적 평가 전략을 통합하는 방향으로, continuing certification이 변화되어야 한다"고 주장했다[40].

자격Certification은 자신의 업무 역량에 대한 요구에 기초해야 한다. AI는 제공자의 환자 패널과 결과를 모니터링하고 적절한 교육 자원을 적시에 추천할 수 있는 잠재력을 제공한다. 자신의 실제 업무 범위를 이해하고 인증 지속을 위한 적절하고 표적화된 평가를 권고하는 데 사용할 수 있으며, 따라서 업무와 면허 사이의 연계를 강화할 수 있다. 
Ongoing education is a fundamental aspect of every health profession, but meaningful continuing professional development has also suffered from this lack of customization, with poor alignment to each provider’s actual practice. The American Board of Medical Specialties recently argued that

  • “continuing certification must change to incorporate longitudinal and other innovative formative assessment strategies that support learning, identify knowledge and skills gaps, and help diplomates stay current” [40].

Certification must be based on the competency demands of one’s practice. AI offers the potential to monitor a provider’s patient panel and outcomes and recommend appropriate educational resources just in time. It can be used to understand one’s true scope of practice and recommend appropriate, targeted assessments for continuing certification, thus strengthening the link between practice and licensure.

 

학습을 위한 교육자원의 배치 최적화
Optimizing the Deployment of Educational Resources for Learning

교육 자원은 모든 보건 분야에 걸쳐 제한된다. 조언, 교육 경험 및 평가 관행을 효율적으로 배치하면 자료 공급과 교육자 및 직원의 시간과 노력을 확장할 수 있습니다. 사회 사업 분야에서 AI는 훈련 데이터에 포함된 인간 편향을 계산적으로 그리고 최종 의사 결정에 인간을 포함시킴으로써 어떻게 최소화할 수 있는지 조사하는 동시에 위탁 관리에 참여하는 개별 청소년이 특별한 지원을 필요로 할지를 더 잘 예측하기 위해 탐구되고 있다[41]. 마찬가지로, 보건 전문 교육자는 AI를 활용하여 어떤 학습자와 의사가 추가 학습 지원이 필요한지 예측할 수 있다.
Educational resources are limited across all health professions. The efficient deployment of advising, educational experiences, and assessment practices would serve to extend material supplies and the time and effort of educators and staff. In the field of social work, AI is being explored to better anticipate which individual youth involved in foster care will require special support, while examining how human bias embedded in training data can be minimized computationally and by including humans in final decision making [41]. Similarly, health professions educators could leverage AI to predict which learners and practitioners need extra learning support.

 

학습 의료 시스템 활성화
Enabling the Learning Health Care System

학습 의료 시스템의 이상은 AI의 지원으로 실현될 수 있다. [Amplifire 학습 플랫폼]은 이러한 개념을 잘 보여줍니다 [42]. Amplifire 내에서 의료 시스템 메트릭과 EHR 데이터를 마이닝하여 개선 기회와 공유 학습 요구를 식별한 다음, 전문 분야 전반의 시스템 훈련으로 변환된다. 평가 단계에서 각 참가자는 질문에 답변할 뿐만 아니라 자신의 답변에 대한 신뢰도를 평가하도록 요구됩니다. 정확하지 않지만 자신감이 떨어지는 참가자는 단순히 더 많은 교육이 필요할 수 있습니다. AI는 확신에 찬 잘못된 정보를 가진 개인들을 발견하는 데 도움이 된다. 이 그룹을 다루는 것은 전체 학습 커뮤니티의 성공에 매우 중요하다. 따라서 AI는 의료 시스템이 각 개인 및 시스템의 학습 요구를 충족하기 위해 교육의 깊이와 접근 방식을 모두 조정할 수 있도록 합니다.
The ideal of a learning health care system [5] can be realized with support from AI. The Amplifire learning platform illustrates these concepts well [42]. Within Amplifire, health system metrics and EHR data are mined to identify opportunities for improvement and shared learning needs, which is then converted into system-wide training across professions. During the assessment phase, each participant is asked not only to answer questions but also to rate confidence in one’s answer. Participants who are incorrect but less confident may simply need more training. AI helps to uncover individuals harboring confidently held misinformation; addressing this group is critical to the success of the entire learning community. Thus, AI enables the health system to tailor both the depth of and approach to education in order to meet each individual’s — and thus the system’s — learning needs.

 

번아웃 완화
Mitigating Burnout

AI는 정신 건강과 웰빙을 지원하는 데 효과적으로 적용되었다. 교수자 작업량의 일부를 자동화하면 보건 전문 교육자의 스트레스 및 소모량을 완화하는 데 도움이 될 수 있습니다. 정신 건강 장애 위험이 높은 의료 종사자의 조기 발견에 고급 기술이 적용되었다[43]. 유사한 알고리즘을 개발하여 스트레스와 불안을 보건 전문직 학생에게 모니터링할 수 있다. 마찬가지로, 청소년들 사이에서 시험된 스마트폰 앱과 파일럿 테스트를 통해 개발된 자연어 처리 알고리즘 모델은 교육자와 교사가 자살위험이 있는 학생을 식별하는 데 도움이 될 수 있다[44, 45].
AI has effectively been applied to supporting mental health and well-being. Automating parts of instructors’ workload can help mitigate some of the stress and burnout of health professions educators. Advanced technology has been applied by mental health practitioners in the early detection of health care workers at high risk for mental health disorders [43]; similar algorithms could be developed to monitor health professions students for stress and anxiety. Similarly, natural language processing algorithmic models developed through a smartphone app and pilot tested among adolescents might help educators and preceptors identify suicidal health professions students [44, 45].

학습 효과를 향상시키고 HPE의 비용을 절감하는 것뿐만 아니라 궁극적으로 환자에 대한 더 나은 학습 경험을 제공하기 위해 훈련 프로그램과 교육 실습의 전환이 필요하다.

A call for transformation of training programs and educational practice is needed, not only to improve learning effectiveness and reduce costs of HPE, but also to provide a better learner experience that ultimately leads to higher quality care for patients.

 

다음 단계: 행동에 대한 요구에 응답하기
Next Steps: Answering the Call to Action

교육자들은 AI 훈련을 HPE에 통합하는 것을 더 잘 정의하기 위해 협력해야 한다. 교육자들 사이의 행동 부족은 위험하다. [AI에 관한 의료 전문가의 적절한 훈련이 위험이 아닌 약속을 촉진하는 가장 강력한 도구라는 점]이기 때문이다. 이전 섹션에서 설명한 광범위한 이해 범주는 [학습 목표와 역량]으로 공식적으로 명시되어야 합니다. 적절한 훈련의 "복용dosing"은 보건 직업 전반에 필요한 핵심 내용뿐만 아니라 주어진 직업과 각 직업 내의 다양한 전문 분야에 걸친 고급 훈련 요구 사항을 정의하는 것과 함께 고려되어야 한다. 또한, 보건 분야 전반에 걸친 일반적인 교육 행정 과제는 AI를 활용하여 교육 과정을 개선할 수 있는 공유 기회를 제공한다.
Educators must collaborate to better define the necessary incorporation of AI training into HPE. A lack of action among educators poses risk in that adequate training of health professionals in AI is the strongest tool to promote its promise over its peril. The broad categories of understanding outlined in prior sections will need to be formally articulated as learning objectives and competencies. Appropriate “dosing” of training must be considered along with defining the core content needed across health professions, as well as advanced training needs in given professions and across the various specialties within each profession. Additionally, common educational administrative challenges across health professions offer shared opportunities to leverage AI to improve the process of education.

이 원고는 실천을 촉구하는 역할을 하기 위한 것으로, 저자들은 그 안에서 교육자들이 지금 취해야 할 구체적인 단계들을 제시하고 있다(박스 1 참조). 보건 전문직에 걸친 교육자들의 집단 행동은 의도하지 않은 결과를 완화하는 동시에 AI의 힘이 최적화되는 원하는 미래 상태를 조성할 것이다.

This manuscript is intended to serve as a call to action, and in it, the authors offer concrete steps that health professions educators should take now (see Box 1). Collective action of educators across health professions will foster a desired future state in which the power of AI is optimized while mitigating unintended consequences.


박스 1 | 인공지능(AI)을 학습자를 위한 교육과 훈련에 통합하기 위해 교육 지도자들이 지금 해야 할 일
Box 1 | What Health Professions Education Leaders Should Do Now to Incorporate Artificial Intelligence (AI) into Education and Training for Learners


AI와 관련된 기본 개념과 논쟁에 대해 자신과 교수진을 교육합니다.
• 다양한 교수진의 역할에 필요한 다양한 이해 수준 고려

Educate yourself and your faculty in basic concepts and controversies related to AI
• Consider the diff ering levels of understanding needed for various faculty roles

아래 리소스를 고려하면서 관계를 구축한다.
• 의료 시스템 정보학 및 임상 의사 결정 지원 팀
  • 제휴 임상 기업에서의 AI 애플리케이션의 침투는 무엇인가?
  • 임상 시스템에서 교육은 어떻게 수행되고 있는가?
• 대학 컴퓨터 공학부
• 윤리학자
• 이 주제에 관심이 있는 교수진과 학습자
• 전문 교육 동료들

Build relationships while considering the resources below
• Health system informatics and clinical decision support teams
  • What is the penetration of AI applications in affi liated clinical enterprise?
  • How is training being carried out in the clinical system?
• University computer science departments
• Ethicists
• Faculty and learners with interest in this topic
• Interprofessional education colleagues

기존 교육과정 감독 프로세스에 협력할 로컬 자문단을 설립한다.
• 교수진 리더십과 기관 커뮤니티를 위한 AI에 대한 학습 기회 창출
• AI에 대한 회의론을 공개적으로 대응한다.
• 평가와 같은 교육 관행을 촉진하는 데 AI가 적용됨에 따라 학습자를 보호하기 위한 메커니즘을 고려하십시오.
Establish a local advisory group to collaborate with the existing curricular oversight process
• Create learning opportunities about AI for faculty leadership and the institutional community
• Openly address skepticism about AI
• Consider mechanisms to protect learners as AI is applied to facilitating educational practices, such as assessment

기존 프로그램에서의 [역량 성과 및 커리큘럼]을 검토한다.
• AI의 확장이 의료 지식, 환자 치료, 커뮤니케이션 기술, 전문직 간 협업 실습, 시스템 기반 진료, 전문성 및 실습 기반 학습 및 개선과 같은 기존 역량 영역의 이해에 어떻게 영향을 미칠지 고려합니다.
• 컴퓨터 과학 및 기술에 필요한 새로운 역량 영역을 고려하십시오.
• 임상 추론, 메타 인지, 진단 오류, 인지 편향 등과 같은 관련 기존 콘텐츠 영역에 AI 학습 목표를 통합하는 것을 고려하십시오. 
• AI가 커리큘럼 관리를 지원할 수 있는 잠재적 기회 식별

Review the program’s existing competency outcomes and curriculum
• Consider how expansion of AI will impact understanding of existing competency domains, such as medical knowledge, patient care, communication skills, interprofessional collaborative practice, systems-ased care, professionalism, and practice-based learning and improvement
• Consider new domains of competency needed in computer science and technology
• Consider incorporation of AI learning objectives into relevant existing content areas, such as clinical reasoning, metacognition, diagnostic error, cognitive bias, etc. 
• Identify potential opportunities for AI to assist in the administration of the curriculum

기존 [평가 프로그램]을 검토한다.
• 각 학습자의 지식 보유를 평가하는 데 중점을 두는 것에서 각 학습자의 지식 접근, 비판적 평가 및 적용 능력을 평가하는 것으로 이동합니다. 예를 들어 임상 의사 결정 지원 도구를 시뮬레이션 이벤트에 통합하는 것을 고려한다. 
• 필요한 새로운 역량과 기술을 평가할 기회를 고려합니다.
• AI가 프로그램 평가 관리를 지원할 수 있는 잠재적 역할 식별

Review the existing assessment program
• Move from an emphasis on assessing each learner’s possession of knowledge to assessing each learner’s ability to access, critically appraise, and apply knowledge. For example, consider incorporating clinical decision support tools into simulation events 
• Consider opportunities to assess necessary new competencies and skills
• Identify potential roles for AI to assist in the administration of programmatic assessment

기존 입학/선발 프로세스를 검토한다.
• 개인의 지식과 성취에 대한 강조에서 팀워크와 상황 판단의 증거로 이동합니다. 
• 지원자 심사에서 AI가 지원할 수 있는 잠재적 역할 파악
Review existing admissions/selection processes
• Move from an emphasis on individual knowledge and accomplishment toward evidence of teamwork and situational judgment 
• Identify potential roles for AI to assist in the review of applicants

AI가 교육에 미치는 영향에 대한 평가 및 연구에 참여한다.
Participate in evaluation and research regarding the impact of AI in education

국가 및 글로벌 토의에 참여합니다.
• AI 교육 강화
• AI에 대한 학습 목표 설정 및 개발적으로 적절한 교육 진행
• 교육에 AI 활용
• 교육 프로그램 전달을 지원하는 AI 기능 개발

Engage in national and global discussions to
• Enhance training in AI
• Establish learning objectives and developmentally appropriate progression of training in AI
• Leverage AI in training
• Develop AI capabilities that assist in the delivery of educational programs


 

제한 사항
Limitations

이 원고는 AI와 AI가 보건, 의료 및 교육에 미치는 영향에 대해 학습하는 과정에 있는 많은 보건 분야의 저자들의 경험을 통해 알 수 있다. 인공지능은 빠르게 발전하는 분야이기 때문에 여기서 제공되는 아이디어에는 영구적이지 않다. 일부 건강 전문직과 분야는 현재 다른 분야보다 더 많은 영향을 받고 있지만, 시간이 지남에 따라 AI의 발전 기능이 실현됨에 따라 모든 수준의 교육 목표가 진화해야 한다. AI에 대한 현재 교육에 대한 비공식 검토는 이러한 개요를 제공했지만, 모범 사례를 명확히 하기 위해 보건 전문 교육 프로그램 전반에 걸친 협업 연구 의제가 필요하다.

This manuscript is informed by the experience of authors across many health professions, who themselves are in the process of learning about AI and its implications for health, health care, and education in the health professions. AI is a rapidly advancing field, so there is impermanence to the ideas offered here. Some health professions and disciplines are currently more impacted than others; however, as advancing capabilities of AI are realized over time, educational objectives at all levels must evolve. An informal review of current training in AI informed this overview, but a collaborative research agenda is needed across health professions educational programs to clarify best practices.

 

 


 

 

NAM Perspect. 2021 Sep 8;2021:10.31478/202109a. doi: 10.31478/202109a. eCollection 2021.

 

Artificial Intelligence for Health Professions Educators

Affiliations collapse

Affiliations

1American Medical Association.

2Vanderbilt School of Nursing.

3PalattaSolutions.

4University at Buffalo School of Social Work.

5Weill Cornell Medicine-Qatar.

6Texas A&M University-San Antonio.

7Association of American Medical Colleges.

PMID: 34901780

PMCID: PMC8654471

DOI: 10.31478/202109a

Free PMC article

 

No abstract available

어떻게 의학교육이 건강 형평성을 후퇴시키는가 (Lancet, 2022)
How medical education holds back health equity

 

 

나이지리아의 첫 의과대학은 1948년 이바단 대학의 일부로서 설립되었다. 영국 런던 대학의 커리큘럼을 본떠서 만들었기에, 나이지리아인들을 위해 설계되지 않았고, 반짝이는 교육 병원도 아니었다. 대안은 다양한 지역 요구에 맞게 조정되고 토착 의료 시스템, 지식 및 사회 조직을 기반으로 하는 중앙 형평성 촉진 1차 의료가 있었을 것이다. 나이지리아의 첫 의과대학은 아프리카와 다른 지역의 식민지 정부에 의해 설립된 많은 의과대학과 마찬가지로 식민지 시대 건물이었다.

The first medical school in Nigeria was founded in 1948 as part of University College Ibadan. Its curriculum, modelled on that of the University of London in the UK, was not designed for Nigerians—neither was its sparkling teaching hospital. The alternative would have been to centre equity-promoting primary health care tailored to diverse local needs and built on Indigenous health systems, knowledge, and social organisation. Nigeria's first medical school was a colonial edifice, as were many medical schools founded by colonial governments across Africa and elsewhere.

1970년 나이지리아 서부 정부는 이페 대학교(현재의 오바페미 아울로우 대학교)에 새로운 의과 대학을 설립하였다. 당시 [이바단 의대 커리큘럼]은 [이페 의대 설립자]들에 의해 대부분의 나이지리아인들의 건강 요구에 반응하지 않는 것으로 인식되었다. 나중에 의학 및 보건 전문 교육의 Ife 철학으로 명명된 실험에서, Ife 의과대학은 형평성 중심의 원칙에 따라 설립되었다. Ife 철학은 나이지리아의 의학자인 토마스 아데산야 아이게 그릴로가 고안한 것으로, 그는 의과대학의 창립 학장이 되었다. 학생들은 1차 및 2차 의료 시설망에서 교육을 받았으며, 접근 가능한 3차 병원이 하나 있다. 1978년 알마 아타 선언 이전에, Ife 의과대학은 지역 사회에 가깝고 반응하는 건강 시스템을 보장하는 데 1차 의료가 필수적이라고 인정했습니다. 1971년 호주 원주민 활동가들은 주류 의료에 대한 평등한 대안으로서 원주민 공동체 통제 보건 서비스를 시작했다. Ife 의대생들은 기존의 전문적 위계질서를 보강하기보다는 간호, 물리치료, 기타 교육생들과 동일한 수업에서 교육을 받아 지역사회에서 팀워크를 함께 할 수 있도록 하였다. 그들의 훈련은 사회과학, 농업, 교육을 포괄하는 다학제적 교육이었다. 학생들은 약 500개의 마을과 2개의 마을에 서비스를 제공하는 보건 센터 전반에 걸친 지역사회 기반 1차 건강 관리 활동에 참여했습니다. 그들은 교육과정 코드개발에 참여한 의료 종사자들과 지역 사회로부터 경험적으로 배웠다. 이 커리큘럼은 예방과 치료 사이의 구분을 없애고 1차 의료와 농촌 의료 서비스에 초점을 맞췄다.
In 1970, the Government of the then Western State of Nigeria established a new medical school at the University of Ife (now Obafemi Awolowo University, Ile-Ife). At the time, Ibadan medical school's curriculum was perceived by the founders of Ife medical school as unresponsive to the health needs of most Nigerians. In an experiment, later named the Ife Philosophy of medical and health professions education, Ife medical school was founded on an equity-oriented principle. The Ife Philosophy was conceived by Nigerian medical scholar Thomas Adesanya Ige Grillo, who became the medical school's founding dean. Students were trained in a network of primary and secondary health-care facilities, with one accessible tertiary hospital. Before the Alma Ata Declaration of 1978, Ife medical school recognised primary health care as integral to ensuring a health system that was close and responsive to local communities. There were similar efforts elsewhere—in 1971, Indigenous Australian activists initiated Aboriginal Community-Controlled Health Services as an equity-oriented alternative to mainstream health care. Rather than reinforce existing professional hierarchies, Ife medical students were trained in the same classes as nursing, physiotherapy, and other trainees so that they could work together in teams in the community. Their training was multidisciplinary and encompassed the social sciences, agriculture, and education. Students participated in community-based primary health-care activities across health centres that served about 500 villages and two towns. They learnt experientially from health workers and the community, who were involved in codeveloping the curriculum. The curriculum removed divisions between preventive and curative care and focused on primary health care and rural health services.

그것의 약속에도 불구하고, Ife 철학은 도전에 직면했다. Ife에서 교육을 받은 의사들이 졸업하기 시작했을 때, 그들은 보통 병원에서 일하기를 기대했다. 일부 졸업생들은 주로 병원에서 훈련을 받은 동료들에게 폄하당하거나 주로 1차 의료 종사자로 일할 수 없는 것에 실망했다. 식민주의 의과대학에서 교육을 받은 일부 Ife 학자들은 If 철학에 저항했다. 이러한 긴장감을 고려할 때, 1980년대 초반에는 프로그램이 서서히 후퇴했다. Ife 의대를 설립했던 정부는 사라졌다. 시간이 지남에 따라, Ife는 점점 더 다른 의과대학과 같이 되어, 자신만의 반짝이는 교육 병원을 완성했다. Ife 실험은 부분적으로 의과대학이 나이지리아의 식민지 대학 시스템의 더 넓은 맥락에서 운영되었기 때문에 흔들렸다.
Despite its promise, the Ife Philosophy faced challenges. When Ife-trained medical doctors began to graduate, they were usually expected to work in hospitals. Some graduates felt disparaged by colleagues who had trained primarily in hospitals or were disappointed they could not work mainly as primary health care practitioners. Some Ife academics, trained in more colonial medical schools resisted the Ife Philosophy. Given these tensions, the programme was slowly rolled back during the early 1980s. The government that had established Ife medical school was defunct. Over time, Ife became increasingly like other medical schools, complete with its own sparkling teaching hospital. The Ife experiment faltered partly because the medical school operated within the broader context of Nigeria's colonial university system.

유럽 정착민들에 의해 이전과 현재 식민지화된 많은 나라에서, 식민지 기관으로서의 의학 교육은 보건, 지식, 사회 조직의 서구 시스템에 기반을 두고 있다. 무엇이 유럽인지 보편화함으로써, 이 식민지 기관은 다른 인식론을 지우고 흡수한다. 서양의 [영점 인식론zero-point epistemology]은 서양의 관점을 이상적이고 표준적이며 보편적인 것으로 간주한다. 나이지리아, 남아프리카공화국 등 과거 식민지 국가들과 호주, 미국 등 정착민 식민지의 원주민 공동체가 없애기 위해 고군분투해온 족쇄를 만든다. 그것은 지역의 필요를 충족시키지 못해 생명을 앗아간다. 식민지 침략 이전에 존재해왔던 [앎의 방법]과 [경험 해석의 방법]을 지움으로써 인식 살해를 야기한다.
In many countries previously and currently colonised by European settlers, medical education as a colonial institution is based on western systems of health, knowledge, and social organisation. By universalising what is European, this colonial institution erases and subsumes other epistemologies. The western zero-point epistemology places western perspectives as the ideal, standard, and universal. It creates shackles that previously colonised countries, such as Nigeria and South Africa, and Indigenous communities in settler colonies such as Australia and the USA have been struggling to remove. It costs lives by failing to serve local needs. By obliterating ways of knowing and interpreting experiences that predate colonial invasions, it causes epistemicide.

의학계에서 일어나는 많은 일들은 서양의 생물의학 모델이 지배하는 계층적 시스템으로 학생들을 사회화하는 교육 시스템에 의해 형성된다. 이 지배적인 건강 모델은 세계 대부분의 사람들의 경험에 둔감하다. 의과대학에 의한 다수 세계의 인식론에 대한 부정은 의도적으로 또는 기본적으로 학생들에게 모호하다. 대다수의 의사들은 그들의 맥락과 일치하지 않는 지배적인 시스템에 적응하도록 훈련 받고 그것을 지원하고 복제하도록 훈련시킨다; 그들은 때때로 이 지배적인 시스템의 결함에 대해 그들 자신, 환자, 그들의 문화, 그리고 그들의 맥락을 비난하게 될 수 있다.

Much of what happens in the world of medicine is shaped by an educational system that socialises students into a hierarchical system dominated by the western biomedical model. This dominant model of health is insensitive to the experiences of most of the world's people. The denial of majority world's epistemologies by medical schools remains deliberately or by default obscure to students. Doctors in the majority world are trained to fit into a dominant system that is discordant with their contexts and trains them to support and replicate it; they can sometimes end up blaming themselves, their patients, their culture, and their context for the failings of this dominant system.

 

Frantz Fanon은 그의 책 Black Skin, White Masks에서 부분적으로 자신의 의료 훈련 경험을 바탕으로 의학 교육은 원주민, 인종, 소외되고 억압받는 공동체 학생들을 [비존재non-being의 영역]으로 몰아넣는다고 주장했다. 이는 "좋은 의사"가 되기 위해 끊임없이 노력하지만 결코 [좋은 백인 의사]라는 지위는 얻을 수 없는 물리적, 경험적 공간을 의미한다. "좋은 의사"의 개념은 1910년 미국의 교육학자 아브라함 플렉스너에 의해 기술되었으며 서양 인식론에 확고하게 뿌리를 두고 있으며 백인, 서구, 건강한 남성의 특징과 사회화가 스며 있다. 플렉스너의 업적은 미국의 대부분의 시골과 아프리카계 미국인 의과대학들을 폐교시키는 결과를 가져왔다. 이상화된 "좋은 의사"의 개념은 의학 교육에서 암묵적으로 추구되고 배양되는 것이다. "좋은 의사"는 서양의 이상, 도덕, 그리고 윤리적, 사회적으로 바람직한 특징에 바탕을 둔 전문성과 같은 특성으로 존경받는다. 

In his book Black Skin, White Masks, Frantz Fanon argued, partly based on his own experiences of medical training, that medical education puts students from Indigenous, racialised, marginalised, and oppressed communities into a zone of non-being—into a physical and experiential space where they constantly strive to be the “good doctor” but can never attain the state of being a good white doctor. The concept of the “good doctor” was described by US educationist Abraham Flexner in 1910 and is firmly rooted in western epistemology and infused with the characteristics and socialisation of white, western, able-bodied males. Flexner's work led to the closure of most rural and African American medical schools in the USA. This idealised concept of the “good doctor” is what is tacitly sought and cultivated in medical education. The “good doctor” is revered for characteristics such as professionalism, founded in western ideals, morals, and ethical and socially desirable traits.

나이지리아와 남아프리카 공화국의 보건 전문가로서의 경험으로부터, 다른 전문가에 대한 존중, 전통적인 교훈, 환자 및 가족 구성원과의 광범위하고 서두르지 않는 상담이 중요하다. 서양의 전문성 개념에서 볼 때, 그러한 접근법은 지각, 자신감 부족 또는 우유부단함을 암시할 수 있지만, 그것은 [건강, 지식 및 사회 조직에 관한 토착 시스템]의 일부인 대인 관계 규범과 일치한다. 그것이 식민지화된 공간과 마음 안에서 복제되는 과정 속에서, 의학 교육을 뒷받침하는 서구 인식론은 토착 건강 지식 시스템을 소멸시킨다. 이것은 인식론적 폭력의 한 형태이다.

From our experience as health professionals in Nigeria and South Africa, respect for other professionals, traditional precepts, and wide and unhurried consultation with patients and members of their family are crucial. From a western notion of professionalism, such an approach might suggest tardiness, lack of confidence, or indecisiveness, but it is consistent with interpersonal norms of care that are part of our Indigenous systems of health, knowledge, and social organisation. As it replicates itself within colonised spaces and minds, the western epistemology that underpins medical education annihilates Indigenous health knowledge systems. This is a form of epistemic violence.

그래서 영어를 제2외국어로 하는 가난한 배경의 남아공 '유색인종 여성'이 남아프리카 의대에 입학할 때, 그녀는 [플렉스너가 자신과 같은 사람들을 위해 정한 기준]에 의해 판단될 가능성이 높다. 그녀의 정체성은 침묵하고, 그녀의 역사적, 조상적, 맥락적, 그리고 살아있는 경험도 침묵한다. 세상을 이해하고 관련짓는 그녀의 방식은 이상적이고 표준적이며 보편적인 것을 정의하는 제로포인트 관점으로 대체된다. 내부 갈등이 뒤따른다. 그녀는 파논이 [소외의 상태state of alienation]라고 불렀던 것을 느끼고, 존재하며 배운다. 소외의 결과로 생기는 것은 [파열rupture]이다: 한 사람이 [배운 것]과 [진실이라고 알고 있는 것] 사이의 충돌이다. 우리는 불협화음을 이해하려고 노력한다. 우리는 우리가 알고 있는 우리 자신이 되기를 갈망한다. 마침내 우리는 [우리가 알고 있는 우리 자신]과는 거리가 먼, [건강, 지식 및 사회 조직의 시스템을 기반으로 한 유럽 중심적 캐논]으로부터 배울 수 밖에 없었다는 것을 깨닫고, 그 때 우리는 [무엇이 알려진 것으로 추정되는지presumed to be known]에 대해 의문을 제기하기 시작한다
So, when a South African “woman of colour” from an impoverished background with English as second language enters medical school in South Africa, she is likely to be judged by the standards set by Flexner for people like himself. Her identity is silenced, so is her historical, ancestral, contextual, and lived experience. Her way of understanding and relating to the world is replaced by the zero-point perspective that defines what is ideal, standard, and universal. An internal conflict ensues. She feels, exists, and learns in what Fanon called a state of alienation. What results from the alienation is rupture: a clash between what one is taught and what one knows to be true. We seek to make sense of the dissonance. We yearn to be who we know ourselves to be. When we finally realise that we have been forced to learn primarily from a Eurocentric canon based on systems of health, knowledge, and social organisation far removed from who we know ourselves to be, we start to call into question what is presumed to be known.

[파열]은 [기존의 사회적, 인식론적 관행과 관계의 붕괴]를 나타낸다. [파열의 시간]은 무엇이 정상화normalize되었는지 의문을 제기합니다. 그래야 다른 것이 성장할 수 있습니다. 분열과 함께, 식민지 사람들은 그들의 [교육에 의해 그들의 정신에 뿌려진 열등감이라는 허구]를 추방하기 시작한다. 이 파열이 널리 퍼지면 치료용 바이오의학, 스파클링 병원, 의사들에게 특권을 주는 [위계 구조를 해체]하고, 대신 심층적으로 맥락화되고 포괄적인 1차 의료 서비스를 중심으로 하는 등 형평성에 어긋나는 방식으로 [의료 교육의 집단적 재상상collective reimagining]을 기대한다. 우리는 또한 [지역사회에서 실천]하고, 그 실천이 [전통적인 치료사healer의 혜택benefit과 반향echo하는 사람들]이 의학 교육에 포함되기를 기대한다. 그들의 커뮤니티에 위치한 그러한 사람들은, 본질적으로 건강의 사회적 결정요인에 대한 개념과 영적, 정치적 행위자들과의 전문직 간 협력, 즉 서양 사회에서 소외되는 효과를 고려할 때 의학 교육이 이제 겨우 수용되기 시작했다는 개념을 이해한다. [위계 구조를 평탄화flattening]한다는 것은 [간과해온 인식론의 잠재성을 충분히 탐구할 수 있는 공간]을 제공하면서, [다수성plurality을 포용]하고, [서구 인식론의 이점을 인식]하는 것을 의미한다. 우리는 잘못된 출발로부터 배워야하며, Ife 철학과 같이 과거에 놓쳤던 기회로부터 배워야 한다.

Ruptures represent breakdowns in existing social and epistemic practices and relations. Times of rupture call into question what is normalised, so that something else can grow. With rupture, colonised people begin to expel the fictions of their own inferiority sown in their psyche by their education. If this rupture becomes widespread, we expect a collective reimagining of medical education in ways that default to equity, including by dismantling the hierarchies that privilege curative biomedicine, sparkling hospitals, and medical doctors and centring instead deeply contextualised and comprehensive primary health care. We also expect the encompassing into medical education of those who practise in their communities and whose practice echoes the benefits of traditional healers. Located in their communities, such people inherently understand concepts of the social determinants of health and interprofessional collaboration with spiritual and political actors—concepts that medical education is only beginning to embrace, given its alienating effects in western societies. Flattening hierarchies means embracing plurality and recognising the benefits of western epistemology while giving space for underexplored potentials of neglected epistemologies. We must learn from the false starts and the missed opportunities of the past, such as the Ife Philosophy.

하지만 이 파열음이 널리 퍼질 수 있을까? 우리는 현재의 위계질서를 유지하기 위해 사회화된 서구 및 다수 세계의 교육자와 실무자들의 반발이 예상된다. 많은 환경에서 의학교육은 일반적으로 [기존의 위계를 유지하는 전문가를 생산하는 자본주의적 생산라인]이다. 세계적으로, 특권층의 학생들이 의대에 입학할 가능성이 가장 높다. 높은 사회적 지위와 소득의 매력은 계층에 진입하고 유지하기 위한 강력한 인센티브이다. Ife의 경험에서 알 수 있듯이, 하나의 의과대학이 바뀌는 것만으로는 충분하지 않다; 전체 국가 커리큘럼과 사고 방식이 바뀌어야 한다.
But can this rupture become widespread? We expect pushbacks from western and majority world educators and practitioners who have been socialised to uphold current hierarchies. Medical education in many settings is a capitalist production line that typically produces professionals who maintain existing hierarchies. Globally, students of privileged backgrounds are the most likely to enter medical schools. The allure of high social status and income are powerful incentives to enter and sustain hierarchies. As the Ife experience showed, it is not enough that one medical school changes; entire national curricula and ways of thinking must change.

서구 배우들이 너무 오랫동안 대다수의 세계에서 의료 교육의 목덜미에 발을 디뎠다는 것을 인정한다면 좋을 것이다. 미국 페미니스트와 폐지론자 사라 무어 그림케가 물었던 것처럼 우리가 요청하는 것은 "목에서 발을 떼고 우리가 똑바로 서도록 허락해 달라"는 것이다. 과거와 현재 진행 중인 인식론적 폭력을 인정하는 것은 치유를 위해 필요하며, 행동을 촉진할 수 있다. 일단 서양이라는 발western feet이 들어올려지면, 우리는 다음에 무슨 일이 일어날지 예측할 수 없고, 그렇게 하기 위해 서두를 필요가 없다; 그것은 집단적으로 이루어져야 한다. 파논은 "중요한 것은 300명의 사람들이 계획을 세우고 그것을 실행하기로 결정하는 것이 아니라, 비록 두세 배의 시간이 걸리더라도 전체 사람들이 계획하고 결정하는 것이다."라고 썼다.

If only western actors would acknowledge that they have had their foot on the neck of medical education in the majority world for far too long. All we ask, as the US feminist and abolitionist Sarah Moore Grimké asked, is for them to “take their feet from off our necks and permit us to stand upright”. Acknowledging past and ongoing epistemic violence is necessary for healing—and may facilitate action. Once western feet have been lifted, we cannot predict what happens next, and there should be no hurry to do so; it must be done collectively. As Fanon wrote in The Wretched of the Earth: “the important thing is not that three hundred people form a plan and decide upon carrying it out, but that the whole people plan and decide, even if it takes them twice or three times as long”.

 

 


Lancet. 2022 Aug 20;400(10352):556-557. doi: 10.1016/S0140-6736(22)01423-4. Epub 2022 Jul 30.

How medical education holds back health equity

Affiliations collapse

Affiliations

1School of Nursing and Public Health, Nelson R Mandela School of Medicine, University of KwaZulu-Natal, Durban 4041, South Africa. Electronic address: naidut10@ukzn.ac.za.

2School of Public Health, University of Sydney, Sydney, NSW 2006, Australia.

PMID: 35914535

DOI: 10.1016/S0140-6736(22)01423-4

심리학에서 이론의 위기: 어떻게 나아갈 것인가(Perspect Psychol Sci, 2021)
The Theory Crisis in Psychology: How to Move Forward
Markus I. Eronen1 and Laura F. Bringmann2

 

최근 몇 년 사이 심리학의 이론적 토대가 흔들리고 있다는 사실에 주목해야 하는 저자들이 늘고 있다. 심리학 이론은 일반적으로 질이 나쁘고 심리학은 통계 기술과 관행을 개선하고 더 많은 복제 연구를 수행하는 대신 더 나은 이론을 개발하는 쪽으로 더 많이 전환되어야 한다는 주장이다. 훨씬 많은 관심을 받았던 복제 위기보다 더 근본적인 '이론 위기'를 맞고 있는 셈이다.

In recent years, more and more authors have called attention to the fact that the theoretical foundations of psychology are shaky. The claim is that psychological theories are in general of poor quality and that the focus in psychology should shift more toward developing better theories instead of (just) improving statistical techniques and practices and performing more replication studies. In other words, we are facing a “theory crisis” that is more fundamental than the replication crisis that has received far more attention.

이 점은 물론 새로운 것은 아니지만, 폴 미엘이 그의 경력을 통해 강조하기도 했다(예: 미엘, 1967, 1978, 1990). 멜은 심리학자들은 새로운 이론들을 개발하는 것을 좋아하지만, 이러한 이론들은 누적된 이론적 진보를 낳는 대신 그냥 왔다가 사라지는 경향이 있다고 지적했다. 이론은 결정적으로 반박되거나 확립된 지식의 일부로 받아들여지지 않는다. 그들은 버려지거나 잊혀질 때까지 그저 빈둥거린다. 그는 1930년대와 1960년대에 각각 많은 열정으로 받아들여졌지만 지금은 대부분 잊혀진 '열망의 수준'과 '위험한 변화'의 이론을 예로 든다.

This point is of course not new but notably was also emphasized by Paul Meehl throughout his career (e.g., Meehl, 1967, 1978, 1990). Meehl pointed out that psychological scientists are fond of developing new theories, but instead of resulting in cumulative theoretical progress, these theories tend to just come and go: Theories are neither decisively refuted nor accepted as part of established knowledge; they simply hang around until they are abandoned or forgotten. He mentions as examples theories of “level of aspiration” and “risky shift,” which were received with much enthusiasm in the 1930s and 1960s, respectively, but are now largely forgotten.

미엘(1978)의 고전적 글 이후 40년이 지난 지금까지 심리학에서 이론의 역할은 크게 변하지 않았다. 예를 들어, 행동 변화 이론의 ABC라는 책에는 자기 조절 이론과 자기 효능감 이론에서부터 생태 모델에 이르기까지 [행동 변화 분야에만 83개의 이론]이 나열되어 있다(Michie et al., 2014). 이러한 이론들 중 어느 것도 보편적으로 받아들여지거나 결정적으로 반박되지 않는다고 가정해도 무방하다. 좀 더 구체적인 예로, [자아 고갈 이론]을 떠올려보라. 이 이론은 대단한 열정을 가진 기간 후에, 최근 몇 년 동안 심하게 비판되어 왔으며, 현재 그것에 대한 찬반 양측의 결정적인 증거는 없다.
In the 40 years that have passed since Meehl’s (1978) classic article, the role of theories in psychology has not changed much. For example, the book ABC of Behavior Change Theories lists 83 theories in the field of behavior change alone, ranging from self-regulation and self-efficacy theories to ecological models (Michie et al., 2014).1 It is safe to assume that none of these theories is universally accepted or decisively refuted. As a more specific example, consider ego-depletion theory (Baumeister et al., 1998, 2000). After a period of great enthusiasm, this theory has been heavily criticized in recent years, and currently there is no conclusive evidence either for or against it (Friese et al., 2019).

심리학에서 이론적 진보가 부족한 이유는 심리학 이론이 너무 모호하거나 추상적으로 공식화되는 경향이 있기 때문에 이를 위조하거나 시험하기 어렵다는 것이다(Meehl, 1978, 1990). 더욱이, 이론이 부족하고 일부 현상을 설명할 수 없는 것으로 밝혀진 경우에도, 심리학자들은 종종 그것의 과거의 성공에 초점을 맞추어 그것을 계속 사용한다(예: 고전적 조건화의 레스콜라-바그너 모델; 밀러 외, 1995). 이러한 요인들로 인해 [부족한 것으로 알려져 있지만 결정적으로 잘못된 것은 아닌 공존하고 중복되는 심리학 이론]이 많이 발생한다(Meehl, 1990). 따라서 최근 이론위기에 관한 문헌에서 공통적으로 제기되는 주제는 심리이론을 보다 형식적이고 정밀하게 만들거나 심리학자들에게 더 나은 이론을 구축하는 방법을 가르쳐야 한다는 것이다.
An explanation for the lack of theoretical progress in psychology is that psychological theories tend to be formulated so vaguely or abstractly that it is difficult to falsify or test them (Meehl, 1978, 1990). Moreover, even when a theory is found to be deficient and unable to explain some phenomena, psychological scientists often continue to use it, focusing on its past successes (e.g., the Rescorla-Wagner model of classical conditioning; Miller et al., 1995). These factors result in a plethora of coexisting and overlapping psychological theories that are known to be deficient but have not been decisively falsified (Meehl, 1990). Therefore, a common theme in the recent literature on the theory crisis is that psychological theories should be improved by making them more formal and precise or by teaching psychologists how to build better theories (e.g., Gigerenzer, 2010; Muthukrishna & Henrich, 2019; Oberauer & Lewandowsky, 2019; van Rooij & Baggio, 2021).

우리는 이러한 노력이 중요하고 칭찬받을 만하다고 생각한다. 그러나 이 기사에서는 다른 접근 방식을 취합니다. 우리는 좋은 심리이론을 개발하는 것이 극히 어렵고, 그것이 어려운 이유를 이해하는 것이 이론위기의 진전을 이루는 중요한 첫걸음이라고 주장한다. 즉, 심리학자들이 이론 개발에 충분한 노력을 기울이지 않거나 이론을 세울 줄 모르는 것이 아니라, 주제의 특성상 좋은 심리학 이론을 구축하는 데 큰 장애가 있다는 것이 문제이다. 이러한 장애물을 설명하고 분석하기 위해, 우리는 최근의 과학 철학에서 도출한다.
We find these efforts important and laudable. However, in this article, we take a different approach. We argue that the core of the problem is that developing good psychological theories is extremely difficult and that understanding the reasons why it is so difficult is a crucial first step in making progress in the theory crisis. In other words, the problem is not (just) that psychological scientists do not put enough effort into developing theories or do not know how to build theories but that there are great obstacles to building good psychological theories because of the nature of the subject matter. To explain and analyze these obstacles, we draw from recent philosophy of science.

이러한 접근 방식을 통해 우리는 미엘의 발자취를 따라갑니다. 이 특별호(Meehl, 1978)의 초점인 글에서 그는 인간의 심리를 과학적으로 연구하기 어렵게 만드는 어려움의 목록을 제공했다. 그러나 미엘은 자연히 당대 과학철학에 의존하고 있었고, 그 이후로 특히 자료, 이론, 인과관계를 이해하는 데 있어 이론의 위기와 매우 관련성이 높은 많은 발전이 있었다. 우리는 과학철학의 이러한 발전으로부터 출발하여, 좋은 심리이론을 개발하는 것이 왜 그렇게 어려운지에 대한 세 가지 주요 이유를 논의한다:

  • 강력한 현상에 의한 이론에 대한 제약의 부족,
  • 심리구조의 타당성의 문제, 
  • 심리변수들 사이의 인과관계를 발견하는 것의 장애물

With this approach, we follow in Meehl’s footsteps: In the article that is the focal point of this special issue (https://doi.org/10.1037/0022-006X.46.4.806" data-mce-href="https://journals.sagepub.com/doi/10.1177/1745691620970586#">Meehl, 1978), he provided a list of difficulties that make human psychology hard to study scientifically. However, Meehl was naturally relying on the philosophy of science of the day, and since then there have been many developments that are highly relevant for the theory crisis, especially in understanding the nature of data, theories, and causality. We draw from these developments in philosophy of science and discuss three key reasons for why developing good psychological theories is so hard:

  • the lack of constraints on theories by robust phenomena,
  • problems of validity of psychological constructs, and
  • obstacles to discovering causal relationships between psychological variables.

이론의 제약으로서의 현상
Phenomena as Constraints for Theories

이 절에서 우리는 현상이 과학에서 이론 발전을 제약한다고 주장하지만, 심리학에서는 충분한 제약을 가할 만큼 강력한 현상에 대한 지식이 충분하지 않다. 우선 과학철학에서는 [데이터, 현상, 이론]을 구분하는 것이 일반적이다. [데이터]는 실험 또는 데이터 수집을 기반으로 하는 원시 관측치입니다. 심리학의 경우, 예를 들어 설문지나 행동의 관찰에 대한 반응일 수 있다. [데이터]는 세계의 비교적 안정적인 특징인 현상에 대한 증거로 작용한다. 예를 들어, 서로 다른 Stroop 작업 실험의 데이터는 Stroop 효과에 대한 증거를 제공합니다. 만약 우리가 그 현상들을 설명하고 싶다면, 우리는 그것들이 어떻게 발생하는지 설명하는 이론이 필요하다.
In this section, we argue that phenomena constrain theory development in science, but that in psychological science, there is not enough knowledge of robust phenomena to impose sufficient constraints. To start with, in philosophy of science, it is common to distinguish among data, phenomena, and theories (Bogen & Woodward, 1988; Haig, 2013; Woodward, 1989). Data are the raw observations based on experiments or data collection: In the case of psychological science, they can be, for example, responses to questionnaires or observations of behavior. Data serve as evidence for phenomena, which are relatively stable features of the world: For example, the data from different Stroop task experiments provide evidence for the Stroop effect. If we then want to explain the phenomena, we need theories that describe how they come about.2

이 프레임워크는 잘 확립되었고 심리학에 적용되었다(Borsboom et al., 2021; Haig, 2013). 그러나 [이론과 현상] 사이의 관계는 일반적으로 "일방향 트래픽"으로만 논의된다. [이론]은 [현상]을 설명하기 위해 [공식화formulated]되며, 따라서 [이론]으로부터 관련 [현상]을 [도출derive]하거나 [예측predict]하는 것이 가능해야 한다. 예를 들어, 심리학 이론 논쟁에서 심리학 이론이 너무 모호하게 공식화되어 현상에 대한 정확한 예측을 하지 못한다는 것이 핵심이다. 이 논쟁에서 훨씬 덜 주목받은 것은 이 관계가 양방향이라는 것이다. 현상들은 또한 가능한 이론들에 제약을 가한다. 즉, 이론은 가능한 이론의 공간을 좁히는 현장의 모든 관련 현상과 일치해야 한다.
This framework is well established and has been applied to psychological science (Borsboom et al., 2021; Haig, 2013). However, the relationships between theories and phenomena are usually discussed only as “one-way traffic”: A theory is formulated to explain phenomena, and therefore it should be possible to derive or predict the relevant phenomena from the theory. For example, a central (and, in our view, valid) argument in the theory debate in psychological science is that psychological theories are so vaguely formulated that they do not make precise predictions regarding phenomena (e.g., Oberauer & Lewandowsky, 2019). What has received far less attention in this debate is that this relationship is bidirectional: Phenomena also impose constraints on the possible theories (Bechtel & Richardson, 1993; Craver & Darden, 2013). In other words, a theory has to be consistent with all the relevant phenomena of the field, which narrows the space of possible theories.

이것을 예로 들어 설명하겠습니다. 진화론을 도입하기 전에 찰스 다윈은 엄청난 양의 설명적 증거를 수집했다. 그는 H.M.S. 비글호를 타고 유명한 항해를 하는 동안 (거의 5년 동안 지속되었다) 수많은 관찰을 하고 노트에 기록했는데, 위에서 설명한 프레임워크는 데이터와 일치한다. 이 자료로부터 그는 갈라파고스 섬에 서로 다르지만 매우 유사한 새 종의 분포와 같은 흥미로운 패턴을 도출했다. 다윈은 돌아온 후 몇 년 동안 선택적 번식, 화석 기록, 항해 중에 수집한 표본을 포함한 광범위한 주제를 집중적으로 연구했다. 이 모든 영역에서 그는 종들이 공통의 조상을 가지고 있고 선택적인 번식과 유사한 방식으로 자연에 의해 선택된다는 것을 암시하는 [현상]을 발견했다. 그는 이러한 발견을 바탕으로 다양한 증거의 상세한 설명으로 구성된 종의 기원을 썼다(브라운, 2006; 다윈, 1859).
Let us illustrate this with an example. Before introducing the theory of evolution, Charles Darwin had gathered an immense amount of descriptive evidence (Browne, 2006; Darwin, 1859; Rozin, 2001). During his famous voyage on the H.M.S. Beagle (lasting nearly 5 years), he made numerous observations and wrote them down in his notebooks, which in the framework described above correspond to data. From these data he derived interesting patterns, such as the distribution of different but very similar bird species on the islands of the Galapagos. Over the years after his return, Darwin intensively studied a broad range of topics, including selective breeding, the fossil record, and the samples he had collected during the voyage. In all of these areas, he found phenomena suggesting that species have common ancestors and are selected by nature in a manner analogous to selective breeding. He wrote the Origin of Species, a large part of which consists of detailed descriptions of the various lines of evidence, on the basis of these findings (Browne, 2006; Darwin, 1859).

중요한 것은 이 증거가 다양할 뿐만 아니라 매우 강력하다는 것입니다. 이 [현상]은 몇 가지 독립적인 방법으로 검증 및 탐지 가능하며 특정 이론적 틀이나 관찰 방법에 의존하지 않았다. 예를 들어, 비둘기, 소, 개의 선택적 사육에서 형질의 진화의 패턴을 관찰할 수 있었고, 다른 연구자는 원칙적으로 이러한 패턴을 확인할 수 있었다. 그러므로 이러한 [현상]들은 과학계에서 일반적으로 동의되었고 [가능한 이론possible theories]의 공간에 [매우 강한 제약]을 가했다. 진화론은 이러한 강력한 패턴들 중 한두 개에만 해당되는 것이 아니라, [모든 것]과 일치해야 했습니다.
Importantly, this evidence was not only diverse but also highly robust: The phenomena were verifiable and detectable in several independent ways and not dependent on a specific theoretical framework or observation method (Eronen, 2015, 2019; Kuorikoski & Marchionni, 2016; Munafò & Smith, 2018; Wimsatt, 2007). For example, the patterns of the evolution of traits could be observed in the selective breeding of pigeons, cattle, and dogs, and any other researcher could in principle confirm these patterns. These phenomena were therefore generally agreed on in the scientific community and imposed very strong constraints on the space of possible theories. A theory of evolution had to fit with not just one or two of these robust patterns but with all of them.

천문학의 역사는 [현상이 이론에 강요하는 제약]의 훨씬 더 놀라운 예를 제공한다. 이 경우 관련 [현상]은 천체(가장 중요한 것은 달과 행성)의 운동 패턴이었다. 이러한 패턴은 수세기에 걸친 관찰에 기초했으며 매우 강력했다. 문제는 현상에 의해 부과된 엄격한 제약을 만족시키는 이론을 생각해내고 있었다(호스킨, 1997). 행성들이 복잡한 에피사이클 기반 궤적을 따른다는 프톨레마이오스의 지구중심적 모델은 부분적으로 현상에 더 적합하거나 동등하게 잘 맞을 이론을 내놓기가 매우 어려웠기 때문에 수세기 동안 살아남았다. 그러므로, 코페르니쿠스와 갈릴레오가 그들의 태양 중심 이론을 발전시켰을 때, 가능한 이론의 공간은 현상에 의해 매우 강하게 제약을 받았다. 현대의 [이론 물리학에 대한 제약]은 훨씬 더 극단적이다. 입자 물리학에서 천문학에 이르는 강력하고 논쟁의 여지가 없는 패턴의 방대한 본체가 있으며, 물리학에 대한 새로운 이론은 이 [모든 패턴]과 일치할 필요가 있다.
The history of astronomy provides an even more striking example of the constraints that phenomena impose on theories. In this case, the relevant phenomena were the patterns in the movement of celestial objects (most importantly the moon and the planets). These patterns were based on centuries of observations and highly robust; the problem was coming up with a theory that satisfied the stringent constraint imposed by the phenomena (Hoskin, 1997). Ptolemy’s geocentric model, according to which planets followed complex epicycle-based trajectories, survived for centuries partly because it was extremely difficult to come up with a theory that would have fit the phenomena better or equally well (Hoskin, 1997). Thus, when Copernicus and Galileo developed their heliocentric theories, the space of possible theories was very strongly constrained by the phenomena. The constraints on contemporary theoretical physics are even more extreme: There is a vast body of robust and undisputed patterns ranging from particle physics to astronomy, and any new theory of physics needs to be consistent with all of these patterns.

심리학에서의 상황은 매우 다르다. 이를 보기 위해 데이터와 현상의 구분을 상기해 보자. 심리학에서는 설문지, 웨어러블 기기, 인터넷 행동 등에서 사용할 수 있는 데이터의 양이 증가하고 있다. 그러나 이러한 데이터는 종종 의심스러운 품질(다음 절 참조)이며, 심리 과학의 많은 분야는 여전히 생물학이나 물리학에 필적할 만한 강력한 현상의 큰 본체를 가지고 있지 않다.

The situation in psychological science is very different. To see this, let us recall the distinction between data and phenomena. In psychological science, there is an increasing amount of data available from questionnaires, wearable devices, Internet behavior, and so on. However, these data are often of questionable quality (see the next section), and many areas of psychological science still have no large body of robust phenomena comparable to that of biology or physics.

예를 들어, [자아 고갈 효과]를 고려해보자. 이전에 자제력이 필요한 작업에 참여한 후(예: 쿠키를 먹고 싶은 유혹에 저항하는) 사람들이 자제력이 필요한 작업(예: 어려운 퍼즐 풀기)에서 더 나쁜 성과를 거두는 현상. 이 현상을 설명하는 독창적이고 매우 영향력 있는 이론은 자기 통제의 힘(또는 근육 또는 자원) 모델이며, 이에 따르면 [자기 통제]는 자기 통제가 필요하고 고갈될 수 있는 모든 작업에 사용되는 제한적이고 도메인-일반적인 자원이다.

As an example, consider the ego-depletion effect (Baumeister et al., 1998, 2000): the phenomenon that people perform worse on a task requiring self-control (e.g., solving a difficult puzzle) after having previously engaged in a task requiring self-control (e.g., resisting the temptation to eat cookies). The original and highly influential theory explaining this phenomenon is the strength (or muscle, or resource) model of self-control, according to which self-control is a limited and domain-general resource that is used by any tasks that require self-control and can be depleted (Baumeister et al., 1998, 2000).

이 이론을 지지하는 것으로 보이는 수백 개의 연구가 발표되었다(Inzlicht & Friese, 2019). 그러나 최근 몇 년 동안 자아 고갈 효과 자체와 그 이면에 있는 이론 모두에 의문이 제기되었다. 멀티랩 사전 등록 복제 연구에서 자아 고갈에 대한 증거는 거의 발견되지 않았다. 전체 효과 크기는 작았고(d = 0.04) 대부분의 참여 실험실의 경우 효과 크기의 95% 신뢰 구간이 0을 포함했다. 저자들은 "만약 어떤 효과가 있다면, 그것은 0에 가깝다" 더욱이 효과가 실제적이라 하더라도, 이용 가능한 근거는 자기통제의 강도모델 외에 다른 이론과도 양립할 수 있다는 지적이 있었다(Inzlicht & Friese, 2019). 예를 들어, Inzlicht와 Schmeichel(2012)이 제안한 프로세스 모델에서는 고갈된 일반적인 자원 대신 동기부여 감소와 관심의 이동에 의해 자아 고갈 효과가 설명된다.

Hundreds of studies that seem to support this theory have been published (Inzlicht & Friese, 2019). However, in recent years, both the ego-depletion effect itself and the theory behind it have been called into question (Friese et al., 2019). In a multilab preregistered replication study (Hagger et al., 2016), little evidence for ego depletion was found: The overall effect size was small (d = 0.04), and for most of the participating laboratories, the 95% confidence intervals of the effect size included zero. The authors concluded that “if there is any effect, it is close to zero” (p. 558). Moreover, it has been pointed out that even if the effect is real, the available evidence is compatible with other theories in addition to the strength model of self-control (Inzlicht & Friese, 2019). For example, in the process model proposed by Inzlicht and Schmeichel (2012), the ego-depletion effect is explained by reduced motivation and shifts in attention instead of a generic resource that is depleted.

중요한 것은 이것이 유일한 예가 아니라는 것이다. 심리학에서 발견의 수많은 복제 실패는 [심지어 잘 확립되었다고 생각되었던 현상]들(예: 고정관념 위협, 신생아 모방, 다양한 프라이밍 효과)도 심리학의 다른 영역에서도 상황은 비슷하다는 것을 시사한다. 다시 말해, 심리학 분야에서는 이론에 강한 제약을 가하는 광범위한 강력한 현상이 존재하지 않는다. 이는 가능한 이론들이 증거에 의해 [과소 결정]된다는 것을 의미한다. 즉, 사용 가능한 증거(즉, 관련 현상)는 우리가 어떤 이론을 진실이라고 믿어야 하는지 결정하기에 충분하지 않다(Stanford, 2017). 이런 점에서 [비교적 강력한 현상]이 거의 확립되지 않은 심리학 분야에서 [이론적인 진보]가 거의 이루어지지 않은 것은 놀라운 일이 아니다.

Importantly, this is not an isolated example. The numerous replication failures of findings in psychology, even phenomena that were thought to be well established (e.g., stereotype threat, neonatal imitation, various priming effects; Bird, 2018), suggest that the situation is similar in other areas of psychology (Inzlicht & Friese, 2019). In other words, in many areas of psychology, there is no broad range of robust phenomena that would impose strong constraints on theories. This means that the possible theories are underdetermined by evidence: The available evidence (i.e., the relevant phenomena) is not sufficient to determine which theory we should believe to be true (Stanford, 2017).3 In this light, it is not surprising that little theoretical progress has been made in areas of psychology in which relatively few robust phenomena have been established.

심리적 구조와 인식론적 반복
Psychological Constructs and Epistemic Iteration

심리학에서 좋은 이론이 왜 그렇게 적은지를 설명하는 또 다른 중요한 요소는 심리 구조를 개선하고 검증하는 데 관심이 부족하다는 것이다. 심리학 문헌에서 우리는 점점 더 많은 수의 심리학 구조를 발견한다. 새로운 구조와 그에 상응하는 척도가 지속적으로 도입되고, 오래된 구조처럼 보이는 것에 대해 새로운 용어가 발명되며, 명백히 다른 구조에 대해 동일한 용어가 사용된다(Hagger, 2014). 예를 들어, 엘렌 스키너(1996)는 통제 심리학 문헌의 구조에 대한 리뷰에서 [인식된 통제]와 관련된 구조만 30개 이상 발견했으며, 그 이후로 더 많은 구조물이 소개되었다(Hagger, 2014).
Another important factor explaining why there are so few good theories in psychology is the lack of attention on improving and validating psychological constructs. In the psychological literature, we find a large and increasing number of psychological constructs. New constructs and corresponding scales are constantly introduced, new terms are invented for what seem to be old constructs, the same term is used for apparently different constructs, and so on (Hagger, 2014). For example, in her review of constructs in the psychological literature on control, Ellen Skinner (1996) found more than 30 constructs related to perceived control alone, and since then many more have been introduced (Hagger, 2014).


원칙적으로, 수용 가능한 과학적 구조가 되기 위해서는, 이러한 모든 심리적 구조가 타당성을 가져야 한다. 구인 타당성의 개념은 Cronbach와 Meehl(1955)에 의해 도입되었으며, 그 의미는 그 후 수십 년 동안 크게 진화 및 영향을 받았다. 핵심 아이디어 중 일부는 구조가 [이론적 프레임워크](또는 Cronbach & Meehl의 처음 표현에 따르자면 "노몰로지 네트워크")에 포함되어야 하며, [구인의 측정]은 [측정하려는 것을 측정한다]는 의미에서 타당해야 한다는 것이다.
In principle, to be acceptable scientific constructs, all of these psychological constructs should have construct validity. The notion of construct validity was introduced by Cronbach and Meehl (1955), and its meaning has greatly evolved and ramified in the decades that followed (Newton & Shaw, 2013). Some of the core ideas are that the construct should be embedded in a theoretical framework (or a “nomological network” as originally phrased by Cronbach & Meehl, 1955) and that measurements of the construct should be valid in the sense that they measure what they are intended to measure (Borsboom et al., 2004).

문제는 구인 타당성이 결정적으로 중요하다는 데 널리 동의하지만, 실제로 심리학자들은 신뢰성과 같은 척도에 비교하자면, 구인 타당도에는 거의 주의를 기울이지 않는다는 것이다. 예를 들어, Flake et al(2017)은 Journal of Personality and Social Psychology에 게재된 논문의 무작위 샘플을 검토한 결과, 검토한 논문의 대부분이 사용된 구조에 대한 타당성 증거를 전혀 보고하지 않았다는 것을 발견했다. 증거가 보고되었을 때, 그것은 일반적으로 다른 기사에 대한 인용만으로 구성되었다. 마찬가지로 Zumbo와 Chan(2014)에 수집된 논문은 심리학자들이 상대적으로 타당성 증거를 적게 보고하고 다른 심리측정학적 특성, (가장 주요하게는) [신뢰성에 훨씬 더 집중하는 경향]이 있음을 보여준다. 이에 대한 가장 간단한 설명은 신뢰성 증거를 제공하는 것이 비교적 쉬운 반면, 타당성 증거를 제공하는 것은 매우 어렵다는 것이다. 전자의 경우 크론바흐의 α와 같이 잘 확립되고 정량화된 측정값이 있다. 후자의 경우 단순한 정량적 측정이 없으며, 구성 타당성이 무엇인지 또는 타당성 증거가 어느 정도여야 하는지에 대한 합의조차 이루어지지 않았다(Newton & Shaw, 2013). 구성 타당성이 교과서 및 지침서에 자주 등장하는 "시험은 측정하고자 하는 것을 측정해야 한다"는 문구로 이해된다면, 타당성을 확립하려면 관심 속성의 변동이 실제로 시험 점수의 변동을 야기하고 있음을 보여줄 필요가 있다. 이런 종류의 구조 검증은 거의 이루어지지 않기 때문에, 그 결과 심리학은 타당성을 알 수 없는 수많은 심리 구조들에 의해 스며들고 있다.

The problem is that although it is widely agreed that construct validity is crucially important, in practice psychological scientists give it very little attention compared with measures such as reliability. For example, Flake et al. (2017) reviewed a random sample of articles published in Journal of Personality and Social Psychology and found that most of the articles reviewed reported no validity evidence whatsoever for the constructs used. When evidence was reported, it typically consisted only of a citation to another article. Likewise, the articles collected in Zumbo and Chan (2014) show that psychological scientists tend to report relatively little validity evidence and focus much more on other psychometric properties, most importantly reliability. The simplest explanation for this is that providing reliability evidence is relatively easy, whereas providing validity evidence is very hard. For the former, there are well-established and quantified measures, such as Cronbach’s α. For the latter, there is no simple quantitative measure, and there is not even agreement on what construct validity is or what validity evidence should amount to (Newton & Shaw, 2013). If construct validity is understood in terms of the phrase “the test should measure what it is intended to measure,” which often appears in textbooks and guidelines, then establishing validity requires showing that variation in the attribute of interest is actually causing the variation in the test scores (Bringmann & Eronen, 2016; Borsboom et al., 2004). As construct validation of this kind is hardly ever done, the result is that psychological science is permeated by numerous psychological constructs of unknown validity (Flake et al., 2017; Fried & Flake, 2018).

자아 고갈 연구는 이것의 대표적인 예이다. 루르퀸과 미야케(2017)가 지적하듯이 핵심 개념인 '자기통제'가 명확하게 정의되거나 운용된 적은 없다. 종종 이 통제의 성격을 더 구체적으로 명시하지 않고 생각, 감정 또는 행동에 대한 모든 종류의 (억제적) 통제를 지칭하기 위해 매우 광범위하게 사용된다(Lurquin & Miyake, 2017). 또한 자아 고갈 연구에서 자기 통제를 측정하거나 조작하는 데 사용되는 설정은 검증되지 않았다. 최근 연구에서 윔머 외 연구진(2019)은 자아 고갈을 유도하기 위해 가장 널리 사용되는 작업 중 하나인 [편지 취소 작업]을 체계적으로 테스트했는데, 참가자들은 복잡한 규칙에 따라 문자를 지워야 한다. 그들은 이 작업이 자기 통제나 억제 통제에 영향을 미친다는 어떤 증거도 발견하지 못했다.

Ego-depletion research is a prime example of this. As Lurquin and Miyake (2017) point out, the key concept “self-control” has never been clearly defined or operationalized. It is often used very broadly to refer to any kind of (inhibitory) control over thoughts, emotions, or actions without further specifying the nature of this control (Lurquin & Miyake, 2017). Moreover, the setups that are used to measure or manipulate self-control in ego-depletion studies have never been validated (Inzlicht & Friese, 2019). In a recent study, Wimmer et al. (2019) systematically tested one of the most widely used tasks to induce ego depletion, the letter-cancellation task, in which participants have to cross off letters following complex rules. They did not find any evidence that this task would affect self-control or inhibitory control (Wimmer et al. 2019).

임상심리학에서 예로 주요 우울증(MDD)을 들 수 있다. MDD의 정의는 1970년대부터 시작되었으며, 그 이후로는 근본적으로 바뀌지 않았다. 예를 들어, MDD의 다른 경우에 큰 이질성이 있기 때문이다. (예를 들어, 두 사람이 단일 증상을 공유하지 않고 MDD를 가질 수 있다.) MDD 자체가 잘 정의된 카테고리인지 의심스럽다. 또한, MDD를 측정하는 데 사용되는 수많은 척도는 내용이 중복되지 않는 경우가 많아 실제로 하나의 동일한 구조를 측정하는 것인지 불분명하다.

As an example from clinical psychology, consider major depressive disorder (MDD). The definition of MDD stems from the 1970s and has not essentially changed since then, although it is increasingly clear that the validity of the construct is problematic (De Jonge et al., 2015; Fried, 2017). For example, because there is great heterogeneity in different cases of MDD (e.g., two individuals can have MDD without sharing a single symptom), it is doubtful that MDD in itself is a well-defined category (Fried, 2017). In addition, the numerous scales that are used to measure MDD often have little content overlap, making it unclear whether they are really measuring one and the same construct (Fried, 2017; Fried & Flake, 2018).

이러한 예들을 자연과학과 대조하는 것은 명확하다. 자연과학의 개념이나 분류는 추가 실험과 관찰을 통해 그리고 그것들이 내재된 이론적 틀을 개선함으로써 지속적으로 정제된다. 초기에 거칠고 잘못 정의된 개념(예: 상식적인 개념 "물고기fish")은 정제되고 재개념화된다. (예를 들어, 린네의 전통적인 종 분류법에서 물고기Pisces라는 개념으로, 대략 물 속에서 영원히 사는 지느러미 동물로 정의된다.) 그리고 새로운 버전은 새로운 이론과 증거에 기초하여 다시 테스트되고 조정된다. (예를 들어, 물고기는 더 이상 과학적 범주로 간주되지 않고 진화적 관계에 기초하여 몇 개의 다른 부류로 나뉘었다.)
It is illuminating to contrast these examples with the natural sciences. Concepts or classifications in the natural sciences are constantly refined through further experiments and observations and by improving the theoretical framework in which they are embedded. A concept that is initially rough and poorly defined (e.g., the commonsense notion “fish”) is refined and reconceptualized (e.g., into the concept “Pisces” in the traditional Linnaean taxonomy of species, defined roughly as finned animals perpetually living in water), and then the new version is again tested and adjusted on the basis of new theories and evidence (e.g., “Pisces” is no longer considered a scientific category but has been divided into several distinct classes on the basis of evolutionary relationships).

이것의 예는 과학에 많이 있다. 예를 들어, "전자"라는 개념은 1890년대에 물리학에 도입되었고, 처음에는 전하의 기본 단위를 의미했지만, 그 이후 양자 이론과 같은 실험과 이론적 발전을 통해 그 의미가 진화했고, 현재 "전자"는 페르미온이고, 전하가 -1인 소립자를 가리킨다. 1/2 등등.  Chang(2004, 2016)은 이 과정을 "인식적 반복"이라고 부르며, "특정 인식론적 목표의 달성을 강화하기 위해, 각각에 선행한 것 위에 구축되는, 지식의 연속적인 단계가 만들어지는 과정"이라고 특징짓는다(Chang, 2004, p.224).

Examples of this are abundant in the sciences: For example, the concept “electron” was introduced to physics in the 1890s, and it initially meant an elementary unit of electric charge, but since then its meaning has evolved through experiments and theoretical advances such as the quantum theory, and now “electron” refers to an elementary particle that is a fermion, has a charge of −1, spin of 1/2, and so on. Chang (2004, 2016) calls this process “epistemic iteration” and characterizes it as “a process in which successive stages of knowledge, each building on the preceding one, are created in order to enhance the achievement of certain epistemic goals” (Chang, 2004, p. 224)

이와는 대조적으로 심리학에서는 공식 지침이 검증의 중요성과 진행 중인 프로세스로 어떻게 봐야 하는지를 강조하지만, 이러한 반복은 표준이 아니다(Flake et al., 2017). 그러나 몇 가지 긍정적인 예외가 있다. 예를 들어, 에빙하우스가 1880년대에 기억의 과학적 연구를 개척했을 때, 그는 "기억"을 하나의 상식적인 개념으로 취급하고 있었고, 다른 종류의 기억들을 구별하지 않았다. 이후 연구, 특히 1950년대부터 시작된 [비선언적 기억]과 [선언적 기억]과 같은 많은 종류의 기억들이 도입되었으며, 그 중 [후자(선언적 기억)]는 [에피소드적 기억]과 [의미적 기억]으로 더 나눌 수 있다. 기억의 다른 범주와 종류는 고정되어 있지 않지만 새로운 증거와 주장에 비추어 여전히 정제되고 논의되고 있다(Tulving, 2007).
In contrast, in psychology, this kind of iteration is not the norm, although official guidelines emphasize the importance of validation and how it should be seen as an ongoing process (Flake et al., 2017). There are, however, some positive exceptions (see also Kendler, 2012). For example, when Ebbinghaus pioneered the scientific study of memory in the 1880s, he was treating “memory” as a monolithic commonsense notion and did not distinguish between different kinds of memory (Tulving, 2007). In subsequent research, especially starting from the 1950s, many different kinds of memory have been introduced, such as nondeclarative and declarative memory, the latter of which can be further divided into episodic and semantic memory (Michaelian & Sutton, 2017). The different categories and kinds of memory are not fixed but are still refined and debated in light of new evidence and arguments (Tulving, 2007).

심리학적 구조가 종종 변화에 그렇게 저항하는 실용적인 이유 중 하나는, 윌리엄 윔샛에 의해 만들어지고 개발된 개념인 , "생성적 고착(알박기)"이다. 일단 어떤 개념이 그것에 따라 다른 많은 개념, 이론, 또는 실천을 가지면, 그것은 "고착"이 되고, 그것이 부족하거나 문제가 있다고 알려져도 바꾸기가 매우 어려울 것이다. 개념을 바꾸면 그에 따라 구조가 무너져 재앙이나 혁명으로 이어질 수 있기 때문이다. 심리학적 구조(특히 임상심리학)는 다른 이론과 모델뿐만 아니라 사회 전반에서도 적용되기 때문에 시간이 지남에 따라 깊이 자리 잡게 되는 경우가 많다. 예를 들어, MDD와 같은 구조는 환자를 진단하거나 건강보험에 대한 결정을 내리는 데 중요한 역할을 한다.
One practical reason why psychological constructs are often so resistant to change is “generative entrenchment,” a concept coined and developed by William Wimsatt (1986, 2007). Once a concept has many other concepts, theories, or practices depending on it, it becomes “entrenched” and will be very difficult to change, even if it is known to be deficient or problematic. This is because changing the concept could collapse the structures depending on it, leading either to a disaster or a revolution (Wimsatt, 2007, p. 140). Psychological constructs (especially in clinical psychology) often become deeply entrenched over time, as they have applications not only in other theories and models but also in society at large. For example, constructs such as MDD play an important role in diagnosing patients or in making decisions about health insurance.

그러나 인식론적 반복과 심리적 구조의 검증은 이론의 위기에서 벗어나는 방법을 찾는 데 결정적으로 중요하다. 앞 절에서 주장했듯이 [좋은 이론의 근거]는 [강력한 현상]이다. 결국, 현상은 데이터에서 추론되며, 데이터가 대부분 잘 이해되거나 검증되지 않은 구성과 측정을 기반으로 한다면, 추론된 현상은 강력하지 않을 것이다. 다시 말해, 심리학에서 강력한 현상이 없는 한 가지 원천은 구성 검증 과정에 대한 강조의 부족이다.
However, epistemic iteration and validation of psychological constructs is crucially important for finding a way out of the theory crisis. As we argued in the previous section, the basis for good theories is robust phenomena. Phenomena, in turn, are inferred from data, and if the data are based on constructs and measurements that for the most part have not been well understood or validated, the phenomena that are inferred are unlikely to be robust. In other words, one source for the lack of robust phenomena in psychology is the lack of emphasis on the process of construct validation.

심리학적 이론과 원인 규명의 문제
Psychological Theories and the Problem of Finding Causes

심리학에서 좋은 이론이 그렇게 적은 세 번째 이유는 심리적 원인을 찾는 것이 매우 어렵기 때문이다. 좋은 이론의 주요 특징은 어떤 식으로든 인과관계를 추적해야 한다는 데 널리 동의되고 있다. 예를 들어 다윈의 진화론은 진화의 원인(자연선택)을 기술했고, DNA 이론은 유전의 인과적 메커니즘을 기술했다. 이러한 관점에서, 심리학적 이론들이 정신이 어떻게 작용하는지를 설명하는 것을 목표로 하는 한, 정신의 인과적 메커니즘을 또한 반영해야 한다고 요구하는 것은 타당하다. 즉, 심리적 변수들 간의 인과관계를 포착해야 한다.
The third reason why there are so few good theories in psychology is that finding psychological causes is extremely challenging. It is widely agreed that a key feature of good theories is that they should, in one way or another, track causal relationships (e.g., Craver, 2007; Pearl, 2000; Woodward, 2003). For example, Darwin’s theory of evolution described the causes of evolution (natural selection), and the DNA theory describes the causal mechanism of inheritance. In this light, it is reasonable to require that psychological theories, insofar as they aim to explain how the mind works, should also reflect the causal mechanisms of the mind (Bechtel, 2008; Thomas & Sharp, 2019). In other words, they should capture causal relationships between psychological variables.

그러나 문제는 Eronen(2020)에서 광범위하게 주장되었듯이 심리적 변수들 간의 인과관계를 발견하는 것이 종종 극도로 어렵거나 불가능하다는 것이다. 그 이유를 설명하기 위해 인과관계를 명확하고 일반적인 방법으로 추론할 수 있는 조건을 제시하는 개입주의적 인과관계의 틀에 의존한다. 
The problem, however, is that discovering causal relationships between psychological variables is often extremely difficult or impossible, as extensively argued in Eronen (2020). To explain why, we rely on the framework of the interventionist theory of causation (Woodward, 2003, 2015; see also Pearl, 2000, 2009), which lays out the conditions for inferring causal relationships in a clear and general way.

[인과관계]의 특징은 (상관관계와 달리) 조작과 통제에 이용될 수 있는 관계라는 것이다. [원인에 개입]하는 것은 [효과의 변화]를 가져오는 방법이다. 개입주의 이론은 이것을 출발점으로 삼아 다음과 같이 인과관계를 정의한다. 다른 변수가 해당 값에 고정되어 있을 때 X에 개입하여 Y를 변경할 수 있는 경우에만 X가 Y의 원인입니다. [개입]은 [Y에 대한 X의 교란 없는unconfounded 조작]이어야 한다: 즉, 'X를 조작'했을 때, [X를 거치지 않는 다른 경로]를 통해 Y를 변화시켜서는 안 된다. (더 정확한 정의는 Eronen, 2020; Woodward, 2003 참조). 실제로 개입을 수행할 필요가 항상 있는 것은 아닙니다. 
때때로 예를 들어 관찰 데이터를 기반으로 간접적으로 개입의 효과에 대한 지식을 얻는 것이 가능하다. 또한, 루빈의 인과관계 모델(예: 루빈, 2005)이나 캠벨의 인과관계 모델(예: 샤디쉬 외, 2002)과 같이 심리과학자들에게 더 친숙한 인과관계에 대한 다른 접근법에서도 동일한 생각이 다른 형태로 나타난다.

The characteristic feature of causal relationships is that (unlike correlations) they are relationships that are exploitable for manipulation and control: Intervening on the cause is a way of bringing about a change in the effect. The interventionist theory takes this as the starting point and defines causation (roughly) as follows: X is a cause of Y if (and only if) it is possible to intervene on X to change Y when other variables are held fixed to their values. The intervention should be an unconfounded manipulation of X with respect to Y: The manipulation of X should not change Y via any other route that does not go through X (for more precise definitions, see Eronen, 2020; Woodward, 2003). It is not always necessary to actually perform an intervention; sometimes it is possible to gain knowledge about the effects of interventions indirectly, for example, on the basis of observational data. The same ideas also appear in different forms in other approaches to causation that are more familiar to psychological scientists, such as Rubin’s causal model (e.g., Rubin, 2005) or Campbell’s causal model (e.g., Shadish et al., 2002).

무작위 대조 시험은 일반적으로 인과 추론을 위한 "금본위제"로 간주되며 위의 조건을 만족시킨다. 예를 들어, 약물 실험에서 참가자는 무작위로 치료 및 대조군에 할당되며, 이 무작위화는 원인(약물)과 효과(회복)가 아닌 다른 변수를 "고정"하는 효과를 생성한다. 치료 그룹의 참가자에게 약물을 투여하는 개입은 근거가 없어야 한다. 예를 들어, 알약에는 약물 자체를 순환하는 원인 경로를 통해 회복에 영향을 미치는 다른 성분이 있어서는 안 된다.
Randomized controlled trials are usually taken to be the “gold standard” for causal inference and for satisfying the above conditions. For example, in a drug trial, participants are randomly assigned to treatment and control groups, and this randomization generates the effect of “holding fixed” other variables than the cause (the drug) and the effect (recovery). The intervention of administering the drug to participants in the treatment group should be unconfounded: For example, there should not be other ingredients in the pill that would affect recovery through a causal route that goes around the drug itself.

많은 [심리 실험]은 약물, 교육 자료 또는 시각 및 청각 자극과 같은 비심리적 원인의 조작을 포함한다(Eronen, 2020). 이러한 경우, 올바른 종류의 개입을 수행하는 것은 원칙적으로 다른 분야보다 어렵지 않다. 따라서 다음의 주장은 외적 독립 변수를 조작하고 심리적 영향을 추적하는 빌헬름 분트까지 거슬러 올라가는 오래된 실험 전통과 관련이 없다. 그러나 정신의 [인과적 메커니즘]을 기술하는 [실체적인 심리학 이론substantive psychological theory]을 개발하는 것이 목적이라면, [외부 독립 변수]와 [심리적 변수] 사이의 인과 관계를 확립하는 것만으로는 충분하지 않다. 우리는 또한 [심리적 변수]들 사이의 인과관계를 배울 필요가 있다. 그리고 이것을 하기 위해서, 우리는 개입이 심리적 변수에 미치는 영향에 대해 배울 필요가 있다.

Many psychological experiments involve the manipulation of nonpsychological causes, such as drugs, educational materials, or visual and auditory stimuli (Eronen, 2020). In such cases, performing the right kinds of interventions is in principle not more difficult than in other fields. Therefore, the following arguments do not concern the venerable experimental tradition, going all the way back to Wilhelm Wundt, of manipulating external independent variables and tracking their psychological effects. However, if the aim is to develop substantive psychological theories that describe causal mechanisms of the mind, establishing causal relationships between external independent variables and psychological variables is not enough: We also need to learn causal relationships between psychological variables. And to do this, we need to learn about the effects of interventions on psychological variables.

[심리적 변수]에 대한 개입의 문제는 일반적으로 "뚱뚱한 손"이라는 것이다. 이 variable는 대상 variable 하나만 변경하는 것이 아니라 여러 다른 variable도 바꿔놓습니다. 생각이나 영향 등 심리적 변수를 직접 조작할 방법이 없기 때문이다. 대신, 그들은 구두 지시나 다른 외부 자극을 통해 간접적으로 조작되어야 하며, 그러한 기술은 일반적으로 하나의 변수만 변경할 정도로 정확하지 않다. 예를 들어, (적어도 현재) 동기, 주의 또는 불안감과 같은 다른 심리 상태를 변경하지 않고 [통제력 상실의 감정을 조작하는 것]은 불가능하다. 또한 심리적 변수는 예를 들어 자기 보고서나 행동 대용물을 기반으로 간접적으로만 측정할 수 있다(De Houwer, 2011). 따라서 개입이 정확히 어떤 변수를 변경했는지, 따라서 어느 정도까지 뚱뚱했는지 검증하거나 확인하는 것이 매우 어렵습니다.

The problem with interventions on psychological variables is that they are typically “fat-handed” (Eronen, 2020)4: They do not change just the one variable that is targeted but several other variables as well. This is because there is no direct way of manipulating psychological variables such as thoughts or affects (Chiesa, 1992; Hughes et al., 2016). Instead, they have to be manipulated indirectly via verbal instruction or other external stimuli, and such techniques are typically not precise enough to change just one variable. For example, it is (at least currently) impossible to manipulate feelings of loss of control without changing any other psychological states, such as motivation, attention, or feelings of anxiety. Moreover, psychological variables can be measured only indirectly, for example, on the basis of self-reports or behavioral proxies (De Houwer, 2011). This makes it very difficult to verify or check what variables the intervention precisely changed and therefore to what extent it was fat-handed.

이것은 심리적인 원인을 찾는 데 문제를 일으키는데, 왜냐하면 개입이 뚱뚱할 때, 우리는 그것들이 [인과적 추론]을 할 수 있게 만들어주는 [교란 없는unconfounded 조작manipulation]이라고 가정할 수 없기 때문이다. 보다 구체적으로, 우리는 그것들이 추정 원인 X를 통과하는 경로를 통해서만 추정 효과 Y를 변화시킨다고 가정할 수 없다. 이것을 설명하기 위해, 다시 한번 자아 고갈 연구에 초점을 맞추자. 자아 고갈 실험에서, 자기 통제는 매우 다양한 방식으로 조작된다(예: 참가자가 복잡하거나 좌절하는 작업이나 게임에 참여하게 하거나 맛있는 음식을 먹고 싶은 유혹을 뿌리치게 함으로써). Friese et al., 2019. 두 번째 작업에서 자기 통제가 성능 저하의 원인이라는 결론을 보증하기 위해, 이러한 개입은 추정 효과(즉, 두 번째 작업에서 성능 저하)와 관련하여 근거 없는 자기 통제의 조작이어야 한다. 다시 말해, 그들은 효과의 다른 가능한 원인(예: 동기, 주의, 분노의 감정)에 영향을 미치지 않는 방식으로 자기 통제를 변화시켜야 한다. 그러나 개입의 다소 일반적인 성격과 자기 통제 및 관련 구성(동기, 주의 등)의 인과 구조에 대한 우리의 지식이 부족하다는 점을 고려할 때, 
우리는 현실적으로 이것이 사실이라고 가정할 수 없다. 예를 들어, 쿠키를 먹고 싶은 유혹에 저항하는 것은 또한 동기부여에 영향을 미치거나 분노와 좌절의 감정을 유발시킬 수 있다. 이는 자아 고갈 실험이 감소된 자기 통제 자원이 두 번째 작업에서 성능 저하에 대한 원인이라는 충분한 증거를 제공하지 않는다는 것을 의미하며, 이는 실제로 최근 연구 상태에 대한 검토에서 도달한 결론과 일치한다.

This creates a problem for finding psychological causes because when interventions are fat-handed, we cannot assume that they are unconfounded manipulations that license causal inferences. More specifically, we cannot assume that they change putative effect Y only via a route that goes through the putative cause X. To illustrate this, let us again focus on ego-depletion research. In ego-depletion experiments, self-control is manipulated in very diverse ways (e.g., by letting participants engage in a complex or frustrating task or game or by letting them resist the temptation to eat delicious food; Friese et al., 2019). To warrant the conclusion that self-control is the cause of impaired performance in the second task, these interventions should be unconfounded manipulations of self-control with respect to the putative effect (i.e., impaired performance in the second task). In other words, they should change self-control in such a way that other possible causes of the effect are not affected (e.g., motivation, attention, feelings of anger). However, given the rather general nature of the interventions and our lack of knowledge of the causal structure of self-control and related constructs (motivation, attention, etc.), we cannot realistically assume that this is the case (Friese et al., 2019). For example, resisting the temptation to eat cookies might also affect motivation or induce feelings of anger and frustration. This means that ego-depletion experiments do not provide sufficient evidence that a diminished self-control resource is the cause for the impaired performance in the second task which is indeed in line with the conclusion reached in recent reviews of the state of the research (Friese et al., 2019; Inzlicht & Friese, 2019).

요약하면, [심리 변수에 대한 개입]은 [뚱뚱한 손]일 가능성이 높으며, 그러한 개입은 인과 추론의 [신뢰할 수 있는 근거를 제공하지 못한다]. 심리변수에 대한 개입은 종류가 완전히 다르고 외부변수에 대한 개입보다 훨씬 어렵기 때문에 외부요인을 조작하고 그 심리적 영향을 추적하는 실험적 전통은 단순히 심리변수를 조작하는 것으로 확장될 수 없다(Chiesa, 1992; De Houwer, 2011 참조). 심리학 이론이 인과관계를 추적해야 하는 한, 이는 심리학에서 좋은 이론이 왜 그렇게 적은지, 그리고 왜 그렇게 발전하기 어려운지를 설명하는 데 중요한 요소이다.
In sum, interventions on psychological variables are likely to be fat-handed, and such interventions do not provide a reliable basis for causal inference. The experimental tradition of manipulating external factors and tracking their psychological effects cannot simply be extended to manipulate psychological variables, as interventions on psychological variables are entirely different in kind and far more difficult than interventions on external variables (see also Chiesa, 1992; De Houwer, 2011). Insofar as psychological theories should track causal relationships, this is an important factor in explaining why there are so few good theories in psychology and why they are so difficult to develop.

논의
Discussion

이 글에서는 좋은 심리이론을 개발하는 데 있어 세 가지 근본적인 어려움에 대해 논의하였다. 

  • (충분한) 강력한 현상의 부족,
  • 심리적 구조에 대한 타당성과 인식론적 반복의 부족,
  • 심리적 원인 정립의 문제 등

이러한 문제들은 이론 위기 해결에 진전을 이루기 위해 다루어지고 논의되어야 한다. 우리는 이제 이러한 문제에 기초하여 심리 연구에 대한 몇 가지 권장 사항을 개략적으로 설명한다.

In this article, we have discussed three fundamental difficulties in developing good psychological theories:

  • the lack of (sufficient) robust phenomena,
  • the lack of validity and epistemic iteration for psychological constructs, and
  • the problem of establishing psychological causes.

These issues should be addressed and discussed to make progress in resolving the theory crisis. We now outline several recommendations for psychological research on the basis of these issues.

첫째, 우리의 논의는 심리학에서 최근 더 많은 "현상 감지" 또는 "현상 주도 연구"에 대한 요구를 지지한다. [새로운 현상을 발견]하고, 이미 발견된 것에 대한 보다 강력한 증거를 수집함으로써 가능한 이론의 공간은 제한될 것이다. 

First, our discussion supports the recent calls for more “phenomena detection” or “phenomenon-driven research” in psychology (Borsboom et al., 2021; De Houwer, 2011; Haig, 2013; see also Trafimow & Earp, 2016). By discovering new phenomena and gathering more robust evidence for those already discovered, the space of possible theories will be constrained.

[현상 주도 연구]를 지지하는 또 다른 중요한 이유는 현상이 과학과 사회에 매우 중요할 수 있기 때문이다(Eronen, 2020). 
예를 들어 확증편향과 같이 심리학자들이 발견한 광범위한 인지편향은 대부분 매우 강력한 현상이다(길로비치 외, 2002). 이러한 현상을 설명하기 위해 다양한 이론이 제안되었는데, 예를 들어, 사람들이 간단한 휴리스틱으로 어려운 계산을 대체한다고 보는 [속성-대체 이론]이나, 이것보다 훨씬 일반적인 [이중 시스템 이론](Kaneman & Frederick, 2002) 등이 있다. 그러나 이러한 이론들은 현상 자체보다 훨씬 더 논란이 많다. 더욱이, 이러한 [현상들이 존재한다는 것]을 아는 것은 비록 우리가 그 이면의 이론이나 메커니즘을 알지 못하더라도 과학과 사회에 매우 중요하다. 심리학에서 발견된 광범위한 다른 강력한 현상, 예를 들어, 사람들이 [익숙하지 않은 자극]보다 [익숙한 자극]을 선호하는 경향이 있는 현상도 마찬가지다(즉, 단순한 노출 효과; Bornstein, 1989). 이러한 [현상이 존재한다는 것]을 [아는 것, 그리고 그것을 기술하는 것]은 그것들을 설명할 수 있는 받아들여진 이론이 없는 경우에도 유용하다. 

Another important reason to support phenomenon-driven research is that phenomena can also be extremely important for science and society as such (https://doi.org/10.1016/j.newideapsych.2020.100785" data-mce-href="https://journals.sagepub.com/doi/10.1177/1745691620970586#">Eronen, 2020): Consider, for example, the broad range of cognitive biases that psychologists have discovered, such as confirmation bias, most of which are very robust phenomena (Gilovich et al., 2002). Various theories have been proposed to explain these phenomena, such as the attribute-substitution theory, according to which people substitute difficult computations with simple heuristics, or the more general dual-system theory (Kahneman & Frederick, 2002). However, these theories are far more controversial than the phenomena themselves. Moreover, knowing that these phenomena exist is extremely important for science and society, even if we do not know the theory or mechanism behind them. The same holds for a broad range of other robust phenomena discovered in psychology, for example, the phenomenon that people tend to prefer familiar stimuli to unfamiliar ones (i.e., the mere-exposure effect; Bornstein, 1989). Simply knowing that these phenomena exist and describing them is useful, even in the absence of an accepted theory that would explain them.

발견되고 기술되는 것 외에도, [서로 다른 현상들에서 공유된 추상적 구조]를 찾아냄으로써 현상을 더욱 분석할 수 있다(Hughes et al., 2016). 예를 들어, 추상적 수준에서, [끊임없이 전화기를 확인]하고 [사탕으로 아이들의 좋은 행동을 보상하는 것]이라는 이 두 가지 서로 다른 현상들은 둘 다 (긍정적) 강화의 사례로 볼 수 있다(Hughes et al., 2016). 이러한 모든 이유로, [현상 탐지]는 그 자체로 중요한 목표이자 심리 연구의 중심적인 부분으로 간주되어야 한다(Fiedler, 2017; Haig, 2013; Rozin, 2001 참조).
In addition to being discovered and being described, phenomena can also be further analyzed by looking for shared abstract structures in different phenomena (Hughes et al., 2016). For example, at an abstract level, phenomena as different as constantly checking your phone and rewarding the good behavior of children with candy can both be seen as instances of (positive) reinforcement (Hughes et al., 2016). For all of these reasons, phenomena detection should be seen as an important goal in itself and as a central part of psychological research (see also Fiedler, 2017; Haig, 2013; Rozin, 2001).

그러나 우리는 결코 심리학에서의 이론화가 절망적이거나 자원의 낭비이거나 정신적 과정에 대한 이론이 비과학적이라고 거부되는 일종의 행동주의로 돌아가야 한다고 제안할 생각은 없다. 우리가 제기한 문제는 극복할 수 없는 장애물이 아니라 주어진 영역에서 좋은 심리학 이론이 개발되기 전에 충족되어야 할 도전으로 보아야 한다.
However, we by no means intend to suggest that theorizing in psychology is hopeless or a waste of resources or that we should return to a kind of behaviorism in which theories about mental processes are rejected as unscientific. The issues we have raised should not be seen as insurmountable obstacles but rather as challenges that need to be met before good psychological theories can be developed in a given domain.

이제 다음 사항을 살펴보겠습니다. 최근 문헌에서 공통적으로 다루어지는 주제인 [심리이론을 좀 더 수학적으로, 형식적으로 만드는 것]이 과학으로서 심리학의 상당한 발전으로 이어질지 의문이다.5 우리가 논의한 문제들 중 어떤 것도 심리학 이론을 공식화하는 것으로 해결되지 않는다. (심리 이론을 formalize하더라도) 여전히 [이론을 제약할 강력한 현상]은 많이 나타나지 않을 것이며, 따라서 [사용된 구인]이 더 유효해지지도 않을 것이며, 공식적인 처치formal treatment만으로는 [인과관계와 뚱뚱한 개입의 문제]를 해결할 수 없다. 또한 생명과학에서 많은 성공적이고 매우 중요한 이론들은 형식화되거나 수학적인 이론이 아니다. (예: 발효 이론 또는 시냅스 전달 이론; Bechtel & Richardson, 1993; Machamer, Darden & Craver, 2000) Rozin(2001; Morey et al., 2018 참조)이 지적한 바와 같이, 복잡한 통계 및 계산 모델을 사용한다고 해서 심리학이 더 과학적이지는 않으며, [개념 및 경험적 기초(예: 강력한 현상)]가 아직 견고하지 않다면 오히려 역효과를 낼 수 있다.

This brings us to our next point: It is doubtful whether making psychological theories more mathematical or formal, which is a common theme in the recent literature (e.g., Borsboom et al., 2021; Muthukrishna & Henrich, 2019; Oberauer & Lewandowsky, 2019; van Rooij & Baggio, 2021), will lead to significant advances in psychology as a science.5 None of the problems we have discussed is solved by formalizing psychological theories: There will still be no large body of robust phenomena to constrain the theories, the constructs used do not become more valid, and a formal treatment alone does not solve the problem of causality and fat-handed interventions. Moreover, many successful and extremely important theories in the life sciences are not formalized or mathematical theories (e.g., the fermentation theory or the theory of synaptic transmission; Bechtel & Richardson, 1993; Machamer, Darden & Craver, 2000). As pointed out by Rozin (2001; see also Morey et al., 2018), using complex statistical and computational models does not make psychology more scientific and can be even counterproductive if the conceptual and empirical basis (e.g., robust phenomena) is not yet solid.

마지막으로, [이론의 기초]로서 [명확하고 투명하게 정의된 개념을 갖는 것]의 중요성을 아무리 강조해도 지나치지 않다. 이는 이론의 공식화와는 다르다. 개념은 [정성적으로 공식화된 이론]에서도 잘 정의될 수 있으며(예: 다윈의 진화론), 형식 이론은 제대로 정의되지 않은 개념을 요소로 가질 수 있다(예: 명확한 수학적 구조를 가지고 있지만 중심 개념 "밈"이 잘 정의되지 않은 밈학 모델; Kronfeldner, 2011). [개념적 명확화]와 [구인 타당화construct validation]은 연구의 중요하고 가치 있는 부분으로 간주되어야 하며, validation은 단지 넘어야 할 장애물이 아닌 반복적이고 지속적인 과정으로 간주되어야 한다. 우리가 볼 때, 심리학 이론의 개념적 기초를 강화하는 것은 적어도 심리학 연구에서 통계적 기법과 관행을 향상시키는 것만큼 중요하다.

Finally, it is hard to overemphasize the importance of having clearly and transparently defined concepts as the basis for theories. Note that this is not the same as formalization of theories: Concepts can be well defined in qualitatively formulated theories as well (e.g., Darwin’s theory of evolution), and formal theories can have poorly defined concepts as their elements (e.g., models in memetics that have a clear mathematical structure but for which the central concept “meme” is not well defined; Kronfeldner, 2011). Conceptual clarification and construct validation should be seen as an important and valuable parts of research, and validation should be taken to be an iterative and ongoing process instead of just a hurdle that needs be crossed. In our view, strengthening the conceptual basis of psychological theories is at least as important as improving statistical techniques and practices in psychological research.

장기적으로, 이것은 [명확하게 정의되고, 명확하게 측정 가능한 구인]을 가지게 해줌으로써, [표적 개입]을 수행하고 그 영향을 추적하는 것을 더 쉽게 만들어주고, 궁극적으로 [인과 추론] 문제에 도움이 될 것이다. 충분히 [잘 정의된 구조]와 [타당한 측정]으로, 순수한 [관측 데이터로부터 인과 관계를 추론]할 수도 있다(예: Eronen, 2020; Roher, 2018 참조). 심리학적 원인을 찾는 문제에 대한 또 다른 가능한 반응은, 예를 들어, 현상으로부터 추출된 추상적 기능 원리의 형태로 [비인과 이론noncausal theory]을 개발하는 것이지만, [비인과 이론]이 진정으로 설명될 수 있는지는 현재 진행 중인 논쟁의 문제이다.

In the long run, this will also help with the problem of causal inference, as having clearly defined and clearly measurable constructs makes it easier to perform targeted interventions and to track their effects. With sufficiently well-defined constructs and valid measurements, it may also be possible to eventually infer causal relationships from purely observational data (for more, see, e.g., Eronen, 2020; Rohrer, 2018). Another possible reaction to the problem of finding psychological causes is to develop noncausal theories, for example, in the form of abstract functional principles extracted from phenomena (De Houwer, 2011; Hughes et al., 2016), although whether noncausal theories can be truly explanatory is a matter of ongoing debate (see, e.g., Reutlinger & Saatsi, 2018).

다행히도, 우리가 위에서 설명한 좋은 관행을 예시하는 심리학의 지속적인 연구 프로그램들이 있다. 예를 들어, 최근 [자아 고갈 연구]에서 실망한 이후, [자기 통제 및 관련 개념]과 같은 핵심 구조를 더 잘 정의하고 이를 측정하는 다양한 방법을 검증하려는 노력이 증가하고 있다. 더 넓은 예는 먼저 [환경-행동 관계(강력한 현상)]를 확립한 후 [매개자 역할]을 하는 명확하게 정의된 정신적 구조의 관점에서 이에 대한 설명을 공식화하는 것을 목표로 하는 기능-인지 패러다임이다. 마지막으로, 보다 구체적인 예로서, Robinaugh 외 연구진(2020)은 이러한 특정 장애에 맞춤화되어 현상에 의해 제약을 받는 공황 장애에 대한 이론을 제안하고, 저자들은 또한 핵심 개념을 정의하는 데 명시적으로 초점을 맞추고 있다.
Fortunately, there are ongoing research programs in psychology that exemplify the good practices we have describe above. For example, after the recent disappointments in ego-depletion research, there are now increasing efforts to better define the key constructs, such as self-control and related concepts, and to validate different ways of measuring them (Friese et al., 2019; Inzlicht & Friese, 2019; Lurquin & Miyake, 2017). A broader example is the functional-cognitive paradigm (De Houwer, 2011; Hughes et al., 2016) that aims at first establishing environment-behavior relations (robust phenomena) and then formulating explanations for them in terms of clearly defined mental constructs that act as mediators. Finally, as a more concrete example, Robinaugh et al. (2020) propose a theory for panic disorder that is tailored to this specific disorder and thereby constrained by phenomena (there is robust evidence for many central phenomena related to panic attacks), and the authors also explicitly focus on defining the key concepts.


결론적으로, 우리는 이론 위기의 근저에 있는 가장 근본적인 요인은 주제 그 자체인 심리학이 좋은 이론을 개발하는 것을 매우 어렵게 만든다는 것이라고 믿는다(Meehl, 1978). 현대 과학 철학을 바탕으로, 우리는 심리학적 이론을 발전시키기 위한 세 가지 핵심 과제에 대해 논의했습니다. 이론을 제약할 만큼 [강력한 현상]이 없는 경우가 많고, [구인를 정의하고 검증]하는 데 충분한 주의를 기울이지 않으며, 심리적 [원인을 규명]하는 것은 매우 어렵다. 우리는 이 기사가 이러한 중요한 문제들에 더 많은 관심을 가져옴으로써 심리학의 이론적 토대를 위한 보다 견고한 구성 요소를 제공하는 데 도움이 되기를 바란다.

To conclude, we believe that the most fundamental factor underlying the theory crisis is that the subject matter itself, psychology, makes it very hard to develop good theories (https://doi.org/10.1037/0022-006X.46.4.806" data-mce-href="https://journals.sagepub.com/doi/10.1177/1745691620970586#">Meehl, 1978). Drawing on contemporary philosophy of science, we have discussed three central challenges to developing psychological theories: There are often not enough robust phenomena to constrain theories, not enough attention is paid to defining and validating constructs, and establishing psychological causes is very hard. We hope that this article brings more attention to these crucial issues and thereby helps to provide more solid building blocks for the theoretical foundations of psychology.

 

 


Perspect Psychol Sci. 2021 Jul;16(4):779-788. doi: 10.1177/1745691620970586. Epub 2021 Jan 29.

The Theory Crisis in Psychology: How to Move Forward

Affiliations collapse

Affiliations

1Department of Theoretical Philosophy.

2Department of Psychometrics and Statistics, University of Groningen.

PMID: 33513314

PMCID: PMC8273366

DOI: 10.1177/1745691620970586

Free PMC article

Abstract

Meehl argued in 1978 that theories in psychology come and go, with little cumulative progress. We believe that this assessment still holds, as also evidenced by increasingly common claims that psychology is facing a "theory crisis" and that psychologists should invest more in theory building. In this article, we argue that the root cause of the theory crisis is that developing good psychological theories is extremely difficult and that understanding the reasons why it is so difficult is crucial for moving forward in the theory crisis. We discuss three key reasons based on philosophy of science for why developing good psychological theories is so hard: the relative lack of robust phenomena that impose constraints on possible theories, problems of validity of psychological constructs, and obstacles to discovering causal relationships between psychological variables. We conclude with recommendations on how to move past the theory crisis.

Keywords: causation; phenomena; robustness; theory; validity.

 

교육적 평가의 타당화: 시뮬레이션 등을 위한 프라이머(Adv Simul (Lond). 2016)
Validation of educational assessments: a primer for simulation and beyond
David A. Cook1,2,3* and Rose Hatala4

 

 

 

좋은 평가가 중요하며 시뮬레이션이 도움이 될 수 있습니다.
Good assessment is important; simulation can help

교육자, 관리자, 연구원, 정책 입안자, 심지어 일반 대중들도 건강 전문가 평가의 중요성을 인식하고 있습니다. 역량 기반 교육, 이정표 및 숙달 학습과 같은 트렌드 주제는 성과에 대한 필수 정보를 제공하기 위해 정확하고 시기 적절하며 의미 있는 평가에 달려 있습니다. 전문 역량 평가는 교육을 넘어 임상 실습으로 점차 확대되며, 초기 및 지속적인 전문 면허 및 인증 요건에 대한 지속적인 논의가 이루어진다. 일선 교육자와 교육 연구자는 임상 및 비임상 환경에서 의료 전문가의 방어 가능한 평가를 요구합니다. 실제로, 좋은 평가에 대한 필요성은 그 어느 때보다도 컸으며 앞으로도 계속 증가할 것입니다.
Educators, administrators, researchers, policymakers, and even the lay public recognize the importance of assessing health professionals. Trending topics such as competency-based education, milestones, and mastery learning hinge on accurate, timely, and meaningful assessment to provide essential information about performance. Assessment of professional competence increasingly extends beyond training into clinical practice, with ongoing debates regarding the requirements for initial and ongoing professional licensure and certification. Front-line educators and education researchers require defensible assessments of health professionals in clinical and nonclinical settings. Indeed, the need for good assessments has never been greater and will most likely continue to grow.

직장 기반 평가가 필수적이지만 [1–3] 시뮬레이션은 안전한 환경에서 특정 주제와 기술을 목표로 삼을 수 있기 때문에 보건 전문직 평가에서 중요한 역할을 하며 앞으로도 그럴 것이다 [4–6]. 시뮬레이션에서 평가 조건은 학습자 간에 표준화될 수 있으며 질병, 임상 상황 및 합병증의 스펙트럼을 조작하여, 예를 들어 [흔하지만 중요한 작업, 자주 보이지 않는 조건, 환자를 위험에 빠뜨릴 수 있는 활동 또는 특정 감정 반응을 유발하는 상황]에 초점을 맞출 수 있다[7, 8]. 따라서 시뮬레이션 기반 평가가 점점 일반화되고 있는 것은 놀랄 일이 아니다. 2013년에 발표된 리뷰에서는 시뮬레이션 기반 평가를 평가하는 400개 이상의 연구가 확인되었으며[9] 그 수는 확실히 증가했다. 그러나 동일한 검토에서는 이러한 평가를 뒷받침하는 증거와 그러한 증거를 수집하기 위해 설계된 연구(즉, 검증 연구)에서 심각하고 빈번한 결함을 확인했다. 좋은 시뮬레이션 기반 평가의 필요성과 현재 검증 노력의 과정과 산물의 결함 사이의 차이는 검증 과학의 현재 상태에 대한 인식을 높일 필요가 있음을 시사한다.
Although workplace-based assessment is essential [13], simulation does and will continue to play a vital role in health professions assessment, inasmuch as it permits the targeting of specific topics and skills in a safe environment [46]. The conditions of assessment can be standardized across learners, and the spectrum of disease, clinical contexts, and comorbidities can be manipulated to focus on, for example, common yet critical tasks, infrequently seen conditions, activities that might put patients at risk, or situations that provoke specific emotional responses [7, 8]. Thus, it comes as no surprise that simulation-based assessment is increasingly common. A review published in 2013 identified over 400 studies evaluating simulation-based assessments [9], and that number has surely grown. However, that same review identified serious and frequent shortcomings in the evidence supporting these assessments, and in the research studies designed to collect such evidence (i.e., validation studies). The gap between the need for good simulation-based assessment and the deficiencies in the process and product of current validation efforts suggests the need for increased awareness of the current state of the science of validation.

이 기사의 목적은 교육자와 교육 연구자를 위한 평가 검증에 대한 입문서를 제공하는 것입니다. 우리는 건강 전문가에 대한 시뮬레이션 기반 평가의 맥락에 중점을 두지만, 이 원칙은 다른 평가 접근법과 주제에도 광범위하게 적용된다고 믿는다.
The purpose of this article is to provide a primer on assessment validation for educators and education researchers. We focus on the context of simulation-based assessment of health professionals but believe the principles apply broadly to other assessment approaches and topics.

타당화는 프로세스입니다.
Validation is a process

[타당화]는 [평가 결과에 기초하여 해석, 사용 및 결정의 적절성을 평가하기 위해 타당성 증거를 수집하는 과정]을 의미한다[10]. 이 정의는 몇 가지 중요한 점을 강조합니다.
Validation refers to the process of collecting validity evidence to evaluate the appropriateness of the interpretations, uses, and decisions based on assessment results [10]. This definition highlights several important points. 

첫째, 검증은 엔드포인트가 아닌 프로세스입니다. 평가에 "타당화됨"이라는 라벨을 붙이는 것은 타당화 검사 프로세스가 적용되었다는 것, 즉 증거가 수집되었다는 것만을 의미하며, 다음의 것들은 알려주지 않는다. 

  • 어떤 프로세스가 사용되었는가,
  • 증거의 방향 또는 크기는 어떠한가(즉, 유리한가, 불리한가, 어느 정도까지 사용되었는가?), 
  • 어떤 gap이 남아 있는가, 또는 
  • 어떤 맥락(집단, 학습 목표, 교육적 설정)에 대한 증거.

First, validation is a process not an endpoint. Labeling an assessment as “validated” means only that the validation process has been applied—i.e., that evidence has been collected. It does not tell us

  • what process was used,
  • the direction or magnitude of the evidence (i.e., was it favorable or unfavorable and to what degree?),
  • what gaps remain, or
  • for what context (learner group, learning objectives, educational setting) the evidence is relevant.

둘째, 타당화는 다음 절에서 논의한 바와 같이 타당성 증거 수집을 포함한다.
Second, validation involves the collection of validity evidence, as we discuss in a following section.

셋째, 타당화와 타당성은 궁극적으로 (이러한 수치 점수 또는 서술적 의견[11]과 같은) 평가 데이터의 특정 해석 또는 사용을 의미하며, 이 해석에 근거한 결정을 의미한다. 우리는 임상 의학에서의 진단 테스트와 유추를 통해 이 점을 설명하는 것이 도움이 된다는 것을 발견했다[12]. 임상시험은 (a) 시험이 결정에 영향을 미치고 (b) 이러한 결정이 조치 또는 환자 결과에 의미 있는 변화를 가져오는 정도까지만 유용하다. 따라서, 의사들은 종종 "만약 그것이 환자 관리에 변화를 주지 않는다면 검사를 지시하지 말라"고 가르친다. 예를 들어, 전립선특이항원(PSA) 검사는 신뢰성이 높고 전립선암과 강하게 연관돼 있다. 그러나 전립선암 검진은 암이 없을 때 상승하는 경우가 많고, 검사가 불필요한 전립선 생체검사와 환자의 불안감을 유발하며, 종종 발견되는 암을 치료해도 임상 결과가 개선되지 않기 때문에 더 이상 널리 권장되지 않는다. (즉, 치료가 필요하지 않음). 즉, 많은 환자에서 부정적인/유해한 결과가 시험(검진)의 유익한 결과보다 크다[13–15].

Third, validation and validity ultimately refer to a specific interpretation or use of assessment data, be these numeric scores or narrative comments [11], and to the decisions grounded in this interpretation. We find it helpful to illustrate this point through analogy with diagnostic tests in clinical medicine [12]. A clinical test is only useful to the degree that (a) the test influences decisions, and (b) these decisions lead to meaningful changes in action or patient outcomes. Hence, physicians are often taught, “Don’t order the test if it won’t change patient management.” For example, the prostate-specific antigen (PSA) test has high reliability and is strongly associated with prostate cancer. However, this test is no longer widely recommended in screening for prostate cancer because it is frequently elevated when no cancer is present, because testing leads to unnecessary prostate biopsies and patient anxiety, and because treating cancers that are found often does not improve clinical outcomes (i.e., treatment is not needed). In other words, the negative/harmful consequences outweigh the beneficial consequences of testing (screening) in many patients [1315]. 

그러나 PSA 검사는 전립선암을 진단하고 치료한 후에도 여전히 질병의 지표로 유용하다. 이 예를 교육 테스트(평가)와 의사 결정의 중요성에 반영하면 이러하다.

  • (1) 만약 그것이 관리management를 바꾸지 않는다면, 시험을 하지 말아야 한다. 
  • (2) 하나의 목표 또는 설정에 유용한 시험은 다른 맥락에서 덜 유용할 수 있다. 
  • (3) 시험의 전반적인 유용성을 결정할 때 시험의 장기적인 결과와 다운스트림 결과를 고려해야 한다.

However, PSA testing is still useful as a marker of disease once prostate cancer has been diagnosed and treated. Reflecting this example back to educational tests (assessments) and the importance of decisions:

  • (1) if it will not change management the test should not be done,
  • (2) a test that is useful for one objective or setting may be less useful in another context, and
  • (3) the long-term and downstream consequences of testing must be considered in determining the overall usefulness of the test.

평가 타당화가 중요한 이유는 무엇입니까?
Why is assessment validation important?

교육적 평가에 대한 엄격한 타당화는 최소한 두 가지 이유로 매우 중요하다.
Rigorous validation of educational assessments is critically important for at least two reasons. 

첫째, 평가를 사용하는 사람들은 결과를 신뢰할 수 있어야 한다. 유효성 확인은 신뢰도(유효성)에 관한 간단한 예스/노 답변을 제공하지 않습니다. 오히려, 신뢰도나 타당성의 판단은 의도된 적용과 맥락에 따라 달라지며 일반적으로 정도의 문제이다. 타당화는 그러한 [판단]과 [남아있는 격차gaps]에 대한 비판적 평가를 할 수 있는 증거를 제공한다.
First, those using an assessment must be able to trust the results. Validation does not give a simple yes/no answer regarding trustworthiness (validity); rather, a judgment of trustworthiness or validity depends on the intended application and context and is typically a matter of degree. Validation provides the evidence to make such judgments and a critical appraisal of remaining gaps.

둘째, 새로운 객관식 문제, 척도 항목 또는 시험장이 사실상의 새로운 도구를 만들기 때문에 평가 도구, 도구 및 활동의 수는 본질적으로 [무한]하다. 그러나 주어진 교육자에게 평가가 필요한 관련 과제와 구성은 [유한]하다. 따라서 각 교육자는 자신의 즉각적인 요구에 가장 잘 맞는 평가 솔루션을 식별하기 위해 무수한 가능성을 분류하고 선별할 수 있는 정보가 필요합니다. 잠재적 해결책으로는 기존 평가도구 선택, 기존 평가도구 적응, 여러 평가도구의 요소 결합 또는 새로운 평가도구를 새로 생성 등이 있습니다 [16]. 교육자는 점수의 신뢰도뿐만 아니라 시험 시행과 관리 과정에서 발생하는 비용, 수용성, 타당성 등 물류 및 실무적 이슈에 대한 정보가 필요하다.
Second, the number of assessment instruments, tools, and activities is essentially infinite, since each new multiple-choice question, scale item, or exam station creates a de facto new instrument. Yet, for a given educator, the relevant tasks and constructs in need of assessment are finite. Each educator thus needs information to sort and sift among the myriad possibilities to identify the assessment solution that best meets his or her immediate needs. Potential solutions include selecting an existing instrument, adapting an existing instrument, combining elements of several instruments, or creating a novel instrument from scratch [16]. Educators need information regarding not only the trustworthiness of scores, but also the logistics and practical issues such as cost, acceptability, and feasibility that arise during test implementation and administration.

또한 시뮬레이션 기반 평가는 그 정의상 "의미 있는meaningful" 임상 또는 교육적 결과의 대체물surrogate로 사용된다[17]. 우리는 [학습자들이 시뮬레이션된 환경에서 얼마나 잘 수행하는지]를 알고 싶은 것이 아니다; 우리는 그들이 실제 생활에서 어떻게 수행하는지 알고 싶다. 타당화에 대한 포괄적인 접근법에는 평가 결과가 다른 설정과 결과에 추정하는 정도를 평가하는 것이 포함된다[18, 19].
In addition, simulation-based assessments are almost by definition used as surrogates for a more “meaningful” clinical or educational outcome [17]. Rarely do we actually want to know how well learners perform in a simulated environment; usually, we want to know how they would perform in real life. A comprehensive approach to validation will include evaluating the degree to which assessment results extrapolate to different settings and outcomes [18, 19].

타당성 증거란 무엇을 의미하는가?
What do we mean by validity evidence?

[고전적인 타당화 프레임워크]는 적어도 세 가지 다른 "유형"의 타당성을 식별했다: 내용, 구성, 준거. 표 1을 참조하십시오. 그러나 이러한 관점은 보다 미묘하면서도 통일된 실용적 타당성 관점으로 대체되었다[10, 12, 20]. 현대의 틀은 타당성을 [가설]로 보고, 연구자가 [연구 가설]을 지지하거나 반박하기 위해 증거를 수집하는 것처럼, 타당성 증거는 [타당성 가설]을 지지하거나 반박하기 위해 수집된다. 가설을 절대 증명할 수 없듯이, 타당성은 절대 증명할 수 없다. 그러나 증거가 축적됨에 따라 [타당성 주장을 지지하거나 반박]할 수 있다.

Classical validation frameworks identified at least three different “types” of validity: contentconstruct, and criterion; see Table 1. However, this perspective has been replaced by more nuanced yet unified and practical views of validity [10, 12, 20]. Contemporary frameworks view validity as a hypothesis, and just as a researcher would collect evidence to support or refute a research hypothesis, validity evidence is collected to support or refute the validity hypothesis (more commonly referred to as the validity argument). Just as one can never prove a hypothesis, validity can never be proven; but evidence can, as it accumulates, support or refute the validity argument.

최초의 현대적 타당성 프레임워크는 1989년 Messick에 의해 제안되었고 [21] 1999년 [22] 그리고 2014년 [23]에 이 분야의 표준으로 채택되었다. 이 프레임워크는 고전적 프레임워크와 부분적으로 중복되는 다섯 가지 타당성 증거의 출처를 제안한다[24–26]. (표 2 참조)

  • 콘텐츠 증거(콘텐츠 유효성의 개념과 본질적으로 동일)는 평가 항목(시나리오, 질문 및 응답 옵션 포함)이 측정하고자 하는 구성을 반영하도록 하기 위해 취한 단계를 말한다.
  • 내부 구조 증거는 신뢰성, 도메인 또는 요인 구조, 항목 난이도 등 개별 평가 항목과 주요 구성 요소 간의 관계를 평가한다.
  • 다른 변수와의 관계 증거는 평가 결과와 다른 측정 또는 학습자 특성 사이의 연관성을 긍정 또는 부정, 강 또는 약하게 평가한다. 이것은 준거criterion 타당성과 구성construct 타당성에 대한 고전적인 개념과 밀접하게 일치한다.
  • 반응 프로세스 증거는 문서화된 레코드(응답, 등급 또는 자유 텍스트 서술)가 관찰된 성능을 얼마나 잘 반영하는지 평가합니다. 응답 품질을 방해할 수 있는 문제에는 제대로 훈련되지 않은 평가자, 저품질 비디오 녹화, 부정행위 등이 포함된다.
  • 결과 증거는 유익하거나 유해한 평가 자체와 그 결과로 발생하는 결정과 조치의 영향을 살펴봅니다 [27–29].

The first contemporary validity framework was proposed by Messick in 1989 [21] and adopted as a standard for the field in 1999 [22] and again in 2014 [23]. This framework proposes five sources of validity evidence [2426] that overlap in part with the classical framework (see Table 2). 

  • Content evidence, which is essentially the same as the old concept of content validity, refers to the steps taken to ensure that assessment items (including scenarios, questions, and response options) reflect the construct they are intended to measure. 
  • Internal structure evidence evaluates the relationships of individual assessment items with each other and with the overarching construct(s), e.g., reliability, domain or factor structure, and item difficulty. 
  • Relationships with other variables evidence evaluates the associations, positive or negative and strong or weak, between assessment results and other measures or learner characteristics. This corresponds closely with classical notions of criterion validity and construct validity. 
  • Response process evidence evaluates how well the documented record (answer, rating, or free-text narrative) reflects the observed performance. Issues that might interfere with the quality of responses include poorly trained raters, low-quality video recordings, and cheating. 
  • Consequences evidence looks at the impact, beneficial or harmful, of the assessment itself and the decisions and actions that result [2729].

교육자와 연구자는 평가 및 해당 결정과 가장 관련이 있는 증거를 확인한 후 이 증거를 수집하고 평가하여 타당성 주장을 공식화해야 한다. 불행하게도, 이 "5가지 근거 소스" 프레임워크는 증거 사이의 우선 순위를 정하거나, 증거를 선택하는 데 있어 불완전한 지침만을 제공한다.
Educators and researchers must identify the evidence most relevant to their assessment and corresponding decision, then collect and appraise this evidence to formulate a validity argument. Unfortunately, the “five sources of evidence” framework provides incomplete guidance in such prioritization or selection of evidence.

Kane의 최신 유효성 프레임워크는 평가 활동에서 4가지 주요 추론을 식별함으로써 우선순위 부여 문제를 다룬다(표 3). 고전적 또는 5가지 증거 소스 프레임워크에 익숙한 사람들에게 케인의 프레임워크는 용어와 개념이 완전히 새로워 처음에는 종종 도전적이다. 사실, 이 프레임워크를 학습할 때, 우리는 이전 프레임워크의 개념과 일치하려고 시도하지 않는 것이 도움이 된다는 것을 발견했다. 오히려, 우리는 모든 평가 활동에 관련된 단계들을 개념적으로 고려하는 것으로 혁신을 시작한다.
The most recent validity framework, from Kane [10, 12, 30], addresses the issue of prioritization by identifying four key inferences in an assessment activity (Table 3). For those accustomed to the classical or five-evidence-sources framework, Kane’s framework is often challenging at first because the terminology and concepts are entirely new. In fact, when learning this framework, we have found that it helps to not attempt to match concepts with those of earlier frameworks. Rather, we begin de novo by considering conceptually the stages involved in any assessment activity.

평가는 객관식 시험 항목에 대한 답변, 실제 또는 표준화된 환자 인터뷰 또는 절차적 작업 수행과 같은 일종의 [수행performance]으로 시작한다.

  • 이 관찰에 기초하여, 우리가 성능 수준을 반영한다고 가정하는 점수 또는 서면 서술이 문서화됩니다. 
  • 여러 점수 또는 서술이 결합되어 시험 환경에서 수행능력을 반영한다고 가정하는 전체 점수 또는 해석을 생성합니다. 
  • 시험 환경에서의 수행능력은 실제 환경에서 원하는 성능을 반영하는 것으로 가정한다. 
  • 그리고 그 성과는 의미 있는 결정을 내리기 위한 합리적인 근거를 구성한다고 가정한다(그림 1 참조).

An assessment starts with a performance of some kind, such as answering a multiple-choice test item, interviewing a real or standardized patient, or performing a procedural task.

  • Based on this observation, a score or written narrative is documented that we assume reflects the level of performance;
  • several scores or narratives are combined to generate an overall score or interpretation that we assume reflects the desired performance in a test setting;
  • the performance in a test setting is assumed to reflect the desired performance in a real-life setting; and
  • that performance is further assumed to constitute a rational basis for making a meaningful decision (see Fig. 1).

이러한 가정들 각각은 실제로 정당화될 수 없는 추론을 나타낸다.

  • 성과의 문서화가 부정확할 수 있다. (점수 추론)
  • 개별 점수의 합성은 원하는 시험 영역에 걸쳐 수행능력을 정확하게 반영하지 못할 수 있다(일반화 추론). 
  • 합성 점수는 또한 실제 수행능력을 반영하지 않을 수 있다(외삽 추론). 
  • 이 성능(시험 설정 또는 실제)은 원하는 결정을 위한 적절한 기반을 형성하지 못할 수 있다. (함의 또는 결정 추론)

Each of these assumptions represents an inference that might not actually be justifiable.

  • The documentation of performance (scoring inference) could be inaccurate;
  • the synthesis of individual scores might not accurately reflect performance across the desired test domains (generalization inference);
  • the synthesized score also might not reflect real-life performance (extrapolation inference); and
  • this performance (in a test setting or real life) might not form a proper foundation for the desired decision (implications or decision inference).

케인의 타당성 프레임워크는 이 네 가지 추론에 대한 정당성을 명시적으로 평가한다. 우리는 케인의 프레임워크에 대해 더 알고 싶은 사람들을 그의 설명[10, 30]과 그의 최근 작품 개요[12]에 언급한다.

Kane’s validity framework explicitly evaluates the justifications for each of these four inferences. We refer those wishing to learn more about Kane’s framework to his description [10, 30] and to our recent synopsis of his work [12].

교육자들과 연구원들은 종종 얼마나 많은 타당성 증거가 필요한지 그리고 새로운 맥락에서 도구를 사용할 때 이전 검증의 증거가 어떻게 적용되는지 묻는다. 불행하게도, 이러한 질문에 대한 대답은 잘못된 결정의 위험성(즉, 평가의 "부담stakes"), 의도된 사용 및 상황적 차이의 크기와 중요성을 포함한 몇 가지 요인에 따라 달라진다. 모든 평가가 중요해야 하지만, 일부 평가 결정은 다른 평가보다 학습자의 삶에 더 많은 영향을 미친다. 연구 목적으로 사용되는 평가를 포함하여 더 큰 영향력 또는 더 큰 위험성을 가진 평가는 증거의 양, 품질 및 범위에 대해 더 높은 기준을 가질 가치가 있다. 엄밀히 말하면, 타당성 증거는 그것이 수집된 목적, 맥락 및 학습자 그룹에만 적용된다. 기존 증거는 평가 접근법의 선택을 안내할 수 있지만 향후 해석과 사용을 지지하지는 않는다

Educators and researchers often ask how much validity evidence is needed and how the evidence from a previous validation applies when an instrument is used in a new context. Unfortunately, the answers to these questions depend on several factors including the risk of making a wrong decision (i.e., the “stakes” of the assessment), the intended use, and the magnitude and salience of contextual differences. While all assessments should be important, some assessment decisions have more impact on a learner’s life than others. Assessments with higher impact or higher risk, including those used for research purposes, merit higher standards for the quantity, quality, and breadth of evidence. Strictly speaking, validity evidence applies only to the purpose, context, and learner group in which it was collected; existing evidence might guide our choice of assessment approach but does not support our future interpretations and use.

물론, 현실에서, 우리는 타당성 주장을 구성할 때 기존 증거를 일상적으로 고려한다. 오래된 증거가 새로운 상황에 적용되는지 여부는 상황 차이가 증거의 관련성에 어떻게 영향을 미칠 수 있는지에 대한 비판적인 평가를 필요로 한다. 예를 들어,

  • 체크리스트의 일부 항목은 서로 다른 직무에 걸쳐 관련될 수 있는 반면, 다른 항목은 직무에 특정적일 수 있다.
  • 신뢰성은 그룹마다 크게 다를 수 있으며, 일반적으로 더 동질적인 학습자 사이에서 더 낮은 값을 갖는다. 
  • [맥락의 차이(입원 환자 대 외래 환자), 학습자 수준(의대학생 대 시니어 전공의), 목적]의 차이가 내용, 다른 변수와의 관계 또는 결과에 대한 우리의 해석에 영향을 미칠 수 있다. 

Of course, in practice, we routinely consider existing evidence in constructing a validity argument. Whether old evidence applies to a new situation requires a critical appraisal of how situational differences might influence the relevance of the evidence. For example,

  • some items on a checklist might be relevant across different tasks while others might be task-specific;
  • reliability can vary substantially from one group to another, with typically lower values among more homogeneous learners; and
  • differences in context (inpatient vs outpatient), learner level (junior medical student vs senior resident), and purpose might affect our interpretation of evidence of content, relations with other variables, or consequences.

우리의 것과 유사한 맥락에서 수집된 증거와 다양한 맥락에서 일관된 발견은 우리의 타당성 주장을 구성하는 데 기존 증거를 포함하려는 우리의 선택을 뒷받침할 것이다.
Evidence collected in contexts similar to ours and consistent findings across a variety of contexts will support our choice to include existing evidence in constructing our validity argument.

타당성 논쟁은 무엇을 의미합니까?
What do we mean by validity argument?

케인은 네 가지 핵심 추론을 명확히 하는 것 외에도 사전 "해석-사용 주장argument" 또는 "IUA"와 최종 "타당성 주장"이라는 두 가지 뚜렷한 논쟁 단계를 강조함으로써 검증 과정에서 "주장"에 대한 우리의 이해를 진전시켰다.

In addition to clarifying the four key inferences, Kane has advanced our understanding of “argument” in the validation process by emphasizing two distinct stages of argument: an up-front “interpretation-use argument” or “IUA,” and a final “validity argument.”

위에서 언급한 바와 같이, 모든 해석과 사용(즉, 결정)은 다수의 가정을 수반한다. 예를 들어 가상 현실 평가의 점수를 해석할 때 시각적 표현, 시뮬레이터 제어 및 작업 자체를 포함한 시뮬레이션 작업이 임상적으로 중요한 작업과 관련이 있다고 가정할 수 있다. 

  • 채점 알고리즘이 해당 작업의 중요한 요소를 설명하는지 여부 
  • 교육자 성과를 신뢰성 있게 측정하기에 충분한 과제와 과제 간 다양성이 있는지 여부 
  • 훈련생들이 목표 점수를 달성할 때까지 계속 연습하도록 하는 것이 유익한지 여부

As noted above, all interpretations and uses—i.e., decisions—incur a number of assumptions. For example, in interpreting the scores from a virtual reality assessment, we might assume that the simulation task—including the visual representation, the simulator controls, and the task itself—has relevance to tasks of clinical significance;

  • that the scoring algorithm accounts for important elements of that task;
  • that there are enough tasks, and enough variety among tasks, to reliably gauge trainee performance; and
  • that it is beneficial to require trainees to continue practicing until they achieve a target score.

이러한 가정들은 테스트할 수 있고 테스트해야 합니다! 많은 가정이 암묵적이며 증거를 수집하거나 조사하기 전에 이를 인식하고 명시적으로 진술하는 것이 필수적인 단계이다. 의도된 용도를 지정했으면 다음을 수행해야 합니다.

  • (a) 가능한 한 많은 [가정을 확인]한다. 
  • (b) 가장 우려되거나 의심스러운 [가정에 우선 순위]를 매긴다. 
  • (c) 각 가정의 정확성을 확인하거나 반박할 [증거를 수집하는 계획]을 세우다 

그 결과 우선 순위화된 가정과 원하는 증거 목록이 [해석-사용 주장]을 구성한다. 해석-사용 주장을 명시하는 것은 연구 가설을 진술하고 그 가설을 경험적으로 검증하는 데 필요한 증거를 명확히 하는 것과 개념적으로나 중요하다.

These and other assumptions can and must be tested! Many assumptions are implicit, and recognizing and explicitly stating them before collecting or examining the evidence is an essential step. Once we have specified the intended use, we need to

  • (a) identify as many assumptions as possible,
  • (b) prioritize the most worrisome or questionable assumptions, and
  • (c) come up with a plan to collect evidence that will confirm or refute the correctness of each assumption.

The resulting prioritized list of assumptions and desired evidence constitute the interpretation-use argument. Specifying the interpretation-use argument is analogous both conceptually and in importance to stating a research hypothesis and articulating the evidence required to empirically test that hypothesis.

일단 평가 계획이 구현되고 증거가 수집되면, 우리는 증거를 합성하고, 이러한 발견을 원래의 해석-사용 논쟁에서 예상한 것과 대조하고, 강점과 약점을 식별하고, 이것을 [최종 타당성 주장]으로 증류한다. 타당성 주장은 해석과 용도가 실제로 방어할 수 있다는 것(또는 중요한 갭이 남아 있다는 것)을 다른 사람들에게 설득하려고 시도하지만, [잠재적 사용자들]은 [근거의 충분성]과 [bottom-line 평가]의 정확성에 관한 자신의 결론에 도달할 수 있어야 한다. 우리의 일은 변호사가 배심원 앞에서 사건을 주장하는 것과 비슷하다. 우리는 전략적으로 증거를 찾고 정리하고 해석하며 정직하고 완전하며 설득력 있는 주장을 제시하지만, 궁극적으로 의도된 사용과 맥락에 대한 타당성에 대한 판단을 내리는 것은 [잠재적 사용자]라는 "배심원jury"이다. [31]

Once the evaluation plan has been implemented and evidence has been collected, we synthesize the evidence, contrast these findings with what we anticipated in the original interpretation-use argument, identify strengths and weaknesses, and distill this into a final validity argument. Although the validity argument attempts to persuade others that the interpretations and uses are indeed defensible—or that important gaps remain—potential users should be able to arrive at their own conclusions regarding the sufficiency of the evidence and the accuracy of the bottom-line appraisal. Our work is similar to that of an attorney arguing a case before a jury: we strategically seek, organize, and interpret the evidence and present an honest, complete, and compelling argument, yet it is the “jury” of potential users that ultimately passes judgment on validity for their intended use and context. [31]

단일 연구가 특정 결정을 뒷받침하는 데 필요한 모든 타당성 증거를 수집할 가능성은 낮다. 오히려, 다른 연구는 일반적으로 논쟁의 다른 측면을 다룰 것이며, 교육자들은 그들의 맥락과 필요에 대한 평가 도구를 선택할 때 [증거의 전체성totality]을 고려할 필요가 있다.
It is unlikely that any single study will gather all the validity evidence required to support a specific decision. Rather, different studies will usually address different aspects of the argument, and educators need to consider the totality of the evidence when choosing an assessment instrument for their context and needs.

물론, 연구원들이 단순히 증거를 수집하는 것만으로는 충분하지 않다. 중요한 것은 증거의 양뿐만 아니라 관련성, 품질 및 폭이다. 점수 신뢰성에 대한 풍부한 증거를 수집한다고 해서 내용, 관계 또는 결과에 대한 증거가 필요하지 않습니다. 반대로, 기존의 증거가 견고하고 엄격한 항목 개발 과정과 같이 우리의 맥락에 논리적으로 적용될 수 있다면, 그러한 노력을 복제하는 것이 최우선 순위가 아닐 수 있다. 불행하게도, 연구자들은, 종종 가정의 중요성을 의도적으로 우선시하지 못하거나 [해석-사용 주장]을 완전히 건너뛰기 때문에, 가장 중요한 가정보다는 시험하기 쉬운 가정에 대한 증거를 보고할 수 있다.
Of course, it is not enough for researchers to simply collect any evidence. It is not just the quantity of evidence that matters, but also the relevance, quality, and breadth. Collecting abundant evidence of score reliability does not obviate the need for evidence about content, relationships, or consequences. Conversely, if existing evidence is robust and logically applicable to our context, such as a rigorous item development process, then replicating such efforts may not be top priority. Unfortunately, researchers often inadvertently fail to deliberately prioritize the importance of the assumptions or skip the interpretation-use argument altogether, which can result in reporting evidence for assumptions that are easy to test rather than those that are most critical.

검증에 대한 실용적인 접근 방식
A practical approach to validation

위의 개념들은 검증 과정을 이해하는 데 필수적이지만, 이 과정을 실용적인 방법으로 적용할 수 있는 것도 중요하다. 표 4에는 위에서 설명한 타당성 프레임워크(클래식, 메식 또는 케인)와 함께 작동할 수 있는 검증에 대한 하나의 가능한 접근법이 요약되어 있다. 이 섹션에서는 가상 시뮬레이션 기반 예를 사용하여 이 접근 방식을 설명합니다.
Although the above concepts are essential to understanding the process of validation, it is also important to be able to apply this process in practical ways. Table 4 outlines one possible approach to validation that would work with any of the validity frameworks described above (classical, Messick, or Kane). In this section, we will illustrate this approach using a hypothetical simulation-based example.

 

파트 태스크 트레이너를 사용하여 1학년 내과 레지던트에게 요추 천자(LP)를 가르치고 있다고 상상해 보십시오. 교육 세션이 끝나면 학습자가 실제 환자와 함께 안전하게 LP를 시도할 준비가 되어 있는지 평가하고자 합니다.
Imagine that we are teaching first year internal medicine residents lumbar puncture (LP) using a part-task trainer. At the end of the training session, we wish to assess whether the learners are ready to safely attempt an LP with a real patient under supervision.

 

1. 구성 및 제안된 해석을 정의합니다.
1.Define the construct and proposed interpretation

타당화는 관심 구인을 고려하는 것으로 시작한다. 예를 들어, 우리는 LP 표시와 위험에 대한 학습자의 지식, LP 수행 능력 또는 LP를 시도할 때 비기술적 기술에 관심이 있는가? 이들은 각각 다른 평가 도구를 선택해야 하는 서로 다른 구인이다. 지식을 평가하기 위해 객관식 질문(MCQ)을 선택할 수도 있고, 부분 작업 트레이너를 사용하여 절차적 스킬을 평가하기 위한 일련의 스킬 스테이션(OSATS) [32] 또는 소생 시나리오를 사용하여 선택할 수도 있습니다. 충실도가 높은 마네킹과 비기술적 기술(NOTECHS) 척도로 비기술적 기술을 평가하기 위한 공급자 팀[33].
Validation begins by considering the construct of interest. For example, are we interested in the learners’ knowledge of LP indications and risks, their ability to perform LP, or their non-technical skills when attempting an LP? Each of these is a different construct requiring selection of a different assessment tool: we might choose multiple-choice questions (MCQs) to assess knowledge, a series of skill stations using a part-task trainer to asses procedural skill with an Objective Structured Assessment of Technical Skills (OSATS) [
32], or a resuscitation scenario using a high-fidelity manikin and a team of providers to assess non-technical skills with the Non-Technical Skills (NOTECHS) scale [33]


우리의 예에서, [구인]은 "LP 기술"이고 [해석]은 "학습자는 실제 환자에게 감독된 LP를 시도하기에 충분한 기본적인 LP 기술을 가지고 있다"는 것이다.
In our example, the construct is “LP skill” and the interpretation is that “learners have fundamental LP skills sufficient to attempt a supervised LP on a real patient.”

2. 의도된 결정을 명시합니다.
2.Make explicit the intended decision(s)

그러한 해석에 기초하여 [우리가 내릴 것으로 예상되는 결정]에 대한 명확한 생각이 없다면, 우리는 일관성 있는 타당성 주장을 만들 수 없을 것이다.
Without a clear idea of the decisions we anticipate making based on those interpretations, we will be unable to craft a coherent validity argument.

우리의 예에서, 우리의 [최우선 결정]은 [학습자가 실제 환자에게 감독된 LP를 시도할 수 있는 충분한 절차적 역량을 가지고 있는지 여부]이다. 대안적으로 고려할 수 있는 다른 결정에는 학습자에게 [피드백을 제공할 성과 지점을 식별]하거나, 학습자가 [다음 교육 단계로 승진할 수 있는지 여부]를 결정하거나, 학습자에게 [라이센스를 인증]하는 것이 포함됩니다.
In our example, our foremost decision is whether the learner has sufficient procedural competence to attempt a supervised LP on a real patient. Other decisions we might alternatively consider include identifying performance points on which to offer feedback to the learner, deciding if the learner can be promoted to the next stage of training, or certifying the learner for licensure.

3. 해석-사용 주장을 정의하고, 필요한 타당성 증거의 우선 순위를 정합니다.
3.Define the interpretation-use argument, and prioritize needed validity evidence

우리는 해석과 결정을 내릴 때, 많은 가정을 실행하며, 이것들은 검증되어야 한다. 주요 가정을 식별하고 우선 순위를 정하고 우리가 찾기를 원하는 증거를 예상하면 해석-사용 논쟁의 개요를 설명할 수 있다[30].
In making our interpretations and decisions, we will invoke a number of assumptions, and these must be tested. Identifying and prioritizing key assumptions and anticipating the evidence we hope to find allows us to outline an interpretation-use argument [30].

우리의 시나리오에서, 우리는 "합격"이 실제 환자에게 감독된 LP를 시도할 수 있는 능력을 나타내는 평가 도구를 찾고 있다. 우리는 이것이 기술 스테이션에서 학생들의 성과를 평가하는 의사를 포함할 것으로 예상한다. 이러한 맥락에 포함된 가정은 다음과 같다.

  • 스테이션은 LP 성능에 필수적인 기술(무균 기술 또는 기구 취급에 대한 일반적인 기술 대)을 테스트하도록 설정되었고,
  • 평가자가 적절하게 훈련되었으며,
  • 서로 다른 평가자도 유사한 점수를 줄 것이며,
  • 시험에서 더 높은 점수를 받은 학습자가 첫 번째 환자 대상 시도에서 더 안전하게 수행하게 될 것이다.

In our scenario, we are looking for an assessment instrument in which a “pass” indicates competence to attempt a supervised LP on a real patient. We anticipate that this will involve a physician rating student performance on a skills station. Assumptions in this context include

  • that the station is set up to test techniques essential for LP performance (vs generic skills in sterile technique or instrument handling),
  • that the rater is properly trained,
  • that a different rater would give similar scores, and
  • that learners who score higher on the test will perform more safely on their first patient attempt.

이러한 [가정을 지지하거나 반박해야 할 수 있는 증거]를 고려하고 케인의 프레임워크를 지침으로 삼아 다음과 같은 해석-사용 주장을 제안한다. 증거가 이미 수집됐는지, 직접 수집해야 할지는 현 단계에서 알 수 없지만 최소한 무엇을 찾아야 할지는 파악했다.

  • (a)점수 매기기: 성능에 대한 관찰이 일관된 숫자 점수로 올바르게 변환됩니다. 증거는 기기 내의 항목이 LP 성능과 관련이 있고 평가자가 기기 사용 방법을 이해했으며 비디오 녹화 성능이 직접적인 관찰과 유사한 점수를 산출한다는 것을 이상적으로 보여준다.
  • (b)일반화: 단일 성능의 점수는 테스트 설정의 전체 점수와 일치합니다. 증거는 우리가 성능을 적절하게 샘플링했다는 것(충분한 시뮬레이션 LP 수와 시뮬레이션된 환자 습관 변경과 같은 충분한 다양한 조건)과 성과 간 및 평가자 간(스테이션 간 및 평가자 간 신뢰성)을 이상적으로 보여줄 것이다.
  • (c)외삽: 평가 점수는 실제 성과와 관련이 있습니다. 증거는 기기의 점수가 절차 로그, 환자 부작용 사건 또는 감독자 등급과 같은 실제 상황에서 다른 LP 성능 측정과 상관관계가 있다는 것을 이상적으로 보여준다.
  • (d)함의: 평가는 학습자, 훈련 프로그램 또는 환자에게 중요하고 긍정적인 영향을 미치며 부정적인 영향은 미미합니다. 증거는 이상적으로 학생들이 평가 후에 더 준비가 되었다고 느끼고, 교정조치가 필요한 학생들은 이 시간이 충분히 소비되었다고 느끼고, 실제 환자의 LP 합병증은 시행 후 1년 동안 감소한다는 것을 보여줄 것이다.

Considering the evidence we might need to support or refute these assumptions, and using Kane’s framework as a guide, we propose an interpretation-use argument as follows. We do not know at this stage whether evidence has already been collected or if we will need to collect it ourselves, but we have at least identified what to look for.

  1. (a)Scoring: the observation of performance is correctly transformed into a consistent numeric score. Evidence will ideally show that the items within the instrument are relevant to LP performance, that raters understood how to use the instrument, and that video-recording performance yields similar scores as direct observation.
  2. (b)Generalization: scores on a single performance align with overall scores in the test setting. Evidence will ideally show that we have adequately sampled performance (sufficient number of simulated LPs, and sufficient variety of conditions such as varying the simulated patient habitus) and that scores are reproducible between performances and between raters (inter-station and inter-rater reliability).
  3. (c)Extrapolation: assessment scores relate to real-world performance. Evidence will ideally show that scores from the instrument correlate with other LP performance measures in real practice, such as procedural logs, patient adverse events, or supervisor ratings.
  4. (d)Implications: the assessment has important and favorable effects on learners, training programs, or patients, and negative effects are minimal. Evidence will ideally show that students feel more prepared following the assessment, that those requiring remediation feel this time was well spent, and that LP complications in real patients decline in the year following implementation.

우리는 타당화에서 이 처음 세 단계의 중요성을 아무리 강조해도 지나치지 않다. 제안된 해석, 의도된 결정(들) 및 가정과 그에 상응하는 증거를 명확하게 설명하는 것은 그 이후의 모든 것을 위한 단계를 집합적으로 설정한다.
We cannot over-emphasize the importance of these first three steps in validation. Clearly articulating the proposed interpretations, intended decision(s), and assumptions and corresponding evidence collectively set the stage for everything that follows.

4. 후보 평가도구 식별 및/또는 새 평가도구 생성/어댑트
4.Identify candidate instruments and/or create/adapt a new instrument

우리는 목표 구인과 개념적으로 일치하는 측정 형식을 식별한 다음, 우리의 요구에 부합하거나 적응할 수 있는 기존 도구를 검색해야 한다. 엄격한 검색은 최종 평가를 뒷받침할 내용 증거를 제공합니다. 적절한 기존 평가도구를 찾을 수 없는 경우에만 평가도구 개발을 해야 한다.
We should identify a measurement format that aligns conceptually with our target construct and then search for existing instruments that meet or could be adapted to our needs. A rigorous search provides content evidence to support our final assessment. Only if we cannot find an appropriate existing instrument would we develop an instrument de novo.

우리는 LP[34]에서 PGY-1의 절차적 역량 평가를 위한 체크리스트에 대한 설명을 찾는다. 체크리스트는 유사한 교육적 맥락에서 사용될 것이기 때문에 우리의 목적에 매우 적합한 것으로 보인다. 따라서 우리는 도구를 변경하지 않고 증거를 평가하는 작업을 계속합니다.

We find a description of a checklist for assessing PGY-1’s procedural competence in LP [34]. The checklist appears well suited for our purpose, as we will be using it in a similar educational context; we thus proceed to appraising the evidence without changing the instrument.

5.기존 증거를 평가하고 필요에 따라 새로운 증거를 수집합니다.
5.Appraise existing evidence and collect new evidence as needed

기존 증거는 그렇지 않지만, 엄밀히 말하면, 실제적인 목적을 위해 우리는 이 도구를 사용할지 여부를 결정할 때 기존 증거에 크게 의존할 것이다. 물론, 우리는 우리 자신의 증거도 수집하기를 원하겠지만, 우리는 현재 이용 가능한 것에 기초해야 한다.
Although existing evidence does not, strictly speaking apply to our situation, for practical purposes we will rely heavily on existing evidence as we decide whether to use this instrument. Of course, we will want to collect our own evidence as well, but we must base our initial adoption on what is now available.

우리는 기존의 증거를 찾는 것에서부터 타당성 주장에 대한 평가를 시작한다.

  • 원본 설명[34]은 공식적인 LP 과제 분석과 전문가 합의를 통해 체크리스트 항목의 개발을 기술함으로써 채점 증거를 제공한다.
  • 평가자 간 신뢰성이 우수하여 일반화 증거를 제공하고, 경험이 많은 거주자가 체크리스트 점수가 더 높았음을 확인함으로써 제한된 외삽 증거를 추가한다.
  • 동일하거나 약간 수정된 체크리스트를 사용한 다른 연구는 좋은 평가자 간 신뢰성으로 추가 일반화 증거를 제공하며 [35, 36] 훈련 후 점수가 더 높고 [35, 37] 계측기가 실제 환자 LP를 평가하는 데 사용될 때 중요한 학습자 오류를 식별했다는 것을 보여줌으로써 외삽 증거를 제공한다[38].
  • 또한 한 연구는 시뮬레이션 환경에서 역량을 획득하는 데 필요한 연습 시도 횟수를 계산하여 제한적인 함의 증거를 제공했다[37]. 

We begin our appraisal of the validity argument by searching for existing evidence.

  • The original description [34] offers scoring evidence by describing the development of checklist items through formal LP task analysis and expert consensus.
  • It provides generalization evidence by showing good inter-rater reliability, and adds limited extrapolation evidence by confirming that residents with more experience had higher checklist scores.
  • Other studies using the same or a slightly modified checklist provide further evidence for generalization with good inter-rater reliabilities [3536], and contribute extrapolation evidence by showing that scores are higher after training [3537] and that the instrument identified important learner errors when used to rate real patient LPs [38].
  • One study also provided limited implications evidence by counting the number of practice attempts required to attain competence in the simulation setting [37].

이러한 기존 연구에 비추어 볼 때, 우리는 이 도구를 처음 채택하기 전에 더 많은 증거를 수집할 계획을 세우지 않을 것이다. 그러나, 우리는 이행하는 동안, 특히 우리가 중요한 gap을 식별한다면, 우리 자신의 증거를 수집할 것이다. 즉, 유효성 검사 프로세스의 후반 단계에서 수집할 것이라는 의미이다.

In light of these existing studies, we will not plan to collect more evidence before our initial adoption of this instrument. However, we will collect our own evidence during implementation, especially if we identify important gaps, i.e., at later stages in the validation process; see below.

6. 비용을 포함한 실질적인 문제를 추적합니다.
6.Keep track of practical issues including cost

중요하지만 종종 제대로 평가되지 않고 연구되지 않은 검증의 측면은 개발, 구현 및 점수의 해석을 둘러싼 실제 문제와 관련이 있다. 평가 절차는 뛰어난 데이터를 산출할 수 있지만, 비용이 엄청나게 많이 들거나, 필요한 물류나 전문성이 현지의 가용 자원을 초과하는 경우 구현이 불가능할 수 있습니다.

An important yet often poorly appreciated and under-studied aspect of validation concerns the practical issues surrounding development, implementation, and interpretation of scores. An assessment procedure might yield outstanding data, but if it is prohibitively expensive or if logistical or expertise requirements exceed local resources, it may be impossible to implement.

LP 계측기의 경우, 한 연구[37]는 시뮬레이션 기반 LP 교육 및 평가 세션의 운영 비용을 추적했다. 저자들은 훈련된 비의사 평가자를 사용함으로써 비용을 줄일 수 있다고 제안했다. 우리가 그 기구를 시행하면서, 특히 새로운 타당성 증거를 수집한다면, 우리는 마찬가지로 돈, 인적 및 비인적 자원, 그리고 다른 실질적인 문제와 같은 비용을 모니터링해야 한다.
For the LP instrument, one study [37] tracked the costs of running a simulation-based LP training and assessment session; the authors suggested that costs could be reduced by using trained non-physician raters. As we implement the instrument, and especially if we collect fresh validity evidence, we should likewise monitor costs such as money, human and non-human resources, and other practical issues.

7.해석-사용 주장와 관련하여 타당성 인수를 공식화/합성합니다.
7.Formulate/synthesize the validity argument in relation to the interpretation-use argument

이제 우리는 원하는 해석과 결정(해석-사용 주장)을 뒷받침하기 위해 필요한 것으로 사전에 식별한 증거와 사용할 수 있는 증거(유효성 주장)를 비교한다.
We now compare the evidence available (the validity argument) against the evidence we identified up-front as necessary to support the desired interpretations and decisions (the interpretation-use argument).

우리는 합리적인 점수 매기기 및 일반화 증거, 외삽 증거의 차이(시뮬레이션과 실제 성능 간의 직접적인 비교가 이루어지지 않음) 및 제한된 함의 증거를 찾는다. 거의 항상 그렇듯이 해석-사용 주장과 사용 가능한 증거 사이의 일치는 완벽하지 않다. 일부 갭은 남아 있고, 일부 증거는 우리가 원하는 만큼 유리하지 않다.
We find reasonable scoring and generalization evidence, a gap in the extrapolation evidence (direct comparisons between simulation and real-world performance have not been done), and limited implications evidence. As is nearly always the case, the match between the interpretation-use argument and the available evidence is not perfect; some gaps remain, and some of the evidence is not as favorable as we might wish.

8.판단을 내리십시오. 그 증거가 의도된 사용을 뒷받침합니까?
8.Make a judgment: does the evidence support the intended use?

검증의 마지막 단계는 증거의 충분성과 적합성을 판단하는 것이다. 즉, 타당성 주장과 관련 증거가 제안된 해석-사용 주장의 요구를 충족하는지 여부.
The final step in validation is to judge the sufficiency and suitability of evidence, i.e., whether the validity argument and the associated evidence meet the demands of the proposed interpretation-use argument.

위에서 요약한 증거를 바탕으로, 우리는 타당성 주장이 그러한 해석을 뒷받침하고 합리적으로 잘 사용하고 있으며, 체크리스트는 우리의 목적에 적합한 것으로 보인다고 판단한다. 게다가, 비용은 지출된 노력에 비해 합리적인 것 같고, 우리는 평가자로서 훈련을 받기를 열망하는 시뮬레이션 실험실의 조수를 만날 수 있다.
Based on the evidence summarized above, we judge that the validity argument supports those interpretations and uses reasonably well, and the checklist appears suitable for our purposes. Moreover, the costs seem reasonable for the effort expended, and we have access to an assistant in the simulation laboratory who is keen to be trained as a rater.

우리는 또한 우리 기관에서 도구를 구현하면서 연구 연구를 수행하여 위에 언급된 증거 격차를 해소할 수 있도록 도울 계획입니다. 외삽 추론을 뒷받침하기 위해 시뮬레이션 평가의 점수를 진행 중인 작업 공간 기반 LP 평가와 상관시킬 계획이다. 또한 성과가 부진한 전공의에 대한 추가 훈련의 효과를 추적하여 시사점 추론을 다룰 것이다. 즉, 평가의 다운스트림 결과입니다. 마지막으로, 우리는 학습자 모집단의 평가자 간, 사례 간 및 내부 일관성 신뢰성을 측정하고 위에서 언급한 바와 같이 비용과 실제 문제를 모니터링할 것이다.
We also plan to help resolve the evidence gaps noted above by conducting a research study as we implement the instrument at our institution. To buttress the extrapolation inference we plan to correlate scores from the simulation assessment with ongoing workplace-based LP assessments. We will also address the implications inference by tracking the effects of additional training for poor performing residents, i.e., the downstream consequences of assessment. Finally, we will measure the inter-rater, inter-case, and internal consistency reliability in our learner population, and will monitor costs and practical issues as noted above.

 

동일한 평가도구를 다른 설정에 적용
Application of the same instrument to a different setting

사고 실험으로서, 만약 우리가 [같은 기구를 다른 목적과 결정에 사용]하기를 원한다면, 예를 들어, 신경과 수련생들이 [레지던시를 마칠 때 인증하는 고부담 시험의 일부]로서 위의 것들이 어떻게 전개될지 생각해 보자. 우리의 결정이 바뀌면, 우리의 해석-사용 주장도 바뀐다. 우리는 이제 [체크리스트의 "합격" 점수]가 [다양한 실제 환자에게 독립적으로 LP를 수행할 수 있는 능력]을 나타난대는 증거를 찾고 있을 것이다. 우리는 다른 또는 추가적인 타당성 증거를 요구할 것이다.

  • 일반화 (연령, 신체 습관 및 난이도에 영향을 미치는 기타 요인에 따라 달라지는 시뮬레이션된 환자에 대한 분석) 
  • 외삽 (시뮬레이션과 실제 성능 사이의 더 강력한 상관 관계 찾기) 및 
  • 함의 (예: 학습자를 독립적 실천을 위한 유능 또는 무능으로 정확하게 분류하고 있었다는 증거) 

As a thought exercise, let us consider how the above would unfold if we wanted to use the same instrument for a different purpose and decision, for example as part of a high-stakes exam to certify postgraduate neurologist trainees as they finish residency. As our decision changes, so does our interpretation-use argument; we would now be searching for evidence that a “pass” score on the checklist indicates competence to independently perform LPs on a variety of real patients. We would require different or additional validity evidence, with increased emphasis on

  • generalization (sampling across simulated patients that vary in age, body habitus, and other factors that influence difficulty),
  • extrapolation (looking for stronger correlation between simulation and real-life performance), and
  • implications evidence (e.g., evidence that we were accurately classifying learners as competent or incompetent for independent practice).

우리는 현재의 증거들이 이 주장을 뒷받침하지 않으며 다음 중 하나가 필요하다고 결론지어야 할 것이다. 

  • (a) 우리의 요구에 부합하는 증거를 가진 새로운 도구를 찾아라. 
  • (b) 새 도구를 만들고 처음부터 증거를 수집하기 시작합니다. 
  • (c) 공백을 메우기 위해 추가 타당성 증거를 수집합니다.

We would have to conclude that the current body of evidence does not support this argument and would need to either

  • (a) find a new instrument with evidence that meets our demands,
  • (b) create a new instrument and start collecting evidence from scratch, or
  • (c) collect additional validity evidence to fill in the gaps.

이 사고 연습은 두 가지 중요한 점을 강조한다. 첫째, 의사 결정이 변경될 때 해석-사용 주장이 변경될 수 있다. 둘째, 기구 자체는 "유효"하지 않다. 오히려, 검증되는 것은 해석이나 결정이다. 동일한 증거에 기초한 타당성의 최종 판단은 제안된 결정마다 다를 수 있다.

This thought exercise highlights two important points. First, the interpretation-use argument might change when the decision changes. Second, an instrument is not “valid” in and of itself; rather, it is the interpretations or decisions that are validated. A final judgment of validity based on the same evidence may differ for different proposed decisions.

타당화에서 피해가야 할 일반적인 실수
Common mistakes to avoid in validation

당사 자체의 타당화 노력[39–41]과 타인의 작업[9, 25, 42]을 검토하면서 최종 사용자의 결과를 이해하고 적용하는 능력을 저해하는 몇 가지 일반적인 실수를 확인했습니다. 우리는 동료 검토자에게 경고하고, 독자를 좌절시키고, 도구의 사용을 제한하도록 보장된 10개의 실수를 제시한다.
In our own validation efforts [3941] and in reviewing the work of others [9, 25, 42], we have identified several common mistakes that undermine the end-user’s ability to understand and apply the results. We present these as ten mistakes guaranteed to alarm peer reviewers, frustrate readers, and limit the uptake of an instrument.

1번 실수. 바퀴 재창조(매번 새로운 평가 작성)
Mistake 1. Reinvent the wheel (create a new assessment every time)

우리의 검토[9]는 대부분의 타당성 연구가 기존 도구를 사용하거나 채택하기보다는 새로 만들어진 도구에 초점을 맞춘다는 것을 발견했다. 그러나 대부분의 구조를 평가하는 도구가 이미 어떤 형태로 존재하기 때문에 학습자 평가를 시작할 때 완전히 처음부터 시작할 필요는 거의 없다. 기존 도구를 사용하거나 기존 도구를 사용하여 구축하면 도구를 새로 개발하는 수고를 덜 수 있고, 우리의 결과를 다른 사람의 이전 작업과 비교할 수 있으며, 다른 사람이 우리의 작업과 비교할 수 있으며, 해당 도구, 작업 또는 평가 양식에 대한 전체 증거 기반에 우리의 증거를 포함할 수 있다. OSATS [42], 복강경 수술의 기초 (FLS) [43] 및 기타 시뮬레이션 기반 평가에 대한 근거 검토[9]는 모두 근거 기반에 중요한 차이를 보여준다. 이러한 공백을 메우기 위해서는 동일한 평가에서 도출된 점수, 추론 및 결정에 대한 증거를 수집하는 데 초점을 맞춘 여러 조사관의 협업 노력이 필요하다.

Our review [9] found that the vast majority of validity studies focused on a newly created instrument rather than using or adapting an existing instrument. Yet, there is rarely a need to start completely from scratch when initiating learner assessment, as instruments to assess most constructs already exist in some form. Using or building from an existing instrument

  • saves the trouble of developing an instrument de novo,
  • allows us to compare our results with prior work, and
  • permits others to compare their work with ours and
  • include our evidence in the overall evidence base for that instrument, task, or assessment modality.

Reviews of evidence for the OSATS [42], Fundamentals of Laparoscopic Surgery (FLS) [43], and other simulation-based assessments [9] all show important gaps in the evidence base. Filling these gaps will require the collaborative effort of multiple investigators all focused on collecting evidence for the scores, inferences, and decisions derived from the same assessment.

실수 2. 타당화 프레임워크를 사용하지 않음
Mistake 2. Fail to use a validation framework

위에서 언급한 바와 같이, 검증 프레임워크는 증거의 선택과 수집에 엄격함을 더하고 그렇지 않으면 놓칠 수 있는 격차를 식별하는 데 도움이 된다. 어떤 프레임워크를 선택했느냐보다 더 중요한 것은 검증 노력에 프레임워크가 적용되는 시기(이상적으로 초기)와 방식(엄정하고 완전하게)이다.
As noted above, validation frameworks add rigor to the selection and collection of evidence and help identify gaps that might otherwise be missed. More important than the framework chosen is the timing (ideally early) and manner (rigorously and completely) in which the framework is applied in the validation effort.

3번 실수. 전문가와 초보자의 비교를 타당성 논쟁의 핵심으로 삼는다.
Mistake 3. Make expert-novice comparisons the crux of the validity argument

[경험이 적은 그룹의 점수]를 [경험이 많은 그룹의 점수]와 비교하는 것(예: 의대생 대 시니어 전공의)은 다른 변수와의 관계에 대한 증거를 수집하는 일반적인 접근법이다. 시뮬레이션 기반 평가 연구의 73%에서 보고되었다[9]. 그러나 이 접근법은 점수 차이가 의도된 구성과 무관한 무수한 요인에서 발생할 수 있기 때문에 약한 증거만을 제공한다[44]. 예를 들어, [봉합 능력]을 측정하기 위한 평가에서 실제로 [멸균 기술을 측정]하고 [봉합 능력 측정은 완전히 무시되었다]고 가정합니다. 만약 조사관이 3학년 의대생과 재학 중인 의사들 사이에서 실제로 이것을 시험한다면, 그는 아마도 주치의에게 유리한 상당한 차이를 발견할 것이고, 이 증거가 제안된 해석의 타당성(즉, 봉합 기술)을 뒷받침한다고 잘못 결론지을 수 있다.

Comparing the scores from a less experienced group against those from a more experienced group (e.g., medical students vs senior residents) is a common approach to collecting evidence of relationships with other variables—reported in 73% of studies of simulation-based assessment [9]. Yet this approach provides only weak evidence because the difference in scores may arise from a myriad of factors unrelated to the intended construct [44]. To take an extreme example for illustration, suppose an assessment intended to measure suturing ability actually measured sterile technique and completely ignored suturing. If an investigator trialed this in practice among third-year medical students and attending physicians, he would most likely find a significant difference favoring the attendings and might erroneously conclude that this evidence supports the validity of the proposed interpretation (i.e., suturing skill).

물론, 이 가상의 예에서, 우리는 어텐딩이 봉합과 멸균 기술 모두에서 의대생보다 낫다는 것을 알고 있습니다. 그러나 실제 삶에서, 우리는 [실제로 평가되고 있는 것]이 무엇인지에 대해서는 전지적 지식이 부족하다. 우리가 아는 것은 오로지 시험 점수이고, 동일한 점수는 어떤 수의 기본 구조를 반영하는 것으로 해석될 수 있다."교란confounding"의 문제(복수의 가능한 해석)는 그룹 간의 차이가 실제로 의도된 구조와 연결된다고 말하는 것을 불가능하게 만든다. 반면에 예상 차이를 확인하지 못하면 점수 무효의 강력한 증거가 될 수 있다.

Of course, in this hypothetical example, we know that attendings are better than medical students in both suturing and sterile technique. Yet, in real life, we lack the omniscient knowledge of what is actually being assessed; we only know the test scores—and the same scores can be interpreted as reflecting any number of underlying constructs. This problem of “confounding” (multiple possible interpretations) makes it impossible to say that any differences between groups are actually linked to the intended construct. On the other hand, failure to confirm expected differences would constitute powerful evidence of score invalidity.

쿡은 이 문제에 대한 확장된 토론과 설명을 제공했고, 다음과 같이 결론을 내렸다. "연구자들이 한계를 이해한다면, 그러한 분석을 수행하는 것은 잘못된 것이 아니다." … 이러한 분석은 [달라야 할 집단을 구별하지 못하거나] [차이가 없어야 할 곳에 차이를 발견하게 된다면] 가장 흥미로울 것이다. 가설상의 차이 또는 유사성의 확인은 타당성 주장에 거의 추가되지 않는다." [44]
Cook provided an extended discussion and illustration of this problem, concluding that “It is not wrong to perform such analyses, … provided researchers understand the limitations. … These analyses will be most interesting if they fail to discriminate groups that should be different, or find differences where none should exist. Confirmation of hypothesized differences or similarities adds little to the validity argument.” [44]

4번 실수. [가장 중요한 증거]보다는 [쉽게 접근할 수 있는 타당성 증거]에 초점을 맞춘다.
Mistake 4. Focus on the easily accessible validity evidence rather than the most important

검증 연구자들은 종종 쉽게 이용할 수 있거나 쉽게 수집할 수 있는 데이터에 초점을 맞춘다. 이 접근법은 이해할 수 있지만, 종종 한 소스에 대해 풍부한 유효성 증거가 보고되는 반면 동등하거나 더 중요할 수 있는 다른 소스에 대해서는 큰 증거 격차가 남아 있다. 그 예로는

  • [내부 구조]를 무시하면서 [내용 증거]를 강조하거나,
  • [평가자 간 신뢰성]이 더 중요할 때 [문항 간 신뢰도]를 보고하거나,
  • 다른 변수와의 관계에 대해 [독립적인 측정과의 상관관계]보다는 [전문가-초심자 비교를 보고하는 것]이 있다.

우리의 검토에서, 우리는 306/417(73%)의 연구가 전문가와 초보자의 비교를 보고했고, 이 중 138(45%)은 추가 증거를 보고하지 않았다는 것을 발견했다. 이에 비해 별도의 측정으로 관계를 보고한 경우는 128명(31%), 내용증거 보고는 142명(34%), 점수 신뢰성 보고는 163명(39%)에 불과했다. 이러한 보고 패턴의 모든 이유를 알 수는 없지만, 적어도 부분적으로 일부 요소(예: 전문가-노바이스 비교 데이터)를 쉽게 얻을 수 있기 때문일 것으로 추측한다.
Validation researchers often focus on data they have readily available or can easily collect. While this approach is understandable, it often results in abundant validity evidence being reported for one source while large evidence gaps remain for other sources that might be equally or more important. Examples include

  • emphasizing content evidence while neglecting internal structure,
  • reporting inter-item reliability when inter-rater reliability is more important, or
  • reporting expert-novice comparisons rather than correlations with an independent measure to support relationships with other variables.

In our review, we found that 306/417 (73%) of studies reported expert-novice comparisons, and 138 of these (45%) reported no additional evidence. By contrast, only 128 (31%) reported relationships with a separate measure, 142 (34%) reported content evidence, and 163 (39%) reported score reliability. While we do not know all the reasons for these reporting patterns, we suspect they are due at least in part to the ease with which some elements (e.g., expert-novice comparison data) can be obtained.

이것은 해석-사용 주장을 명확하고 완전하게 진술하고, 기존의 증거와 격차를 식별하고, 가장 중요한 격차를 해결하기 위해 증거 수집을 조정하는 것의 중요성을 강조한다.
This underscores the importance of clearly and completely stating the interpretation-use argument, identifying existing evidence and gaps, and tailoring the collection of evidence to address the most important gaps.

5번 실수. 점수 해석 및 사용보다는 평가도구에 집중
Mistake 5. Focus on the instrument rather than score interpretations and uses

위에서 언급한 바와 같이, 타당성은 평가도구의 속성이 아니라 점수, 해석 및 용도의 속성이다. [동일한 도구]를 [다양한 용도]에 적용할 수 있으며(PSA는 임상 검사 도구로 유용하지 않을 수 있지만, 전립선암 재발을 모니터링하는 데 계속 가치가 있다), 많은 타당성 증거는 상황에 따라 다르다. 예를 들어,

  • 점수 신뢰성은 서로 다른 모집단에 걸쳐 크게 변할 수 있으며 [44],
  • 외래 진료와 같은 한 학습 상황에 대해 설계된 평가는 병원이나 급성 치료 의료와 같은 다른 맥락과 관련되거나 관련되지 않을 수 있으며,
  • OSATS 글로벌 등급 척도와 같은 일부 도구는 새로운 작업에 대한 평가에 쉽게 적용할 수 있지만, OSATS 체크리스트와 같은 것은 그렇지 않다 [42]

물론 의과대학과 같이 한 맥락에서 수집된 증거는 레지던트 훈련과 같은 다른 맥락과 적어도 부분적인 관련성을 갖는 경우가 많지만, 증거가 언제 어느 정도 새로운 환경으로 전이가능한지transfer에 대한 결정은 판단의 문제이며, 이러한 판단은 잠재적으로 잘못될 수 있다.

As noted above, validity is a property of scores, interpretations, and uses, not of instruments. The same instrument can be applied to different uses (the PSA may not be useful as a clinical screening tool, but continues to have value for monitoring prostate cancer recurrence), and much validity evidence is context-dependent. For example,

  • score reliability can change substantially across different populations [44],
  • an assessment designed for one learning context such as ambulatory practice may or may not be relevant in another context such as hospital or acute care medicine, and
  • some instruments such as the OSATS global rating scale lend themselves readily to application to a new task while others such as the OSATS checklist do not [42].

Of course, evidence collected in one context, such as medical school, often has at least partial relevance to another context, such as residency training; but determinations of when and to what degree evidence transfers to a new setting are a matter of judgment, and these judgments are potentially fallible.

[해석-사용 주장]은 엄밀히 말하면 [의도된 적용의 맥락]을 명확히 하지 않고서는 적절하게 만들어질 수 없다. 연구자의 문맥과 최종 사용자의 문맥은 거의 항상 다르기 때문에 해석-사용 논쟁도 반드시 다르다. 연구자들은 [데이터 수집의 맥락]을 명확하게 명시함으로써 후속 작업의 활용을 촉진할 수 있다. 예를 들어, 학습자 그룹, 과제 및 의도된 사용/사용 범위, 그리고 자신의 연구 결과가 타당하게 적용될 수 있다고 믿는 범위를 제안함으로써.
The interpretation-use argument cannot, strictly speaking, be appropriately made without articulating the context of intended application. Since the researcher’s context and the end-user’s context almost always differ, the interpretation-use argument necessarily differs as well. Researchers can facilitate subsequent uptake of their work by clearly specifying the context of data collection—for example, the learner group, task, and intended use/decision—and also by proposing the scope to which they believe their findings might plausibly apply.

점수의 타당성에 대해 언급하는 것은 허용되지만, 위에 명시된 이유로, 그러한 점수의 의도된 해석과 사용, 즉 의도된 결정을 명시하는 것이 더 낫다. 우리는 연구자와 최종 사용자(교육자) 모두가 모든 검증 단계에서 해석과 사용을 명확히 할 것을 강력히 권장한다.
It is acceptable to talk about the validity of scores, but for reasons articulated above, it is better to specify the intended interpretation and use of those scores, i.e., the intended decision. We strongly encourage both researchers and end-users (educators) to articulate the interpretations and uses at every stage of validation.

6번 실수. 타당성 증거를 종합하거나 비평하지 못함
Mistake 6. Fail to synthesize or critique the validity evidence

우리는 종종 연구자들이 [증거를 합성하거나 평가하려는 시도 없이, 그저 보고하기만 하는 것]을 관찰했다. 교육자와 미래 연구자 모두 제안된 [해석-사용 주장]에 비추어 연구자가 [자신의 발견을 해석]하고, 이를 [이전 작업과 통합]하여 [현재 및 포괄적인 타당성 주장]을 만들고, [한계 및 지속적인 gap 또는 불일치를 식별]할 때 큰 이익을 얻는다. 교육자와 다른 최종 사용자도 증거에 익숙해져야 하며, 연구자의 주장을 확인하고 특정 상황에 대한 타당성에 대한 자체 판단을 공식화해야 한다.
We have often observed researchers merely report the evidence without any attempt at synthesis and appraisal. Both educators and future investigators greatly benefit when researchers interpret their findings in light of the proposed interpretation-use argument, integrate it with prior work to create a current and comprehensive validity argument, and identify shortcomings and persistent gaps or inconsistencies. Educators and other end-users must become familiar with the evidence as well, to confirm the claims of researchers and to formulate their own judgments of validity for their specific context.

7번 실수. 평가 개발을 위한 모범 사례 무시
Mistake 7. Ignore best practices for assessment development

평가 과제, 도구 및 절차의 개발, 개선 및 구현에 대한 책이 작성되었습니다 [23, 45–48]. 이러한 모범 사례를 고려하지 않고 평가를 개발하거나 수정하는 것은 경솔한 일일 것이다. 우리는 이것들을 요약할 수 없었지만, 우리는 건강 전문 교육자들에게 특별한 인상에 대한 두 가지 권고를 강조한다. 두 가지 모두 콘텐츠 증거(클래식 또는 5가지 소스 프레임워크 기준)와 일반화 추론(케인 기준)과 관련이 있다.
Volumes have been written on the development, refinement, and implementation of assessment tasks, instruments, and procedures [23, 4548]. Developing or modifying an assessment without considering these best practices would be imprudent. We could not begin to summarize these, but we highlight two recommendations of particular salience to health professions educators, both of which relate to content evidence (per the classic or five sources frameworks) and the generalization inference (per Kane).

첫째, [작업 또는 토픽의 표본]은 원하는 수행능력 영역을 나타내야 한다. 보건 전문가 평가에서 반복적으로 발견되는 것은 [일반화 가능한 기술]이란 것은 거의 존재하지 않는다는 것이다. 한 과제에 대한 성과는 다른 과제에 대한 성과를 예측하지 못한다[49, 50]. 따라서 평가는 시나리오, 사례, 과제, 스테이션 등의 충분히 많고 광범위한 샘플을 제공해야 한다.

First, the sample of tasks or topics should represent the desired performance domain. A recurrent finding in health professions assessment is that there are few, if any, generalizable skills; performance on one task does not predict performance on another task [49, 50]. Thus, the assessment must provide a sufficiently numerous and broad sample of scenarios, cases, tasks, stations, etc.

둘째, 평가 응답 형식은 [객관화]와 [판단 또는 주관성]의 균형을 이루어야 한다[51]. 체크리스트와 글로벌 등급의 장점과 단점은 오랫동안 논의되어 왔으며, 둘 다 장단점이 있는 것으로 밝혀졌다[52]. 체크리스트는 원하는 행동에 대한 구체적인 기준과 형성적 피드백을 위한 지침을 개략적으로 설명하므로 평가 과제에 익숙하지 않은 평가자가 종종 사용할 수 있다. 그러나 체크리스트의 "객관성"은 대체로 착각이다. [53] [관찰된 행동에 대한 정확한 해석]은 여전히 [과제와 관련된 전문지식]을 필요로 할 수 있으며, 평가자에게 등급을 이분화하도록 강요하는 것은 정보의 손실을 초래할 수 있다. 또한 각 특정 작업에 대해 새로운 점검표를 작성해야 하며, 해당 항목은 종종 임상 역량을 보다 정확하게 반영할 수 있는 조치를 희생하여 철저성을 보상한다. 대조적으로, 글로벌 등급은 사용하기 위해 더 큰 전문지식이 필요하지만 성능의 더 미묘한 뉘앙스를 측정하고 여러 보완적 관점을 반영할 수 있다. 글로벌 등급은 또한 OSATS의 경우와 마찬가지로 여러 작업에 걸쳐 사용하도록 설계될 수 있다. 최근의 체계적 검토에서, 우리는 여러 연구에서 평균을 낼 때 글로벌 등급보다 체크리스트에 대한 등급 간 신뢰성이 약간 더 높았지만, 글로벌 등급은 항목 간 및 스테이션 간 신뢰성이 더 높았다[52]. 정성적 평가는 일부 학습자의 속성을 평가하기 위한 또 다른 옵션을 제공한다[11, 54, 55].
Second, the assessment response format should balance objectification and judgment or subjectivity [51]. The advantages and disadvantages of checklists and global ratings have long been debated, and it turns out that both have strengths and weaknesses [52]. Checklists outline specific criteria for desired behaviors and guidance for formative feedback, and as such can often be used by raters less familiar with the assessment task. However, the “objectivity” of checklists is largely an illusion; [53] correct interpretation of an observed behavior may yet require task-relevant expertise, and forcing raters to dichotomize ratings may result in a loss of information. Moreover, a new checklist must be created for each specific task, and the items often reward thoroughness at the expense of actions that might more accurately reflect clinical competence. By contrast, global ratings require greater expertise to use but can measure more subtle nuances of performance and reflect multiple complementary perspectives. Global ratings can also be designed for use across multiple tasks, as is the case for the OSATS. In a recent systematic review, we found slightly higher inter-rater reliability for checklists than for global ratings when averaged across studies, while global ratings had higher average inter-item and inter-station reliability [52]. Qualitative assessment offers another option for assessing some learner attributes [11, 54, 55].

8번 실수. 평가도구에 대한 세부 정보 생략
Mistake 8. Omit details about the instrument

의도된 용도를 뒷받침하는 타당성 증거와 지역 요구와 관련된 평가를 식별하는 것은 실망스러운 일이지만, 평가가 적용을 허용하기에 충분한 세부 사항을 명시하지 않았다는 것을 발견하는 것은 좌절스러운 일이다. 주로 누락되는 중요한 사항에는 다음이 있다.

  • 평가도구 문항의 정확한 워딩,
  • 채점 기준(rubric)
  • 학습자 또는 평가자에게 제공되는 지침,
  • 스테이션 배치에 대한 설명(예: 절차적 작업에 필요한 자료, 표준화된 환자 접견에서 참가자 교육) 
  • 사건의 순서. 

대부분의 연구자들은 다른 사람들이 그들의 창작물을 사용하고 그들의 출판물을 인용하기를 원한다. 
필요한 세부 정보가 보고될 경우 이 문제가 발생할 가능성이 훨씬 높습니다. 온라인 부록은 기사 길이가 문제인 경우 인쇄 출판에 대한 대안을 제공합니다.

It is frustrating to identify an assessment with relevance to local needs and validity evidence supporting intended uses, only to find that the assessment is not specified with sufficient detail to permit application. Important omissions include

  • the precise wording of instrument items,
  • the scoring rubric,
  • instructions provided to either learners or raters, and
  • a description of station arrangements (e.g., materials required in a procedural task, participant training in a standardized patient encounter) and
  • the sequence of events.

Most researchers want others to use their creations and cite their publications; this is far more likely to occur if needed details are reported. Online appendices provide an alternative to print publication if article length is a problem.

9번 실수. 시뮬레이터/평가 기구의 가용성이 평가를 주도하도록 합니다.
Mistake 9. Let the availability of the simulator/assessment instrument drive the assessment

교육자로서, 우리는 너무 자주 [수행능력 기반 평가]가 임상실습의 목표와 더 잘 일치함에도 불구하고, [임상실습 말 평가를 위해 기성 MCQ 시험을 보는 것]과 같처럼 [평가 도구의 가용성]이 평가 프로세스를 끌어나가게 방치한다. 이 문제는 시뮬레이터의 가용성이 교육 프로그램을 설계하고 교육 요구에 맞는 최적의 시뮬레이션을 선택하는 것과 반대로 교육 프로그램을 구동할 수 있는 시뮬레이션 기반 평가와 더욱 복잡하다[56]. 우리는 [우리가 가르치고 있는 구조]를 [그 구조를 가장 잘 평가하는 시뮬레이터 및 평가 도구]와 일치시켜야 한다.
Too often as educators, we allow the availability of an assessment tool to drive the assessment process, such as taking an off-the-shelf MCQ exam for an end-of-clerkship assessment when a performance-based assessment might better align with clerkship objectives. This issue is further complicated with simulation-based assessments, where the availability of a simulator may drive the educational program as opposed to designing the educational program and then choosing the best simulation to fit the educational needs [56]. We should align the construct we are teaching with the simulator and assessment tool that best assess that construct.

10번 실수. 평가도구를 '타당화된'이라고 명명
Mistake 10. Label an instrument as validated

계측기를 유효하다고 레이블링하는 데는 세 가지 문제가 있습니다.

  • 첫째, 타당성은 도구가 아니라 점수, 해석, 결정의 속성이다.
  • 둘째, 타당성은 정도의 문제이다. 예스냐 아니냐의 결정이 아니다.
  • 셋째, 타당화는 엔드포인트가 아닌 프로세스입니다.

Validated라는 단어는 [프로세스가 적용되었다는 것]을 의미할 뿐이며, 프로세스에 대한 세부 정보를 제공하지 않으며 경험적 소견의 크기나 방향(지지 또는 반대)을 나타내지 않는다.
There are three problems with labeling an instrument as validated.

  • First, validity is a property of scores, interpretations, and decisions, not instruments.
  • Second, validity is a matter of degree—not a yes or no decision.
  • Third, validation is a process, not an endpoint. 

The word validated means only that a process has been applied; it does not provide any details about that process nor indicate the magnitude or direction (supportive or opposing) of the empiric findings.

시뮬레이션 기반 평가의 미래
The future of simulation-based assessment

우리는 시뮬레이션 기반 평가의 미래를 아는 척하지 않지만, 실현되기를 바라는 여섯 가지 야심찬 개발로 결론을 내린다
Although we do not pretend to know the future of simulation-based assessment, we conclude with six aspirational developments we hope come to pass.

1.우리는 일련의 학습자 평가의 일환으로 시뮬레이션 기반 평가를 더 많이 사용할 수 있기를 바란다. 시뮬레이션 기반 평가는 그 자체로 목표가 되어서는 안 되지만 일반적으로 더 빈번한 평가를 예상하고 시뮬레이션이 중요한 역할을 할 것으로 믿는다. 양식 선택은 먼저 주어진 상황, 즉 학습 목표, 학습자 수준 또는 교육적 맥락에서 최선의 평가 접근법이 무엇인지 고려해야 한다. 특히 조건과 내용의 표준화가 필요한 기술 평가에서 다양한 형태의 시뮬레이션이 해답이 될 수 있다.

1.We hope to see greater use of simulation-based assessment as part of a suite of learner assessments. Simulation-based assessment should not be a goal in and of itself, but we anticipate more frequent assessment in general and believe that simulation will play a vital role. The choice of modality should first consider what is the best assessment approach in a given situation, i.e., learning objective, learner level, or educational context. Simulation in its various forms will often be the answer, especially in skill assessments requiring standardization of conditions and content.

2.우리는 시뮬레이션 기반 평가가 [테크놀로지보다는 교육적 필요성에 더 명확하게 초점]을 맞추기를 바란다. 값비싼 마네킹과 가상현실 작업 트레이너가 역할을 할 수도 있지만 족발, 펜로즈 배수구, 나무 말뚝, 판지 마네킹은 더 많은 빈도와 더 적은 제약으로 사용될 수 있기 때문에 실제로 더 실용적인 유용성을 제공할 수 있다. 예를 들어, 이러한 저가 모델은 전용 시뮬레이션 센터보다는 가정이나 병동에서 사용할 수 있다. 고부가가치, 비용 의식이 높은 교육의 필요성을 고려함에 따라[57] 혁신적인 교육자들이 저기술 솔루션을 적극적으로 모색할 것을 권장한다.
2.
We hope that simulation-based assessment will focus more clearly on educational needs and less on technology. Expensive manikins and virtual reality task trainers may play a role, but pigs feet, Penrose drains, wooden pegs, and cardboard manikins may actually offer more practical utility because they can be used with greater frequency and with fewer constraints. For example, such low-cost models can be used at home or on the wards rather than in a dedicated simulation center. As we consider the need for high-value, cost-conscious education [57], we encourage innovative educators to actively seek low-tech solutions.


3. 처음 두 가지를 바탕으로, 우리는 비용이 적게 들고 덜 정교하며 덜 거슬리고 덜 거슬리는 저부담 평가가 시뮬레이션과 작업장에서 모두 더 다양한 맥락에서 더 자주 수행되기를 바란다. 슈워츠와 반 데르 블류텐이 제안했듯이, 이 모델은 시간이 지남에 따라 아무리 잘 설계되었더라도 어떤 단일 평가보다 학습자의 완전한 그림을 그릴 것이다.
3.Building off the first two points, we hope to see less expensive, less sophisticated, less intrusive, lower-stakes assessments take place more often in a greater variety of contexts, both simulated and in the workplace. As Schuwirth and van der Vleuten have proposed [58], this model would—over time—paint a more complete picture of the learner than any single assessment, no matter how well-designed, could likely achieve.

4.새로운 평가 도구가 더 적게 생성되고 기존 도구를 지원하고 적용하기 위해 더 많은 증거를 수집하기를 바랍니다. 우리는 새로운 도구의 창조를 장려할 수 있는 힘을 높이 평가하지만, 연구자들이 [더 작은 집합의 유망한 도구]에 대해 타당성 증거를 확장하기 위해 노력을 모으고, [다른 맥락에서 그러한 도구를 평가]하여 [증거 공백을 연속적으로 메워간다면], 이 분야가 점점 더 빠르게 발전할 것이라고 믿는다. 
4.
We hope to see fewer new assessment instruments created and more evidence collected to support and adapt existing instruments. While we appreciate the forces that might incentivize the creation of novel instruments, we believe that the field will advance farther and faster if researchers pool their efforts to extend the validity evidence for a smaller subset of promising instruments, evaluating such instruments in different contexts, and successively filling in evidence gaps.

5.우리는 평가의 결과 및 시사점을 알려주는 더 많은 증거를 보기를 바란다. 이것은 아마도 가장 중요한 증거 자료일 것이지만, 가장 자주 연구되지 않는 것 중 하나이다. 평가의 결과에 대한 연구를 위한 제안이 최근에 발표되었다[27].
5.
We hope to see more evidence informing the consequences and implications of assessment. This is probably the most important evidence source, yet it is among the least often studied. Suggestions for the study of the consequences of assessment have recently been published [27].

6.마지막으로, 우리는 해석-사용 주장의 더 빈번하고 명시적인 사용을 볼 수 있기를 바란다. 위에서 언급한 바와 같이, 이 초기 단계는 어렵지만 의미 있는 검증에 매우 중요하다.
6.
Finally, we hope to see more frequent and more explicit use of the interpretation-use argument. As noted above, this initial step is difficult but vitally important to meaningful validation.

 

 


Adv Simul (Lond). 2016 Dec 7;1:31. doi: 10.1186/s41077-016-0033-y. eCollection 2016.

Validation of educational assessments: a primer for simulation and beyond

Affiliations collapse

Affiliations

11Mayo Clinic Online Learning, Mayo Clinic College of Medicine, Rochester, MN USA.

22Office of Applied Scholarship and Education Science, Mayo Clinic College of Medicine, Rochester, MN USA.

33Division of General Internal Medicine, Mayo Clinic College of Medicine, Mayo 17-W, 200 First Street SW, Rochester, MN 55905 USA.

44Department of Medicine, University of British Columbia, Vancouver, British Columbia Canada.

PMID: 29450000

PMCID: PMC5806296

DOI: 10.1186/s41077-016-0033-y

Free PMC article

Abstract

Background: Simulation plays a vital role in health professions assessment. This review provides a primer on assessment validation for educators and education researchers. We focus on simulation-based assessment of health professionals, but the principles apply broadly to other assessment approaches and topics.

Key principles: Validation refers to the process of collecting validity evidence to evaluate the appropriateness of the interpretations, uses, and decisions based on assessment results. Contemporary frameworks view validity as a hypothesis, and validity evidence is collected to support or refute the validity hypothesis (i.e., that the proposed interpretations and decisions are defensible). In validation, the educator or researcher defines the proposed interpretations and decisions, identifies and prioritizes the most questionable assumptions in making these interpretations and decisions (the "interpretation-use argument"), empirically tests those assumptions using existing or newly-collected evidence, and then summarizes the evidence as a coherent "validity argument." A framework proposed by Messick identifies potential evidence sources: content, response process, internal structure, relationships with other variables, and consequences. Another framework proposed by Kane identifies key inferences in generating useful interpretations: scoring, generalization, extrapolation, and implications/decision. We propose an eight-step approach to validation that applies to either framework: Define the construct and proposed interpretation, make explicit the intended decision(s), define the interpretation-use argument and prioritize needed validity evidence, identify candidate instruments and/or create/adapt a new instrument, appraise existing evidence and collect new evidence as needed, keep track of practical issues, formulate the validity argument, and make a judgment: does the evidence support the intended use?

Conclusions: Rigorous validation first prioritizes and then empirically evaluates key assumptions in the interpretation and use of assessment scores. Validation science would be improved by more explicit articulation and prioritization of the interpretation-use argument, greater use of formal validation frameworks, and more evidence informing the consequences and implications of assessment.

Keywords: Content Evidence; Lumbar Puncture; Validation Framework; Validity Argument; Validity Evidence.

테크놀로지-강화 평가: 오타와 합의문과 권고(Med Teach, 2022)
Technology enhanced assessment: Ottawa consensus statement and recommendations
Richard Fullera, Viktoria C. T. Goddardb, Vishna D. Nadarajahc , Tamsin Treasure-Jonesd, Peter Yeatese , Karen Scottf , Alexandra Webbg, Krisztina Valterh and Eeva Pyoralai 

 

 

배경
Background

2011년 이전의 오타와 기술 강화 평가(TEA) 합의 성명 이후, 기술 향상은 평가 관행을 혁신할 수 있는 이전에는 상상할 수 없었던 가능성을 실현했습니다(Amin et al. 2011). 테크놀로지와 교육의 인터페이스가 직원, 학습자 및 기관을 연결하는 학습, 교육 및 평가에 대한 새로운 접근 방식을 개발함에 따라 흥미로운 새로운 지평이 계속 드러나고 있다(Alexander et al. 2019). 이러한 연결성은 점점 더 쉽게 액세스할 수 있는 '빅 데이터'와 결합되어 개인화된 평가와 시기적절한 피드백을 제공할 수 있는 실질적인 기회를 제공합니다.
Since the previous Ottawa Technology Enhanced Assessment (TEA) consensus statement of 2011, technology enhancements have realised previously unimagined possibilities to innovate assessment practices (Amin et al. 2011). Exciting new horizons continue to be revealed as the interface of technology and education develops new approaches to learning, teaching, and assessing, connecting staff, learners, and institutions (Alexander et al. 2019). This connectivity, coupled with increasingly accessible ‘big data,’ presents real opportunities to deliver personalised assessment and timely feedback.

그러나 평가에서 (새로운) 테크놀로지를 무비판적으로 채택하는 것은 (평가 보안 및 시스템 장애에 걸친 우려에서 학문적 무결성을 포함하여 학습자와 교수진에 미치는 영향에 이르기까지) 상당한 위험을 초래한다(Andreou et al. 2021). 혁신의 기회 또는 테크놀로지의 오용 및 잘못된 적용 가능성(예: 의사 결정을 촉진하기 위한 분석 사용)은 교육이 제공되는 환경에서 학습자, 교수진 및 조직에 복잡한 [학문적 및 윤리적 딜레마]를 가져옵니다.
However, uncritical adoption of (new) technologies in assessment brings substantial risk, from concerns spanning assessment security and systems failure through to their impact on learners and faculty, including academic integrity (Andreou et al. 2021). Opportunities for innovation, or the potential for misuse and misapplication of technology (for example, the use of analytics to drive decision making), bring complex academic and ethical dilemmas for learners, faculty, and organisations in settings where education is delivered.

우리는 테크놀로지를 비교적 '새로운' 구인construct으로 인식할 수도 있지만, 역사적으로 [사용 및 경험을 통해 테크놀로지를 적용할 수 있는 '규칙'을 생성하는 동시에, 테크놀로지 업그레이드 및 혁신의 역동적이고 가속화하는 지형과 씨름하면서] 혁신은 교육에 도전해 왔습니다. 테크놀로지 변화의 속도는 교육 개혁보다 훨씬 더 빠르며, 영원한 '따라잡기catch up' 감각을 만들어낸다. 이러한 지속적인 도전은 이러한 변화와 함께 교육자들이 평가 관행을 혁신하고자 할 때 '정치, 교육학, 실천'의 3원적 인터페이스에 반영된다(Shum and Luck in 2019).
Whilst we might recognize technology as a relatively ‘new’ construct, innovations throughout history have challenged education as we generate ‘rules’ for its application through use and experience, whilst grappling with an increasingly dynamic, accelerating landscape of technology upgrades and innovation. The pace of change in technology continues to be much quicker than educational reform, creating a perpetual sense of ‘catch up.’ This continual challenge is reflected in the triadic interface of ‘politics, pedagogy, and practices’ as educators seek to innovate assessment practices alongside these changes (Shum and Luckin 2019).

2020년 오타와 회의 이후 코로나19 범유행으로 인한 글로벌 혼란이 사회 모든 부문에 영향을 미치고 있다. 교육은 학습자의 세대 간 집단(학전부터 지속적인 전문적 발달까지)에 영향을 미쳐 기관이 원격/온라인 교육을 신속하게 채택하고 적응해야 한다(아리스토브니크 외 2020; 클렐란드 외 2020; 고든 외 2020; 라힘 2020; 파로키 외 2021; 그래프톤-클라케 외 2021). 평가는 특별한 과제를 보았지만 보건 전문 교육(HPE)에서 창의적이고 혁신적인 솔루션을 제공하기 위해 테크놀로지를 채택했다(Fuller et al. 2020; Hegazy et al. 2021). 예를 들어, TEA에서 '온라인 OSCE'(객관적 구조 임상 검사)(Hytönen et al. 2021; Roman et al. 2022)와 같은 새로운 담론이 등장했지만, 이는 우수한 평가 관행과 OSCE의 목적에 대한 정의나 정렬이 부족할 수 있다(Boursicot et al. 2020, 2021). 학습 분석과 같은 다른 제안된 기술 솔루션은 상당한 잠재력을 보여주지만, 현재 중요한 증거 기반이 부족하다(Sonderlund et al. 2019; Archer and Prinslo 2020). 결과적으로, 교육을 혁신하기 위한 테크놀로지 사용을 뒷받침하기 위해 더 큰 연구가 필요하다는 주장이 제기되었고(Ellaway et al. 2020), 이것은 이 새로워진 TEA 합의문을 탐구하는 데 유용한 배경을 제공한다.
Since the Ottawa conference of 2020, global disruption caused by the Covid-19 pandemic continues to impact every sector of society. Education has affected a cross-generational cohort of learners (from pre-school to continuing professional development), necessitating institutions to rapidly adopt and adapt to remote/online education (Aristovnik et al. 2020; Cleland et al. 2020; Gordon et al. 2020; Rahim 2020; Farrokhi et al. 2021; Grafton-Clarke et al. 2021). Assessment has seen particular challenges but has embraced technology to deliver creative, innovative solutions in Health Professions Education (HPE) (Fuller et al. 2020; Hegazy et al. 2021). Whilst new discourses have emerged in TEA, for example, the ‘online OSCE’ (Objective Structured Clinical Examination) (Hytönen et al. 2021; Roman et al. 2022), these may lack definition or alignment to good assessment practice and the purpose of the OSCE (Boursicot et al. 2020, 2021). Other proposed technology solutions, such as learning analytics show significant potential, but currently lack a critical evidence base (Sonderlund et al. 2019; Archer and Prinsloo 2020). Consequently, calls have emerged for a greater scholarship to underpin the use of technology to innovate education (Ellaway et al. 2020), and this provides a helpful backdrop to explore this refreshed TEA consensus statement.

과거를 통해 미래를 볼 수 있을까? 2011년 컨센서스와 새로운 10년을 위한 새로운 프레임워크로부터의 교훈
Looking back to the future? Lessons from the 2011 consensus and a refreshed framework for a new decade

이전의 Ottawa TEA 컨센서스에 의해 예측된 많은 [테크놀로지 혁신]은 이제 평가의 게이미피케이션에서 증가하는 추세와 함께 일상적인 교육 관행(가상 학습 환경, 컴퓨터 기반 평가, 시뮬레이션 및 마네킹 포함)으로 인식될 수 있다(Wang et al. 2016; Prochazkova et al. 2019; Tsoy et al. 2019; Tu.tie et al. 2020; Roman et al. 2022). 또한 지난 10년간 [모바일 기술]의 급속한 확산은 학습자가 임상 작업장에서 정보를 검색할 수 있는 기회를 제공했지만 학생, 임상 교사, 의료 전문가, 환자와 보호자 사이에 긴장을 조성했다(Scott et al. 2017; Harrison et al. 2019; Folger et al. 2021).
Many of the technology innovations forecasted by the previous Ottawa TEA consensus may now be perceived as everyday education practice (including virtual learning environments, computer-based assessment, simulation, and mannequins) with growing trends in the gamification of assessment (Wang et al. 2016; Prochazkova et al. 2019; Tsoy et al. 2019; Tuti et al. 2020; Roman et al. 2022). Furthermore, the rapid spread of mobile technology over the past decade has provided learners opportunities to retrieve information in the clinical workplace but has also created tensions between students, clinical teachers, health care professionals, and patients and carers (Scott et al. 2017; Harrison et al. 2019; Folger et al. 2021).

그러나 [자원과 테크놀로지의 한계]는 [일부 기관이 새로운 테크놀로지를 필요로 하는 교수, 학습 및 평가 관행을 구현할 수 없음을 의미함]을 인식하는 것이 중요하다. 게다가, 모든 학생들이 최신 테크놀로지에 접근할 수 있는 것도 아니다. 이러한 요인들은 테크놀로지 강화 학습에 대한 접근성을 매개로 이미 고착화된 [저자원 환경과 고자원 환경] 간의 격차를 확대한다(Aristovnik et al. 2020). 이전의 합의 이후, 더 넓은 사회에서 등장한 많은 광범위한 '하드웨어' 솔루션은 학습을 평가하는 방법을 근본적으로 변화시켰다. 예를 들면 OSCE(Judd 등 2017; Daniels 등)에서의 태블릿 기반 표시와 직장에서의 스마트폰 지원 평가(Mooney 등 2014; Joynes 및 Fuller 2016)와 같은 것이 있다.

However, it is important to recognise that resource and technology limitations mean that some institutions have been unable to implement teaching, learning, and assessment practices that require new technology. In addition, not all students have access to the latest technology. These factors widen an already established disparity between lower and higher-resourced environments through access to technology-enhanced learning (Aristovnik et al. 2020). Since the previous consensus, many of the broader ‘hardware’ solutions that have emerged in wider society have radically changed how we can assess learning, e.g. tablet-based marking in OSCEs (Judd et al. 2017; Daniels et al. 2019) and smartphone assisted assessment in the workplace (Mooney et al. 2014; Joynes and Fuller 2016).

[테크놀로지 '도구tools']에 초점을 맞추는 것은 유혹적이지만,이전 오타와 프레임워크의 핵심 개념 중 일부는 구현과 연구 질문의 최전선에 남아 있으며, 특히 다음과 관련된다.

  • 온라인 환경에서 [기존 평가 과제와 관행을 복제]하기 위한 기술 적용('변환transmediation') 또는
  • 시험 및 채점 [속도를 높이는 테크놀로지-지원 평가 도구 사용]의 효율성 향상('보조기구prosthesis'). 

Whilst it is tempting to explore a focus on technology ‘tools,’ some of the key concepts from the previous Ottawa framework remain at the forefront of implementation and research questions, particularly relating

  • to the application of technology to replicate the existing assessment assignments and practices in an online environment (‘transmediation’) or
  • to the efficiency in the use of technology-assisted assessment tools that speed up examinations and grading (‘prosthesis’).

TEA는 실생활에서 필요한 지식, 기술 및 행동의 조합 또는 학생의 역량에 대한 진정한authentic 평가를 제공하기 위해 제안되었다(Gulikers et al. 2004). 그러나 [의도하지 않은 구조에 대한 의도하지 않은 평가] 또는 [결과적으로 학습자의 참여와 행동에 영향을 미치는 실제 관행으로부터의 deviation]으로 인해서, [TEA를 통한 진정한 평가]에 대한 위험은 여전히 높다. 2011년 프레임워크는 또한 고비용 및 충실도 평가 기술 관행의 일부 과제에 초점을 맞췄습니다. 특히 학습자와 기관 간의 디지털 불평등의 출현과 이해로 인해 현재 더욱 어려워지고 있습니다(UNESCO 2018). 10년간의 혁신과 연구에도 불구하고 평가의 진실성과 학습의 영향을 둘러싼 몇 가지 핵심 질문이 우리의 생각의 최전선에 남아 있다.
TEA has been suggested to provide authentic assessments (Gulikers et al. 2004) of students' competencies or combinations of knowledge, skills, and behaviours required in real life. However, the risks to authentic assessment through TEA remain high, either through unintentional assessment of unintended constructs, or deviation from real-life practices that consequently affect learner engagement and behaviours. The 2011 framework also focused on some of the challenges of high cost and high-fidelity assessment technology practices—now particularly challenged by the emergence, and understanding, of digital inequity amongst learners and institutions (UNESCO 2018). Despite ten years of innovation and scholarship, some of the key questions posed, surrounding the authenticity of assessment and the impact of learning remain at the forefront of our thinking.

이러한 교훈을 바탕으로, 이 새로워진 프레임워크는 평가가 이루어지는 더 넓은 환경에서 평가, 기술 및 교육 관행에 걸친 광범위한 범위에서 도출된다. 2010-2020년(Auxier et al. 2019)을 형성한 확립된 (교육) 테크놀로지과 능동적 학습의 실천을 뒷받침하는 새로운 테크놀로지 및 이론을 모두 반영한다.
Drawing on these lessons, this refreshed framework draws from broad scoping across assessment, technology, and educational practices in the wider environment in which assessment takes place. It draws on a reflection of both the established (educational) technology that shaped the 2010–2020 decade (Auxier et al. 2019), emergent technologies, and theories that underpin the practice of active learning.

2020년 오타와 컨퍼런스 및 후속 공개 컨설팅 및 워크숍의 직접 워크숍 피드백에 민감한 합의 프레임워크는 다음의 세 가지 핵심 단계로 나뉜다.

  • (1) 기술 채택 준비,
  • (2) 평가 라이프사이클에 적용(대표적 사례 연구 포함)
  • (3) TEA의 평가와 확산을 위한 프로세스 

Sensitised by feedback from in-person workshops in the 2020 Ottawa Conference and subsequent open consultation and workshops, the consensus framework is divided into three key stages, spanning

  • (1) readiness for technology adoption,
  • (2) its application to the assessment lifecycle (supported by illustrative case studies), and
  • (3) processes for evaluation and dissemination of TEA.

1단계: 평가 개선을 위한 기술 채택 준비 상태 평가
STAGE 1: Assessing readiness to adopt technology to enhance assessment

기술은 최근 HPE의 학습 및 평가에 대한 많은 COVID 관련 과제에 대한 공통적인 해결책으로, 학회 및 저널 플랫폼에 걸쳐 개별 기관 반응을 보여주는 전체 범위의 학술 커뮤니케이션(예: Khalaf et al. 2020; Jaap et al. 2021)이 있다. 그러나 다른 저자들은 코로나 이전에 존재했던 교육 관행에 대한 많은 우려가 이러한 접근 방식을 통해 해결될 가능성이 낮다고 강조했다(Ellaway et al. 2020). 게다가, 테크놀로지는 형편없는 평가 관행의 영향과 위험을 증가시킬 수 있다. 자동화된 프로세스는 '버튼을 누르면' 상당한 오류가 발생할 수 있으며(예: 부정확한 점수 보고를 통해) 평가 프로세스 주변의 학습자와 교직원의 신뢰에 장기적인 손상을 줄 수 있습니다.
Technology has been a common solution to many of the recent COVID-related challenges to learning and assessment in HPE, with a whole range of scholarly communications illustrating individual institutional responses across conference and journal platforms (e.g. Khalaf et al. 2020; Jaap et al. 2021). However, other authors have highlighted that many of the concerns around educational practice that existed pre-COVID are unlikely to have been resolved through these approaches (Ellaway et al. 2020). Moreover, technology may increase the impact and risk of poor assessment practises. Automated processes may ‘at the push of a button’ generate a substantial error (e.g. through inaccurate score reporting), causing long-lasting damage to learner and faculty trust around assessment processes.

이전 섹션에서 확인한 바와 같이, 평가에서 테크놀로지를 무비판적으로 도입한다는 것은 [잠재적 편익]이 다양한 [잠재적 단점(학업적, 재정적, 제도적)]으로 상쇄될 수 있다는 것을 의미한다. 테크놀로지 도입에 있어 가장 중요한 것은 '평가'를 통해 차선의 평가 관행을 파악하고 해결할 필요가 있다는 것입니다.
As identified in the previous section, non-critical adoption of technology in assessment means potential benefits could be offset by a range of potential disadvantages (academic, financial, and institutional). Critical to the adoption of technology is the need to ‘assess assessment,’ to ensure that any sub-optimal assessment practices are identified and resolved.

이 오타와 합의의 핵심 권고 사항 중 하나는 '기술은 제쳐두고' TEA와 관련된 네 가지 중요한 영역을 조사하는 것입니다.

  • 기존 평가 관행의 품질
  • TEA 도입의 목적
  • 디지털 형평성에 관한 당면 과제 
  • 테크놀로지를 채택할 수 있는 제도적 역량

One of the key recommendations of this Ottawa consensus is to ‘put aside the technology’ and investigate four critical areas associated with TEA:

  • The quality of existing assessment practice
  • The purpose of introducing TEA
  • Engagement with digital equity challenges
  • Institutional capacity to adopt technology

목적에 맞는 평가?
Assessment fit for purpose?

[기존 평가 프로세스에 대한 검토는 TEA 채택 준비의 핵심]이며, 다음에 초점을 맞춰야 합니다. 

  • 단순히 평가 '도구'뿐만 아니라,
  • 보다 광범위한 평가 프로그램과 그것의 이론적 기반
  • 평가 제공에 사용된 기존 테크놀로지(예: 강의실 데스크톱 또는 개인용 노트북 컴퓨터 또는 모바일 장치) 를 포함하여
  • 평가를 수행할 수 있는 환경(캠퍼스/임상 실습/학습자의 개인 공간)

A review of existing assessment processes is central to readiness for adoption of TEA, and should focus

  • not just on assessment ‘tools,’
  • but the wider programme of assessment, its theoretical underpinning and
  • environments in which assessment may be undertaken (campus/clinical practice/learners’ personal space)
  • including any existing technology used to deliver assessment (e.g. classroom desktop or personal laptop computers, or mobile devices).

광범위한 전문가, 목적 적합 규격 및 지침이 이 평가 검토를 지원해야 한다(Norcini et al. 2018; Boursicot et al. 2021; Heeneman et al. 2021; Torre et al. 2021). 시작시에 '평가를 평가하는 것assessing assessment'는 평가가 기존 형식에서 목적에 적합한지 확인하는 데 도움이 될 뿐만 아니라 테크놀로지 채택 전에 해결할 수 있는 잠재적 함정을 식별하는 데 도움이 된다. 또한 평가 관행의 개선을 탐구할 기회를 마련하거나 이 검토의 다음 권고사항에 중심이 될 새로운 개발을 식별한다.

A broad range of expert, fit-for-purpose specifications and guidance should support this assessment review (Norcini et al. 2018; Boursicot et al. 2021; Heeneman et al. 2021; Torre et al. 2021). ‘Assessing assessment’ at the outset helps not just ensure that assessment is fit for purpose in its existing format but identifies potential pitfalls that can be resolved in advance of technology adoption. It also establishes opportunities to explore the enhancement of assessment practices or identifies new developments that will be central to the next recommendation of this review.

TEA를 채택하는 목적은 무엇입니까?
What is the purpose of adopting TEA?

TEA 도입에 앞서 가장 중요한 질문은, 모든 교육 테크놀로지와 마찬가지로, 이 테크놀로지가 학생들의 학습과 이를 지원하는 교수진의 능력을 어느 정도까지 향상시킬 것인가이다(Fuller and Joynes 2015). TEA의 목적이 단지 동일한 평가의 종이 버전을 '대체'하는 것이라면, 평가가 기술에 의해 '향상'될 것이라는 주장은 이미 잃어버린 것과 마찬가지다. 또한 비용이 많이 드는 실수이거나, 더 나쁜 것일 가능성이 높으며, '허영 프로젝트'로 인식될 경우 평판 훼손이 더 오래 지속된다. 대신, 교육자로서, 우리는 과정 내용, 학습 활동, 제안된 평가 및 원하는 과정 결과 간의 정렬을 살펴봄으로써 모든 잘 이론화된 교육 발전을 안내하는 원칙으로 돌아가야 한다(Biggs and Tang 2011; Villaroel et al. 2019). 학습자들은 그들이 배우기 위해 하는 일에 의미를 부여한다. 따라서 교수진은 특정 평가 방법을 구현하는 데 초점을 맞추기보다는 학습 성과 달성을 촉진하는 학습 활동과 평가 과제를 의도적으로 설계해야 한다.
The overriding question ahead of the introduction of TEA should be, as with all educational technology, to what extent will the technology enhance students’ learning and faculty’s ability to support this? (Fuller and Joynes 2015). If the purpose of TEA is only to ‘replace’ a paper version of the same assessment, the argument that the assessment would be ‘enhanced’ by technology is already lost, and could likely be an expensive mistake or worse, have longer lasting reputational damage if perceived as a ‘vanity project.’ Instead, as educators, we need to return to the principles that guide all well-theorised educational developments, looking at alignment between course content, learning activities, the proposed assessment, and the desired outcomes of the course (Biggs and Tang 2011; Villarroel et al. 2019). Learners build meaning on what they do to learn. Thus, faculty should intentionally design learning activities and assessment tasks that foster the achievement of learning outcomes, rather than focussing on implementing specific assessment methods.

[교육학에서 informed된 접근 방]식을 사용하면 팀은 테크놀로지 투자가 (일회성 맞춤형 요소든 프로그램적 접근 방식이든) 자신의 코스에 가장 유의미한 부분이 어딜지 살펴볼 수 있습니다. 그럼에도 불구하고, 단편적인 투자는 거의 지속 가능하지 않으며 학습자와 교수진이 커리큘럼의 단일 영역에서 여러 도구를 사용하는 방법을 배우도록 요청받을 위험이 있다는 점에 주목할 필요가 있다. 고부담 평가를 수반하는 경우, 학습자에게 상당한 인지 부하로 이어질 수 있다(Davies et al. 2010). 새롭고 유망한 테크놀로지가 등장할 때, 평가를 강화하기 위해 이를 도입하려는 결정은 거의 즉시 이루어지지 않으며, 잠재적으로 혁신을 지연시킨다. 그러나 동일한 우려 사항은, (테크놀로지가) 단순히 평가 측면에서 수행되고 있는 것을 '대체'하는 것을 넘어 practice를 발전시키는 데 실패했다는 것입니다.
Using an approach informed by pedagogy will enable teams to look at where investment in technology will be the most meaningful to their courses, either as a one-off bespoke element or as a programmatic approach. Nevertheless, it is worth noting that piecemeal investment is rarely sustainable and risks learners and faculty being asked to learn how to use multiple tools in a single area of a curriculum. If they involve high-stakes assessments, this can lead to a significant cognitive load on learners (Davies et al. 2010). When new and promising technology emerges, decisions to introduce it to enhance assessment are rarely immediate, potentially delaying innovation. However, of equal concern is a failure to evolve practices beyond merely ‘replacing’ what is, and has always been, done in terms of assessment.

주어진 기관에서 TEA의 목적을 고려할 때, 주목할 만한 교육적 설계를 위한 더 넓은 기회가 있다. 소규모 또는 대규모 평가 변경을 가져올 때, 예를 들어, [몰입형 설계의 도입]과 심지어 [평가의 공동 제작]을 통한 과정의 광범위한 전환 측면에서 이점을 활용할 수 있으므로 교육자와 학습자 모두가 그 결과에 투자하고 참여할 수 있습니다. 이것은 학습자들로 하여금 [평가가 자신들과 '함께' 하는 것이 아니라 '그들에게' 행해지는 것이라고 느끼게 만드는] 것을 줄여준다. 평가에 테크놀로지를 도입함으로써, 평가 프로세스를 통해 수집된 데이터를 사용하여 [어떤 학습과 피드백이 이루어지고 있는지 살펴볼 수 있는 기회]도 강화됩니다. 그럼에도 불구하고 이것은 TEA 도입의 긍정적인 부산물이지 도입의 동력이라고 보아서는 안 된다.
Within considerations of the purpose of TEA in any given institution, there are wider opportunities for an educational design that are worth noting. When bringing in either small or large-scale assessment change, it is possible to leverage benefits from the process in terms of wider course transformation through, for example, the introduction of immersive design and even co-production of assessment so that both educators and learners are invested and engaged with the result (Holmboe 2017; Cumbo and Selwyn 2022). This moves away from the perennial challenge of learners feeling that assessment is something that is done ‘to’ them, rather than done ‘with’ them. Through the introduction of technology in assessment, there are also enhanced opportunities to use the data which are gathered through the assessment processes to explore what learning and feedback is taking place. Nevertheless, this should be seen as a positive by-product of the introduction of TEA and not the driving force for its introduction.

TEA 프로세스를 개발하는 데 존재하는 광범위한 기회 내에서, 우리는 또한 그러한 도입이 가져오는 도전을 인식해야 한다. 차세대 학습자가 개인 생활에서 모바일 기기를 유창하게 사용하기 때문에 학습 및 평가에서 새로운 기술을 쉽게 수용하는 이른바 '디지털 네이티브'라는 신념을 수용하는 것을 피해야 할 필요성이 지속적으로 제기되고 있다(Tapscott 1998; Prensky 2001; Bennett et. 2008; Jones 2010; Jones et. 2010). 학습자와 교수진의 테크놀로지 몰입도는 높아졌지만, 이는 주로 [사회적/개인적 공간]에 존재한다. [일상생활에서 디지털 기술을 사용하는 것]과 [학습에서 디지털 기술을 사용하는 것] 사이의 격차는 이전 연구에서 보고되었다(Selwyn 2010; Pyörä et al. 2019). 따라서 HPE는 여전히 모든 학습자와 교육자가 필요로 하는 지원에 초점을 맞춰 TEA를 효과적으로 만들어야 합니다. 
Within the broader opportunities that exist in developing TEA processes, we must also be cognisant of the challenges such introduction brings. There is a continued need to avoid embracing the myth that the next generation of learners are so-called ‘digital natives’ who easily embrace the use of new technology in learning and assessment because they use mobile devices fluently in their personal lives (Tapscott 1998; Prensky 2001; Bennett et al. 2008; Jones 2010; Jones et al. 2010). Whilst learners and faculty have increased technology immersion, this primarily exists in their social/personal spaces; gaps between their use of digital technology in their daily life and in learning have been reported in previous studies (Selwyn 2010; Pyörälä et al. 2019). HPE therefore still needs to focus on the support that all learners and educators will need, to make TEA effective.

또한 TEA의 도입은 이미 큰 성취 격차를 더 벌릴 위험도 있다. 한 기관의 다른 [학습자 그룹 간] 또는 [기관 간]에서 발생할 수 있다(Rahim 2020; Hegazy et al. 2021). (이전 교육을 통해 또는 HPE 내에서) 더 나은 IT 시스템, 지원 및 연결성에 [이미 접근하고 있는 사람들]은 [기본적 인프라에서 불안정을 겪거나 박탈에 직면한 사람들]보다 TEA를 도입/채택하는 것이 더 쉽다는 것을 알게 될 것이다(Aristovnik et al. 2020). 기관들과 교육자들은 필연적으로 그들 자신의 지역적 과제에 집중하게 될 것이지만, TEA의 도입으로 제기되는 더 큰 질문 중 하나는 [디지털 형평성]을 촉진하는 기술 변화를 어떻게 바꿔나가고 주도할 수 있는가 하는 것이다.
There is also a risk that the introduction of TEA will widen the already large attainment gaps, between different groups of learners in an institution or between/across institutions (Rahim 2020; Hegazy et al. 2021). Those already with access to better IT systems, support, and connectivity (either through their previous education or within HPE) will find TEA easier to introduce/adopt than those who face instability or deprivation in the basic infrastructure (Aristovnik et al. 2020). While institutions and educators will inevitably be focused on their own local challenges, one of the larger questions posed by the introduction of TEA is how we could steer and drive technology change that promotes digital equity.

TEA에서 디지털 형평성의 중요성은?
The importance of digital equity within TEA?


개별 프로그램 수준에서 TEA는 모든 학습자가 필요한 테크놀로지와 온라인 테크놀로지에 대한 [동등한 접근성]을 갖도록 하기 위해 모든 학습자의 [디지털 형평성]을 보장해야 한다(Alexander et al. 2019). 따라서 온라인 평가를 구현할 때 학습자(및 교수진) 간의 기술적 차이를 제한하기 위해 디지털 형평성을 보장하는 전략이 필요하다. 전략은 학습에 사용되는 장치의 카파시티, 학습(즉, 장치 생성), 운영 체제(예: iOS, Android) 및 필요한 액세서리(예: 카메라, 마이크)를 고려해야 한다. 이 전략은 학생들의 디지털 역량이 특정 업무와 기술과 관련이 있다는 점을 감안하여 각 [온라인 평가에 필요한 디지털 역량]을 포함해야 한다(Bennett et al. 2008). TEA에 대한 디지털 형평성 보장은 한 기관의 프로그램 내에서 학습자 또는 전국적으로 기관 면허/전문 평가를 받기 위해 앉아 있는 피평가자에게 [평가 동등성]을 보장하는 중요한 단계이다(Wilkinson and Nadarajah 2021).
At an individual programme level, TEA needs to ensure the digital equity of all learners to ensure they have the required skills and comparable access to online technology (Alexander et al. 2019). When implementing online assessments, a strategy that ensures digital equity is therefore needed to limit the technological differences between learners (and faculty). Strategies need to consider the capacity of devices used for learning (i.e. the generation of devices), operating systems (e.g. iOS, Android), and accessories required (e.g. camera, microphone). The strategy ought to include the digital capabilities students need for each online assessment, given that students’ digital capabilities relate to specific tasks and technologies (Bennett et al. 2008). Ensuring digital equity for TEA is a crucial step to ensuring assessment equivalence for learners within a programme in one institution or for candidates sitting for licencing/professional assessments across institutions nationally (Wilkinson and Nadarajah 2021).

[디지털 형평성]은 학생들의 기존 기기와 디지털 역량 내에서 작동하는 온라인 평가와 새로운 테크놀로지를 구매해야 하는 학생들을 위한 능력과 비용에 이르는 기기를 나열하는 기기 사양을 통해 강화될 수 있다. BYOD(Bring Your Own Device) 평가의 성공적인 성장은 공동 생성 및 학습자 연결을 촉진하는 학습자가 보유한 커뮤니티 기반 기술의 신중한 사용에 의존했습니다(Sundgren 2017). 가정 내 온라인 평가를 포함하는 프로그램은 학습자의 고속 인터넷 연결의 용량과 안정성을 고려해야 한다.
Digital equity can be enhanced through online assessments that operate on students’ existing devices and within their digital capabilities, and a device specification that lists devices ranging in capability and cost for students who need to purchase new technology. The successful growth of BYOD (Bring Your Own Device) assessments relied on the deliberate use of community-based technologies, held by learners, that facilitate co-creation and learner connectivity (Sundgren 2017). A programme involving in-home online assessments needs to consider the capacity and stability of learners’ high-speed internet connectivity.

그러나, 세계 다른 지역에 위치한 기관들 간의 형평성을 보장하는 TEA의 능력에 대한 더 광범위한 질문이 있으며, 이는 여기서 만들어진 권고안이 [저자원 기관]을 뒤처지게 하지 않도록 하기 위해 명시적인 논의가 필요하다. 유네스코는 디지털 접근성에는 두 가지 차원이 있다고 언급했다.

  • 기술적(장치의 연결과 용량을 위한 인프라) 차원
  • 사회경제적(저렴성과 학생의 디지털 능력) 차원

[테크놀로지에 대한 불평등한 접근]과 그에 따른 TEA는 [지역사회 간 및 지역사회 내의 기존 소득 및 자원 불평등]과 관련이 있으며 이를 악화시킬 수 있다(UNESCO 2018). 인터넷 사용률이 높은 지역 내에서도 소외된 지역사회는 기회를 놓칠 수 있다. 예를 들어 뉴욕에서는 25%의 가정이 인터넷 접속이 없다(Mozilla 2017). 개별 기관만으로는 이러한 문제를 해결할 수 없을 것 같지만, TEA에서 기술 사용이 잘 될 때, 그리고 더 중요한 것은, 다른 프로그램이 비용이 많이 드는 실수를 하지 않도록 돕기 위해 다양한 기술 솔루션을 시험해 볼 수 있는 사람들이 결과를 공유하는 것이 중요합니다.
However, there are broader questions around the ability of TEA to ensure equity between institutions situated in different parts of the globe, and these need explicit discussion to ensure that recommendations made here do not leave lower resourced institutions behind. UNESCO noted that there are two dimensions to digital accessibility:

  • technical (infrastructure for connectivity and capacity of devices) and
  • socio-economic (affordability and students’ digital capabilities).

Unequal access to technologies and subsequently to TEA is linked to and can exacerbate, existing inequalities of income and resources between and within communities (UNESCO 2018). Even within areas of high internet use, marginalised communities may be missing out on opportunities; for example, in New York, 25% of homes have no internet access (Mozilla 2017). While individual institutions are unlikely to be able to solve these issues alone, it is vital that those who are able to trial different technological solutions share their results when the use of technology in TEA goes well—and even more importantly, when it goes less well, to help other programmes avoid making costly mistakes.

프로그램, 인력, 제품 및 프로세스?
Programmes, people, products, and processes?

성명서 작성자 및 워크숍 참석자 중 많은 사람의 경험에 비추어 보았을 때, 테크놀로지 채택을 준비할 때 [의도된 결과]보다는 [테크놀로지 자체]에 초점을 맞추는 경우가 많다. 이 접근 방식이 위험한 이유는 테크놀로지는 활성화자enabler가 아니라 [그 자체가 평가 향상의 초점이자 동인]이 된다는 것입니다. 이러한 접근 방식은 또한 개인적인 선호와 이전의 경험에 기초하여 특정 기술 제공자, 제품 또는 솔루션에 과도하게 초점을 맞추는 결과를 초래할 수 있다. 이를 방지하기 위해 본 권고안은 TEA를 채택할 때 포괄적인 팀 기반 접근법으로 '4P' 접근법(프로그램, 인력, 프로세스 및 제품)을 제안한다.
Based on the experiences of many of the statement’s authors and workshop attendees, considerations regarding readiness to adopt technology are often focused on the technology itself rather than the intended outcome. The risk of this approach is that the technology becomes the focus and driver of assessment enhancement rather than the enabler. This approach may also result in an over-focus on a particular technology provider, product, or solution based on personal preferences and previous experiences. To avoid this, this recommendation proposes a ‘4P’ approach (Programmes, People, Processes, and Products) as a comprehensive team-based approach when adopting TEA.

프로그램
Programmes

첫 번째로 [맥락과 교육적 요구]의 프레임에 넣어야 한다. 평가 Blueprint는 현재 구현 격차, 기술 솔루션(있는 경우), 리스크 평가 및 필요한 리소스를 포함하도록 더욱 확장될 수 있습니다. 위험 평가에는 규제 준수에 대한

  • 로컬(새로운 형식/승인 일정을 변경/도입하는 과제)과
  • 외부(해당되는 경우 국가 및/또는 규제 요건에 대한 지속적인 준수) 및
  • 자원(기반시설, 하드웨어 또는 소프트웨어 업그레이드)이 포함되어야 한다.

the first area of consideration should frame the context and educational need. Assessment blueprints can be further expanded to include

  • current implementation gaps,
  • technological solutions (if any),
  • risk assessment, and
  • resources needed.

Risk assessments should include

  • the impact on regulatory compliance locally (challenges of switching/introducing new formats/approval timelines) and
  • (compliance) externally (where appropriate, continued compliance with national and/or regulatory requirements), and
  • resources (upgrading infrastructure, hardware, or software).

사람
People

성공적인 구현을 이루려면, 변화 관리의 우선 순위는 항상 사람에게 집중됩니다(Er et al. 2019). 평가 강화와 관련하여 참여해야 할 인력은 [교수진, 전문 지원 인력(예: 시험장, IT) 및 학생] 등 세 그룹으로 구성됩니다. 이 계약에는 개선과 관련된 새로운 스킬과 관련된 교육 및 파일럿 개발 후 피드백을 제공할 수 있는 기회가 포함되어야 합니다. 마찬가지로, 학습자와 전문 지원 인력의 참여는 끝이 아니라 [프로젝트의 시작]에 참여해야 합니다. 학생들은 평가 향상과 협력하거나 공동 개발을 위해 성공적으로 협력할 수 있다(Er. et al. 2019, 2020).
Priorities for change management always focus on people, as their buy-in, participation, and feedback are crucial for successful implementation (Er et al. 2019). In the context of enhancing assessments, there are three groups of people to engage with: faculty, professional support staff (e.g. exam office, IT), and students. It is critical that this engagement includes training related to any new skill sets related to the enhancement and opportunities to give feedback after pilot developments. Similarly, the engagement of learners and professional support staff should be genuine, with their involvement at the start of the project rather than the end. Students can be successfully co-opted to partner with or co-develop the assessment enhancements (Er et al. 2019, 2020).

과정
Processes

평가를 효율적으로 구현하기 위해 관련 이해 관계자들 간에 공유해야 하는 [내부 프로세스]가 있습니다. 그러나 평가를 위해 테크놀로지가 사용되거나 추가될 때, 종종 파편적이거나 직접적인 '잘라서 붙여넣기 접근법'(전환)을 하는 함정에 빠질 수 있다. [평가 데이터 관리]는 특히 이러한 프로세스의 변화에 민감할 수 있습니다. 다양한 레벨에서 [평가 데이터 거버넌스, 보안, 전송 및 보고]에 대한 테크놀로지 향상의 영향을 검토하면 데이터 [상호 운용성]을 지원하고, 테크놀로지 평가의 실패 위험을 줄일 수 있습니다.

To implement assessments efficiently, there are internal processes that should be shared across relevant stakeholders. However, when technology is used or added for assessments, process change pitfalls often include piecemeal or direct ‘cut and paste approaches’ (transmediation). Assessment data management can be particularly susceptible to changes in such processes. A review of the impact of the technology enhancement on assessment data governance, security, transfer, and reporting at different levels can help enable data interoperability and reduce risks of technology assessment failure.

상품들
Products

기술 제품의 선택은 [업무 범위, 접근성, 기관의 지불가능성]에 따라 달라집니다. 전자에 기반한 평가는 제품을 개발하기 위해 외부 조직과 구매, 구축 또는 파트너 관계를 결정하는 것으로 이어질 수 있습니다. 모든 제품을 선택할 때, 기존의 제도적 기술(예: MS Office와 같은 일상적 제품의 모든 능력을 더 잘 활용할 수 있는 기회)과 이미 개인 및 전문 학습을 지원하기 위해서 이용할 수 있는 광범위한 테크놀로지를 갖춘 '현대 전문 학습 도구 키트'의 개념을 신중하게 고려할 필요가 있다. (Hart 2021).
The selection of the technology product depends on its alignment to the scope of work, accessibility, and affordability to the institution. An evaluation based on the former can lead to the decision to buy, build or partner with an external organisation to develop the product. In the selection of any product, careful consideration needs to be given to the utilisation of existing institutional technology (e.g. opportunities to better leverage the full abilities of everyday products, such as MS Office) and the concept of the ‘modern professional learner’s toolkit’ with an extensive range of technology already available to support personal and professional learning (Hart 2021). 

https://www.toptools4learning.com/

2단계: '평가 라이프사이클' 내 기술 적용
STAGE 2: Applying technology within the ‘assessment lifecycle’

이 논문은 다른 최근의 오타와 합의 진술과 함께 기술을 통한 평가 향상을 안내하는 핵심 원칙의 프레임워크를 제공한다. 보다 광범위한 고등교육 평가 라이프사이클 모델을 지원으로 채택하는 것은 의도적인 것으로, 이 합의의 다중 교육 맥락에 대한 적용 가능성을 극대화한다. 라이프사이클은 평가의 이해관계와 목적에 관계없이 평가에 관련된 모든 핵심 프로세스에 대해 쉽게 식별할 수 있는 '헬리콥터 뷰'를 제공합니다. 라이프사이클 프로세스는 반복적이며, 평가 설계, 스케줄링 및 전달을 무결성 및 행동, 조정 및 학생 진행 추적(JISC 2016)을 둘러싼 주요 학문적 프로세스까지 포괄하는 품질 개선 접근 방식을 가능하게 합니다. 그림 1에 나타난 바와 같이:
In keeping with other recent Ottawa consensus statements, this paper provides a framework of core principles to guide the enhancement of assessment with technology. Adopting a broader Higher Education assessment lifecycle model as support is intentional, maximising the applicability of this consensus to multiple educational contexts. The lifecycle provides a readily identifiable ‘helicopter view’ of all key processes involved in assessment, whatever the stakes and purpose of the assessment. The lifecycle process is iterative, enabling a quality improvement approach that spans assessment design, scheduling, and delivery through to key academic processes surrounding integrity and conduct, moderation, and student progress tracking (JISC 2016). As demonstrated in Figure 1:

 

이 라이프사이클 접근 방식은 [평가 '도구']에서 [우수한 평가의 시스템과 프로그램], 특히 프로그램 평가에서 볼 수 있는 [전체론적 접근 방식]으로 HPE의 초점 변화를 반영한다(Heeneman et al. 2021). 의료 교육에서 라이프사이클은 OSCE와 같은 복잡한 평가 개입의 설계 및 전달에도 성공적으로 적용되었다. TEA의 컨텍스트에 적용되는 라이프사이클은 [5가지 핵심 초점]과 적용 대상을 제공합니다.

  • 평가의 Authenticity 향상(대원칙)
  • 학습자를 평가에 참여시킵니다.
  • 설계 및 스케줄링을 강화한다.
  • 평가 전달 및 학습자 성과 기록을 최적화한다.
  • 학습자 진행 과정 및 교수진 활동을 트래킹한다 —종방향 학습 및 지속적인 평가 지원.


This lifecycle approach reflects the changing focus in HPE from assessment ‘tools’ to systems and programmes of good assessment, particularly the holistic approach seen in programmatic assessment (Heeneman et al. 2021). Within medical education, the lifecycle has also been successfully applied to the design, and delivery, of complex assessment interventions, such as the OSCE. Applied to the context of TEA, the lifecycle provides five key foci, and targets for application:

  1. Advancing authenticity of assessment (an overarching principle)
  2. Engaging learners with the assessment
  3. Enhancing design and scheduling
  4. Optimising assessment delivery and recording of learner achievement
  5. Tracking and learner progress and faculty activity—supporting longitudinal learning and continuous assessment.

합의된 직접 워크숍의 피드백과 이론 정보를 바탕으로 한 실천 혁신 보고서의 가치에 따라, 이러한 원칙은 합의된 저작자로부터 도출된 일련의 모범 사례로 보완된다. 언제든지 교육 혁신을 도입하는 것이 도전이라는 것을 인식하면서(그리고 이러한 예들은 전염병 시대/대유행 시대에는 더욱 그렇다), 영감을 주는 동시에 잠재적 템플릿으로 기능하는 것을 목표로 하며, 위에서 설명한 기준에 따라 정의된 TEA의 기존 우수 관리 사례에 대한 [사례 연구]를 제공한다. 모든 예가 모든 맥락에서 작동하는 것은 아니지만, 독자들이 자신의 환경에서 작동하도록 적응될 수 있는 모든 사례 연구와 지원 문헌의 요소를 찾을 수 있기를 바란다. 형평성에 관한 합의의 모범 사례 조언에 따라, 사례 연구는 의도적으로 이러한 목적을 위한 하나의 '최고의' 기술을 의미하지 않는다. 각 위치에서 작동하는 실제 하드웨어 및 소프트웨어는 기존 기관 인프라와 투자에 의존하며, 이는 맥락에 관계없이 교육자가 전 세계적으로 작업하는 범위를 제한합니다.
Following feedback from consensus in-person workshops, and the value of theory-informed, practice innovation reports, these principles are supplemented by a series of good practice exemplars are drawn from the consensus authorship. Recognising that introducing educational innovation at any time is a challenge (and arguably more so in peri/post-pandemic times), these exemplars aim to serve both as inspiration and a potential template, providing case studies of existing good practice in TEA as defined by the criteria outlined above. Not all the examples will work in all contexts, nevertheless, it is hoped that readers will be able to find elements of all the case studies and supporting literature that could be adapted to work in their own environments. Following the consensus’ best practice advice in relation to equity, case studies deliberately do not imply one ‘best’ technology for this purpose. The actual hardware and software that works in each location depend upon existing institutional infrastructures and investment, confines under which educators work globally, regardless of context.

원칙 1: 평가의 진정성 제고
Principle 1: Advancing assessment authenticity

커리큘럼의 적절한 단계 및 관련 역량과 일치하는 ['진짜Authentic' 평가] 과제의 설계는 학습자 참여 및 품질 평가의 초석입니다. 기술이 이러한 과제를 추가로 개발하기 위해 사용될 때(예: 가상 현실 시뮬레이션의 도입) 학습자 참여 및 기술 혁신의 잠재적 이점은 [의도하지 않은 다른 구조(테크놀로지 친숙성/네비게이션 요구 포함)]의 도입으로 상쇄될 수 있다. 교육 연구는 'Authentic' 과제에 대한 참여와 평가가 진정으로 고립 상태에서 과제를 숙달하는지, 아니면 실천과 진정한 학습자 개발에 더 통합적으로 적용하는지 여부를 계속 조사한다(Wiliam 2021). 따라서 HPE에서의 TEA 개발은 [교육적, 기술적, 임상적]으로  '진정성 인터페이스authenticity interface'를 어떻게 연결하는지 비판적으로 검토할 필요가 있다.
The design of ‘authentic’ assessment tasks, aligned with the appropriate stage of a curriculum and relevant competencies, is a cornerstone of learner engagement and quality assessment. When technology is used to develop these tasks further (e.g. introduction of virtual reality simulation), the potential benefits of enhanced learner engagement and innovation may be offset by the unintentional introduction of different constructs (including familiarity/navigation requirements of the technology). Educational research continues to examine whether engagement in, and assessment of, ‘authentic’ tasks truly leads to mastery of the task in isolation, or more integrative application to practice and true learner development (Wiliam 2021). The development of TEA in HPE, therefore, needs to critically examine how it bridges the ‘authenticity interface’ of pedagogy, technology, and clinical practice.

[교육학적]으로, 평가의 초점은 [학습의 평가]만을 유일한 초점으로 가지고 있다가 [학습을 위한 평가]라는 더 큰 표현으로, 더 나아가 '지속 가능한 평가sustainable assessment'로 계속 전환되고 있다(Boud 2000). 목표는 학생들의 [오늘날 성적]에 대한 점수를 주는 것뿐만 아니라 그들의 [미래 학습과 자기 조절 학습 기술]의 성장을 지원하는 것, 그들이 스스로 [학습 목표를 설정하고 그들의 지식, 기술 및 행동을 모니터하는 능력]이다. [지속가능한 평가]는 학생이 교육 환경뿐만 아니라 미래의 직장 생활 전반에 걸쳐 자신의 성과를 평가하는 능력을 배워야 한다고 강조한다(Boud 2000; Boud and Soler 2016).

Pedagogically, the focus of assessment continues to shift from a sole focus of the assessment of learning to a greater representation of assessment for learning and thus to ‘sustainable assessment’ (Boud 2000). The goal is not only to give grades on the students’ performance today but to support their future learning and growth of self-regulated learning skills, the ability to set goals for their learning, and monitor their knowledge, skills, and behaviour. Sustainable assessment emphasises that the student should learn the ability to assess their own performance not only in their educational settings but throughout their future working lives (Boud 2000; Boud and Soler 2016).

TEA에서, 이것은 우리가 평가 도구의 측정과 테크니컬한 개발에 초점을 덜 맞추고, 진정한 학습/직장 맥락에서 학생 학습을 촉진하는 질적이고 인격화된personified 평가에 더 큰 초점을 맞추어야 한다는 것을 의미한다. 평가 도구와 더불어서, [평가의 결과]로 [메타인지 기능과 학생 참여를 고려하는 대안적alternative 학습 분류법]을 사용하면 Authentic tools의 선택과 설계에 정보를 제공할 수 있다. Higher and Continuous Education의 광범위한 경험과 평가에 대한 접근 방식은 다음과 같은 대안적인 평가 형식을 위한 추가적인 유용한 리소스입니다.

  • 오픈 북 및 테이크아웃 평가(예: Sambell 및 Brown 2021),
  • 교사가 학생의 진도를 추적하는 동시에 학습자가 학습 진도와 계획 개선에 대한 판단을 내릴 수 있는 능력을 개발할 수 있도록 지원하는 평가 도구(말레카 및 Boud 2021).

In TEA, this means that we should ensure less focus on the measurement and technical development of assessment tools, and a greater focus on the qualitative and personified assessment fostering student learning in authentic learning/workplace contexts. The use of alternative learning taxonomies that consider metacognitive function and student engagement as a result of the assessment, alongside assessment tools, can inform the selection and design of authentic tools (Marzano and Kendall 2007; Villarroel et al. 2018). The wider experiences of, and approaches to, assessment in Higher and Continuing Education are an additional useful resource for alternative assessment formats including

  • open book and takeaway assessments (e.g. Sambell and Brown 2021), and
  • assessment tools that help teachers track their students' progress whilst allowing learners to develop their own capacity to make a judgement about their learning progress and plan improvement (Malecka and Boud 2021).

[테크니컬하게], TEA는 교육 테크놀로지 개발에 inform하는 핵심 원칙을 활용하여, '네비게이션' 문제는 최소화하고, 학습자와 교직원을 설계의 중심에 두어야 합니다(Divami 2021). 평가가 다음의 특징을 갖도록 설계되어야 한다.

  • 기회적 (예: 광범위한 환경에서 WBA를 지원하기 위한 스마트폰 사용)
  • 몰입적 (예: 학습자가 자체 및 그룹 평가 기회를 만들 수 있음)
  • 연결적 (학습 조직 내 개인화 및 연결성 향상—예: 전공의의 성찰을 촉진하기 위한 스마트폰 앱/코칭 그룹)

Technically, TEA should leverage key principles that inform educational technology development, minimising ‘navigation’ issues and place learners and faculty at the heart of design (Divami 2021). Design should allow the assessment to be

  • opportunistic (e.g. the use of smartphones to support WBA in a wide range of settings),
  • immersive (e.g. allowing learners to create their own self- and group assessment opportunities), and
  • connected (allowing personalisation and connectivity within learning organisations—e.g. smartphone apps/coaching groups to promote reflection by residents) (Konings et al. 2016).

[임상적]으로 TEA가 기술 지원 의료에 대한 현재 및 새로운 접근 방식과 효과적으로 상호 작용할 수 있는 상당한 기회가 있습니다. HPE 평가에서 현재 교육 테크놀로지는 많은 경우에 ([개인, 그룹 및 인구의 관리를 강화하기 위해 테크놀로지가 어떻게 사용되는지에 맞추는 기회보다는]) 전달delivery에만 초점을 맞추고 있다. 예를 들어, 평가 기회를 안내하기 위해 다음과 같은 간단한 프레임워크를 제안합니다.
Clinically, there are significant opportunities for TEA to interface effectively with current and emerging approaches to technology-enabled healthcare. Much of the current focus of educational technology in HPE assessment focuses on delivery, rather than an opportunity to align to how technology is used to enhance the care of individuals, groups, and populations. For example, we suggest the following simple framework to guide assessment opportunities:

장치 증강 치료
Device augmented care

많은 의료 시스템에서 [종이 없는 의료 시스템]과 클라우드 기반 '공유 진료shared care'의 출현은 온라인 상담, 커뮤니케이션 및 의사 결정에 필요한 빠른 [업스킬링]을 강조한다(Greenhalgh et al. 2016; Darnton et al. 2021). 학부생과 전문가 모두를 위한 침상 진단 및 치료 절차로서의 침상 초음파의 출현과 성장은 TEA 개발의 목표를 제공한다(McMenamin et al. 2021).
In many health systems, the advent of paperless healthcare systems and cloud-based ‘shared care’ (e.g. Philips 2021) spotlight the rapid upskilling needed for online consultation, communication, and decision making (Greenhalgh et al. 2016; Darnton et al. 2021). The advent and growth of bedside ultrasound as a bedside diagnostic and therapeutic procedure for undergraduates and professionals alike provides targets for TEA development (McMenamin et al. 2021).

환자 및 전문가에 대한 기대 및 보건 기술 사용능력
Expectations, and health technology literacy, of patients and professionals

빠르게 변화하는 치료 속도는 HPE 학습자와 전문가의 글로벌 커뮤니티가 [끊임없이 변화하는 가이드라인, 프로시저 및 약물을 사용하여 치료를 제공한다]는 것을 의미하며, 이를 위해서는 [온라인 리소스에 대한 적시 액세스]와 [지속적인 전문 개발CPD]이 필수적이다. 환자 치료의 일환으로 [그러한 자원에 '언제, 왜, 어떻게' 접근하는지를 입증하는 것]이 평가의 중요한 대상이 되어야 한다.
A rapidly changing pace of care means the global community of HPE learners and professionals will deliver care using constantly changing guidelines, procedures, and drugs, where timely access to online resources and continuing professional development are essential. Demonstrating ‘when, why, and how’ such resources are accessed as part of patient care should be a critical target for assessment.

상태 분석 및 리스크 커뮤니케이션
Health analytics and risk communication

[빅 데이터와 딥 머신 러닝]의 사용은 건강에 점점 더 기여하고 알고리즘과 의사 결정을 안내하며 진단에 기여한다(Rajpurkar et al. 2022). [공유된 환자-전문가 상담 모델] 내에서 [위험 커뮤니케이션, 디지털 사용능력 및 의사 결정]을 통합하는 평가를 설계하면 AI의 기회와 한계에 대한 지속적인 논의를 수용하면서 매우 정통한 평가 작업에 대한 기회를 제공한다(원칙 5).
The use of big data and deep machine learning increasingly contribute to health, guiding algorithms and decision making, and contributing to diagnosis (Rajpurkar et al. 2022). Designing assessments that integrate risk communication, digital literacy, and decision making within shared patient-professional consultation models provide opportunities for highly authentic assessment tasks, accepting the ongoing debate about the opportunities and limitations of AI (Principle 5).

 

원칙 2: 학습자를 평가에 참여시킵니다.
Principle 2: Engaging learners with assessment

이상적인 교육 프로그램에서, 학습자는 (중요하다고 인식할 때뿐만 아니라) [언제나] 학습 프로그램 전반에 걸쳐 평가에 완전히 참여합니다. 합의 전반에 걸쳐 제시된 각 모범 사례 연구의 헤드라인 원칙은 비동기성과 연결의 기회가 주어지면 학습자 참여를 TEA를 통해 더 잘 촉진할 수 있다는 것을 강화한다. [능동적인 학습자 참여]는 [심층 학습]과 [성취 및 활동 측정 및 모니터링을 위한 기술 사용(예: 가상 학습 환경을 통한)]과 강하게 연관되어 있으며, 평가 성과에서 [초기 및 지속적인 학습자 참여의 중요성]을 강조한다(Korhonen 2021). 이 첫 번째 사례 연구에서 Webb와 Valter는 평가에 대한 참여와 창의성을 개선하고 재사용 가능한 학습 리소스를 개발하며 학습자 그룹을 연결하는 단순하고 쉽게 사용할 수 있는 기술의 힘을 입증합니다.

In an ideal educational programme, learners would always be fully engaged with assessment throughout their programmes of study (not just when they perceive it matters). The headline principle for each of the good practice case studies presented throughout the consensus reinforces that learner engagement can be facilitated better through TEA given the opportunities for asynchronicity and connectivity. Active learner engagement is strongly associated with deeper learning (Villarroel et al. 2019) and achievement and the use of technology (e.g. through virtual learning environments) to measure and monitor activity highlights the importance of both early, and sustained learner engagement in assessment outcomes (Korhonen 2021). In this first case study, Webb and Valter demonstrate the power of simple, readily available technology to improve participation and creativity in assessment, develop reusable learning resources, and connect groups of learners:


사례 연구 1
Case Study 1

유튜브 세대를 위한 평가: [학생이 만든 해부학 비디오]에 대한 사례 연구(Alex Webb & Chrisztina Valter, 호주 국립 대학교)
Assessment for the You-Tube generation: a case study on student-created anatomy videos (Alex Webb & Krisztina Valter, Australian National University)

맥락
Context

우리는 선생님이 제공한 5가지 옵션 목록에서 선택한 [해부학 주제에 대한 2000단어 개별 에세이 평가]를 현대화하려고 했다.
We sought to modernise a 2000-word individual essay assessment on anatomy topics chosen from a list of five options provided by the teacher.

우리가 달성하려고 했던 게 뭐죠?
What were we trying to achieve?

우리는 주제에 대한 학생 질문을 자극하고 일반적으로 사용 가능한 기술을 사용하는 자체 지식 표현의 구성을 촉진하기 위해 평가 과제를 다시 설계했다. 또한 이 과제가 학생들의 선택권을 부여하고, 학습을 재미있게 하며, 학생들이 창의적으로 할 수 있도록 하며, 학생들이 동료들과 쉽게 공유할 수 있는 결과물을 생산할 수 있는 기회를 제공하는 것도 중요했다. 게다가, 우리는 더 적은 시간 안에 더 즐겁게 채점를 할 수 있기를 바랐습니다!
We re-designed the assessment task to stimulate student interrogation of the topic and construction of their own knowledge representations utilising commonly available technology. It was also important that the task empowered student choice, made learning fun, allowed students to be creative, and provided an opportunity for students to produce outputs that could easily be shared with peers. In addition, we hoped to make marking more enjoyable in less time!

우리가 한 일
What we did

학생들은 5명으로 구성된 스스로 선택한 그룹의 해부학적 주제에 대한 5-7분짜리 재미있는 교육 비디오를 만들어야 했다. 각각의 비디오는 선생님들에 의해 채점되었다. 비디오는 평가와 수정을 위해 전체 코호트에 제공되었다.
Students were tasked to create a 5–7-min entertaining educational video on an anatomy topic of their choice in self-selected groups of five. Each video was graded by the teachers. The videos were provided for the whole cohort for evaluation, and for their revision.

영향의 지속적인 평가
Ongoing evaluation of impact

대다수의 학생들이 이 활동을 즐겼으며(93%) 이 활동을 통해 주제에 대한 이해도(90%)가 향상되는 것으로 나타났다. 주제를 연구하고 지식을 통합할 수 있는 기회가 학습에 도움이 되는 핵심 요소였습니다. 하지만, 시간과 새로운 기술을 배우는 것은 그들의 학습에 방해가 되었다. 교사들에게는, 채점하고 피드백을 제공하는 것이 더 효율적이고 즐거웠습니다.
The majority of students enjoyed the activity (93%) and found that it improved their understanding of the topic (90%). The opportunity to research the topic and consolidate their knowledge were key factors aiding their learning. However, time and learning a new technology detracted from their learning. For teachers, marking and providing feedback were more efficient and enjoyable.

테이크홈 메시지
Take home message

비디오를 만드는 과정은 학생들이 동료들과 쉽게 공유할 수 있는 그들 자신의 학습을 돕기 위해 해부학적 개념에 대한 그들 자신의 표현을 구성하기 위해 팀으로 일할 수 있는 재미있고 자극적인 기회를 제공했다.The process of creating videos provided students with a fun and stimulating opportunity to work as a team to construct their own representations of anatomical concepts to aid their own learning, which can be easily shared with peers.


이 사례는 학습자가 평가 과정에 참여하는 강력한 사례로, '하면서 배우는 것을 선호하는' 세대를 위한 평가 적응에 있어 최상의 원칙(Marzano와 Kendall 2007)과 학습자가 학습하기 위해 하는 일에 의미를 구성한다는 원칙(Biggs와 Tang 2011)을 보여준다. 이러한 작업(평가 지분 범위에 적응할 수 있음)은 [공동 제작 콘텐츠 생성]의 추가적인 이점을 가지고 있으며, 그 결과 다음 코호트에 대한 교육 및 평가 참여를 향상시키는 데 사용될 수 있는 [리소스 뱅크]가 생성된다. 건강 인문학적 관점에서, 이러한 과제들은 또한 학생들이 평가를 통해 창의적 역량을 발휘할 수 있게 한다.
The case study is a powerful example of learner engagement with the assessment process, demonstrating the best principles in adapting assessment for a generation who ‘prefer to learn by doing’ (Marzano and Kendall
 2007) and the principle that learners construct meaning on what they do to learn (Biggs and Tang 2011). Such tasks (which can be adapted to a range of assessment stakes) have the additional benefit of co-produced content creation, resulting in a bank of resources that can then be used to enhance teaching and assessment engagement for the following cohort. From a health humanities perspective, such tasks also enable students to demonstrate their creative capacities through assessment.


[디지털 및 지리적 형평성 관점]에서 TEA는 국경을 넘어 교육자와 학습자 간에 낮은 [저부담 평가 포맷]을 공유할 수 있는 무한한 가능성을 제시합니다. 단순하고 확립된 기술의 사용은 종종 학습자가 (컴퓨터나 노트북이 아닌) 비교적 [기본적인 스마트폰 장치]만을 접근/보유하는 것으로도 충분하다. 인구와 관련된 장치의 보급을 고려할 때 2014년에 전세계적으로 실현 가능한 것으로 간주되었다. 현재 테크놀로지는 모든 모바일 장치에서 현재 보편화된 필기, 오디오 또는 'STT' 기능을 통해 [무엇이 잘 진행되고 있는지, 무엇을 개선할 수 있는지, 어떻게 다음 단계로 나아갈 수 있는지]에 대한 생각을 순간적으로 요청하고 기록할 수 있는 기회를 제공할 수 있습니다(Tuti et al. 2020). 이러한 기회는 실제로 학습자 주도적이고 실행 가능한 피드백의 확립된 이론적 원칙을 기반으로 평가와 학습 행동을 긍정적으로 형성할 수 있는 기술의 힘을 열어줍니다(Sadler 2010; Boud and Molloy 2013).
From a digital and geographical equity perspective, TEA presents endless possibilities to share low-stakes assessment formats between educators and learners across borders. The use of simple, established technology often requires learners only to access/hold a relatively basic smartphone device (rather than a computer or laptop); something which was considered to be feasible worldwide in 2014, given the prevalence of devices in relation to the population (International Telecommunication Union 2014 in Fuller and Joynes 2015). Technology can present opportunities to engage learners differently with feedback; offering quicker ways to request and record in the moment thoughts on what is going well, what can be improved, and how to progress to the next level, through written, audio, or ‘speech to text’ functions now common in all mobile devices (Tuti et al. 2020). Such opportunity really opens up the power of technology to positively shape both assessment and learning behaviours, building on established theoretical principles of learner-driven, actionable feedback (Sadler 2010; Boud and Molloy 2013).

원칙 3: 평가 설계 및 스케줄링 개선
Principle 3: Enhancing design and scheduling of assessment

지난 10년간의 많은 기술 발전은 특히 품질 또는 유효성 렌즈를 통해 볼 때 HPE 평가에 대한 접근 방식의 상당한 개발을 가능하게 했다(St-Onge et al. 2017). 소프트웨어는 이제 개인, 기관, 컨소시엄 및 국가 수준에서 [지식 시험 문제은행(예: 단일 모범 답안 형식)]의 창설을 지원하기 위해 일상적으로 사용된다. 평가 문항을 설계하고 공유하기 위해 평가 컨소시엄 내에서 [원격 작업]하는 것은 상당한 비용 절감과 효율성을 제공하며, 항목의 정교한 [태깅]은 테스트 생성과 해당 구성 정렬에서 틀림없이 더 나은 품질을 가능하게 한다(Kickert et al. 2022). 문항의 개발, 수정 및 은행 업무와 관련된 상당한 비용은 현재 [자동 문항 생성]의 잠재력에 의해 도전받고 있다(Lai et al. 2016).
Many of the technological developments of the last decade have enabled considerable development of approaches to HPE assessment, particularly when viewed through a quality, or validity lens (St-Onge et al. 2017). Software is now used routinely to support the creation of knowledge test item banks (e.g. for single best answer formats) at the individual, institutional, consortia, and national levels. Working remotely within assessment consortia to design and share assessment items presents substantial cost savings and efficiencies, and sophisticated tagging of items allows arguably better quality in the creation of tests and their constructive alignment (Kickert et al. 2022). The substantial costs associated with the development, emendation, and banking of items are now being challenged by the potential of automatic item generation (Lai et al. 2016).

성과 평가에서 TEA의 사용은 임상 실습에서 보다 학습자 중심의 기회주의적 성과 평가 문화를 개발할 수 있는 기회를 제공하는 WBA(Work Based Assessment) 형식을 사용하는 데 특히 영향을 미쳤다. 프로그램 수준 [WBA의 기관 및 국가 모델]은 [테크놀로지 기반 플랫폼과 테크놀로지 기반 포트폴리오]를 사용하여 환자 치료 시에 평가(기회)를 잡아낸다. 이러한 발전의 대부분은 'BYOD(Bring Your Own Device)' 모델(Sundgren 2017)을 사용하여 이루어졌지만, 기회의 불평등을 방지하고 섹션 배경에서 강조했듯이 이러한 접근 방식을 지원할 수 있는 충분한 인프라를 확보할 수 있도록 주의를 기울여야 합니다.

The use of TEA within performance assessment has been particularly impactful using Work Based Assessment (WBA) formats, presenting opportunities to develop more learner-centred, opportunistic cultures of performance assessment in clinical practice. Institutional and national models of programme level WBA operate using technology-based platforms and technology-based portfolios (van der Schaaf et al. 2017; NHS eportfolios 2021), with the use of mobile devices to capture assessment at the point of patient care (Joynes and Fuller 2016; Harrison et al. 2019; Maudsley et al. 2019). Much of this advancement has been facilitated using ‘Bring Your Own Device’ (BYOD) models (Sundgren 2017) but care needs to be taken to avoid inequity of opportunity and to ensure sufficient infrastructure to support these approaches as highlighted in Section Background.

학습자의 개인과 코호트 수준 [진전을 일상적으로 포착하는 평가 관리 시스템]의 성장은 평가에 대한 새로운 접근 방식을 설계하기 위해 [대규모 데이터 세트]를 의미 있게 사용할 수 있게 했다. 평가 프로그램(Pell et al. 2012)에서 [보더라인과 저성과자의 결과를 종단적으로 추적하는 작업]은 평가 품질에 미치는 영향을 점점 더 입증하는 [데이터 중심 순차적 테스트sequential testing 형식]의 구현을 지원했다. [적응형 지식 시험 시스템]을 지원하는 작업은 잠재적으로 고도로 개인화된 응용 지식 테스트 및 피드백의 출현을 보여준다(Collares and Cecilio-Fernandes 2019).
The growth in assessment management systems that routinely capture individual, and cohort level progress of learners has enabled meaningful use of large data sets to design newer approaches to assessment. Work to track the longitudinal consequences of borderline and underperformance in programmes of assessment (Pell et al. 2012) has supported the implementation of data-driven Sequential Testing formats (Pell et al. 2013; Homer et al 2018), which are increasingly demonstrating impact on assessment quality. Work supporting adaptive knowledge testing systems demonstrates the emergence of potentially highly personalised applied knowledge testing and feedback (Collares and Cecilio-Fernandes 2019).

[온라인 테스트에 대한 대규모 글로벌 경험](그리고 단일 모범 답안 형식의 전통적인 사용을 통한 '클로즈드 북' 형식 테스트의 과제)은 오픈 북 테스트 형식과 기술이 가져올 수 있는 기회에 대한 새로운 관심을 불러일으켰다. 이전에는 HPE 내에서 지배적인 평가 형식은 아니었지만, 의학 교육 및 특히 더 광범위한 교육에서 Open Book 또는 'Take home/take away' 테스트 형식의 사용에 대한 실질적인 증거가 있다. 이런 시험이 '클로즈드 북' 형식을 대체하는 것에 대한 방대한 실무 경험이 쌓이기 시작한 것이다. 주장하건대, 이것은 개별적으로 또는 그룹으로 연구와 합성이 필요한 복잡한 문제(예: 많은 보건 문화, 특히 복잡한 임상 결정을 위해 일하는 다학제 팀의 사용에 맞춰 조정)를 설계하고 학습자가 해결해야 하는 매우 정통한 평가 접근 방식을 제시한다. 테크놀로지는 '책'(예: 모바일 기기)을 재정의할 수 있는 실질적인 레버리지를 제공합니다. 사례 연구 2에서 입증되었듯이, [학습자가 어떻게 검색 전략을 개발 및 운영하고, 다른 사람과 협업/연결하여 문제를 해결하는지]를 모니터링하고 이해할 수 있는 잠재력은 '저부담' 평가를 위한 새로운 기회를 제공합니다.
Large scale, global experience of online testing (and the challenges of ‘closed book’ format testing, e.g. through traditional use of Single Best Answer formats) have renewed interest in Open Book test formats and the opportunities that technology may bring (Zagury-Orly and Durning 2021). Whilst previously not a dominant assessment format within HPE, there is substantial evidence about the use of Open Book or ‘take home/take away’ test formats within both medical education (Westerkamp et al. 2013; Durning et al. 2016; Johanns et al. 2017), and particularly within wider education (Bengtsson 2019; Spiegel and Nivette 2021), with extensive practical experience on replacement of closed book formats (Sambell and Brown 2021). Arguably, this presents a highly authentic approach to assessment which challenges faculty to design, and learners to solve, complex problems that require research and synthesis, either individually or in groups (e.g. aligning to the use of multi-disciplinary teams working in many health cultures, particularly for complex clinical decisions). Technology presents a real lever to redefine the ‘Book’ (e.g. a mobile device). The potential to monitor and understand how learners develop and operate search strategies and collaborate/connect with others to solve problems provides new opportunities for ‘lower stakes’ assessments, as demonstrated in Case Study 2.


사례 연구 2
Case Study 2

오픈 북 온라인 평가: 보건 전문 프로그램에 걸친 제도적 구현 사례 연구(국제 의학 대학, 말레이시아)
Open Book Online Assessments: A case study of institutional implementation across health professions programmes (International Medical University, Malaysia)

맥락
Context

그 대학은 2018년에 건강 전문 프로그램에 대한 온라인 평가 시스템(OAS)을 시행했다. OAS는 문제 개발, 시험 후 분석을 통한 지식 기반 및 OSCE 평가 전달, 학습 결과에 기반한 개별 학생 보고서를 제공한다는 점에서 포괄적이었다. COVID-19 팬데믹의 초기 단계에서 OAS는 학생과 교직원을 위한 오프사이트 온라인 시험 플랫폼으로 수정되었다.
The university implemented an online assessment system (OAS) for its health professions programmes in 2018. The OAS was comprehensive in that it allowed for question development, delivery of knowledge-based and OSCE assessments with post-exam analysis, and individual student reports based on learning outcomes. During the early phase of the Covid-19 pandemic, the OAS was modified to be an offsite online test-taking platform for students and staff, as the physical campus space was unable to be used for assessments due to national lockdown restrictions.

우리가 이루려고 했던 것은
What we were trying to achieve

OAS에 프록토링 기능이 없었기 때문에, 오프사이트 온라인 평가를 활성화할 수 없었고, 이러한 적응에서 새로운 문제가 발생했다. 코로나 19로 인한 교수 및 학습 활동의 변경과 비-프록토링 평가가 학생 진행에 미치는 위험을 고려하여, 우리는 저부담 시험에 대한 기존 평가 형식을 사용하여 온라인 비-프록토링non-proctored 시간 기반 오픈 북 평가를 구현했다. 오픈북 시험은 학습 결과에 대해 청사진으로 작성된 지식 응용 항목 형식을 사용했다.
A new challenge emerged from this adaptation as we were unable to invigilate the offsite, online assessment as no proctoring feature existed in the OAS. Given the modifications to teaching and learning activities due to Covid-19 and the risks of non-proctored assessment on student progression, we implemented an online, non-proctored time-based open book assessment using existing assessment formats for low stakes exams. Open book assessments used knowledge application item formats which were blueprinted against learning outcomes.

영향의 지속적인 평가
Ongoing evaluation of Impact

오프사이트 온라인 테스트를 실시한 1차 구현에서는 학생의 데이터 용량 및 기기 제한, 기술 지원 능력, 교직원과 학생 간의 부정행위에 대한 우려에 대한 주요 우려가 강조되었습니다. 이로 인해 [기기 또는 데이터 카파시티]가 있는 학생을 위한 추가 조항과 (외부 보호 소프트웨어 대신) 사내 온라인 활성화의 도입을 포함한 추가 개선이 이루어졌다. 후속 분석 결과, 이러한 개선으로 개별 학생과 코호트 평가 성과는 적응 전 평가와 강하게 상관관계가 있는 것으로 나타났다(Er et al 2020).
The first round of implementation with offsite online test taking highlighted major concerns around data capacity and device limitation of students, ability to provide technical support, and concerns of cheating amongst faculty and students. This led to further improvements including additional provisions for students with device or data capacity and the introduction of in-house online invigilation (instead of external proctoring software). Subsequent analysis showed that, with these improvements, individual student and cohort assessment performance correlates strongly with pre-adaption assessments (Er et al 2020).

테이크홈 메시지
Take home message

오프사이트 온라인 오픈북 평가로 전환할 때, 교수진은 처음에는 오픈북 평가의 사용과 진행에 따른 학생 역량에 미치는 영향에 대해 더 우려했다. 대신, 발생된 문제는 현장검사에서 외부검사로의 테크놀로지 변화와 관련이 있었다. 위기 상황에서 적응할 수 있는 기회를 잡은 것도 유익했지만, 첫 시행 후 평가를 적응시켜 더 개선하는 것도 마찬가지로 중요하다.

When shifting to offsite online open book assessments, faculty were initially more concerned about the use of open book assessments and their impact on student competencies as they progressed. Instead, issues that arose were related to technological shifts from an onsite to an offsite examination. It was beneficial to take the opportunity to adapt during a crisis, but it is also equally important to adapt the assessment after its first implementation to improve it further.



지속적인 코로나 팬데믹에 대응하여, 온라인 테스트를 하는 것이 거의 wholesale로 전환된 덕분에 테스트에 필요한 리소스(공간, 인력)와 테스트 타이밍 및 배치를 개선할 수 있는 기회도 새롭게 볼 수 있었다. 저부담 시험 및 특히 학습 형식에 대한 평가의 경우, 웹과 발터는 비물리적 환경에서 평가와 함께 학습자 참여의 기회를 보여준다. [대규모 시험장을 예약하고 여러 프로그램을 계획하는 제약]은 테크놀로지를 [지능으로 사용]함으로써 통해 해방되었지만, 동시에 학습자 불안과 감정에 대한 물리적 평가 환경의 중요성에 대한 증거가 새롭게 등장했다(Harley et al. 2021). 이러한 평가의 설계, 준비 및 전달에 있어 학습자와 교직원에 대한 지원의 중요성은 아무리 강조해도 지나치지 않으며(Tweed et al. 2021), 여기에 더 넓은 교육 자원을 게시할 수 있는 기회를 제공한다(Wood 2020a, 2020b).

The near wholesale switch to online test delivery in response to the ongoing Covid pandemic has also allowed a fresh look at resources needed for testing (space, staffing) and opportunities to improve the timing and deployment of testing. For lower stakes tests, and particularly assessment for learning formats, Webb and Valter demonstrate the opportunities for learner engagement with assessment in non-physical settings. The constraints of booking large exam halls and scheduling multiple assessments within, and across, programmes are liberated through the intelligent use of technology, with emerging evidence about the importance of the physical assessment environment on learner anxiety and emotion (Harley et al. 2021). The importance of support for learners and faculty in the design, preparation, and delivery of such assessments cannot be overstated (Tweed et al. 2021), with the opportunity to signpost wider education resources there (Wood 2020a, 2020b).

 

원칙 4: 평가 전달 및 학습자 성과 기록 최적화
Principle 4: Optimising assessment delivery and recording of learner achievement

이 합의의 향후 반복에서 2020-2021년을 돌아보고 평가에 대한 COVID-19의 가장 큰 영향을 검토하는 것은 흥미로울 것이다. 그러나 이 단계에서 TEA의 가장 가시적인 영향은 [평가 전달delivery]에 있었다. 온라인 지식 테스트의 성장은 효과적인 대량 온라인 테스트의 출현을 목격했다. 여기서 테크놀로지는 시험과 자동 채점의 전달을 지원하는 데 사용된다. 정교한 평가 관리 시스템(문제은행도 제함공)은 공인된 합격선 설정 방법(예: Ebel, Angoff)의 자동 적용을 지원합니다. 또한 테크놀로지VSA(Very Short Answer) 질문을 포함한 대체 지식 테스트 형식의 전달 및 자동 채점을 가능하게 하여, 응시자가 자유 텍스트를 사용하여 답변할 수 있도록 하고 머신 러닝 알고리즘을 사용하여 대부분의 채점을 수행할 수 있도록 했다(Sam et al. 2018).
It would be interesting to look back at 2020–2021 in future iterations of this consensus and review the biggest impact Covid-19 had on assessments—but at this stage, the most visible impacts of TEA have been on assessment delivery. The growth of online knowledge testing has seen the emergence of effective mass, online testing where technology is used to support the delivery of testing and automated marking. Sophisticated assessment management systems (which also provide item banking) support the automated application of recognised standard setting methods, e.g. Ebel, Angoff. Technology has also enabled the delivery and automated marking of alternative knowledge testing formats including VSA (Very Short answer) questions, allowing candidates to answer using free text, and the use of machine learning algorithms to undertake most of the marking (Sam et al. 2018).

또한 [평가 관리 시스템Assessment Management System]수행능력 평가에서 채점 및 자동화된 합격선 설정(예: 경계선 방법 사용)을 제공하며, 특히 OSCE는 모바일 장치를 사용한 채점 등을 통해 학습자에게 피드백을 포착할 수 있다. ['버추얼' OSCE]의 부상은 [고품질의 방어 가능한 평가]를 만들어내는 데 필요한 [복잡한 로지스틱스]를 포함하여, 무엇것을 완전히 가상 형식을 사용하여 진정한 평가를 할 수 있는지(또는 할 수 없는지)를 재개념화할 수 있는 기회를 보여주었다(Boursicot et al. 2020). 이러한 경험의 대부분은 TEA를 테크놀로지 강화 의료(예: 온라인/가상 환자-전문가 상담의 일상적인 사용)와 연계할 필요성에 초점을 맞추는 데 도움이 되었다. 원칙 3에서 강조했듯이, WBA 전달을 용이하게 하기 위한 모바일 장치의 사용은 점진적으로 증가했지만, [프로페셔널리즘 평가에 대한 테크놀로지의 영향]은 덜 확산되었다. 예를 들면 여기에는, [360/멀티 소스 피드백의 완전한 온라인 시스템]에서부터, [피드백을 즉시 제공하거나 학습자의 웰빙 또는 행동에 대한 우려를 즉시 제기]하는 테크놀로지 연결의 힘에 대한 적극적인 연구 등이 있다(JISC 2020).
Assessment Management Systems also supports the delivery of marking and automated standard setting (e.g. using Borderline Methods) in performance assessment, notably OSCEs, e.g. through scoring using mobile devices, which can also capture feedback to learners. The rise of ‘virtual’ OSCEs has demonstrated opportunities to further reconceptualise what can (and cannot) be authentically assessed using a fully virtual format, including the complicated logistics needed to return a high-quality, defensible assessment (Boursicot et al. 2020). Arguably, much of this experience has helped focus on a need to align TEA with technology-enhanced healthcare (e.g. the routine use of online/virtual patient-professional consultations). As highlighted in Principle 3, the use of mobile devices to facilitate the delivery of WBA has grown progressively, but less well-disseminated has been the impact of technology on delivering professionalism assessment, e.g. from fully online systems of 360/multi-source feedback, through to active research into the power of technology connectivity to instantly provide feedback or immediately raise concerns about a learner’s well-being or behaviour (JISC 2020).

평가에 테크놀로지를 사용하는 것은 평가 품질 분석, 사후 측정 기준 및 점수 보고에도 강력한 이점을 제공했다(Boursicot et al. 2021). [테크놀로지 기반 포트폴리오]는 [연계된 다양한 'artefacts'(즉, 성과 자체, '점수', 평가자 피드백 및 후보 반영)]을 통해 [누적적이고 종단적인 학습 성과를 기록할 수 있는 기회]가 생기고, 이는 진정으로 지속 가능한 평가에 영향을 미칠 수 있는 강력한 저장소를 제공합니다. 평가 및 피드백 증거의 포괄적인 저장소는 평가 프로그램 및 프로그램 평가 접근법에서 학습자 진행에 대한 효과적인 의사 결정의 중심이다. [TEA의 결과로 포착된 광범위한 데이터]는 OSCE 내의 검사자 행동과 의사 결정에 대한 강력한 통찰력을 제공하여 사례 연구 3에서 입증한 바와 같이 테크놀로지가 OSCE 품질을 더욱 향상시킬 수 있는 방법에 대한 추가 연구(비디오와 같은 간단한 기술을 사용)를 생성합니다.

The use of technology within assessment has also provided powerful benefits to the analysis of assessment quality, post-hoc metrics, and score reporting (Boursicot et al. 2021). The opportunities to record cumulative and longitudinal learner achievement through a range of linked ‘artefacts’ (i.e. the performance itself, the ‘score,’ assessor feedback, and candidate reflection) within a technology-based portfolio presents a powerful repository to influence truly sustainable assessment. A comprehensive repository of assessment and feedback evidence is central to effective decision-making about learner progression in programmes of assessment and programmatic assessment approaches. The extensive data captured as a result of TEA provides powerful insights into examiner behaviour and decision making within the OSCE, generating further research (using simple technology, such as video) into how technology might further augment OSCE quality, as demonstrated in Case Study 3.


사례 연구 3
Case study 3

[분산형 OSCE의 품질보증]을 강화하기 위한 방법으로서의 비디오 기반 Examiner Score 비교 및 조정(VECA) (Peter Yeates, Keele Medical School, UK)
Video-based Examiner Score Comparison and Adjustment (VESCA) as a method to enhance quality assurance of distributed OSCEs (Peter Yeates, Keele Medical School, UK)

맥락
Context

응시자의 숫자 때문에 대부분의 기관은 각각 다른 검사 그룹을 가진 여러 개의 OSCE(객관 구조 임상 검사) 병렬 회로를 운영한다. 이러한 서로 다른 '시험관-단체'들이 모두 같은 기준으로 학생들을 판단하는 것은 타당성 사슬에 매우 중요하다. 기존 문헌은 검사자-코호트 효과가 응시자의 점수에 중요한 영향을 미칠 수 있다고 제안하지만, 이러한 효과의 측정은 일반적으로 다른 검사자-코호트가 판단하는 후보 간 교차점이 없기 때문에 어렵다(즉, 완전히 네스팅된 설계).

Owing to candidate numbers, most institutions run multiple parallel circuits of Objective Structured Clinical Exams (OSCEs), with different groups of examiners in each. It is critical to the chain of validity that these different ‘examiner-cohorts’ all judge students to the same standard. Whilst existing literature suggests that examiner-cohort effects may importantly influence candidates’ scores, measurement of these effects is challenging as there is usually no crossover between the candidates which different examiner-cohorts judge (i.e. fully nested designs).

우리가 달성하려고 했던 것은 무엇인가?
What were we trying to achieve

우리는 OSCE에서 완전히 네스팅된 평가자 코호트의 일반적인 문제를 극복하기 위해 기술 지원 방법을 개발하는 것을 목표로 했다.
We aimed to develop a technology-enabled method to overcome the common problem of fully nested examiner-cohorts in OSCEs.

우리가 한 일
What we did

우리는 '비디오 기반 시험자 점수 비교 및 조정(VESCA)'이라는 3단계 절차를 개발했다. 여기에는 다음이 포함된다.

  • (1) OSCE의 모든 스테이션에서 학생들의 자원봉사 샘플을 비디오로 촬영한다.
  • (2) 또한 모든 검사관examiner에게 스테이션-특이적 비교군comparator 비디오 점수를 매기도록 요청합니다(모든 검사관-코호르트가 동일한 비디오 점수를 매김).
  • (3) 비디오 기반 점수에 의해 제공되는 연결을 사용하여 많은 면 래쉬 모델링을 사용하여 검사자-코호트 효과를 비교하고 조정한다.

We developed a three-stage procedure called ‘Video-based Examiner Score Comparison and Adjustment (VESCA).’ This involved

  • (1) videoing a volunteer sample of students on all stations in the OSCE;
  • (2) asking all examiners, in addition, to live examining, to score station-specific comparator videos (collectively all examiner-cohorts scored the same videos);
  • (3) using the linkage provided by video-based scores to compare and adjust for examiner-cohort effects using Many Facet Rasch Modelling.

영향의 지속적인 평가
Ongoing evaluation of impact

카메라를 배치하려면 학생의 성과를 방해받지 않고 볼 수 있도록 세심한 최적화가 필요했고 침입을 완화했습니다. 비디오 스코어링은 OSCE에 추가적인 시간 요구 사항을 부과했지만 데이터는 인터넷을 통한 지연 스코어링의 동등성을 지원하여 실현 가능성을 향상시켰다. 학생들은 일반적으로 표준화를 강화하기 위한 절차를 환영했다. 점수 조정은 링크 비디오 수 또는 심사관 참여율의 변동에 대해 허용될 정도로 강력했다. 시험관-코호트 효과는 학생 점수의 표준 편차 이상을 설명하면서 때때로 상당했다. 그에 따라 점수를 조정하면 상당한 소수 학생들의 합격/불합격 결정에 영향을 미치거나 그들의 순위를 크게 바꿀 수 있다.

Camera placement required careful optimisation to provide unobstructed views of students’ performances whilst mitigating intrusion. Scoring videos imposed additional time demands on the OSCE but data supported equivalence of delayed scoring via the internet thereby enhancing feasibility. Students generally welcomed procedures to enhance standardisation. Score adjustments were acceptably robust to variations in the number of linking videos or examiner participation rates. Examiner-cohort effects were sometimes substantial, accounting for more than a standard deviation of student scores. Adjusting scores accordingly could influence the pass/fail decisions of a substantial minority of students or substantially alter their rank position.

테이크홈 메시지
Take home message

VESCA는 개별 기관, 평가 파트너십 또는 국가 시험 기관이 다중 회로 또는 분산/국가 OSCE 시험의 품질을 향상시키고 공정성을 보장할 수 있도록 지원하는 유망한 기술 지원 방법을 제공한다(Yeates et al. 2020, 2021a, 2021b, 2022).VESCA offers a promising technology-enabled method to assist individual institutions, assessment partnerships, or national testing organisations to enhance the quality and ensure fairness of multi-circuit or distributed/national OSCE exams (Yeates et al. 2020, 2021a, 2021b, 2022).


전달, 분석 및 점수 보고 외에도, 테크롤로지를 광범위하게 사용하다보면, [테스트 보안, 부정행위 및 후보 추궁에 대한 상당한 의견]을 유발한다. 이 논평은 5가지 핵심의 신중한 균형을 강조합니다. 다음과 같이 요약될 수 있다.

  • 신뢰: 평가를 제공하는 기관, 교직원 및 후보자 자신(그리고 향후 평가에 대한 후속 신뢰와 신뢰)
  • 프로페셔널리즘: 그리고 평가 제공 내부 및 주변에서 후보자와 교수진의 기대
  • 적극적 프록토링: 문맥과 무관한 분산이나 후보 또는 교수진에게 추가적인 인지 부하를 주지 않으며 디지털 불평등을 심화시키는 복잡한 브라우저 시스템/장치에 액세스할 필요가 없는 온정적이고 비례적인 응답
  • 탐지 및 보안: 평가 내 학업 오류, 보안 테스트 뱅크 위반 또는 타사 또는 클라우드 기반 시스템에 의해 저장될 수 있는 후보 특성/성능 데이터의 우발적 손실.
  • 결과: 학문적 과실이 발견되었을 때 제재 측면에서뿐만 아니라 학습자, 전문가 및 환자의 신뢰를 강화하는 측면에서도 마찬가지이다.

Beyond delivery, analysis, and score reporting, the extensive use of technology has generated substantial comments about test security, cheating, and candidate proctoring (Roberts et al. 2020; Bali 2021; Selwyn et al. 2021). The commentary highlights the careful balance of 5 key, overlapping issues which can be best summarised as:

  • Trust: In the institution delivering the assessment, within and amongst Faculty and candidates themselves (and the subsequent confidence and trust in future assessments)
  • Professionalism: and the expectations of candidates and faculty within, and around, the delivery of assessments
  • Active proctoring: compassionate and proportionate responses that do not introduce context irrelevant variance, or additional cognitive load on candidates or Faculty, nor require access to complex browser systems/devices that widen digital inequity
  • Detection and security: of both academic malpractice within an assessment, the breach of e.g. a secure test bank, or inadvertent loss of candidate characteristics/performance data that may be stored by a third party or cloud-based systems.
  • Consequences: both in terms of sanctions when academic malpractice is detected, but also to reinforce the trust of learners, professionals, and patients

현재까지 데이터에 따르면 일부 대규모 국가 평가는 온라인/오프라인 테스트 전달과 비교하여 후보 성과에 차이가 없다고 보고하는 등 보안과 관련하여 테스트 기관 전반에 걸쳐 매우 혼합된 경험을 제시한다. 보다 광범위하게, 테크롤로지는 '부정행위 계약contract cheating'의 성장을 실질적으로 가능하게 했다. 이는 [아웃소싱된 학습자 평가]와 [아웃소싱 평가를 완료한 사람(개인 및 기업)] 간의 결과 균형을 요구한다. 또한 제도적 관행과 입법 모두에 문제를 남긴다.
Data to date suggests very mixed experiences across testing institutions in relation to security, with some larger scale national assessments reporting no differences in candidate performance comparing online/offline test delivery (Andreou et al. 2021; Hope, Davids, et al. 2021; Tweed et al. 2021). More widely, technology has substantially enabled the growth of ‘contract cheating,’ requiring a balance of consequences across learners ‘outsourcing’ assessment and those completing the outsourcing (individuals and companies) and challenges both institutional practices and legislation (Ahsan et al. 2021; Awdry et al. 2021).

원칙 5: 학습자 진행 상황 및 교수 활동 추적—종방향 학습 및 지속적인 평가 지원
Principle 5: Tracking learner progress and faculty activity—supporting longitudinal learning and continuous assessment

테크놀로지 사용은 평가 프로세스와 실무에서 잠재적으로 혁신적이었지만, 학습자 진급에 대한 테크놀로지 주도 '결정'의 출현은 상당한 도전과 우려를 제기합니다. 의료 분야에서 '인공지능'(AI)의 보다 광범위한 사용은 질병의 조기 발견 또는 보다 정확한 진단에 잠재적인 이점을 제공한다(예: 류 외 2019; Yan 외 2020). 그러나 브루사드는 [모든 데이터가 궁극적으로 인간에 의해 생성되기 때문에 잘못된 의사 결정, 코딩 및 출력 사용에 대한 책임은 인간에게 있다]고 강조한다(Broussard 2018).
Whilst the use of technology has been potentially transformational in assessment processes and practice, the advent of technology-driven ‘decisions’ on learner progress presents significant challenges and concerns. The use of ‘artificial intelligence’ (AI) more widely in healthcare presents potential benefits in the early detection of disease or more accurate diagnosis (e.g. Liu et al. 2019; Yan et al. 2020). However, Broussard highlights that all data is ultimately generated by humans, so the challenge for ‘AI’ of poor decision making, the responsibility for coding and use of any outputs remains with humans (Broussard 2018).

교육에서 AI 기반 기술은 학습 또는 웰빙과 관련하여 학습자의 [성공을 예측]하거나, [특정 지원이 필요한 사람]을 탐지할 수 있는 기회를 예고했다(JISC 2020). 그러나 학습자와 교수진에 대한 이러한 테크놀로지의 성과를 살펴보는 고품질 경험적 연구는 거의 없다(Sonderlund et. 2019). 평가 내에서 논평은 개별 평가 내에서 또는 종단적 데이터 세트의 분석을 통해 기계 기반 의사 결정에 초점을 맞췄다(Hope, Dewar, et al. 2021).
In education, AI-based technologies have heralded opportunities to predict learner success or detect those in need of targeted support, whether relating to learning or well-being (JISC 2020). However, there is little high-quality, empirical research that looks at the outcomes of such technology on learners and faculty (Sonderlund et. 2019). Within the assessment, commentaries have focused on either machine-based decision-making within individual assessments (Hodges 2021) or through the analysis of longitudinal data sets (Hope, Dewar, et al. 2021).

광범위한 교육에서 데이터 처리 및 학습자 분석이 TEA의 일부로 사용되는 방법에 대한 몇 가지 접근법이 있었다. 시스템의 설계, 데이터 처리 또는 결과의 이해/적용 불량으로 인해 '프로파일과 예측'이 실패할 수 있으며, 이는 학습자에게 불명확한 결과, 학습자에게 부정적인 영향(실패에 대한 두려움을 강화함) 또는 '게임 행동'을 초래할 수 있다. 교수진과 기관에 의한 그러한 시스템에 대한 이해와 적용은 동등하게 중요하다(Lawson et al. 2016). 이와는 대조적으로, 사례 연구 4에 나타난 바와 같이, 지능형 시스템 설계와 데이터의 목적적 사용은 미래의 실패 위험에 있는 학습자를 식별하고 의미 있게 지원하기 위해 데이터를 사용하거나(Foster and Siddle 2020), 자율 규제와 더 나은 학습자 선택(Broos et al. 2020)을 지원하는 데 사용될 수 있다. 현재의 과제는 이 원칙이 학습에 대한 의미 있는 영향의 측면에서 교육에 대한 혼합 결과를 강조하는 제한된 공개된 증거 기반 내에 있다는 것이다(2019년 슘과 행운).
Within wider education, there have been several approaches to how data processing and learner analytics have been used as part of TEA. Poor design of systems, data processing, or understanding/application of outcomes can lead to failure in ‘profile and predict,’ resulting in either unclear outcomes for learners (Foster and Francis 2020), negative impact on learners (through reinforcing the fear of failure) or development of ‘gaming behaviours’ (Archer and Prinsloo 2020). Of equal consequence is poor understanding and application of such systems by faculty and institutions (Lawson et al. 2016). In contrast, intelligent systems design and purposeful use of data can be used to ‘gather and guide,’ using data to identify and meaningfully support learners at risk of future failure (Foster and Siddle 2020) or support self-regulation and better learner choices (Broos et al. 2020), as shown in Case Study 4. A current challenge is that this principle is situated within a limited published evidence base which highlights mixed outcomes for education in terms of meaningful impact on learning (Shum and Luckin 2019).


사례 연구 4
Case study 4

지속적인 학습 및 평가 준비를 위한 온라인 형태 형성 평가, 학생 피드백 및 학습 분석 안내(호주 시드니 대학 Karen Scott)
Online formative assessment for continuous learning and assessment preparation, guided by student feedback and learning analytics (Karen Scott, University of Sydney, Australia)

맥락
Context

4년제 시드니 메디컬 프로그램의 학생들은 8주간의 소아과 블록에 참여한다. 대부분의 70~80명의 학생들은 시드니 웨스트메드에 있는 아동병원에 1일차 오리엔테이션, 5주차 수업, 8주차 시험을 위해 있으며, 8~12명의 학생들은 시골 병원에 있다. 나머지 블록에서 학생들은 어린이 병원, 광역 및 농촌 병원, 지역사회 보건 센터에서 임상 배치를 받는다.
Students in the four-year Sydney Medical Program undertake an 8-week paediatric block. Most of the 70–80 students are at The Children’s Hospital at Westmead, Sydney for the Day 1 orientation, Week 5 teaching, and Week 8 examinations; 8–12 students are at rural hospitals. For the remaining block, students undertake clinical placements at the Children’s Hospital, metropolitan and rural hospitals, and community health centres.

우리가 달성하려고 했던 게 뭐죠?
What were we trying to achieve?

소아과는 일반 소아과, 소아외과, 그리고 30개 이상의 하위 전공으로 구성되어 있다. 이 광범위한 교육과정에 걸쳐 학생들은 다양한 대면 및 가상 소규모 및 대규모 그룹 교육 세션을 준비하고, 학습을 통합, 검토 및 확장해야 합니다. 학생들은 블록 말기 필기시험과 임상시험도 준비해야 하며, 기말고사는 필기시험이 있다. 
Paediatrics comprises general paediatrics, paediatric surgery, and over 30 sub-specialties. Across this broad curriculum, students need to prepare for a range of face-to-face and virtual small- and large-group teaching sessions, and consolidate, review and extend their learning. Students also need to prepare for end-of-block written and clinical examinations, and final-year has written examinations.

우리가 한 일
What we did

실질적인 온라인 자기 주도형 형성 평가가 개발되었다. 대부분은 전개, 사례 기반 학습으로 구성되어 핵심 지식을 임상 사례에 적용할 수 있다. 일부는 핵심 지식을 학습의 통합 및 확장을 위한 실습 활동과 통합한다. 모든 기능에는 광범위한 자동 피드백이 포함되어 있으며 일부는 보조 웹 링크가 포함되어 있습니다. 핵심지식개발(주로 짧은 포맷으로 녹음된 강의)에 초점을 맞춘 온라인 자료에는 자가테스트를 위한 형성 평가와 이를 통한 장기지식 보유가 포함된다.
Substantial online self-directed formative assessment has been developed: most comprise unfolding, case-based learning, enabling the application of core knowledge to clinical cases; some integrate core knowledge with practice activities for consolidation and extension of learning. All include extensive automated feedback, some with supplementary web links. Online materials focusing on core knowledge development (primarily short format recorded lectures) include formative assessment for self-testing and through this, long-term knowledge retention.

영향 평가
Evaluation of impact

학습 분석 및 학생 설문 조사에 따르면 대부분의 학생들은 대부분의 형태별 평가를 수행하며 더 많은 것을 원합니다! 최근 학습 분석과 평가 결과를 비교한 결과 학생들의 평가 결과는 일반적으로 형성적 평가를 사용하는 범위와 일치한다.
Learning analytics and student surveys show most students do most formative assessments—and want more! A recent comparison of learning analytics and assessment results highlights that students’ assessment results generally correspond with the extent to which they use formative assessment.

테이크홈 메시지
Take-home message

이 연구 결과는 모든 학생(특히 미니멀리스트 접근법을 취하는 학생)이 온라인 형성 평가를 잘 활용하도록 장려하기 위해 의료 프로그램 전체에 전달되고 있다.

This finding is being communicated throughout the Medical Program to encourage all students (especially those taking a minimalist approach) to make good use of online formative assessment.


 

[교육학적 원칙과 좋은 테크놀로지 설계]에 부합하면 TEA는 '올바른 데이터'를 수집하는 데 상당한 이점을 제공할 수 있으며, 이는 인간의 인지 부하를 해방시켜 데이터를 더 잘 이해하고 따라서 교수진의 시간을 학습자 지원에 집중할 수 있다. 여기에는 데이터 기반 신속한 교정조치(리케츠 및 블라이 2011), 코칭 및 멘토링 접근법(말레카 및 바우드 2021), 행동 넛지(담가드 및 닐슨 2018), 예방적 개입으로 (잠재적) 연말 실패 시점을 앞두고 적용되는 전문가 사례 관리가 포함될 수 있다(윈스턴 외 2012). 그러나 광범위한 데이터 수집은 [학습의 관리를 책임지는 사람들]과 [독립적인 행위자agents으로서 학습자 자신] 사이에 긴장을 야기할 수 있다(Tsai et al. 2020). [데이터 소유권에 대한 문제]는 문헌에 의해 대부분 해결되지 않았지만 가장 중요하다.
When aligned to pedagogic principles and good technology design, TEA can provide substantial benefits in collecting the ‘right data,’ freeing up the cognitive load of humans to better understand the data and therefore focus faculty time on learner support. This can include data-driven rapid remediation (Ricketts and Bligh 2011), coaching and mentoring approaches (Malecka and Boud 2021), considered use of behavioural nudges (Damgaard and Nielsen 2018) and specialist case management to be applied ahead of a (potential) end of year point of failure as a preventive intervention (Winston et al. 2012). However, extensive data collection may cause tensions between those responsible for the management of studies and learners themselves as independent agents (Tsai et al. 2020). This question of data ownership remains largely unanswered by the literature but is of paramount importance.

그러나 [평가 설계에 대한 테크놀로지의 지능적 적용]은 특히 포트폴리오 도구의 개발을 통해 학습자 자신의 종단적 참여를 변화시킬 수 있다. Driessen(2017) [포트폴리오]가 [관료적 도구로 보이는지] 또는 [학습 및 평가의 진정한 가능자enabler로 보이는지]에 따라 달라지는 포트폴리오의 함정을 강조한다. Silveira(2013)는 음악과 예술 교육의 교훈을 바탕으로, [포트폴리오]는 [학습과 피드백을 위한 커뮤니케이션 도구]이며, [학습자를 적극적으로 참여시키고 더 나은 자기 조절, 오너십/큐레이션, 종적 개발을 촉진할 수 있는 강력한 기회]를 제시한다고 본다. 그러나 쉽게 접근할 수 있는 포트폴리오에서 성찰의 요건(평가 구성요소)과 '고해성사로서의 성찰'의 심리적 해악에 대해 주의를 기울여야 한다(Hodges 2015). 포트폴리오 평가의 효과적인 활용을 위해 학습자, 감독자 및 역량 위원회를 지원하는 것은 필수적이다(Oudkerk Pool et al. 2020; Pack et al. 2020).

However, the intelligent application of technology to assessment design can transform the longitudinal engagement of learners themselves, particularly through the development of portfolio tools. Driessen (2017) highlights the pitfalls of portfolios depending on whether they are seen as bureaucratic tools or true enablers of learning and assessment. Drawing on the lessons from music and arts education, seeing portfolios as communication tools for learning and feedback, Silveira (2013) presents powerful opportunities to actively engage learners and promote better self-regulation, ownership/curation, and longitudinal development (Clarke and Boud 2018). Caution however needs to be exercised about the requirement of reflection (as a component of assessment) in an easily accessible portfolio, and the psychological harm of ‘reflection as confession’ (Hodges 2015). Supporting learners, supervisors, and competence committees in the effective use of portfolio assessment is essential (Oudkerk Pool et al. 2020; Pack et al. 2020).

테크놀로지는 [학습자에 대한 광범위한 데이터를 수집하고 이해할 수 있는 능력]을 갖추었으므로, 기본적으로 평가자(직장 및 시뮬레이션 평가 모두)와 평가 품질 개선에 대한 기관의 반응에 강력한 렌즈를 제공합니다. 학습자를 지원하기 위한 패러랠 메커니즘으로서, 이 데이터는 목표 지원targeted support나(예: 집중 OSCE 검사자 교육(Gormley et al. 2012) 더 나은 평가자 참여를 촉진하기 위해 TEA(예: 웹 양식, 앱)의 재설계를 추진할 수 있다. 
With the ability to collect and understand extensive data about learners, technology, by default, provides a powerful lens into assessors (both in the workplace and simulated assessment) and the responses of the institution to driving assessment quality. In a parallel mechanism to supporting learners, this data can drive targeted support, e.g. focused OSCE examiner training (Gormley et al. 2012), or redesign of TEA (e.g. webforms, apps) to facilitate better assessor engagement.

4차 산업 혁명(McKinsey 2022)은 교육자가 직면한 미래를 강조하며, 더 많은 양의 (평가) 데이터와 알고리즘 기반 결과를 기록하는 장치와 공존하여 교수진이 학습자 진행 및 의사 결정을 조정할 수 있도록 지원합니다. 교육 평가educational assessment의 주요 과제는 이러한 [상호 연결을 시각화, 연결, 영향 및 연구하는 방법]에 초점을 맞춘다. 개발자, 기술자 및 교육자 간의 증강 및 인공지능의 함정과 잠재력을 더 잘 이해하려면 지속적으로 발생하는 윤리적 문제에 대응할 필요가 있다(Selwyn 2021). 
The fourth industrial revolution (McKinsey 2022) highlights the future that educators face, coexisting with devices recording larger volumes of (assessment) data and algorithm-based outcomes helping faculty coordinate learner progression and decision making. Key challenges of educational assessment focus on how we visualise, connect, influence, and research this interconnectivity. A better understanding of the pitfalls and potential of augmented and artificial intelligence between developers, technologists, and educationalists needs to interface with the ethical challenges that continue to arise (Selwyn 2021).

3단계: TEA 사용의 영향 보건 전문직 교육 내 평가, 보급 및 가속화
STAGE 3: The impact of TEA usage needs evaluating, disseminating, and accelerating within health professions education

글로벌 팬데믹에도 불구하고, 2020년에는 평가에 대한 기술 솔루션을 포함하여 교육에서의 기술 사용에 있어 혁신 보고서의 급속한 성장으로 돌아왔다(Fuller et al. 2020). 이 생산성 기간 동안 우리는 무엇을 배울 수 있을까? 이러한 위기가 창의적 대응으로 이어지는 것은 놀라운 일이 아니지만, 테크놀로지 기반 창의성에 상당한 자원이 필요하다는 요구는 '소박한 혁신'의 가치를 간과하고 있습니다(Tran and Ravaud 2016). 그러나 이러한 창의성으로부터 배우는 모든 것의 중심은 '설명description'을 넘어, [보급과 의미 있는 학술활동]을 통해 그 영향을 극대화해야 한다는 요구이다(Ellaway et al. 2020).
Despite (and indeed because of) the global pandemic, 2020 saw a return to the rapid growth of innovation reports in technology use in education, including technological solutions to assessment (Fuller et al. 2020). What can we learn from this period of productivity? That crisis leads to creative responses is unsurprising, but a requirement that technology-based creativity requires substantial resources overlooks the value of ‘frugal innovation’ (Tran and Ravaud 2016). However, central to any learning from this creativity is a requirement to move beyond ‘description’ and maximise its impact through dissemination and meaningful scholarship (Ellaway et al. 2020).

HPE를 통한 TEA의 학술적 연구 보급은 북미, 유럽, 오스트랄라시아에 걸쳐 개인 및 소규모 그룹의 출판물에 의해 주로 이루어졌다. 아시아 태평양 지역의 생산량이 증가하고 있지만, 아프리카와 남아메리카의 출판물은 거의 남아 있지 않다. TEA가 전 세계적으로 HPE에 진정한 혜택을 주기 위해서는 기술 지원 평가의 설계, 구현 및 평가의 내러티브도 다양성이 필요합니다. 이러한 다양성은 HPE(예: 주제별 통화, 혁신 보고서)에 반영되며 빠르게 변화하는 교육 설계 및 소셜 미디어 영역의 단서로부터의 학술활동 채택으로 인해 반영된다. 이러한 접근 방식은 TEA에 초점을 맞춘 학술 출판물이 실무자의 의견을 통해 협력적이고 점진적으로 구축될 수 있음을 의미한다.
Dissemination of scholarly work in TEA across HPE has largely been dominated by publications from individuals and small groups across North America, Europe, and Australasia. While there is a growing trend of output from the Asia Pacific region, publications from Africa and South America remain few. For TEA to truly benefit HPE globally, the narratives of design, implementation and evaluation of technology-enabled assessments need diversity too. This diversity is reflected within HPE (e.g. thematic calls, innovation reports) and from the adoption of scholarship from cues in the fast-changing realm of instructional design and social media. Such approaches mean that scholarly publications focused on TEA can be built collaboratively and progressively with input from practitioners.

교육 내에서 [지속적으로 새로운 테크놀로지를 채택]하는 실험적인 특성은 [장단기 의도된 결과와 의도하지 않은 결과]의 프레임워크에 적합하다. 이를 위한 '최선의' 방법에 대해서는 HPE 전체에서 합의가 이루어지지 않았지만, 서로 다른 프레임워크는 과정 또는 프로그램 수준 평가(Cook 및 Ellaway 2015) 또는 단일 자원 평가(Pickering and Joynes 2016)에 대한 제안을 제공한다. 이러한 프레임워크의 핵심은 [어떤 형태로든 영향의 evaluation와 assessment가 이루어져야 하며], [TEA 혁신이 학습 경험, 행동 또는 프로세스에 진정한 차이를 가져왔는지] 또는 [기존의 평가에서 일부 긍정적인 요소가 손실되었는지]에 대해 고려해야 한다는 것이다(William 2021).).
The experimental nature of continually adopting new technologies within education lends itself well to frameworks of short- and long-term intended and unintended consequences. There is no agreement across HPE on the ‘best’ way to do this, but different frameworks offer suggestions for course or programme level evaluations (Cook and Ellaway 2015) or for evaluation of a single resource (Pickering and Joynes 2016). The key point of these frameworks remains that evaluation and assessment of impact need to occur in some form and that consideration is given to whether a TEA innovation has truly made a difference to learning experiences, behaviours, or processes, or whether some positive elements have been lost from the assessment which came before (William 2021).

마무리 멘트
Concluding remarks

팬데믹으로 인해 더 넓은 교육이 계속해서 형성되고 있는 상황에서, 미래는 무엇을 유지할 것인가? 국제 고등 교육 정보 기술 그룹 Educause는 디지털 기술이 교육 및 평가를 지속적으로 형성하는 방법을 탐구하기 위해 '복원', '진화', '변환'의 세 가지 모델을 제안합니다(EDUCHAUSE 2021). 저자들은 일련의 대안, 전염병 이후의 미래를 지적하지만, [어포더빌리티, 디지털 보안, 디지털 형평성 및 교육에 대한 평등한 접근 문제]가 TEA에 대한 우리의 전략적 접근 방식을 형성해야 하는 원동력이 될 것이다.

With wider education continuing to be shaped by the pandemic, what does the future hold? The international higher education information technology group Educause proposes three models—‘restore,’ ‘evolve,’ and ‘transform’—to explore how digital technologies may continue to shape education, and assessment (EDUCAUSE 2021). The authors point to a series of alternative, post-pandemic futures, but where issues of affordability, digital security, digital equity, and equitable access to education will be the driving forces that must shape our strategic approaches to TEA.

향후 10년간의 기술 동향에 대한 예측은 일, 건강 및 사회(Gartner 2015)에 대한 광범위한 변화를 강조할 수 있지만, HPE의 보다 근본적인 것은 학습 테크노롤지가 어떻게 사람에 초점을 맞추도록(예: 창의성과 혁신, 학습자 행위자성 및 웰빙) 축을 전환할 것이냐이다. 이러한 것들은 학습자의 자기 조절, 개발, 기여 및 자기 관리를 지원하기 위해 이러한 기술에 참여하는 학습자의 능력을 어떻게 '평가'하는지 생각하는 TEA에게 흥미로운 잠재력을 제공합니다. 테크놀로지 미래학자들은 '인간만의 특성'(예: 동정심, 창의성)을 우리가 배우는 것만큼 점점 더 가치가 있다고 지적하고, 더 많은 자동화를 사용하여 의료 서비스를 제공한다(Leonhard 2021). 테크놀로지와의 공존을 위해서는, 이러한 특성, 관행 기반 윤리 및 의사 결정(및 자동화된 시스템으로부터의 포기)을 어떻게 '평가'하는지가 HPE의 평가에 대한 주요 과제일 것이다.
Whilst predictions around technology trends of the next 10 years may highlight broader changes to work, (health), and society (Gartner 2015), more fundamental to HPE is how learning technologies will shift their axes to focus on people—transformative competencies (e.g. creativity and innovation), learner agency and well-being (OECD 2015). These present interesting potential for TEA, thinking about how we ‘assess’ learners' ability to engage with these technologies to support their self-regulation, development, contribution, and self-care. Technology futurists point to ‘human only traits’ (e.g. compassion, creativity) as increasingly valuable as we learn, and provide healthcare, using more automation (Leonhard 2021). How we ‘assess’ these traits, practice-based ethics, and decision making (and abdication from automated systems) in our co-existence with technology will prove major challenges for assessment in HPE.

모든 기여자들이 이러한 합의를 도출하는 과정에서 핵심 주제는 '더 나은 평가 미래'를 진정으로 가능하게 하는 기술의 필요성을 지적합니다. HPE에서, 이것은 이것을 제공하는 데 필요한 학습과 기술에 초점을 맞추고 진정으로 혁신적인 TEA가 기술을 사용한 진정한 평가를 추구하기 위해 평가 라이프사이클뿐만 아니라 학습자, 교수진 및 환자의 요구를 고려하도록 보장하는 것으로 해석된다.

A key theme throughout the development of this consensus from all contributors points to the need for technology to truly enable ‘better assessment futures.’ In HPE, this translates to focus on the learning and skills needed to deliver this and to ensure that truly transformative TEA considers not just the assessment lifecycle, but the needs of learners, faculty, and patients in the pursuit of authentic assessment using technology.

 


Med Teach. 2022 Jun 30;1-15. doi: 10.1080/0142159X.2022.2083489. Online ahead of print.

Technology enhanced assessment: Ottawa consensus statement and recommendations

Affiliations collapse

Affiliations

1Christie Education, The Christie NHS Foundation Trust, Manchester, UK.

2School of Medicine, University of Liverpool, Liverpool, UK.

3International Medical University, Kuala Lumpur, Malaysia.

4Kubify, Leeds, UK.

5School of Medicine, University of Keele, Keele, UK.

6Faculty of Medicine and Health, University of Sydney, Sydney, Australia.

7College of Health and Medicine, Australian National University, Canberra, Australia.

8John Curtin School of Medical Research, Australian National University, Canberra, Australia.

9Center for University Teaching and Learning, University of Helsinki, Helsinki, Finland.

PMID: 35771684

DOI: 10.1080/0142159X.2022.2083489

Abstract

Introduction: In 2011, a consensus report was produced on technology-enhanced assessment (TEA), its good practices, and future perspectives. Since then, technological advances have enabled innovative practices and tools that have revolutionised how learners are assessed. In this updated consensus, we bring together the potential of technology and the ultimate goals of assessment on learner attainment, faculty development, and improved healthcare practices.

Methods: As a material for the report, we used the scholarly publications on TEA in both HPE and general higher education, feedback from 2020 Ottawa Conference workshops, and scholarly publications on assessment technology practices during the Covid-19 pandemic.

Results and conclusion: The group identified areas of consensus that remained to be resolved and issues that arose in the evolution of TEA. We adopted a three-stage approach (readiness to adopt technology, application of assessment technology, and evaluation/dissemination). The application stage adopted an assessment 'lifecycle' approach and targeted five key foci: (1) Advancing authenticity of assessment, (2) Engaging learners with assessment, (3) Enhancing design and scheduling, (4) Optimising assessment delivery and recording learner achievement, and (5) Tracking learner progress and faculty activity and thereby supporting longitudinal learning and continuous assessment.

Keywords: Assessment; curriculum; medical education research.

 

의과대학에서 전문직업성 기르기: 1990년과 2019년 사이 교육과정의 체계적 스코핑 리뷰(Med Teach, 2020)
Nurturing professionalism in medical schools. A systematic scoping review of training curricula between 1990–2019
Yun Ting Onga,b, Cheryl Shumin Kowa,b, Yao Hao Teoa,b, Lorraine Hui En Tana,b, Ahmad Bin Hanifah Marican Abdurrahmana,b, Nicholas Wei Sheng Queka,b, Kishore Prakasha,b , Clarissa Wei Shuen Cheonga,b, Xiu Hui Tana,b, Wei Qiang Lima,b, Jiaxuan Wua,b, Laura Hui Shuen Tana,b, Kuang Teck Taya,b , Annelissa Chinc, Ying Pin Tohd, Stephen Masone and Lalit Kumar Radha Krishnaa,b,e,f,g 

 

서론
Introduction

전문직업성의 정의
Definition of professionalism

프로페셔널리즘은 의사-환자 관계, 환자 만족도 및 의료 결과에 영향을 미치는 [진화하고, 사회 문화적으로 영향을 받으며, 다차원적인 구인]이다(Li et al. 2017). 임상 치료에 대한 전문직업성의 직접적인 영향은 이 개념을 더 잘 이해하고 임상 실무에서 그 역할에 대한 인식을 높이기 위한 노력을 강조한다(Wilkinson et al.). 그러나 전문직업성을 기르는 일은 전문직업성이 어떻게 인식되는지에conceived 대한 차이로 인해 복잡하다. ACGME, ABIM, GMC 및 CanMEDs 프레임워크 등에 의해 제시된 프로페셔널리즘의 정의는 여기에 [사회문화적, 맥락적, 지리-정치적 요인이 미치는 영향을 보여준다. 이러한 요인의 영향을 인정한다는 것은 현재의 훈련 접근법의 적절성과 실행 가능성을 재고할 필요성을 강조한다(Mueller 2009).
Professionalism is an evolving, socioculturally informed, multidimensional construct (Li et al. 2017) that influences doctor-patient relationships, patient satisfaction and healthcare outcomes (Wilkinson et al. 2009). Professionalism’s direct impact upon clinical care underlines efforts to better understand this concept and nurture greater awareness of its role in clinical practice (Wilkinson et al. 2009). Yet the task of nurturing professionalism is complicated by differences in how professionalism is conceived. Definitions set out by the Accreditation Council for Graduate Medical Education(ACGME), the American Board of Internal Medicine (ABIM), General Medical Council (GMC) and the CanMEDs framework by the Royal College of Physicians and Surgeons of Canada allude to the impact of prevailing sociocultural, contextual and geopolitical factors on prevailing concepts of professionalism. Acknowledging the impact of these factors underlines the need to reconsider the appropriateness and viability of current training approaches (Mueller 2009).

이번 체계적인 범위 지정 검토는 학부 및 대학원 의과대학에서 전문직업성이 양성되는 방식을 지도화하여 의대생들의 전문성 양성을 목표로 하는 프로그램에 대한 설계 정보를 개선하고 지원 및 평가를 강화하는 것을 목표로 한다(Munn et al. 2018).
This systematic scoping review aims to map how professionalism is nurtured in undergraduate and postgraduate medical schools so as to better inform design and enhance support and assessment of programs aimed at nurturing professionalism amongst medical students (Munn et al. 2018).

방법론
Methodology

체계적인 범위 검토는 광범위한 교육 및 실습 설정(Chidwick et al. 2018)에 걸쳐 실행 가능하고 적용 가능한 정보(DuMont et al. 2015)와 사용 가능한 문헌 요약(O'Donovan et al. 2018; Osama et al. 2018)을 체계적으로 추출하고 합성할 수 있다. 2004; Pape and Manning 2006).
A systematic scoping review allows for systematic extraction and synthesis of actionable and applicable information (Du Mont et al. 2015) and a summary of available literature (O’Donovan et al. 2018; Osama et al. 2018) across a wide range of pedagogies and practice settings (Chidwick et al. 2004; Pape and Manning 2006).

싱가포르 국립대학교의 Yong Loo Lin 의과대학(YLLsoM)과 싱가포르 국립 암 센터(NCCS)의 의료 도서관, NCCS의 지역 교육 전문가 및 임상의의 지도 아래 YLsOM 및 Duke-NUS 의과대학(EXPorth)의 의료 사서, NCCS의 현지 교육 전문가 및 임상의의 지도 아래, YLsoM 및 Duke-NUS 의과대학(EXPorthen)은 다음과 같은 의과 함께 의료기관을 운영하고 있습니다. 주요 연구 질문은 '의대생들의 전문직업성 함양에 대해 알려진 것'으로 결정되었다. 연구팀 17명은 또 2차 연구 질문을 '학부와 대학원 의학 커리큘럼에서 전문직업성이 어떻게 이해되고 실천되고 있는가'로 결정했다.

Guided by the medical librarians from the medical library at the Yong Loo Lin School of Medicine (YLLSoM) at the National University of Singapore and at the National Cancer Centre Singapore (NCCS) and local educational experts and clinicians at the NCCS, the Palliative Care Institute Liverpool, YLLSoM and Duke-NUS Medical School (henceforth the expert team), the primary research question was determined to be ‘what is known about nurturing professionalism amongst medical students?”. The 17 members of the research team also determined the secondary research questions to be “how is professionalism understood and practiced in prevailing undergraduate and postgraduate medical curricula?”.

이 체계적인 범위 검토는 Li 등(2017)의, Wilkinson 등을 기반으로 한다. (2009) 및 벨로스키 외. (2005)의 전문성 평가 도구 검토. 향후 체계적인 검토의 기초가 되는 것 외에도, 체계적인 범위 검토를 사용함으로써 의료 전문직업성 훈련의 개인과 시스템에 대한 관련 문헌 부족에 의해 제기되는 한계를 우회할 수 있다(Pinkus et al. 1995; Pinkus 1999; 2001년 5월, Chidwick et al. 2004; Pape and Manning 2006).
This systematic scoping review, builds upon Li et al. (2017)’s, Wilkinson et al. (2009)’s and Veloski et al. (2005)’s reviews of assessment tools in professionalism. Aside from being the basis for a future systematic review, use of a systematic scoping review circumnavigates limitations posed by a dearth of relevant literature on individual and systems of the training of medical professionalism (Pinkus et al. 1995; Pinkus 1999; May 2001; Chidwick et al. 2004; Pape and Manning 2006).

Levac et al. (2010) 의 Arcsey and O'Malley (2005) 의 시스템 스캔 프레임워크가 사용되었습니다. 이를 통해 "연구 영역과 주요 원천과 증거의 종류"를 검색하고, 주제 내에 존재하는 문헌의 프로파일을 만들어서 풍부한 데이터베이스를 구축하였고, 이것이 실천과 후속 연구를 가이드할 수 있는 토대가 되었다. PRISMA-P 2015 체크리스트와 결합하여 Levac et al (2010)의 Arcsey and O'Malley (2005)의 시스템 리뷰를 위한 프레임워크는 6-stage systematic review Protocol의 포워딩으로 확장된다.

Levac et al. (2010)’s adaptation to Arksey and O'Malley (2005)’s framework for systematic scoping review was used to map the key concepts underpinning a research area and the main sources and types of evidence available” (Mays et al. 2001) and “produce a profile of the existing literature in a topic area, creating a rich database of literature that can serve as a foundation” to inform practice and guide further research (Grant and Booth 2009; Daudt et al. 2013; Pham et al. 2014). Combined with the PRISMA-P 2015 checklist (Osama et al. 2018), Levac et al. (2010)’s adaptation to Arksey and O'Malley (2005)’s framework for systematic scoping review allowed the forwarding of a 6-stage systematic review protocol (Mays et al. 2001; Arksey and O'Malley 2005; Grant and Booth 2009; Levac et al. 2010; Thomas et al. 2014; Lorenzetti and Powelson 2015).

프레임워크의 첫 번째 단계에서는 전문가 팀이 연구 질문을 결정하도록 지도했다. 이러한 질문은 PICOS 형식(표 1)을 사용하여 포함 및 배제 기준의 인구, 개념 및 맥락 요소에 대해 설계되었다(Peters et al. 2015).
In the first stage of the framework the expert team guided the research team in determining the research questions. These questions were designed on the population, concept and context elements of the inclusion and exclusion criteria (Peters et al. 2015), using a PICOS format (Table 1).

전문가 팀의 안내와 의료 전문성에 대한 지배적인 정의와 설명에 따라 연구팀은 PubMed(부록 A), Embase, PsycINFO, ERIC, Cochrane Database of Systematic Reviews 및 Scopus 데이터베이스에 대한 검색 전략을 개발했다. 실행 가능하고 지속 가능한 연구 프로세스를 보장하고 지배적인 인력 및 시간 제약을 수용하려는 Pham 등(2014)의 접근 방식에 따라 연구팀은 1990년 1월 1일과 2019년 12월 31일 사이에 발표된 기사로 초점을 제한했다. 영어로 출판되거나 영어로 번역된 논문의 모든 연구 방법론(양적 및 질적)이 포함되었다. 2019년 2월 14일부터 2019년 4월 24일까지, 2019년 10월 18일부터 2020년 1월 17일까지 각각 단독 수색을 실시했다. 

Guided by the expert team and prevailing definitions and descriptions of medical professionalism, the research team developed a search strategy for PubMed (Supplementary Appendix A), Embase, PsycINFO, ERIC, Cochrane Database of Systematic Reviews and Scopus databases. In keeping with Pham et al. (2014)’s approach of ensuring a viable and sustainable research process and to accommodate to prevailing manpower and time constraints the research team confined their focus to articles published between 1 January 1990 and 31 December 2019. All research methodologies (quantitative and qualitative) in articles published in English or had English translations were included. The independent searches were carried out between 14 February 2019 and 24 April 2019 and again between 18 October 2019 and 17 January 2020.

3단계에서는 PICOS에서 정한 심사기준을 이용하여 식별된 제목과 초록을 독자적으로 심사하고, 온라인에 포함될 개별 기사목록을 논의한 후 최종 검토 대상 기사목록에 합의했다. Sandelowski와 Barroso(2006)의 '협상된 합의 검증' 접근 방식을 사용하여 분석할 전체 텍스트 기사의 최종 목록에 대한 합의를 도출했다.
In the third stage, the research team independently screened the identified title and abstracts using the screening criteria set out in the PICOS, discussed their individual lists of articles to be included online and agreed on the final list of articles to be reviewed. Sandelowski and Barroso (2006)’s ‘negotiated consensual validation’ approach was used to achieve consensus on the final list of full text articles to be analysed.

선험적a priori 프레임워크가 없었기에, 포함된 기사에서 공통적인 주제를 식별하였고, [의대생들의 다양한 목표와 모집단 및 의대생들의 존재]에 의해 제기되는 한계, [전문직업성이 맥락-특이적이고 사회문화적으로 영향]을 받는 한계를 우회하기 위해 브라운과 클라크(2006)의 주제 분석에 대한 접근법이 채택되었다.  또한 이 접근방식은 통계적 풀링의 사용을 방지하며, 포함된 기사의 분석을 방지하는 광범위한 연구 방법론을 더 잘 설명한다. 브라운과 클라크(2006)의 접근방식은 다음과 같다.
In the absence of a priori framework, Braun and Clarke (2006)’s approach to thematic analysis was adopted to identify common themes across the included articles and circumnavigate the limitations posed by the presence of different goals and populations of medical students as well as the context-specific, socio-culturally influenced nature of medical professionalism (Van Der Vleuten and Schuwirth 2005; Braun and Clarke 2006; Goldie 2013; Birden et al. 2014; Li et al. 2017; Norcini et al. 2018; Patterson et al. 2018; Hodges et al. 2019). This approach also better accounts for the wide range of research methodologies present that prevent use of statistical pooling and analysis of the included articles (Haig and Dozier 2003a, 2003b; Braun and Clarke 2006; Riquelme et al. 2009; Schönrock-Adema et al. 2009; Soemantri et al. 2010; Gordon and Gibbs 2014). The phases of Braun and Clarke (2006)’s approach are detailed below

  1. 연구팀 구성원 11명이 포함된 기사를 '적극적으로' 읽어 자료에서 의미와 패턴을 찾는 등 반복적인 단계별 주제분석을 진행했다.
  2. An iterative step-by-step thematic analysis was carried out with 11 members of the research team ‘actively’ reading the included articles to find meaning and patterns in the data.
  3. 연구팀의 각 구성원은 텍스트의 '표면' 의미로부터 '코드'를 구성했다. 그런 다음 '오픈 코딩'의 초기 코드를 유사성에 따라 범주로 분류했다.
  4. Each member of the research team constructed ‘codes’ from the ‘surface’ meaning of the text (Boyatzis 1998; Braun and Clarke 2006; Voloch et al. 2007; Sawatsky et al. 2016). The initial codes from ‘open coding’ were then grouped into categories according to their similarities.
  5. 그런 다음 범주를 데이터를 가장 잘 나타내는 테마로 구성했다. 마인드 맵은 다양한 코드 간의 연결을 설명하고 주제를 설명하는 데 사용되었다. [귀납적 접근]은 테마를 "사전 결정된 분류 없이 원시 데이터에서 정의"할 수 있게 했다(Cassol et al. 2018). 브라운과 클라크(2006)는 테마를 "데이터에 대한 중요한 것… 그리고 데이터 집합 내의 패턴화된 반응이나 의미를 나타낸다"고 설명한다.
  6. The categories were then organised into themes that best represent the data. Mind maps were used to illustrate the links between the various codes and to help delineate themes. An inductive approach allowed themes to be “defined from the raw data without any predetermined classification” (Cassol et al. 2018). Braun and Clarke (2006) describe themes as something important about the data… and represents some level of patterned response or meaning within the data set”.
  7. 연구팀의 각 구성원은 테마가 일관적이고 전체 데이터 세트를 대표하는지 확인하기 위해 테마를 검토하고 다듬었다.
  8. Each member of the research team reviewed and refined their themes to ensure they were coherent and representative of the whole data set.
  9. 연구팀의 각 구성원들은 각각의 테마의 구체적인 특징들을 명명하고 설명하기 위해 독립적으로 일했다. 그런 다음 그들은 '협상된 합의된 검증' 접근 방식을 사용하여 공통 코딩 프레임워크와 코드북에 합의하기 위해 온라인과 대면 회의에서 개별 발견에 대해 논의했다(산델로스키와 바로소 2006). 코드북은 코드, 서브테마, 정의, 용어에 대한 설명, 적용 시기와 적용 안 함에 대한 지침으로 구성됐다. 이 회의들은 11명의 회원 모두가 같은 10, 30, 50개의 전문 기사를 검토한 후 3개의 시점에서 진행되었다.
  10. Each member of the research team worked independently to name and delineate specific characteristics of each theme. They then discussed their individual findings online and at face-to-face meetings to agree upon a common coding framework and code book using the ‘negotiated consensual validation’ approach (Sandelowski and Barroso 2006). The code book consisted of the codes, sub-themes, definitions, descriptions of terms and guidelines on when to use and when not to apply. These meetings were carried out at three junctures- after all 11 members had reviewed the same 10, 30 and 50 full text articles.
  11. 브라운과 클라크의 접근법 6단계(2006)의 일환으로, 역 교육자, 임상의사, 임상 환경에서 의료 전문성 교육 및 평가에 경험이 있는 연구자(자문팀)와 전문가 팀과 논의하는 동안 확인된 테마가 Birden 외(2013)의 "BEME 가이드 No.25: 의료 교육에서의 전문성 교육"에서 제안된 범주 및 Wilkinson 외(2009) 및 Veloski의 전문성 평가 도구 검토와 일치한다고 제안했다. 자문 및 전문가 팀은 데이터를 독립적으로 평가하고, 일반적인 이론에 깊이를 더하고, 식별된 주제를 검증하는 데 도움을 주기 위해 [지시된 내용 분석]을 사용해야 한다는 데 동의했다(Hsieh and Shannon 2005; Humble 2009).
  12. During discussions with local educationalists, clinicians and researchers who are experienced in medical professionalism teaching and assessment in clinical settings (advisory team) as well as the expert team as part of the sixth stage of Braun and Clarke (2006)’s approach, it was suggested that as the themes identified were consistent with the categories highlighted by Birden et al. (2013)’s “BEME Guide no.25: Teaching professionalism in medical education” and Wilkinson et al. (2009)’s and Veloski et al. (2005)’s reviews of assessment tools in professionalism. The advisory and expert teams were in agreement that directed content analysis ought to be used to independently evaluate the data, add depth to prevailing theories and would help verify the themes identified (Hsieh and Shannon 2005; Humble 2009).

브라운과 클라크의 주제 분석에 대한 접근 방식(2006)을 이용한 데이터 분석에 관여하지 않은 두 명의 독립 검토자가 [지시된 내용 분석]을 수행했다(Hsieh와 Shannon 2005). 지시적 내용 분석의 3단계는 다음과 같습니다.
Two independent reviewers not involved in the analysis of the data using Braun and Clarke’s approach to thematic analysis (2006) carried out directed content analysis (Hsieh and Shannon 2005). The 3 phases of directed content analysis are as follows.

  1. 첫 번째 단계연역 범주 적용(Elo and Kyngäs 2008)을 사용하여, 검토자가 버거 외(2019), 린치 외(2004), 버든 외(2013)의 BEME 가이드 No.25 및 Wilkinson 외 (2009) 및 벨로스키 외 연구진(2005)의 전문성 평가 도구 리뷰에 의해 제시된 훈련 전문성의 핵심 요소 설명에 기초하여 [코드를 독립적으로 결정]한다. 각 코드는 [코드북]에 정의되었으며, 이후 코딩 과정을 안내하는 역할을 했다.
  2. [2단계]에서는 두 검토자가 '코드북'을 사용하여 포함된 문서에서 관련 데이터를 독립적으로 추출하고 코드화하는 것을 보았다. 이러한 코드에 의해 포착되지 않은 관련 데이터는 연역 범주 적용에 따라 새로운 코드가 할당되었다. 포함된 10개의 기사에 대한 독립적인 검토 후, 검토자들은 온라인에서 그들의 발견을 논의했고, 코드와 코드북의 합의를 얻기 위해 '협상된 합의 검증'을 이용했다.
  3. 코드로부터 4개의 범주가 도출되었다. 이러한 범주(닐 외 2018)는 검토된 기사의 70% 이상(Curtis et al. 2001; Humble 2009)에 나타났는지 여부에 따라 선정되었다. 
  4. Using deductive category application (Elo and Kyngäs 2008), the first stage (Mayring 2000) saw the reviewers independently determine the codes based on descriptions of key elements of training professionalism set out by Berger et al. (2019), Lynch et al. (2004), Birden et al. (2013)’s BEME Guide no.25: Teaching professionalism in medical education and Wilkinson et al. (2009)’s and Veloski et al. (2005)’s reviews of assessment tools in professionalism. Each code was defined in the code book that then served to guide the subsequent coding process.
  5. Stage 2 saw the two reviewers using the ‘code book’ to independently extract and code the relevant data from the included articles. Any relevant data not captured by these codes were assigned a new code in keeping with deductive category application. Following independent review of the same 10 included articles, the reviewers discussed their findings online and ‘negotiated consensual validation’ was used to achieve consensus of the codes and the code book.
  6. From the codes were derived 4 categories. These categories (Neal et al. 2018) were selected based on whether they appeared in more than 70% of the articles reviewed (Curtis et al. 2001; Humble 2009).

[제작된 내러티브]는 BEME(Best Evidence Medical Education) 협업 가이드(Haig and Dozier 2003b)와 STORES(증거 합성의 의료 교육 보고에 대한 체계화된 접근법) 선언문(Gordon and Gibbs 2014)에 의해 안내되었다.

The narrative produced was guided by the Best Evidence Medical Education (BEME) Collaboration guide (Haig and Dozier 2003b) and the STORIES (Structured approach to the Reporting In healthcare education of Evidence Synthesis) statement (Gordon and Gibbs 2014).

품질평가
Quality assessments

연구팀 4명은 의학교육연구품질기구(MERSQI) (Read et al. 2008)와 COREQ (Consolidated Criteria for Report Qualitative Studies) (COREQ) (Tong et al. 2007)를 사용하여 정량적 연구의 개별 평가를 수행하였다.그의 평론 연구 팀은 평가의 차이를 조정하기 위해 대면했다. 품질 평가 요약은 이 체계적 검토에 포함된 기사 목록과 함께 부록 B와 C에 제시되어 있다.
Four members of the research team carried out individual appraisals of quantitative studies using the Medical Education Research Study Quality Instrument (MERSQI) (Reed et al. 2008) and the Consolidated Criteria for Reporting Qualitative Studies (COREQ) (Tong et al. 2007) to evaluate the quality of qualitative and quantitative studies included in this review. The study team met face-to-face to reconcile any differences in their assessments. A summary of the quality assessment together with the list of articles included in this systematic review is founded in Supplementary Appendices B and C.

결과.
Results

6개의 데이터베이스에서 13921개의 추상적인 내용을 확인했고 854개의 전문 기사를 검토했으며 162개의 전문 기사를 체계적으로 검토했다(그림 1: PRISMA 흐름도).

13921 abstracts were identified from six databases, 854 full-text articles reviewed, and 162 full-text articles were thematically analysed in this systematic review (Figure 1: PRISMA Flowchart).

브라운과 클라크(2006)의 접근 방식을 사용한 [주제 분석 결과]와 [지시된 내용 분석]에서 식별된 범주(Hsieh와 Shannon 2005)는 유사했다. 이것들은 1) 전문성의 정의, 2) 영역, 3) 훈련 접근법, 4) 전문성 교육에 대한 장벽과 가능자였습니다.
The results of the thematic analysis using Braun and Clarke’s (2006) approach and the categories identified from directed content analysis (Hsieh and Shannon 2005) were similar. These were 1) definition of professionalism, 2) domains, 3) training approaches, and 4) barriers and enablers to the teaching of professionalism.

전문직업성의 정의
Definition of professionalism

전문직업성의 개념은 여전히 제대로 정의되지 않고 있다. 분석된 162개의 기사에는 58개의 전문직업성 정의와 설명이 있었다. 이러한 정의의 핵심 요소 및 전문성에 대한 설명은 보충 표 1에 주제별로 분석 및 요약되었다.
The concept of professionalism remains poorly defined. There were 58 definitions and or descriptions of professionalism featured in the 162 articles analysed. The key elements of these definitions and or descriptions of professionalism were thematically analysed and summarised in Supplementary Table 1.

Subtheme Elaboration
Abstract concept Comprises of abstract concepts

Is an identity
Influenced by concepts of medicine’s role and place Involves understanding the nature of medicine
 
And underpins the trust in the doctor-patient relationship
 
Knowing the hierarchy and understanding their position in it
Sociocultural informed Varies according to cultural contexts
 
Societal aspects (political, economic and social dimensions)/ interaction with the community
Good clinical practice Having Clinical competence (including clinical judgement, breadth of knowledge, clinical care)
 
Good communication skills
 
Having ethical, moral and legal knowledge and standards
 
Exhibiting teamwork with colleagues

Strong leadership skills

Being sensitive to the needs, beliefs and cultures of others
Driving self-improvement Striving for excellence
 
Having a commitment to the job and learning

Self-assessment, reflection and regulation
Includes a set of virtues Honour and integrity

Accountability and responsibility

Humanism (respect for others, empathy)

Spirituality

Altruism

 

전문 분야
Domains of professionalism

전문직업성의 교육은 표 2에 요약된 임상 역량, 인문학적 자질 및 반사 능력의 세 가지 영역을 포함한다.

Training professionalism involved 3 domains: clinical competence, humanistic qualities and reflective capacity outlined in Table 2.

교육 접근법
Training approaches

전문직업성 육성을 위한 접근방식을 논의할 때, 비공식적이고 숨겨진, 비공식적이고 공식적인 커리큘럼이 교육 접근법에 미치는 영향을 고려하는 것이 유용하다(그림 2).

In discussing approaches to nurturing professionalism it is useful to consider the impact of the informal, hidden, the non-formal and formal curricula upon the training approaches (Figure 2).

 
 
 

접근법 자체는 보충 표 2에 설명되어 있습니다.
The approaches themselves are featured in Supplementary Table 2.

Subtheme Elaboration Reason for Use
Didactic Methods Ceremonies, such as the White Coat Ceremony or a ceremony held prior to dissection. Ceremonies such as the White Coat Ceremony “symbolize the matriculating students’ induction into the medical profession”
Workshops, Lectures, Seminars and Tutorials Such methods appear to be in the minority in favour for methods that encourage active participation from students.
Dialectic Methods Small Group Discussions
 
These require a safe space, such as through a collegial setting.
In preparation for small group discussions, students have an opportunity to reflect on their experiences
 
Additionally, by participating in discussions, students gain “a large bag of tools” to “be able to understand [their] peers better, or [their] patients better”
Role-modelling A role model may be understood as “an individual whose behaviour is admired or imitated by others”.
 
Role models may be assigned by the school as part of a formal mentoring programme.
By demonstrating strong professional attributes, students can understand how such attributes can be adopted into their future practice.
 
Experiential Learning Students are given opportunities to practice professionalism by interacting with patients (real or simulated). These encounters may (or may not) be planned specifically by faculty for the express objective of nurturing professionalism. The key is to integrate theory and practice.
Focused on Reflection Portfolio which is a “a collection of written accounts of events and activities experienced by an individual, kept in the form of a journal.” Reflection should be incorporated into curricula as it allows for the internalisation of attributes taught.
Methods that focus on medical humanities, such as creative writing in response to a prompt.


35개 프로그램은 전문직업성을 가르치기 위한 접근 방식을 조합하여 사용하였다(보완 표 2). 30개의 프로그램은 "서비스 대상 개인과 공동체의 이익을 위한 커뮤니케이션, 지식, 기술 기술, 임상적 추론, 감정, 가치 및 일상적 실천에서의 성찰"과 같은 특정 역량에 대한 교육을 목표로 했다. 반면 다른 이들은 환자 중심 치료 접근법 개발에 초점을 맞췄다(엡스타인 외). 2004) 및 성찰 능력 개선(Elango et al. 2005) (보조 표 2).
35 programmes used a combination of approaches to teach professionalism (Supplementary Table 2). 30 programs targeted training on specific competencies such as “habitual and judicious use of communication, knowledge, technical skills, clinical reasoning, emotions, values, and reflection in daily practice for the benefit of the individual and community being served”(Epstein et al. 2004) whilst others focused upon developing a patient centred approach to care (Epstein et al. 2004) and improving reflective capacity (Elango et al. 2005) (Supplementary Table 2).

일부 프로그램은 몇 년 동안 지속된 종적 접근 방식을 취했다(Branch 2015; Karunakaran et al. 2017). 예를 들어, 프로그램은 "의대생과 함께 2년 이상 동안 매주 - 2회 월별로" 개최될 수 있으며(지점 2015), 5.5년 동안 반년마다 한 번 개최될 수 있다(Kalén et al. 2015).
Some programs took a longitudinal approach that ran over the course of a few years (Branch 2015; Karunakaran et al. 2017). For instance, programmes may be held “weekly to twice monthly for 2 years or longer with medical students”(Branch 2015) or once every half a year for 5.5 years (Kalén et al. 2015).

장벽 및 활성화 요소
Barriers and enablers

장벽은 시스템 수준, 기관 수준, 교수 수준, 개인 수준(표 4)에 존재하는 전문성 교육의 효율성을 저해하는 요인이다. 많은 경우에 이 장벽들은 얽혀있다. 높은 수준의 장벽은 "낙수 효과"를 가지고 있고 낮은 수준의 장벽에 영향을 미친다는 점도 유의하는 것이 유용하다(그림 3).

Barriers are factors that undermine the effectiveness of professionalism training which exist at the system-level, institution-level, faculty-level, individual-level (Table 4). In many instances these barriers are entwined. It is also useful to note that barriers at a higher level have a “trickle-down effect” and affect barriers at a lower level (Figure 3).

 
 
 
 

Enabler전문직업성 훈련의 효과를 촉진하는 요소로 이해될 수 있다. 여기에는 다음이 포함됩니다.

  • 프로그램에 대한 학생들의 적극적인 참여는 매우 중요하다.
  • 학생들에게 전문직업성에 대한 학습 동기를 부여하고, 자기 주도 학습을 강화하며, 전문직업성 훈련에 대한 관심을 전파한다.
  • 그들이 배우고 관찰하는 것의 불일치를 토론할 플랫폼. 이를 통해 교직원과 학생 사이에 신뢰 관계를 구축하여 개방적인 커뮤니케이션과 필요한 경우 후속 교정 작업을 수행할 수 있습니다.
  • 기관과 교수진의 지원은 필수적이다.

Enablers can be understood as factors that promote the effectiveness of professionalism training. These include

  • active student involvement in the programme is crucial (Humphrey et al. 2007; Parker et al. 2008).
  • motivating students about learning about professionalism, enhancing self-directed learning and propagating interest in professionalism training (Humphrey et al. 2007; Parker et al. 2008) (Kenyon and Brown 2007; Monrouxe et al. 2011).
  • a platform to discuss discrepancies in what they learn and observe (Driessen et al. 2003; Rabow et al. 2007; Wald et al. 2009; Monrouxe et al. 2011). This builds trust between faculty and students to allow for open communication and subsequent remediation if needed (Driessen et al. 2003; Rabow et al. 2007; Wald et al. 2009; Monrouxe et al. 2011).
  • support from institutions and faculty is vital (Shapiro and Rucker 2003; Elango et al. 2005; Du Preez et al. 2007; Goldie et al. 2007; Humphrey et al. 2007; Kalet et al. 2007; Kenyon and Brown 2007; Parker et al. 2008; Jayasuriya-Illesinghe et al. 2016).

품질평가
Quality assessments

본 연구에 포함된 논문은 합리적인 품질이었다(부록 C). 이것은 연구의 타당성을 뒷받침한다.
The papers included in this study were of reasonable quality (Supplementary Appendix C). This supports the validity of the study.

논의
Discussion

[지시된 내용 분석]과 브라운과 클라크의 [주제 분석]에 대한 접근 방식을 동시에 사용하는 것은 참신하며, 식별된 범주를 검증하는 역할을 한다. 데이터를 분석하기 위해 두 가지 독립적인 접근 방식을 사용하면 방법적 삼각측량(Asarroudi et al. 2018)을 제공할 수 있으며, 각 검토자는 동일한 데이터를 독립적으로 분석하도록 하여 연구자 삼각측량을 하였다(Davey et al. 2015). 삼각측정은 또한 외부 타당성을 향상시키고 이 접근 방식 내의 객관성을 향상시킨다(Hsieh 및 Shannon 2005).
Concurrent use of directed content analysis (Hsieh and Shannon 2005) and Braun and Clarke’s approach to thematic analysis is novel and does serve to validate the categories identified. Use of two independent approaches to analyse the data also provides method triangulation (Assarroudi et al. 2018) whilst having each reviewer independently analyse the same data provides investigator triangulation (Davey et al. 2015). Triangulation also enhances external validity and improves the objectivity within this approach (Hsieh and Shannon 2005).

주요 연구 질문에 답하기 위해, 전문직업성[전문적 정체성 형성]에 영향을 미치는, [임상 역량, 인문학적 자질, 성찰 능력, 자기 관리 및 자기 인식]에 기반을 둔, 사회문화적으로 영향을 받은, 윤리적으로 민감한 개념으로 스케치할 때, 이 체계적 범위 검토는 앞서 기술된 것보다 더 넓은 전문직업성 개념을 제안합니다. 이러한 관점은 싱가포르의 전문직업성 개념 내의 요소들과 특히 관련이 있다. 예를 들어, 자율성의 '전통적인' 원자론적 개념보다는 임상 치료에서 지배적인 가족 중심적 서술에 민감하다. 이러한 [사회문화적 정보]는 의사 소통, 전문가 간 상호작용, 임상의 역할에 대한 관점, 따라서 싱가포르, 말레이시아, 중국, 일본 및 한국에서 전문성을 바라보는 방식에 영향을 미친다.
In answering its primary research question and sketching professionalism as a socioculturally influenced, ethically sensitive concept built upon clinical competence, humanistic qualities, reflective capacity, self-care and self-awareness that influences professional identity formation this systematic scoping review suggests a wider concept of professionalism than previously described (Cruess and Cruess 2008; Cruess et al. 2016). This perspective is especially relevant with elements within concepts of professionalism in Singapore, for example, being sensitive to the dominant family centric narrative in clinical care rather than ‘traditional’ atomistic concepts of autonomy (Krishna 2014; Krishna et al. 2014; Krishna and Kwek 2015; Radha Krishna and Alsuwaigh 2015). This socioculturally informed practice impacts communication, interprofessional interactions, views on the role of the clinician and thus the manner that professionalism is viewed in Singapore, Malaysia, China, Japan and Korea (Ho et al. 2013; Chai et al. 2014; Chong et al. 2015; Loh et al. 2016; Chang et al. 2017).

[전문적 정체성 형성]은 또한 의대생들 사이에서 전문성을 기르려는 노력에서 더 큰 역할을 부여받지만, 그 정확한 영향은 추가적인 설명이 필요하다(보완표 1). 이는 시간이 지남에 따라, 전문직업성에 대한 평가에 [학습자 개인적 특질personhood이라든가 '나를 나로 만드는 것'에 대한 학습자의 관점]이 동반되어야 한다는 것을 암시한다. 이러한 변화를 보다 효과적으로 그리고 개인 차원에서 지원하는 것은 전문직업성 발달에 대한 교육 및 감독을 더 잘 할 수 있게 할 것이다.

Professional identity formation is also afforded a greater role in efforts to nurture professionalism amongst medical students though its precise impact requires further elucidation (Cruess RL and Cruess SR 1997; Cruess SR and Cruess RL 1997; Inui 2003; Cruess and Cruess 2008; Cruess et al. 2016) (Supplementary Table 1). This suggests evaluations of the professionalism of an individual learner overtime should also be accompanied by they view their personhood or “what makes you, you’ (Krishna 2013; Alsuwaigh and Krishna 2014; Krishna 2014; Alsuwaigh and Krishna 2015; Krishna and Kwek 2015). Supporting these changes more effectively and on an individual level will allow better inculcation and oversight of the development of professionalism.

전반적으로 이러한 연구 결과는 다음과 같이 전문직업성이 길러져야 한다는 것을 시사한다.
Overall these findings suggest that professionalism should be nurtured as

  • I. 구조화된 커리큘럼의 일부분으로
    • 이를 통해 일반적인 지리정치적, 사회문화적 요소와 일치하는 적절한 임상 실무 규범와 관련 전문적 관리 표준이 교육 과정에 적절히 반영되도록 보장할 수 있다.
    • 전문직의 주요 특성(보완표 1)을 교육하고, 역할 모델링하고, 평가하고, 기준을 준수하도록 보장합니다.
    • 안전한 환경과 적절한 시점에 이러한 기술의 연습을 촉진하는 것은 학습과 가치, 신념과 실천을 포함하는데 도움이 될 것이다. 
    • 프로세스에 대한 감독 및 학습자의 지원을 강화합니다.
    • 전문직업성과 관련하여 사고, 실천 및 태도에 영향을 미치는 비공식, 숨겨진, 공식 커리큘럼(그림 2)의 영향을 더 잘 다루고 평가한다.
  1. I. part of a structured curriculum.
    • This will ensure appropriate clinical codes of practice and relevant professional standards of care consistent with prevailing geo-political and sociocultural factors are appropriately inculcated into the training process.
    • Ensures that the key characteristics of a professional (Supplementary Table 1) are taught, role modelled, assessed and standards are policed.
    • facilitate practice of these skills in safe environments and at appropriate junctures will help embed learning and values, beliefs and practice.
    • enhance oversight of the process and support of the learners.
    • better address and assess the impact of the informal, hidden and formal curriculum (Figure 2) that influence thinking, practice and attitudes with regards to professionalism.
  2. II. 단계적으로. (그림 4와 같이) 프로페셔널리즘은 단계별로 발전하며, 각 단계는 다른 단계 위에 구축된다.
    1. 구조화된 접근 방식은 각 개발 단계에서 학습자와 관련된 방식으로 전문직업성을 배양할 수 있도록 한다.
      1. 1단계. 지식 주입
  3. II. in stages (as shown in Figure 4). Professionalism develops in stages, with each stage building upon the other.
    • A structured approach allows professionalism to be nurtured in a manner that is relevant to the learner at each stage of their development.
      • Stage 1. Instilling knowledge
 
 

전문직업성 육성은 수평적, 수직적 통합이 필요하다. 이 단계는 다음에 대한 지식을 주입하기 위한 교육적 프로그램으로 시작한다.

  • 전문직업성의 다양한 차원들,
  • 전문직업적 실천의 중요성,
  • 의료 전문가의 역할과 책임 
  • 여기에 필요한 기술

Nurturing professionalism needs to be horizontally and vertically integrated. This stage begins with didactic programs to instil knowledge about

  • the various dimensions of professionalism,
  • the importance of professional practice,
  • the roles and responsibilities of a medical professional and
  • the skills required.

[의대 신입생]의 경우 [의대생으로서의 전문적 역할]을 중심으로 전문직업성 소개가 이뤄진다. 이러한 역할은 전문 단체와 가능한 경우 [기관의 명예 규범]에 의해 규정된다. 이 문서들은 학생의 행동과 책임에 대한 기대치를 제시한다. 기대치를 설정하고 조정하는 것과는 별개로, 전문성과 전문적 행위에 대한 '핵심' 또는 필수적인 지식의 제공은 전문적 실천과 정체성 형성의 기초를 형성한다.
For new medical students, the introduction to professionalism revolves around their professional roles as medical students. These roles are set out by the professional bodies and where possible, the honour code of the institution. These documents lays out the expectations upon the student’s conduct and responsibilities. Aside from setting out and aligning expectations, provision of ‘core’ or essential knowledge of professionalism and professional conduct forms the basis for professional practice and identity formation.

  • 2단계. 전문적인 아이덴티티 수용
  • Stage 2. Embracing a professional identity

전문적 정체성 형성 단계 2에서 전문직업성의 역할을 반복하는 것은 [사례 기반 토론]과 [새로운 책임을 상징하기 위한 "화이트 코트" 세리머니와 같은 공식적인 행사]의 조합을 포함한다.

Reiterating professionalism’s role in professional identity formation Stage 2 involves a combination of case based discussions and formal events such the “white coat” ceremony to symbolise the new responsibilities.

  • 전문직업성 교육과정의 지식과 기술 구성요소의 [수직적 통합]은 주입되는 전문성의 새로운 요소들이 널리 퍼진 지식과 학생들이 그것의 관련성을 즉시 인식할 수 있는 교육의 배경 위에 구축되도록 하는 수평적 통합이 수반될 것이다.
  • Vertical integration of the knowledge and skills components of the professionalism curriculum will be accompanied by horizontal integration ensuring that new elements of professionalism being instilled build upon prevailing knowledge and a background of teaching where students can immediately appreciate its relevance.

 

  • 3단계. 전문직업성 개념의 맥락화
  • Stage 3. Contextualising the concept of professionalism

[소규모 그룹 토론]은 또한 학습 과정을 [맥락적으로 이해]하는 데 도움이 될 것이다. 이를 통해 학생들은 전문적인 특성, 기대, 사회적 의미 및 기술의 목적과 장소를 볼 수 있다. 이것은 또한 훈련의 초기 단계에서 흡수된 지식, 기술 및 태도를 통합하는 데 도움이 됩니다.
Small groups discussions will also help contextualise the learning process. This allows students to see the purpose and place of professional characteristics, expectations, social implications and skills. This also helps integrate the knowledge, skills and attitudes imbibed in earlier stages of training.

  • 4단계. 역할 모델링
  • Stage 4. Role modelling

[역할 모델링]은 학습 과정 전반에 걸쳐 발생하며 [능동적이고 의식적으로 수행되어야] 합니다. 여기서 1단계와 2단계에서 학습한 우수한 전문적 행동과 실습에 대한 지식은 학생들이 "긍정적인 역할 모델링과 부정적인 역할 모델링을 구별하는 데 도움이 된다"(Karnieli-Miller et al. 2013).

Role modelling occurs throughout the learning process and must be actively and consciously carried out. Here knowledge of good professional conduct and practice learned in Stages 1 and 2 helps students “[discern] between positive and negative role modelling” (Karnieli-Miller et al. 2013).

  • 5단계. 커뮤니케이션을 통한 전문직업성
  • Stage 5. Professionalism through communications

이 단계는 학생들이 의사 소통과 임상 환경에서 [모의 환자] 및 [의료 전문가와의 시뮬레이션]을 사용하여 전문가 간 기술을 개발하는 것을 보여줍니다. 여기서는 문화적 감수성뿐만 아니라 임상적 역량, 인문학적 자질과 성찰 능력이 일제히 실천된다.
This stage sees students practicing professionalism in communication and in the clinical setting using simulations with simulated patients and healthcare professionals to develop interprofessional skills. Here clinical competence, humanistic qualities and reflective capacity as well as cultural sensitivity are practiced in unison.

  • 6단계. 프로페셔널리즘을 표현
  • Stage 6. Portraying professionalism


6단계에서는 의대생들이 [환자 및 그들의 가족들]과 상호작용을 시작하는 것을 본다. 이러한 상호작용은 평가되고, 안전한 환경에서 적시에 피드백이 제공된다.
Stage 6 sees medical students begin interactions with patients and their families. These interactions are assessed and timely feedback provided in a safe environment.

  • 7단계. 전문적 특성 심화
  • Stage 7. Deepening professional traits

여기에는 성찰, 보고 및 피드백이 포함됩니다. 이 '단계'는 학습을 강화하기 위해 모든 초기 단계와 평행하게 진행되어야 한다. 성찰적 실천에는 효과적이고, 개인화되고, 적절하고, 구체적이고, 시기적절하며, 전체적인 피드백과 지원이 수반되어야 한다.

This involves reflections, debriefs and feedback. This ‘stage’ ought to run parallel with all the earlier stages to enhance learning. Reflective practice must be accompanied by effective, personalised, appropriate, specific, timely, holistic feedback and support.

  • III. 종단적으로. 인문학적 특징과 성찰적 실천의 주입은 의대생의 전문직업적 정체성의 발전과 실천의 변화를 지원하기 위한 [종단적 지원과 평가의 필요성]을 강조한다. 교육 과정 전반에 걸쳐 일관성, 수평 및 수직 통합 및 지원을 보장하는 구조화된 접근 방식을 유지하는 것 외에도, 종단적 접근 방식은 교육 과정의 모든 요소에 대한 지속적인 평가를 위한 효과적인 플랫폼을 제공한다.
  • III. longitudinally. The inculcation of humanistic features and reflective practice underlines the need for longitudinal support and assessment to support changes in practice and development of the medical student’s professional identity. Aside from maintaining a structured approach that ensures consistency, horizontal and vertical integration, and support throughout the training process, a longitudinal approach provides an effective platform for continuous assessments of all elements of the training process.
  • IV. 역량 기반 프로세스(Stockley and Forbes 2014; Ziring et al. 2015). 평가는 명확한 이정표를 통해 통보되어야 한다. 역량 기반 프로세스는 "예측할 수 없는 상황을 탐색할 수 있는 내면의 나침반"을 개발하고 "체크리스트 채우기"에 대한 의존을 방지하는 수단으로 간주됩니다. 역량 기반 프로세스는 다음과 같은 특성이 있다.
  • IV. competency based process (Stockley and Forbes 2014; Ziring et al. 2015). Assessments must be informed by clearly delineated milestones. A competency based process is seen as a means of developing an “inner compass in preparation for navigating unforeseeable circumstances” (Baker et al. 2011) and prevent reliance upon “fulfilling checklists” (Stockley and Forbes 2014). A competency based process
    • 널리 퍼진prevailing 지식과 기술을 기반으로 합니다. 이는 교육 과정 전과 과정 중에 능력, 지식 및 기술에 대한 효과적인 평가를 의미합니다. 여기서 데이터는 다루는 주제들이 서로 기반해야 한다는 것을 보여준다. 여기에는 임상 기술 개발, 작업 관리, 전문가 간 관계 관리, 사회와 법률 및 전문 및 임상 기준의 관점에서 그들의 진화하는 역할 이해 및 사회에서의 전문가의 위치 파악이 포함된다. 이러한 주제들은 새로운 학습을 알리는 모든 단계에서 혼합될 수 있다.
    • builds on prevailing knowledge and skills. This means effective evaluation of ability, knowledge and skills before and during the training process. Here the data reveals that the topics covered should build on one another. This includes development of clinical skills, work management, managing interprofessional relationships, understanding their evolving roles in society and in the eyes of the law and professional and clinical standards and appreciation of the professional’s place in society. These topics may be mixed at all stages informing new learning.
    • 효과적으로 평가되어야 한다. 각 단계별로 전문성에 대한 구체적인 평가가 요구된다. 이러한 도구는 숨겨진 공식 커리큘럼의 영향을 고려해야 하며 예측 타당성과 함께 적응 가능하고 신뢰할 수 있어야 합니다. 그러나 일반적인 평가 도구에 대한 데이터는 거의 없다.
    • must be effectively assessed. Specific assessments of professionalism at each stage is required. These tools must consider the impact of the hidden and formal curricula and be adaptable and authentic with predictive validity. There is however little data on prevailing assessment tools.
    • 포트폴리오 기반 종단 교육 프로그램의 일부가 되어야 합니다. 훈련의 종적 성격과 전문 기술, 전문성 평가의 개선을 위한 지속적인 의료 교육 및 동기의 필요성은 전체론적holistic이고, 임상 영역 내에 있어야 한다(Birden et al. 2013). 이 접근 방식은 효과적이고 시기적절한 평가와 일관된 피드백에 의존하여 "학습된 기술을 성숙시키고 반영하고 발전시킬" 수 있는 구체적인 지침과 기회를 적시에 제공합니다(Stockley and Forbes 2014). 현재 평가 방법은 다양하나, 제대로 평가된 바 없다.
    • ought to be part of a portfolio based longitudinal training program. The longitudinal nature of training and the need for continued medical education and motivation to improve on professional skills, assessments of professionalism must be holistic and within the clinical arena (Birden et al. 2013). This approach relies on effective and timely assessments and consistent feedback to provide timely specific guidance (Elango et al. 2005; Chretien et al. 2008) and opportunities to “mature, reflect and build upon skills learned” (Stockley and Forbes 2014). Currently, assessment methods have been varied and poorly evaluated.
    • 학생의 능력, 태도, 지식 및 기술에 따라 [개인화된personalized 프로세스]이므로, 프로그램에 대한 적응을 지원하는 [개인화된individualized 프로세스]여야 합니다(Birden et al. 2013). 이는 필요한 경우 재교육을 주입할 수 있는 가능성을 높인다(Parker et al. 2008).
    • be a personalised process dependent upon the abilities, attitude, knowledge and skills of the student and thus must be an individualised process that supports adaptations to the program (Birden et al. 2013). It also raises the potential to inculcate remediation where needed (Parker et al. 2008).

[일반적인 정의(부록 D)]와 [전문직업성이 길러지는 방법에 대한 일반적인 설명]을 통해 임상적으로 관련된 전문직업성 개념을 전달할 수 있습니다. 여기서 전문직업성은 다음과 같이 개념화될 수 있다."[사회문화적 요인]과 [사회 내에서 의학과 의학의 정체성의 역할에 대한 지배적인 의철학]에 의해 정의되는 진화하는 개념으로, 다음의 것들을 함양하는 과정에서 [역량-기반 단계]로 개발된다.
Drawing from prevailing definitions (Supplementary Appendix D) and prevailing accounts of how professionalism is nurtured allows the forwarding of a clinically relevant concept of professionalism. Here professionalism may be conceived as an evolving concept defined by sociocultural factors and prevailing medical philosophy on the role of medicine and medicine’s identity within a society and developed in competency based stages that include the inculcation of

  1. 의사가 지속적으로 개발하고 추가하고자 하는 [핵심 속성 및 덕목]. 여기에는 자기계발, 좋은 임상진료에 대한 헌신, 임상역량 향상, 리더십 및 지속적 학습, 자기평가, 자기성찰 및 자기조절, 그리고 사회문화적 정보에 기반하며, 윤리적으로 적절하며, 도덕적으로 민감한 돌봄에 대한 관점
  2. 성별, 나이, 문화, 인종, 종교, 장애, 출신, 사회경제적 지위 및 성적 지향에 [관계없이 돌봄의 의무, 공공의 이익을 증진하는 것]을 포함한 [핵심 가치].
  3. 돌봄에 대한 [전문직의 조화]와 동료 전문가와의 효과적이고 [동료적collegial 협력]을 보장하는 책임.
  4. 명예와 성실, 책임과 책임, 휴머니즘, 영성과 이타성을 포함한 전문가의 [덕목]"
  5. core attributes and virtues that physicians seek to continue to develop and add to such as self-improvement, commitment to good clinical care, enhancing clinical competence, leadership and continuous learning, self-assessment, self-reflection and self-regulation and to developing a socioculturally informed, ethically appropriate, morally sensitive perspective to care.
  6. core values including an obligation to care, promote public good irrespective of gender, age, culture, race, religion, disabilities, national origin, socioeconomic status, and sexual orientation that is consistent with prevailing standards of care and conduct.
  7. a responsibility to ensure professional coordination of care and effective and collegial cooperation with fellow professionals.
  8. virtues of a professional including honour and integrity, accountability and responsibility, humanism, spirituality and altruism.”

이 개념은 의학 분야에서 전문적 정체성 형성의 중요성, 그리고 활기차고 훈련된 역할 모델 및 교육자가 전문성의 핵심 가치, 신념 및 원칙을 가르치고 학생들이 안전하고 구조화된 임상 공간에서 이러한 기술을 연마하도록 감독하는 것을 강조한다. 동시에 이 개념은 사회문화적, 지정학적 고려사항의 차이뿐만 아니라 프로그램의 목표와 학습자의 능력을 지적하면서 지배적인 정의의 이질성에 대한 근거를 설명한다.

This concept underscores the importance of professional identity formation, the critical role of emersion in the field of medicine and having vibrant, trained role models and educators instil the key values, beliefs and principles of professionalism and oversee students hone these skills in a safe and structured clinical space. Concurrently this concept explicates the rationale for heterogeneity in prevailing definitions, pointing to differences in sociocultural and geopolitical considerations as well as the goals of the program and abilities of the learners.

검토의 한계
Limitations of the review

의료 전문직업성은 추상적인 개념 때문에 명확하지 않다. 그 결과, 리뷰를 영어로 출판되거나 영어로 번역된 기사로 한정하면 주요 논문 누락의 위험이 있습니다. 또한 영어로 출판되거나 영어로 번역된 논문 기사에 초점을 맞추면서 북미와 유럽에서의 연구에 초점을 맞추게 되었다. 이것은 매우 다른 문화적 환경에서 의료 행위가 일어날 수 있는 다른 나라들에서 결과의 적용 가능성을 감소시킨다.
Medical professionalism is ill-defined due to its abstract (Gauger et al. 2005; Lesser et al. 2010; Pryor 2010; Monrouxe et al. 2011; Bennett et al. 2013; Bernabeo et al. 2014; Cuesta-Briand et al. 2014; Ziring et al. 2015), evolving (Gauger et al. 2005; Lesser et al. 2010; Pryor 2010; Monrouxe et al. 2011; Bennett et al. 2013; Bernabeo et al. 2014; Cuesta-Briand et al. 2014; Ziring et al. 2015) and context-dependent nature (Godkin and Savageau 2001; Kochar et al. 2003; Monrouxe et al. 2011; Bernabeo et al. 2014; Saeedi Tehrani et al. 2017). As a result confining our review to articles published in English or had English translations, risks of missing key papers. In addition, focus upon papers articles published in English or had English translations led to focus upon studies in North America and Europe. This diminishes the applicability of results in other countries where medical practice could take place in a vastly different cultural setting.

또한 시간과 인력 제약으로 인해 체계적인 검토는 1990년부터 2019년까지의 논문만 고려했다.
Additionally, due to time and manpower constraints, the systematic review only considered papers from 1990 to 2019.

교육을 포착할 수 있을 정도로 광범위하지만 전문직업성을 육성하는 데 초점을 제한하고 전문직업성에서 지식, 기술 및 태도의 개발을 지원하는 것은 많은 중요한 영역을 생략한 것으로 보인다. 여기에는 튜터 교육 및 평가, 전문가 정체성 형성을 위한 평가 도구 및 교정 평가가 포함됩니다.
Confining focus upon nurturing professionalism though broad enough to capture teaching and supporting the development of knowledge, skills and attitudes in professionalism does appear to have omitted a number of significant domains. These include tutor training and assessment, assessment tools for professional identity formation and evaluations of remediation.

집중 검토는 또한 전문직업성이 특히 젊은 의사의 사고, 의사 결정 및 행동을 지도하는 가치, 신념 및 원칙을 주입할 때 전문적 정체성 형성의 발전과 개인 및 직업적 정체성을 바라보는 방법에 대한 영향을 폭넓게 이해하도록 방해한다.

A focused review also prevents wider appreciation of the development of professional identity formation and its impact on how professionals view their personal and professional identities particularly when professionalism inculcates values, beliefs and principles that guides thinking, decision making and behaviour of young physicians.

결론
Conclusion

이러한 체계적인 범위 검토는 전문직업성이 의대생들의 성격에 대한 관점의 변화에 영향을 받는 전문적 정체성 형성과 밀접하게 얽혀 있음을 시사한다. 결과적으로, 이 체계적인 범위 검토는 전문가 정체성 형성, 인격의 개념, 과정의 진화하는 맥락에 민감한 종적 특성 및 학습 환경에 미치는 영향을 고려하는 효과적인 도구의 설계에 전문성 육성에 대한 향후 연구가 집중되어야 한다는 결론을 내린다. 이러한 관심 영역에 대한 체계적인 검토가 뒤따라야 한다. 이러한 초기 단계를 통해 의과대학에서 전문성을 효과적으로 육성하고 평가할 수 있다.

This systematic scoping review suggests that professionalism is intimately and inextricably entwined with professional identity formation affected by a change in how medical students’ view their personhood. As a result, this systematic scoping review concludes that future research into nurturing professionalism must be focused upon design of effective tools that consider professional identity formation, concepts of personhood, the evolving context sensitive longitudinal nature of the process and the impact upon the learning environment. Systematic reviews of these domains of interest must follow. It is with these initial steps can professionalism be effectively nurtured and assessed in medical schools.

 


Med Teach. 2020 Jun;42(6):636-649. doi: 10.1080/0142159X.2020.1724921. Epub 2020 Feb 17.

Nurturing professionalism in medical schools. A systematic scoping review of training curricula between 1990-2019

Affiliations collapse

Affiliations

1Division of Supportive and Palliative Care, National Cancer Centre Singapore, Singapore, Singapore.

2Yong Loo Lin School of Medicine, National University of Singapore, Singapore, Singapore.

3Medical Library, National University of Singapore Libraries, National University of Singapore, Singapore, Singapore.

4Family Medicine Residency, National University Health System, Singapore, Singapore.

5Palliative Care Institute Liverpool, Academic Palliative and End of Life Care Centre, University of Liverpool, Liverpool, England.

6Education Department, Duke-NUS Graduate Medical School, Singapore, Singapore.

7Centre for Biomedical Ethics, National University of Singapore, Singapore, Singapore.

PMID: 32065016

DOI: 10.1080/0142159X.2020.1724921

Abstract

Introduction: Professionalism is an evolving, socioculturally informed multidimensional construct that influences doctor-patient relationships, patient satisfaction and care outcomes. However, despite its clinical significance there is little consistency in how professionalism is nurtured amongst medical students. To address this gap a systemic scoping review of nurturing professionalism in medical schools, is proposed.Methods: Levac's framework and the PRISMA-P 2015 checklist underpinned a 6-stage systematic review protocol. Concurrent use of Braun and Clarke's approach to thematic analysis and directed content analysis was used to identify the key elements in nurturing professionalism.Results: 13921 abstracts were identified from six databases, 854 full-text articles reviewed, and 162 full-text included articles were included. The 4 themes identified through thematic analysis are consistent with findings of the directed content analysis. These were the definition of professionalism, the approaches, content, barriers and enablers to teaching professionalism.Conclusion: Informed by a viable definition of professionalism and clear milestones nurturing professionalism nurturing professionalism begins with culturally appropriate training in clinical competence, humanistic qualities and reflective capacity. This process requires effective evaluations of professional identity formation, and the impact of the learning environment underlining the need for longitudinal assessments of the training process.

Keywords: Medical professionalism; medical education; medical students; professionalism training.

판도라의 상자 열기: 누가 프로페셔널리즘을 소유하고 있으며, 21세기 정의가 필요한 시점인가? (Med Educ, 2022)
Re-opening Pandora's box: Who owns professionalism and is it time for a 21st century definition?
Viktoria C. T. Goddard | Susannah Brockbank

 

1 소개
1 INTRODUCTION

"프로페셔널리즘은 성공적인 이데올로기이며,
따라서 지위와 소득을 위해 경쟁하는 광범위한 직업 집단의 정치적 어휘로 들어갔다." (추가됨)

“[P]rofessionalism is a successful ideology and as such has entered the political vocabulary of a wide range of occupational groups who compete for status and income”.1 (emphasis added)


의료 종사자로서 졸업하는 것은 새로운 전문직업적 정체성의 개발, 즉 그러한 정체성을 얻음으로써 획득되는 지위status와 특권 때문에 정확히 중요한 개념이다. 의료 전문직으로 졸업하는 젊은이들이 직면하는 도전은, 이러한 정체성에는 일군의 기대치가 따라온다는 것이다. 관련 규제 기관을 대표하여, 사회를 대표하여 시행enforced된다. 바로 전문직업성이다.
"전문직업성"은 의료 교육 및 모든 의료 학생의 삶에서 지배적인 개념이다.

Graduating as a health-care practitioner involves the development of a new professional identity,1 a concept that matters precisely because of the status and privilege that is acquired with gaining such an identity.2 The challenge that befalls the (often) young people graduating into the health-care professions is that with this identity comes a set of expectations, observed by their educational establishments, on behalf of the relevant regulatory bodies, enforced on behalf of society: professionalism. “Professionalism” then is a dominant concept in health-care education and in the life of any health-care student.

몇 년 전부터 의료 전문직업성과 정체성 개발 분야에서 연구·출판해 왔지만, 여전히 이 분야에서는 상대적으로 신인이라는 느낌이 든다. 전문직업성에 관한 도전에 대해 글로벌 동료들과 논의하는 과정에서 우리가 공유한 반성은 이 분야에서 우리만 있는 것이 아니라는 것이다. 전문직업성을 이해하고 정의하기 위해, 우리는 모두 보건 전문가들 사이에서 공인된 일련의 저자들을 이용한다. 이 규약 자체는 대개 의학을 기반으로 한다. 특히, 법률가과 성직자와 함께 최초로 정의된 전문직 중 하나로서, 다른 의료 직업에서 전문성을 배치하는 것과 관련된 작업이 부족하지는 않지만, 보다 새롭게 "전문직화된" 보건의료 관련직보다, 의료전문직 분야에서 전문직업성의 개념을 논의하는 시간이 더 길었다고 할 수 있다. 

We have been researching and publishing in the area of medical professionalism and identity development for some years,1, 3-5 but it still feels as if we are relative newcomers to the field. Our shared reflection from discussing challenges concerning professionalism with global colleagues6-8 is that we are not alone in this; in order to understand and define professionalism, we all draw upon the same set of authors as recognised canon across the health professions.9, 10 This canon itself is usually based in medicine; notably, as one of the first defined professions alongside law and the priesthood, there has arguably been longer to debate the concept of professionalism in this field than for the more newly “professionalised” health-care occupations, although there is no shortage of work related to positioning professionalism in other health-care professions.11, 12

그러나 "전문직업성"을 이해하기 위한 공동 참조 프레임에도 불구하고, 우리가 전문직업성 위반의 시나리오를 논의할 때, 추가적인 위반을 방지하거나 교정하는 데 합의된 접근 방식은 결코 없다.4 우리는 종종 사회적 또는 문화적 맥락의 중요성에 대해 이야기합니다; 그리고 우리는 전문직업성에 대한 출판된 문헌이 우리 자신의 생각과 가치를 나타내지 않는 것처럼 보인다는 것을 반영합니다. 현재 전문직업성에 관한 지배적인 정의는 [성별, 민족성, 일과 삶의 균형에 대한 21세기의 기대, 그리고 종종 가장 걱정스러운 것은 신체적, 정신적 건강에 대한 고려]를 무시하는 듯 보인다.
Yet despite a shared frame of reference for understanding “professionalism”, when we discuss scenarios of professionalism transgressions, there is never one agreed approach to remediation nor prevention of further transgressions.4 We often talk about the importance of social or cultural context; and we reflect that the published literature on professionalism does not seem to represent our own thoughts and values. Dominant definitions seem to ignore considerations of gender, ethnicity, twenty-first century expectations of work-life balance and often, most worryingly of all, physical and mental health concerns.

한편, 의료 외에서는 이러한 고려사항이 전문직업성에 대한 논의에서 이미 존재하는 것으로 보인다. 실제로, 우리의 우려는 40년 전 프리드슨 자신이 "전문직"을 정의할 때 반영했던 것과 같다. 프리드슨은 이 용어를 "영국-미국 제도들에 의해 강한 영향을 받은 산업국가들에서 특별한 뿌리를 가진 변화된 역사적 개념"임을 인정하지 않고, 대신 "일반적인 개념generic concept"으로 정의하려는 시도의 어리음에 주목했다. 이러한 점을 염두에 두고, 우리는 전문직업성의 정의를 재검토하여 그것들이 다른 맥락에서 어떻게 적용되는지 이해할 시간이 지났다고 느낀다. 여기서 우리 연구는 다시 한번 의학을 기반으로 할 것이다. 따라서 우리가 이러한 논쟁을 모든 보건의료 직업과 관련이 있다고 말하는 동안, 우리는 각각의 단일 건강관리 직업의 맥락이 이 토론이 각각의 직업 정체성에 대해 특별히 이루어져야 한다는 것을 의미할 수 있다는 것을 인정해야 한다.
Meanwhile outside health care, these considerations appear to already exist in discussions of professionalism.13, 14 Indeed, our concerns mirror Friedson's own reflections15 in defining a “profession” 40 years ago. Friedson noted the folly of attempting to define the term as a “generic concept” rather than acknowledging it is a “changing historic concept with particularistic roots in those in industrial nations that are strongly influenced by Anglo-American institutions” (p32). With this in mind, we feel it is beyond time to review the definitions of professionalism to understand how they are applied in different contexts. Our own work here will once again be based in medicine; thus whilst we speak of these debates as relevant to all health-care professions, we must acknowledge the context of each singular health-care profession may mean this debate needs to be had specifically for each occupational identity.

또한 질 개선quality improvement을 주제로 한 이 특별호 내에서 논의를 진행하는 것도 중요합니다. 교육자로서, 우리는 우리 학생들 사이에서 전문직업성 과실을 관리하기 위한 최적의 방법을 찾을 뿐만 아니라 우리의 전문직업성 교육의 질을 향상시키기 위해 끊임없이 노력하고 있다는 것을 발견합니다. 그러나 우리는 종종 단순히 그 일을 감당할 수 없는 [전문직업성의 정의]에 의해 좌절된다는 것을 발견한다. 그러므로, 우리의 눈에는, 전문직업성의 교육 및 관리의 질을 향상시키는 첫 번째 단계는 [기존의 정의]에 대한 공개 토론을 장려하고 이를 뒷받침하는 기원과 가정에 의문을 제기하는 것이다.
It is also important to situate this discussion within this special issue on the theme of quality improvement. As educators, we find ourselves constantly striving to improve the quality of our professionalism teaching, as well as searching for optimal methods to manage professionalism lapses amongst our students.4 We often, however, find ourselves hamstrung by definitions of professionalism that are simply not up to the task. Thus, in our eyes, the first step to improving quality in teaching and management of professionalism is to encourage an open debate of existing definitions and to interrogate the origins and assumptions that underpin these.

현재의 의료 전문직업성 상태에 대한 비판적 평가를 실시하기 위해, 우리는 다음과 같은 질문들을 다룰 것입니다.

  • 전문직업성을 정의하도록 "허용"되는 지배적인 목소리는 누구인가? 전문직업성을 정의하는 것은 규제자, 학자, 전문가 또는 실제로 비정형 "공공"의 소관이 되어야 하는가?
  • 만약 지배적인 목소리가 직업 내에서 모든 것 혹은 심지어 다수를 대변하지 않는다면, 그것은 전문직업성의 패권적 정의와 그에 따른 전문적 기준의 설명에 무엇을 의미합니까?
  • 서로 다른 국가적, 문화적 맥락에 걸쳐 서로 다른 이해를 고려한다면, 모든 사람에게 "통하는" 전문직업성에 대한 하나의 허용되는 정의가 있을 수 있을까?
  • 전문직업성에 대한 현재의 정의를 무비판적으로 수용하는 것이 그 개념이 무기화되고 전문가 자체에 대해 사용되는 결과를 초래할 위험이 있는가?

In order to undertake a critical appraisal of the current state of medical professionalism, we will seek to address the following questions:

  • who are the dominant voices that are “allowed” to define professionalism? Should defining professionalism be the remit of regulators, academics, the profession or indeed the amorphous “public”?
  • If the dominant voices do not speak for all – or even a majority – within a profession, what does that mean for hegemonic definitions of professionalism and for the subsequent delineation of professional standards?
  • Taking into account different understandings across different national and cultural contexts, is it even possible for there to be one single accepted definition of professionalism that “works” for everyone?
  • Is the danger that uncritical acceptance of current definitions of professionalism results in the concept being weaponised and used against the professions themselves?

이 논문은 이러한 대화들이 [현재 존재하는 전문직업성의 정의가 최종적인 것definitive ones]이라는 입장에서 나아가야 할 필요가 있다는 것을 입증하기 위해 이러한 질문들에 대한 토론을 탐구한다.
This paper explores the debate on each of these questions, to make the case that these conversations need to move on from the position that the extant definitions of professionalism are the definitive ones.

2 프로페셔널리즘을 정의할 수 있는 사람(그리고 허용되어야 함)은 누구입니까?
2 WHO IS – AND SHOULD BE – ALLOWED TO DEFINE PROFESSIONALISM?


"전문직"을 정의하려는 시도는 사회학 분야에서 시작되었다. 가장 넓게 본다면, 전문직업성은 사회에서 구성원의 위치를 정당화하는 직업의 측면이다. 이러한 정의에서 "사회적 계약"의 개념이 등장했다. 그것은 전문가들이 사회에 유용한 지식과 기술에 [접근할 수 있게 만들어준다]. 이러한 지식은 전문직 자체에 의해 보호되므로 모든 사람이 이용할 수 있는 것은 아닙니다. 그러므로, 지식을 휘두르고 그것에 대한 접근을 계속 규제하기 위해, 의사들은 전문직업 밖의 사람들의 신뢰를 정당화하는 방법으로 행동해야 한다. 이는 전문직업성이 대중들에 의해 정의된다는 것을 시사한다. 오직 전문직 바깥에 있는 사람들만이 신뢰를 정당화할 수 있는 것을 정의할 수 있다. 그러나 이는 분명히 그렇지 않다. 심지어 의학 교육 분야에 존재하는 이 기사는 전문직업성에 대한 논쟁이 의사들에 의해 지배되고 있다는 것을 보여준다. 따라서 다음과 같은 의문이 제기된다. 전문직의 어떤 구성원들이 전문직업성을 규정할 수 있는 힘을 주장합니까?

Attempts to define a “profession” and thus professionalism started in the field of sociology; most broadly, professionalism is the aspects of occupations that justify members' position in society.16 From these definitions emerged the concept of a “social contract”,17 that is where professionals have access to knowledge and skills that are useful to society. This knowledge is safeguarded by the profession itself – so is not accessible to all – thus, in order to be trusted to wield said knowledge and continue to regulate access to it, doctors must behave in a way that justifies the trust of those outside the profession. Immediately this suggests that professionalism is defined by members of the public: only those out with the profession can define what would justify their trust. This is, however, clearly not the case: even this article, existing within the field of medical education, demonstrates that the debate regarding professionalism is one dominated by doctors. Thus, the question arises: which members of the profession claim the power to define professionalism?

2.1 학술
2.1 Academics

2.1.1 전문성은 의학과 사회계약의 기초이다. 
2.1.1 Professionalism is the basis of medicine's contract with society18

이 인용문이 시사하듯이, 전문직업성을 논하는 학술 문헌들 중 상당수는 의사가 반드시 전문적이어야 하는 이유로 '사회적 계약'을 꼽고 있다. 우리는 대중이 정한 정의에 대해 거의 알려져 있지 않다는 것을 증명했으므로, [대중의 기대]는 [의사들이 생각하는 대중의 기대]와 [헤드라인을 강타한 의료사고의 이야기에 대한 대중의 반응]의 조합에서 추론될 수밖에 없다. 비록 "사회적 계약"이 유용한 이론적 구조일 수도 있지만, 현실은 그것이 기껏해야 역사적 추측에 기초하고, 최악의 경우 허구인 것처럼 보인다는 것이다.
As this quotation suggests, much of the academic literature that discusses professionalism cites the “social contract” as the reason why doctors must be professional.19, 20 As we have established that little is known about definitions set by the public, it must follow that the expectations of the public are only inferred from a combination of what doctors think members of the public expect and the public reaction to stories of malpractice that hit the headlines.21, 22 Though the “social contract” may be a useful theoretical construct, the reality is that it seems at best to be based on historical guesswork and at worst to be a fiction.

이 단계에서는 아마도 전문직업성의 정의와 사회계약에 대한 통제력을 가진 듯한 기득권의 힘으로 몇 가지 어려움을 개략적으로 설명하는 것이 중요할 것이다. "전문직"의 개념은 적어도 1930년대부터 논의되어 왔지만, 직업과 관련된 표준과 관행을 참조하는 개념으로서의 전문직업성은 직업의 가치에 관한 영국과 미국의 사회학적 분석에서 등장하여 1970년대 말과 1980년대 초에 주목을 받았다. 실제로 1990년, 버라지와 토르스텐달 24는 이 분야에서 주의가 필요하다고 통찰력 있게 주장했다. 사회적, 정치적 맥락으로부터 정의된 전문직의 분리separation, 그리고 전문가 간 관계의 무시와 영미 편향은 모두 전문가 행동의 이론화 적용에 대한 우려로 확인되었다.
At this stage, it is perhaps important to outline some difficulties with the power of the establishment that seems to have control over the definition of professionalism and the social contract. Whilst the concept of a “profession” has been discussed since at least the 1930s,23 professionalism as a concept referring to the standards and practices associated with a profession emerged from British and American sociological analysis concerning the value of occupations, gaining traction towards the end of the 1970s and early 1980s.24, 25 Indeed in 1990, Burrage and Torstendahl24 insightfully argued that caution was needed in this field; the separation of a defined profession from its social and political context, and the neglect of inter-professional relationships and an Anglo-American bias were all identified as concerns in the application of the theorising of professional behaviours.

이미 심하게 논의되고 있는 이 작품에서, 전문직업성에 대한 학문적인 토론에 끼어들기가 도전적이라고 느끼는 것은 이해할 수 있을 것이다. 그럼에도 불구하고, 이는 의료 전문직업성의 진화를 이해하고 그 분야에서 [특정 인물의 명백하고, 꿈쩍하지 않는 지배력]과, 위에서 강조된 우려에 대한 후속적인 비판적 관여의 부족에 더 관련되는 데 전념하는 시간과 관련이 적을 수 있다. 예를 들어 크루즈와 크루즈는 20년 넘게 전문성의 정의와 가르침에 대해 출판해 왔으며, 다른 작가들에 의해 전문직업성을 정의하기 위한 일종의 roadstone으로 종종 인용된다. 그러나 크루즈 부부는 1950년대에 졸업한 백인 캐나다인 부부라는 사실을 주목할 필요가 있다. 이것을 염두에 두고, 그들의 전문직업성에 대한 정의는 약간의 질문을 필요로 한다.전문직업성에 대한 이러한 정의가 처음 받아들여졌을 때, 의학은 매우 다르게 보였다. 그것은 여전히 매우 동질적인 노동력에 의해 지배되고 있는 직업이었다. 이러한 정의는 맥락에 대해 사려 깊고 잘 이론화되었을 수 있지만, 우리는 현재와 미래의 노동력에 기존의 정의를 적용하는 것이 의심할 여지 없이 점점 더 어려워지고 있다고 믿는다.

In this already heavily debated body of work, it is perhaps understandable that it feels challenging to break into scholarly discussion of professionalism. Nevertheless, this may be less to do with the time dedicated to understanding the evolution of medical professionalism and relate more to the apparent immovable dominance of particular figures in the field, and a subsequent lack of critical engagement with the concerns highlighted above. Cruess and Cruess, for example, have been publishing about definitions and teaching of professionalism for over 20 years,9, 26 and they are often cited by other authors as a kind of lodestone for defining professionalism.27 It is worth noting, however, that the Cruesses are a white, Canadian couple who graduated in the 1950s.28 With this in mind, their definitions of professionalism require some interrogation. When these definitions of professionalism were first accepted,9, 18 medicine looked very different. It was a profession still dominated – certainly in senior positions – by a very homogeneous workforce. Whilst these definitions may have been thoughtful and well theorised for their context, we believe it is increasingly challenging to apply them unquestioningly to the current and future workforce.

그러나 대안적 정의를 제시하는 데 있어 난제 중 하나가 토론에서 설득력을 얻은 것으로 보인다. 예를 들어, 2006년에 Wear와 Aultman은 다른 이론적 틀을 사용하여 전문성에 대한 비판적 분석 모음집을 편집했다. 이들 중 하나는 전문직업성에 대한 전통적인 정의를 사용할 때 성 불평등의 가능성을 강조한다. 예를 들어, 만약 전문직업성이 초특권supererogation을 요구한다면 – 의무 이상의 것을 요구한다면 – 그들의 아이들을 돌보기 위해 제 시간에 떠나야 하는 부모들은 여전히 전문직업적일 수 있는가? 아마도 의학에 대한 무조건적인 헌신은 모든 국내 업무를 책임지는 파트너에 의해 개인 생활에서 지원받는 사람들의 특권이 될 수 있을 것이다. 의학이 점점 더 다양한 노동력을 수용함에 따라, 정시에 퇴근해도 전문직업적이 되는 것이 확실히 가능해졌는가? 그러나 셜리와 패젯의 비평은 지배적인 정의를 인용하고 암송하라는 소동 속에서 크게 사라졌다. 이것은 전문직업성에 대한 학문적academic 논의와 "현장on the ground"에서 일어나고 있는 일 사이에 더 큰 차이가 있음을 시사한다. 만약 그렇다면, 아마도 전문직업성에 대한 실용적인 정의는 practicing physician들에게 더 널리 적용될 수 있을 것이다.

One of the challenges in presenting an alternative definition, however, seems to have been gaining traction in the debate. In 2006, for example, Wear and Aultman29 edited a collection of critical analyses of professionalism using different theoretical frames. One of these highlights the potential for gender inequality when using conventional definitions of professionalism.30 For example, if professionalism requires supererogation – going above and beyond the call of duty – can parents who need to leave on time to care for their children still be professional? Perhaps, unqualified commitment to medicine can only be the privilege of those supported in their personal lives by a partner who assumes responsibility for all domestic tasks. As medicine embraces an increasingly diverse workforce, surely it has become possible to leave work on time and be professional? And yet Shirley and Padgett's30 critique has been largely lost in the clamour to cite and recite the dominant definitions. This suggests to us that there is a widening gulf between the academic discussion of professionalism and what is happening “on the ground”. If this is the case, perhaps a practical definition of professionalism is more widely applicable to practising physicians.

"사회적 계약"을 일반적으로 합의된 정의로 변환하려고 시도할 때 추가적인 문제가 발생한다. 행동에만 의존하는 전문성의 정의는 "깊이가 얕다skin deep"는 비판을 받아온 반면, 덕목virtues에 의존하는 정의는 비정형적이고 평가에서 구현하기 어렵다. 어떤 이들은 규범적normative 정의 - 대부분의most 의사들이 어떻게 행동할 것인가에 기초하는 -가 도움이 된다고 제안했다. 그러나, 규범은 세대에 따라 변화하며 여기에 어려움이 있다: 전문직업성의 정의는 직업의 모든 구성원에 의해 동등하게 통제되지 않는다. 대신 학계와 규제당국과 같은 강력한 이해당사자들이 정의를 통제하는 것처럼 보인다.
A further challenge arises when attempting to translate the “social contract” into a commonly agreed definition.31 Definitions of professionalism that rely solely on behaviour have been criticised for being “skin deep”,32 whereas definitions that rely on virtues are amorphous and difficult to implement in assessment.33 Some have suggested that normative definitions – based on how most doctors would behave – are helpful.34 Pertinently, however, norms change with generations and herein lies the difficulty: the definition of professionalism is not equally controlled by all members of the profession. Instead, powerful stakeholders such as academics and regulators seem to control the definition.

2.2 규제 기관
2.2 Regulators

아마도 전문직업성에 대한 가장 직접적인 정의는 규제 기관들이 사용하는 정의일 것이다. 이러한 정의와 이를 통제하는 기관들은 전문성을 측정하는 사실상의 기준을 형성하기 때문에 힘을 가지고 있다. 예를 들어, 영국에서 GMC(General Medical Council)전문직업성이 무엇을 의미하는지 설명하기 위해 이 정의를 사용한다.

Perhaps the most straightforward definition of professionalism is one used by regulatory bodies. These definitions – and thus the institutions that control them – have power as they form de facto standards against which professionalism is measured. In the United Kingdom, for example, the General Medical Council (GMC) uses this definition to outline what they believe professionalism means:

 

"좋은 의사들은 환자를 돌보는 것을 첫 번째 관심사로 삼는다. 그들은 유능하고, 지식과 기술을 최신 상태로 유지하고, 환자 및 동료들과 좋은 관계를 수립하고 유지하고, 정직하고 신뢰할 수 있으며, 그리고 법 안에서 정직하게 행동한다." 
“Good doctors make the care of their patients their first concern: they are competent, keep their knowledge and skills up to date, establish and maintain good relationships with patients and colleagues, are honest and trustworthy, and act with integrity and within the law.”35

규제 기관은 의학에 진입하는 조건, 그리고 의학 내에서 합법적인 고용 조건을 설정하기 때문에 전문성을 정의하는 데 강력한 역할을 한다. 그러나 이와 같은 정의에는 명백한 문제가 있다. 첫째, 각 용어 - "좋은good"를 예로 들어 - 더 많은 설명이 필요합니다. 다음으로, 각 개념은 주어진 의사의 경험, 훈련 단계 및 당면한 특정 시나리오와 맥락화되어야 하는데, 이 모든 것은 객관적인 방법으로 측정하기 어렵다. 이러한 명확성의 결여는 해석의 정의를 열어주고 이러한 해석은 일종의 비공식 규제 사례법을 통해 이루어지게 한다. 전문직업성에 대한 GMC의 자체 정의는 의사들과 일반인들이 전문적 위법 행위와 실천의 적합성에 대한 문제를 다루는 데 있어 수행하는 [의료 종사자들의 재판소tribunals]를 통해 검증된다. 따라서, "체제establishment"에는 외부 비판의 기회가 거의 없으며, 자신의 정의를 그대로 유지한다.
Regulatory bodies have a powerful role in defining professionalism as they set the conditions of entry to – and legitimate employment within – medicine. Yet there are manifest problems with a definition such as this. Firstly, each term – take “good” as an example – requires further clarification. Next, each concept needs to be contextualised with a given doctors' experience, stage of training and the specific scenario at hand, all of which are challenging to measure in an objective way. This lack of clarity then opens the definition to interpretation and leaves these interpretations to be made through a kind of informal regulatory case law. The GMC's own definition of professionalism is tested through tribunals of medical practitioners, which are conducted by doctors and lay people experienced in dealing with matters of professional misconduct and fitness to practise. Thus, the “establishment” maintains its own definitions with little opportunity for external critique.

전문직업성에 대한 규제적 정의에 의존할 때 생기는 또 다른 문제는 [전문직업적 기준을 충족하지 못하는 행동과 태도]만 공개적으로 평가된다는 것이다. 이 경우 시간이 지날수록 전문직업성의 '흑백(옳고 그름)'이 조금씩 바뀌기 때문에 도움이 되지 않는다. 개인적인 금전적 이익을 위해 환자를 죽이는 것은 어느 때라도 전문직업적이지 않을 것이다. 하지만 "회색 지대"는 바뀐다. 즉, 이것은 덜 명확한 결정이며, 규제 기관의 소관이 덜한 결정입니다. 대신, 그것들은 교육자, 의료 서비스 제공자, 의사 및 대중이 매일 해야 할 결정입니다.
Another challenge of relying on a regulatory definition of professionalism is that it is only tested in relief: only behaviours and attitudes that do not meet professional standards are publicly measured against it. This is unhelpful as the “black and white” of professionalism changes little over time. It is never going to be professional to kill your patients for personal financial gain. What do change are the “shades of grey”, the decisions that are less clear, which are less often the remit of the regulator. Instead, they are decisions that fall to educators, health-care providers, “jobbing” doctors and members of the public to make on a day-by-day basis.

3 다양한 국가 및 문화적 맥락에 걸친 다른 이해를 고려하여, 모든 사람에게 "효과적"인 전문성에 대한 하나의 허용되는 정의가 가능할까요?
3 TAKING INTO ACCOUNT DIFFERENT UNDERSTANDINGS ACROSS DIFFERENT NATIONAL AND CULTURAL CONTEXTS, IS IT EVEN POSSIBLE FOR THERE TO BE ONE SINGLE ACCEPTED DEFINITION OF PROFESSIONALISM THAT “WORKS” FOR EVERYONE?


여러 이전 출판물에서 인정된 바와 같이, 국가 또는 국제 경계를 넘어서는 전문직업성에 대한 단일 또는 합의된 정의는 없다. 따라서 각 국가/지역 규제 기관 또는 의료 면허 기관은 자체 규정과 어느 정도 "전문직업성"에 대한 자체 정의를 가지고 있다. 이러한 정의는 때때로 전문직 규정 문서에 통합된 지침으로 캡슐화되지만, 다른 정의는 학부 교육 또는 등록된 전문가에 대한 전문적 기대에 초점을 맞춘 전체 문서에서 캡처된다.  실제로, 어떤 맥락에서 전문직업성의 정의는 규제 기관보다는 의사 협회에 의해 생성되는 것처럼 보인다. 여러 가지 시도가 있었음에도 불구하고 전문직업성이 어떻게 다른 국가 지침에서 다루어지는지를 고려할 수 있는 쉽게 식별할 수 있는 비교 가능한 문서 세트는 없다. 가장 주목할 만한 것은, 최근 일련의 문헌에서 서구의 전문직업성 정의가 반드시 비서구 국가의 문화적 가치를 반영하는 것은 아니며, 따라서 다른 맥락에서 다른 전문성 정의가 필요할 수 있다는 점에 주목하고 있다. 
As has been acknowledged in multiple previous publications, there is no single or agreed definition of professionalism across national or international borders.36 As such, each national/regional regulator or medical licensing organisation has its own regulations and to a certain extent their own definition of “professionalism”. These definitions are sometimes encapsulated in guidance incorporated into professional regulatory documents,37 whereas other definitions are captured in whole documents focussed on professional expectations either in undergraduate training38 or for registered professionals.39 Indeed, in some contexts definitions of professionalism seem to be generated by doctors' associations, rather than the regulatory body.39, 40 There is not then an easily identifiable set of comparable documents by which we can consider how professionalism is addressed in different national guidance, though there have been a number of attempts to do so. Most notably, a recent set of literature notes that Western definitions of professionalism do not necessarily reflect the cultural values of non-Western countries, and therefore, that different professionalism definitions could be needed in different contexts.41-50

표 1은 규제 기관 또는 인증 기관 웹 사이트에서 "전문직업성"을 검색할 경우 나타나는 지침의 작은 표현을 결합하려고 시도한다. 이 길이의 기사 범위 내에서, 의학이 규제 직업으로 시행되는 모든 국가의 사례를 검색하고 포함할 수 없었다. 대신 우리는 전문성을 정의하는 복잡성을 보여주기 위해 대륙을 가로질러 가능한 한 횡단면을 포함하기로 선택했습니다. 따라서 이 정보에 대한 검색은 의도적으로 실용적이었으며, 우리가 알고 있는 의학교육 문헌의 큰 단체들이 이미 국제 무대에서 대표성을 가지고 있다는 것을 알 수 있는 장소(영국, 유럽, 미국, 호주 - 이전에는 "서구"라고 불렸을 수도 있는 것)와 다른 것들은 잘 표현되지 않은 장소들을 포함했다. (중국, 사우디아라비아, 남아프리카 및 일본) 그러나, 우리는 이것이 이미 그 분야에서 지배적인 목소리를 더욱 증폭시키고 덜 대표되는 국가들을 여전히 듣지 못하게 한다는 것을 인정한다. 이것은 이러한 토론이 필요한 이유 중 하나를 강조합니다: "전문직업성"에 대한 견해를 [명확하게 정의되고 보편적으로 이해되는 용어인 것처럼 사용하는 사람들]에게 [알려지지 않은 국가가 있다는 것]을 인정하기 위해서입니다.
Table 1 attempts to bring together a small representation of guidance that emerges if one searches for “professionalism” on the regulatory or accreditation body websites. Within the confines of an article of this length, it was not possible to search for and include an example from every country where medicine is practised as a regulated profession. Instead we chose to include a cross-section as far as we could across continents to demonstrate the complexities of defining professionalism. The search for this information was therefore deliberately pragmatic and included locations from where we knew large bodies of medical education literature already had representation on the international stage (UK, Europe, USA and Australia – what might previously have been termed the “Western” voice) and then others less well represented (China, Saudi Arabia, South Africa and Japan). However, we acknowledge this further amplifies the already dominant voices in the field and leaves the underrepresented nations still unheard. This highlights one of the reasons these debates are needed: to acknowledge there are whole nations whose views on “professionalism” are unknown to those who use it as if it were a clearly defined and universally understood term.

표 1. 전문성과 관련된 이용 가능한 정의 또는 지침의 국가 간 비교
TABLE 1. A cross-national comparison of available definitions of, or guidance related to, professionalism

국가/지역 출처 전문성/전문적 행동에 대한 요구사항/지침 발췌
Country/region  Source  Excerpts of requirements/guidance on professionalism/professional behaviours

Australia Australian Medical Council (AMC)36 Nothing articulated in training standards.
AMC promotes a published guide on “Good Medical Practice: Professionalism, Ethics and the Law”:
Professionalism covers a wide range of elements, including good communication skills, an empathetic attitude, the virtues of self-reflection, truthfulness and dependability, cultural awareness in our multicultural society, and awareness of relevant laws pertaining to medical practice. Above all it covers an assumption that a person wishing to practise medicine effectively will bring positive attitudes to all the roles involved in being a doctor
China National Health Commission of the Peoples Republic of China website51; Chinese Medical Doctor Association (CMDA) charter52 Nothing returned in search for “professionalism” on National Health Commission (main national health agency) website. New legislation to “better protect doctors” introduced in August 2021 clarifies that doctors must not produce false medical certification documents and not perform unnecessary examinations and treatments on patients.
CMDA defines “six tenets” of medical practice:
  • equality and benevolence;
  • primacy of patients;
  • honesty and fidelity to promises;
  • commitment to excellence and prudence;
  • incorruptibility and impartiality;
  • lifelong learning.

Germany German Medical Association53 Publishes a (Model) Professional Code for Physicians in Germany which contains the “Rules for Professional Practice”. Excerpts:
Physicians serve the health of the individual and of the population. The medical profession is not a trade. It is by nature a liberal profession.
Physicians practice their profession according to their conscience, the precepts of medical ethics and humaneness. They may not acknowledge any principles, or comply with any regulations or instructions, that are irreconcilable with their tasks or for whose observance they cannot answer.
If physicians who are permanently established or perform their professional activity in another Member State of the European Union temporarily and occasionally perform their medical activity on a cross-border basis in the territory covered by this Professional Code without establishing a practice, they must observe the provisions of this Professional Code.
In addition to practising their profession, physicians are forbidden to engage in any other activity that is irreconcilable with the ethical principles of the medical profession. Physicians are also forbidden to allow their name to be used in conjunction with a medical occupational title in an unfair manner for commercial purposes. They may equally not permit use to be made of their name, or of the professional reputation of physicians, in such a way.
Japan Japan Medical Association Website39 “… the physician should serve society with a basic love for humanity.” Underpinned by the following six principles:
  • continuing education;
  • dignity and responsibility, striving “to enhance his/her cultural refinement, education, and integrity”;
  • respecting the individuality of patients, treating them with compassion and earning their trust;
  • maintaining respect for his/her fellow physician and serving “the cause of medical care to the best of his/her abilities”;
  • respecting the spirit of public service and contributing to the development of society;
  • not engaging in profit-making medical activities.
Saudi Arabia Kingdom of Saudi Arabia Education & Training Evaluation Commission (ETEC) website54 SaudiMeds Framework developed by Saudi Medical Deans Committee; Theme V – Professionalism:
“The commitment to deliver the highest standards of ethical and professional behaviour in all aspects of health practice, and take a responsibility for own personal and professional development.
  • Adhere to professional attitudes and behaviours of physicians
  • Apply Islamic, legal and ethical principles in professional practice
  • Demonstrate the capacity for self-reflection and professional development”

South America Centeno et al 201655 Nothing obvious available in English but Centeno et al. 2016 discuss a collaboration between three South American Schools with a shared aim to promote professionalism amongst their students; the agreed definition of professionalism used was Epstein and Hunderts56 definition where professionalism is:
“The habitual and judicious use of communication, knowledge, technical skills, clinical reasoning, emotions, values, and reflection in daily practice for the benefit of the individual and the community being served”
South Africa Health Professions Council of South Africa website57 Health Professions Council publishes a lengthy document with very specific requirements of all registered health-care practitioners. An example of this is that they provide guidance on a practitioners stationery as follows:
“4. (1) A practitioner shall print or have printed on letterheads, account forms and electronic stationery information pertaining only to such practitioners – (a) name; (b) profession; (c) registered category; (d) speciality or subspeciality or field of professional practice (if any); (e) registered qualifications or other academic qualifications or honorary degrees in abbreviated form; (f) registration number; (g) addresses (including email address); (h) telephone and fax numbers; (i) practice or consultation hours; (j) practice code number; and (k) dispensing licence number (if any).”
The Netherlands Royal Dutch Medical Association (KNMG)40 KNMG Manifesto on Medical Professionalism
“The aim of this manifesto is to perpetuate and promote the trust that society should be able to place in medical professionals.
… A good doctor is a medical professional: he is a medical expert, he keeps his professional know-how up-to-date, communicates in an empathic way with his patients, cooperates with colleagues, exercises his profession within the (moral) boundaries of the professional group, organises quality in his practice and renders account.
The doctor needs society to place trust in him. Trust is necessary for the proper operation of the health-care sector as a whole, for the doctor-patient relationship and for the intrinsic motivation of medical professionals. The medical professionals intrinsic motivation is the most powerful driving force for qualitatively sound, meaningful and efficient care.”
United Kingdom General Medical Council Website Outcomes for Graduates38 defines the standards which all medical graduates are expected to reach by the end of their pre-registration training. It states that “newly qualified doctors must behave according to ethical and professional responsibilities” and gives a 28-point list detailing specific requirements including:
  • demonstrate compassionate professional behaviour and their professional responsibilities in making sure the fundamental needs of patients are addressed
  • act with integrity, be polite, considerate, trustworthy and honest
  • recognise the potential impact of their attitudes, values, beliefs, perceptions and personal biases (which may be unconscious) on individuals and groups and identify personal strategies to address this
Good Medical Practice,35 a document defining professional values and behaviours expected of any qualified doctor registered with the GMC, states that:
“As a good doctor you will:
  • make the care of your patient your first concern
  • be competent and keep your professional knowledge and skills up to date
  • take prompt action if you think patient safety is being compromised
  • establish and maintain good partnerships with your patients and colleagues
  • maintain trust in you and the profession by being open, honest and acting with integrity”

United States of America Accreditation Council for Graduate Medical Education Website58 Common Programme Requirements for residency training includes a long list related to professionalism, including but not limited to:
“Residents and faculty members must demonstrate an understanding of their personal role in the:
  • provision of patient- and family-centred care;
  • safety and welfare of patients entrusted to their care, including the ability to report unsafe conditions and adverse events;
  • assurance of their fitness for work, including:
  • management of their time before, during, and after
  • clinical assignments; and, recognition of impairment, including from illness, fatigue, and substance use, in themselves, their peers, and other members of the health-care team.
  • commitment to lifelong learning;
  • monitoring of their patient care performance improvement indicators; and,
  • accurate reporting of clinical and educational work hours,
  • patient outcomes, and clinical experience data …

“All residents and faculty members must demonstrate responsiveness to patient needs that supersedes self-interest. This includes the recognition that under certain circumstances, the best interests of the patient may be served by transitioning that patients care to another qualified and rested provider …
“Programmes, in partnership with their Sponsoring Institutions, should have a process for education of residents and faculty regarding unprofessional behaviour and a confidential process for reporting, investigating, and addressing such concerns.”

어떤 경우에는, 이것들은 번역된 버전이며, 우리는 여기서 한계점을 인정합니다. 우리는 영어로만 이용 가능한 자원들에 접근할 수 있었고, 때로는 2차 소스를 통해서요. 따라서 우리는 이것을 전문직업성에 대해 이용 가능한 모든 국제 지침의 결정적 표현이라고 주장하지 않으며, 우리는 몇몇 큰 차이가 있다는 것을 인정한다; 예를 들어 러시아의 의학 교육 시스템은 러시아의 모든 핵심 문헌을 찾는다. 따라서 우리는 이 지역, 또는 표에 포함되지 않은 다른 곳에서의 전문직업성에 대한 태도에 대한 지식을 주장할 수 없다. 그러나, 이것이 보여주는 것은 서로 다른 맥락에서 "전문직업성"이 의미하는 것을 이해하는 것이 누구에게나 얼마나 복잡한지이며, 입증하기 위해 국가 기관 웹사이트에서 이용 가능한 기대와 요구사항의 샘플을 제공하는 것이다.

In some instances, these are translated versions, and we acknowledge a limitation here is that we were only able to access resources that were available in English, sometimes via secondary sources. We therefore do not claim this as a definitive representation of all international guidance available on professionalism, and we acknowledge there are some large gaps; the inwardly facing medical education system in Russia for example locates all key literature in Russia; therefore, we can make no claims to knowledge about attitudes to medical professionalism in this part of the world, nor anywhere else not included in the table. What it does, however, is give a sample of the types of expectations and requirements made available on national agency websites for the purpose of demonstrating how complex it is for anyone to make sense of what “professionalism” means in different contexts.

각 국가 규제 기관이 고유한 기준을 갖는 것은 이해할 수 있는데, 이는 의약품과 의료가 고유한 맥락과 관련이 있음을 보장하는 중요한 부분이다. 표 1은 "전문직업성"의 정의, 적용 및 규제가 얼마나 멀리 떨어져 있는지를 보여준다. 이러한 차이에도 불구하고, 우리는 의학 교육 내에서 그것이 하나의 단일한 개념인 것처럼 말하고 쓴다. 흥미롭게도, 대부분의 맥락에서, 지침은 평생 학습 및 전문직업적 개발의 중요성을 포함하지만, 여기서 직접적인 비교는 끝난다. 
It is understandable that each national regulator will have its own standards, an important part of ensuring medicine and health care is relevant to its own context.59 What Table 1 demonstrates is quite how far apart the definition, application and regulation of “professionalism” is. Despite these differences, we speak and write about it within medical education as if it is just one singular concept. Interestingly, in most contexts, guidance incorporates the import of lifelong learning and/or professional development but here the direct comparison ends.

네덜란드 왕립의학협회(Royal Dutch Medical Association)의 가이던스는 학술적 담론을 따르고 있으며, 사회가 전문직에 두는 신뢰와 직업적 지위 사이의 관계에 초점을 맞추고 있다. 일부 규제당국의 경우 교육 제공자에 대한 지침을 포함하여 등록 전pre-registration부터 대학원 교육까지 일련의 지침이 존재한다는 증거가 더 많다. 다른 국가에는 개별 시나리오에 전문적인 판단을 적용할 수 있는 여지를 상상하기 어렵게 만드는 엄청나게 상세한 지침 목록이 있다. 

The guidance from The Netherlands from the Royal Dutch Medical Association,40 a professional organisation rather than a regulator, follows an academic discourse and focusses on the relationship between professional status and the trust that society puts in the profession. For some regulators38, 58 there is more evidence of a continuum of guidance from pre-registration to postgraduate training including guidance for training providers. For others,57 there is an incredibly detailed list of instructions leaving it hard to imagine room for application of professional judgement to individual scenarios.

특히, 한 나라의 교리가 다른 나라에 어떻게 적용될지 상상하는 것은 매우 어려운 일이다; 의료 보험 회사가 바로 그 목적(영리활동)을 위해 존재하는 많은 나라에서는, 의료 활동이 "영리화"를 위해 수행되지 않을 것이라는 일본의 가이던스는 이치에 맞지 않을 것이며, 반면 사우디아라비아의 맥락에서 이슬람 관행을 고수하는 것에 대한 언급은 비이슬람 국가들에게는 거의 의미가 없다. 사실, 종교가 의도적으로 국가와 분리되어 있고 따라서 의료 서비스 제공이 이루어지는 많은 나라에서, 전문직 행위의 일부로서 특정 종교에 대한 언급을 포함하는 것은 꽤 성가신 일이다. 금요기도를 위해 보건활동이 일시 중단되는 일국의 기대가 전문직업적인 것으로 인정되겠지만, 또 다른 문화적 맥락에서, 종교적 교리를 따르기 위해 환자 치료로부터 "휴식"을 고려하는 것은 전문적이지 않은 것으로 보일 수 있다.

Notably, it is extremely challenging to imagine how the tenets of one country would apply in another; the guidance from Japan that medical activities will not be undertaken for “profit-making” would not work in many countries where medical insurance firms exist for that very purpose, whilst reference to adherence to Islamic practice in the Saudi Arabian context54 makes little sense for non-Islamic countries. Indeed, in many countries where religion is deliberately separated from the state and therefore health service provision, the inclusion of a mention of a specific religion as part of professional practices is quite jarring. Where the expectation in one country that health care activity is paused for Friday prayers is seen as professional; in another cultural context, it might be seen as unprofessional to consider a “break” from patient care for religious observance.

개별 국가의 가이던스는 전문직업성에 대한 표면적으로 "유사한" 이해에서 비롯될 수 있지만, 이에 따른 적용은 훨씬 더 멀리 떨어져 있으며, 이는 국제 경계를 넘어 학생과 교직원의 이동에 영향을 미친다. 이는 지배적 정의가 세계화된 의료 관행의 맥락에서 보편적으로 적용될 수 없음을 시사하며, 이는 전문직업적 표준을 이해하려고 시도할 때 의사에게 불확실성을 야기한다. 실제로, 독일의 지침은 그들의 의사가 일시적으로 국경을 넘어 일하는 경우, 그들의 의사는 여전히 독일의 규칙을 따라야 한다고 명시하고 있는데, 이것은 "전문직업적이지 않은" 행동에 대한 어떠한 비난도 누구의 관할권에 의해 중재될 것인지 의문을 제기한다. 

Whilst individual national guidance may originate in superficially “similar” understandings of professionalism, the resultant application of these is much further apart, which has implications for the movement of students and staff across international boundaries. This suggests that dominant definitions are not universally applicable in the context of globalised medical practice, creating uncertainty for doctors when attempting to understand professional standards. Indeed, the German guidance specifies that, where their doctors are temporarily working on a cross-border basis, their physicians must still follow the German rules, which raises questions for whose jurisdiction any accusations of “unprofessional” behaviours would be arbitrated by.53

우리의 분석에서 분명한 것은 비교적 작은 전문 규제자 표본 내에서도 국경, 문화, 맥락을 초월한 전문직업성에 대한 보편적인 정의는 존재하지 않는다는 것이다. 실제로, 우리는 보편적 정의에 대한 어떠한 시도도 서구 중심의 세계관에 의해 지배될 가능성이 높기 때문에 이것이 바람직하지 않다고 주장할 것이다.
What seems clear from our analysis is that, even within a relatively small sample of professional regulators, a universal definition of professionalism that transcends borders, cultures and contexts does not exist. Indeed, we would argue that this is not desirable as in all likelihood any attempt at a universal definition would be dominated by a Western-centric view of the world and thus would not be representative of the needs of many doctors and indeed their patients.

4 만약 지배적인 목소리가 직업 내 전체 또는 심지어 과반수를 대변하지 않는다면, 전문성의 헤게모니적 정의와 후속적인 전문성 표준의 설명에 어떤 의미가 있는가?
4 IF THE DOMINANT VOICES DO NOT SPEAK FOR ALL – OR EVEN A MAJORITY – WITHIN A PROFESSION, WHAT DOES THAT MEAN FOR HEGEMONIC DEFINITIONS OF PROFESSIONALISM AND FOR THE SUBSEQUENT DELINEATION OF PROFESSIONAL STANDARDS?


최근 수십 년간 전문직업성 논쟁에서 변화의 원동력 중 하나는 소셜 미디어의 부상이었다. 많은 의사들이 학문적, 규제적 대화에서 제외되었을 수 있는 반면, 트위터와 같은 플랫폼은 종종 매우 공개적인 방식으로 개인이 토론에 참여하도록 허용했다. 지역 근무 환경 밖에서 새로운 전문직업적 관계를 개발하는 것은 이전에는 컨퍼런스 네트워킹에 국한되었지만 소셜 미디어 플랫폼은 의사로서 공개적인 프로필과 전문직업적 정체성을 갖는 것이 의미하는 것의 성격을 바꾸었다. 소셜 미디어 토론은 종종 논쟁적인 견해와 출판물에 대한 토론을 포함한다. 예를 들어, 2020년 혈관외과 저널은 "젊은 혈관외과 의사들 사이에서 비전문적인 소셜 미디어 콘텐츠의 보급"이라는 제목의 논문을 발표했다. 이 글에서 저자들은 비키니를 입은 자신의 사진을 SNS에 올리는 것은 비전문적이라고 암시했다. 전 세계 의사들로부터 "MedBikini"라는 해시태그를 사용한 소셜 미디어에 대한 반발은 매우 충격적이었고, 저널은 얼마 지나지 않아 논문을 철회해야 했다. 많은 면에서, 소셜 미디어 플랫폼은 새로운 세대의 의사들이 그들의 [온라인 존재]뿐만 아니라, [전문직업성이 그들에게 무엇을 의미하는지 상대적으로 검열없이 토론을 할 수 있는 능력]을 통해서, [전문직업성에 대한 자기만의 정의에 대한 소유권]을 주장할 수 있게 해주었다.

One of the forces for change in the professionalism debate over recent decades has been the rise of social media. Where many doctors may have been excluded from academic and regulatory conversations, platforms such as Twitter have allowed individuals to become involved in the discussion, often in a very public way. Developing new professional relationships outside of local working environments was previously limited to conference networking, but social media platforms have changed the nature of what it means to have a public profile and professional identity as a doctor.60 Social media debates have often included discussions of controversial views and publications. For example, in 2020, the Journal of Vascular Surgery published a paper entitled “prevalence of unprofessional social media content amongst young vascular surgeons“. In this article, the authors implied that posting a picture of oneself on social media wearing a bikini was unprofessional.61 The backlash on social media from doctors around the world – employing the hashtag “MedBikini” – was so impactful; the journal was forced to retract the paper shortly thereafter. In many ways, social media platforms have allowed a new generation of doctors to claim ownership of their own definition of professionalism, not just in their online presence but also in their ability to have relatively uncensored discussion of what professionalism means to them.

흥미롭게도, 소셜 미디어의 사용은 윤리적으로 보이는 것이 개인의 해석에 달려있을 수 있는 전문직업성과 관련하여 논쟁적인 영역이다. 미국 의사협회가 소셜미디어 가이드라인을 2010년 이전부터 도입했고, 의료교육자로서 소셜미디어 활용에 대한 팁페이퍼의 존재에도 불구하고 규제당국은 빠르게 진화하는 소셜미디어와 'e-프로페셔널리즘'의 세계에 발맞추지 못하는 듯했다. 온라인 활동을 하면서 어떻게 "전문직업적"이 될 수 있는지는 점점 더 불분명해지고 온라인에서의 "전문적" 행동이 어떻게 보이는지에 대한 합의가 거의 없는 것 같다.66 백신을 예로 들어보자: 의료 종사자가 개인이 백신을 접종하는 것을 막는 것은 파격적인가, 아니면 비전문적인가? 더욱이, 만약 [비관습적 신념들]이 [전문적이지 않다]고 해석된다면, 누가 이러한 견해를 단속하는 데 책임이 있는지 이해하는 것이 중요합니다. 의료 규제 기관들은 소셜 미디어를 보유하고 있지만, 이것들은 현재 규제 목적보다는 홍보를 위해 존재한다. 이 경우에, 소셜 미디어는 의료 전문가들에게 "동료로 구성된 배심원들에 의해 재판"을 받을 수 있는 기회를 제공한다. 학문적 용어로, 이것은 (e-) 전문성에 대한 규범적 정의와 일치하며, 전문적이라고 여겨지는 것을 통제하는 가장 일반적으로 보유되는 아이디어와 일치한다. 그러나 여기서의 어려움은 [파격적인 아이디어]가 프로페셔널하지 않은 것은 아니더라도, 파괴적일 수도 있다는 것이다. 여기에 [전문직업성]과 [언론의 자유] 사이에서 긋기 어려운 선이 있다. 예를 들어, [극우적인 정치적 의견]을 말하는 것은 전문적이지 않은가? 우리는 개인적으로 이러한 관점이 의사 조직/규제자의 전문적 가치와 어떻게 양립할 수 있는지 보기 위해 고군분투하겠지만, 이러한 맥락에서 의견을 표현하는 것이 [전문적이지 않은 행동]에 해당하는지는 불분명하다.
Interestingly, the use of social media is itself a contentious area in relation to professionalism where what is viewed as ethical can be down to individual interpretation.62 Despite the fact that the American Medical Association introduced social media guidelines as long ago as 2010,63 and the existence of tips papers on using social media as a medical educator,64 regulators have not seemed to keep pace with the rapidly evolving world of social media and “e-professionalism”.56, 65 It is increasingly unclear how “professional” it is possible to be whilst engaging online at all and there seems to be little consensus on what “professional” behaviours online looks like.66 Take the debate around vaccines as an example: is it unconventional, or unprofessional, for a health-care worker to discourage individuals from receiving vaccines? Furthermore, if unconventional beliefs are construed as unprofessional, it is important to understand who is responsible for policing these views. Medical regulators do have a social media presence, but these currently exist for promotion rather than regulatory purposes. In this case, perhaps social media offers medical professionals the opportunity to be “tried by a jury of their peers”. In academic terms, this aligns with a normative definition of (e-)professionalism, with the most commonly held ideas controlling what is deemed professional. The difficulty here, however, is that unconventional ideas may be disruptive – but might not be unprofessional. In addition, there is a line that is difficult to draw between professionalism and freedom of speech. Is it unprofessional, for example, to voice far right political opinions? Whilst we personally would struggle to see how these views are compatible with the professional values of doctors' organisations/regulators, it is unclear whether expressing an opinion in this vein amounts to unprofessional behaviour.

점점 더 많은 소셜 미디어는 ["전문직업성"의 개념이 외모, 언어 및 기타 개인 속성을 감시하기 위한 목적]으로 오용/사용 되었던 예를 공유하기 위해 쓰인다. 걱정스러운 것은, 여기에는 운동화 착용(하루 종일 발바닥에서 일하는 사람들에게 이치에 맞는 말), 넥타이를 매지 않는 것(영국에서는 감염 통제 조치에 따라 금지됨), 화장하고 염색한 머리, 그리고 한 예로 "전문적이지 않은" 이름에 대한 비판만을 포함하는 것이 아니다. 이것은 당연하게도 공동체 내에서, 그리고 실제로 그 직업에 합류하기 위한 훈련을 받고 있는 사람들로부터 점점 더 많은 우려를 유발했다. 전문직업성의 개념이 "무기화weaponised"되고 있으며, 동료 "전문가"들은 소셜 미디어를 사용하여 서로 다른 세계관과 의견을 바탕으로 한 비전문적인 행동으로 서로를 비난하고 있다. 예들은 거의 항상 존재해왔다. 그러나, 소셜 미디어는 이러한 토론을 공유하고, 토론하고, 증폭시키는 새로운 방법을 제공한다.

Increasingly, social media is used to share examples of where the concept of “professionalism” has been (mis-)used to police appearance, language and other personal attributes. Worryingly, not only do examples include wearing of trainers (which make sense for people working on their feet all day), not wearing a tie (which is banned under infection control measures in the UK), wearing make-up, dyed hair and, in one example, a criticism of an “unprofessional” name.67 This has understandably led to increasing concern from within the community and indeed from those training to join the profession that the notion of professionalism is being “weaponised”, with fellow “professionals” using social media to accuse one another of unprofessional behaviour based on differing world views and opinions.68 Examples have arguably always existed; however, social media offers the profession new ways of sharing, discussing and amplifying these debates.

전문직업성이라는 용어를 무기화한 최근의 두드러진 예가 뉴캐슬 대학의 의대생으로부터 나왔다. 이 학생은 치마 길이로 실기시험에서 벌점을 받았다. 억울함을 느낀 그녀는 그 이야기와 그 스커트의 사진으로 무장한 트위터에 글을 올렸고, 처벌을 내린 개인과 그것을 지지한 의대는 광범위한 비난을 받았다. 이는 [전문직업성이 더 이상 의심의 여지 없이 임상 및 학술 엘리트들에 의해 규제될 수 있는 것이 아님]을 보여준다. 학생들과 훈련생들은 침묵할 수 없고, 침묵해서는 안 되는 목소리를 가지고 있다.

A recent prominent example of the weaponisation of the term professionalism emerged from a medical student at the University of Newcastle (UK). This student received a penalty in a practical examination based on the length of her skirt. Feeling aggrieved, she took to Twitter armed with the story and a picture of the said skirt, attracting widespread criticism of the individual who issued the penalty and the medical school that upheld it.69 This demonstrates that professionalism can no longer be unquestioningly policed by the clinical and academic elite: students and trainees have a voice that cannot, and should not, be silenced.

그럼에도 불구하고, 전문직업성 논쟁을 소셜 미디어로 가져가는 흥미로운 측면 중 하나는 그것이 공공 영역이라는 것이다. 만약 우리가 "사회적 계약"의 개념으로 돌아간다면, 아마도 소셜 미디어는 전문직업성이 그들에게 어떤 의미인지에 대한 토론에 대중을 포함시킬 새로운 기회를 제공할 것이다. 궁극적으로, [학문적, 규제적 논쟁]이 아무리 중요하게 보일지라도, 그들은 대체로 "일반lay" 사람들의 목소리를 배제하고, 논쟁을 종결시키며, 그 결과 편협하고 사회 전반에 맞지 않게 된다.
Nevertheless, one of the interesting aspects of taking the professionalism debate to social media is that it is in the public domain. If we return to the idea of the “social contract”, perhaps social media offer a new opportunity to include the public in the debate about what professionalism means to them. Ultimately, however important the academic and regulatory debates may seem, they largely exclude the voices of “lay” people, closing the debate down and ensuring it is insular and out-of-step with society at large.

5 결론
5 CONCLUSIONS

이 기사에서는 우리가 제공한 답변보다 더 많은 질문을 제기했습니다. 우리의 의도는 전문직업성에 대한 지배적인 담론에 도전하고 그 개념이 더 이상 한 때 나타났던 것처럼 간단하지 않다는 것을 증명하는 것이었다. 이번 기사를 통해 학술대화의 질적 향상을 위해 이해당사자들과 폭넓게 참여하는 전문성의 정의에 대한 대화가 활성화되기를 기대한다. 우리는 단일한 글로벌 정의를 추구하는 것은 무의미하다는 대담한 진술을 하고 싶습니다. 우리가 논의한 바와 같이, 문화적 맥락은 전문직업성을 이해하는 데 매우 중요합니다. 이는 전 세계의 전문직업성에 대한 수준 높은 정의가 각 사회의 요구에 문화적으로 양립되고 정서적으로 지적인 정의라는 것을 의미한다.
In this article, we have posed more questions than we have provided answers. Our intention was to challenge dominant discourses around professionalism and demonstrate that the concept is no longer as straightforward as it once appeared. Through this article, we hope to reinvigorate conversations about the definition of professionalism that engage widely with stakeholders in order to improve the quality of the academic conversation. We want to make a bold statement: that seeking a single global definition is pointless. As we have discussed, cultural context is so important to our understanding of professionalism. This means that a high-quality definition of professionalism around the world is one that is culturally compatible and emotionally intelligent to the needs of each society.

간결함을 위해서, 우리가 토론에 포함하지 못한 몇 가지 쟁점들이 있다. 한 가지 예는 전문직업성의 구성에 내재된 잠재적인 사회 경제적 불평등이다: 특정 사회 규칙이나 단서에 대한 무의식적인 인식이 일부 개인에게 다른 개인보다 전문직업성에 더 쉽게 접근할 수 있도록 하는 정도가 있을 수 있다. 게다가, 전문직업성 문제가 발생할 때, 부는 비용이 많이 드는 변호사를 접하게 하고, 따라서 불리한 결과로부터 어느 정도의 보호를 제공하기 때문에 중요하다. 하지만, 이것들은 우리가 여기에 공간을 줄 수 있는 것보다 더 큰 아이디어들이기 때문에, 우리는 토론을 계속하도록 초대합니다.
In the interests of brevity, there are several issues that we have failed to include in our discussion. One example is the potential socioeconomic inequity built into the construct of professionalism: there is perhaps an extent to which unconscious awareness of particular social rules or cues makes access to professionalism easier for some individuals than others.4 Furthermore, when professionalism problems arise, wealth matters as it provides access to expensive defence lawyers and thus a degree of protection from adverse consequences. These are, however, bigger ideas than we can give space to here, so we invite the debate to continue.

마지막으로, 우리가 전문직업성에 대한 이해를 "사회적 계약"에 계속 기초한다면, 품질의 지표는 "대중"이 의료 전문가에 대한 그들의 기대치에 대해 어떻게 상담되는지are consulted가 될 필요가 있다. 변화하는 사회에 맞춰 전문직업성이 진화할 수 있도록 '전문직profession'과 '공공public'의 쌍방향 담론이 진행돼야 한다. 우리는 이것이 종종 서구, 백인, 이단 규범, 남성 엘리트들로부터 전문성에 대한 통제권을 빼앗는 데 도움이 될 수 있기를 바라며, 그 정의가 직업과 사회를 좀 더 폭넓게 대표할 수 있는 쪽으로 방향을 틀게 할 수 있기를 바란다. 따라서, 우리의 맥락에서, 만약 전문직업성이 "무기화"된다면, 우리는 이것이 지배적인 아이디어들을 영구화하기 보다는 도전하기 위한 것이기를 바랍니다.

Finally, if we are going to continue to base understandings of professionalism on the “social contract”, a marker of quality needs to be how the “public” are consulted about their expectations of medical professionals. There needs to be an ongoing two-way discourse between the “profession” and the “public” so that professionalism can evolve in line with changing societies. We hope that this may help us wrest control of professionalism from an academic – and often Western, white, hetero-normative, male – elite and allow the definition to pivot towards one that is more representative of the profession and society more widely. So, in our context, if professionalism is to be “weaponised”, we hope that this will be to challenge dominant ideas rather than to perpetuate them.

 


Med Educ. 2022 Jun 27. doi: 10.1111/medu.14862. Online ahead of print.

Re-opening Pandora's box: Who owns professionalism and is it time for a 21st century definition?

Affiliations collapse

Affiliation

1School of Medicine, University of Liverpool, Liverpool, UK.

PMID: 35761477

DOI: 10.1111/medu.14862

Abstract

Background: The concept of professionalism is dominant within health care education and the lives of practising clinicians globally, and yet there is no single agreed definition nor framework applied universally across the health care professions. This article questions how much attention is paid to where definitions of the concept of professionalism came from and whether the accepted norms within the dominant discourses are still truly applicable to a 21st century workforce.

Method: Taking a critical look at the existing body of literature on professionalism using a locus of medical education, this article reviews who the dominant voices have been in the creation of current understandings of professionalism. Using a pragmatic and targeted approach, regulatory body definitions of professionalism from across the world are compared to demonstrate the complexities of finding a universally accepted definition of the concept.

Results: The article suggests that the extant definitions are grounded but also stuck in a background of Western, White, heteronormative view of society and the professions of the past and argues that we need to better understand the expectations of professionalism from the perspectives of those who now work in health care and health care education, as well as reviewing the views of the "public" within this debate.

Conclusions: By reopening the "Pandora's box" of professionalism, this article argues that we can improve the quality of definitions-and thus application-of professionalism for health care professionals and patients.

논증 이론이 어떻게 평가 타당도에 정보를 제공하는가: 비판적 문헌고찰 (Med Educ, 2022)
How argumentation theory can inform assessment validity: A critical review
Benjamin Kinnear1,2 | Daniel J. Schumacher1 | Erik W. Driessen3 | Lara Varpio4

 

1 소개
1 INTRODUCTION

많은 현대 의료 전문 교육(HPE) 학자들은 [평가의 타당성]을 논증argumentation의 한 형태로 제시한다. 즉, 평가 데이터의 특정한 해석 및 사용에 대한 주장을 의미한다. 그러나 HPE 학자들은 아직 validation을 뒷받침하는 논증argumentation의 철학적, 이론적, 또는 실제적 측면을 탐구하지 않았다. [타당성 주장validity argument]라고 주장하는 것은 종종 평가의 장점을 평가, 우선순위 부여 또는 토론하기 위한, 가이딩 프레임워크가 없는, 그저 증거의 나열일 뿐이다. 이는 증거를 정리할 줄만 알고 [변론이 어떻게 구성돼야 하는지, 누가 변론을 평가할지, 어떻게 변론을 평가할지]는 모르면서 법정 재판을 여는 것과 비슷하다. 우리는 HPE가 우리의 현재 이해와 유효성의 사용을 지원하기 위해 논쟁 이론에 대한 더 깊은 이해를 개발하는 것이 중요하다고 주장한다.

Many modern health professions education (HPE) scholars frame assessment validity as a form of argumentation: A claim about a specific interpretation and use of assessment data.1-4 However, HPE scholars have yet to delve into the philosophical, theoretical, or practical aspects of argumentation that undergird validation. What are purported to be validity arguments are often merely the listing of evidence without a guiding framework to evaluate, prioritise, or debate their merits. This is akin to holding a courtroom trial while only knowing how to organise the evidence, but not knowing how the argument should be structured, who will evaluate the argument, nor how they will evaluate it. We contend that it is vital for HPE to develop a deeper understanding of argumentation theory to support our current understandings and uses of validity.

이것은 타당성에 대한 중요한 통찰이 HPE 학자들에 의해 이미 생성되지 않았다는 것을 말하는 것이 아니다. 아직 멀었지요. 우리 분야의 타당성에 대한 이해는 많은 HPE 연구자들의 연구 덕분에 발전했다. 예를 들어, 

  • 쿡, 하탈라, 그리고 다우닝은 Messick과 Kane의 것과 같은 논증 기반 타당성 프레임워크를 HPE 평가 영역으로 가져오는 데 도움을 주었다. 
  • St. Onge와 Young은 우리 분야의 타당성에 대한 이해의 현재 상태를 파악하는 데 도움을 주었다. 
  • Govaerts, Schwirth, Van der Vleuten 및 다른 사람들은 프로그램적 평가의 맥락에서 타당성에 대한 우리의 현장 관점을 발전시켰다. 

HPE가 [타당성을 주장으로 개념화하도록 진화한 것]은 이들과 다른 학자들 덕분이다. 그럼에도 불구하고, HPE의 현대 타당성 프레임워크의 사용은 타당성 주장에 대한 청중, 구조 및 평가 표준에 대한 명시적인 설명이 부족하다. 따라서 다음과 같은 중요한 질문에 대한 답이 없습니다. 이러한 질문에 대한 답을 알지 못하면 우리 분야는 주장으로서의 타당성 패러다임을 완전히 수용하기에 적합하지 않다.

  • 타당성 주장은 어떻게 그리고 누가 평가해야 하는가? 
  • 타당성 주장은 어떻게 구성되어야 하는가? 

This is not to say that important insights into validity have not already been generated by HPE scholars. Far from it. Our field's understanding of validity has progressed thanks to the work of many HPE researchers.

  • For instance, Cook, Hatala, and Downing have helped bring argument-based validity frameworks, such as those of Messick and Kane,56 into the HPE assessment sphere.1-37-14 
  • St. Onge and Young have helped map out the current state of our field's understanding of validity.415-17 
  • Govaerts, Schuwirth, van der Vleuten, and others have progressed our fields view of validity in the context of programmatic assessment.18-26 

It is thanks to scholars like these, and others, that HPE has evolved to conceptualise validity as argument. And yet, HPE's use of contemporary validity frameworks lack an explicit description of the audiences, structures, and evaluation standards for validity arguments. This leaves important questions unanswered:

  • How should validity arguments be evaluated and by whom?
  • How should validity arguments be structured?

Not knowing the answers to these questions leaves our field ill-equipped to fully embrace the validity-as-argument paradigm.

문헌에 대한 이 비판적 리뷰에서, 우리는 HPE 청중에게 맞춤화된 주장 이론에 대한 설명을 제공하고, 그것이 HPE 평가에 제공할 수 있는 고유한 통찰력을 설명하고, 주장의 다른 접근 방식이 어떻게 우리가 생성적인 방식으로 타당성의 본질을 다시 개념화하는 데 도움이 될 수 있는지를 제시한다. 우리는 주장 이론 내에서 두 가지 다른 방향을 제시하고 각각이 어떻게 타당성 주장을 이해하고, 구조화하고, 평가하는 다른 방법을 만드는지에 대해 논의한다. 이러한 추상적인 이론을 보다 구체화하기 위해, 우리는 이러한 접근 방식을 HPE 관련 사례(상자 1)에 적용한다. 이 사례 토론을 통해, 우리는 논쟁 이론이 우리의 평가 노력을 향상시키는 데 어떻게 도움이 될 수 있는지를 강조한다. 검토를 위해, 우리는 먼저 타당성 주장과 주장 이론의 정의를 제공한다.
In this critical review of the literature, we offer a description of argumentation theory—tailored to the HPE audience—articulating the unique insights it can offer to HPE assessment, and presenting how different approaches to argumentation can help us reconceptualize the nature of validity in generative ways. We present two different orientations within argumentation theory and discuss how each creates different ways of understanding, structuring, and evaluating validity arguments. To make these abstract theories more tangible, we apply these approaches to an HPE-relevant case (Box 1). Via this case discussion, we highlight how argumentation theories can help advance our assessment efforts. To frame our review, we first offer definitions of validity arguments and argumentation theory.


상자 1. 이 사례는 HPE 평가 타당성에서 논쟁 패러다임의 중요성에 대한 실제 사례를 나타낸다. 이 사례는 결과 및 토론 섹션에서 다시 언급할 것이다.
Box 1. 
This case represents a real-world example of the importance of argumentation paradigms in HPE assessment validity. The case is referenced throughout the Results and Discussion sections

사례 연구 – 시간 변동에 따른 프로모션 결정으로 전환되는 APGME 프로그램
Case study – A PGME programme transitioning to time-variable promotion decisions

대학원 의학 교육 프로그램(PGME)은 수년 동안 강력한 평가 프로그램을 개발했다. 프로그램 리더는 문헌 검토 및 새로운 검증 연구를 통해 학습자 성과에 대한 종합적 의사결정에 대한 타당성 증거를 수집했으며, 시간-변동time-variable 교육 접근 방식으로 전환하기를 희망하고 있다. 시간-기반 일정에 따라 관리 수준이 낮은 수준으로 승급되기보다는, [총괄적 진급 결정]이 학습자가 프로그램을 진행하는 시기와 방법을 결정하는 데 그칠 것입니다. 이 잠재적 변화에 대해 중요한 이해관계자(예: 학습자, PGME 리더, 부서 리더, 인증 관계자, 인증 기관)를 참여시킬 때, 프로그램은 보편적으로 다음과 같이 요청된다.

  • "총괄적 진급 결정이 방어가능하다는 것을 어떻게 확신하십니까? 
  • 즉, "올바른 진급 결정을 내릴 수 있다는 당신의 주장argument은 무엇입니까?"라는 것이다. 

프로그램이 그들의 주장을 시작하기 전에, 그들은 대답해야 할 몇 가지 질문이 있었다. 

  • 주장argument은 어떻게 구성되어야 하는가?
  • 어떤 기준으로 평가되어야 하는가?
  • 어떤 청중이 판단을 내릴 것인가?

A post-graduate medical education programme (PGME) has developed a robust programme of assessment over several years. Programme leaders have collected validity evidence for summative decisions about learner performance via literature review and new validation studies, and are hoping to transition to a time-variable training approach. Rather than being promoted to lesser degrees of supervision on a time-based schedule, summative promotion decisions will solely determine when and how learners progress through the programme. When engaging important stakeholders (e.g. learners, PGME leaders, departmental leaders, accreditation officials, certifying bodies) about this potential change, the programme is universally asked,

  • “How do you know your summative promotion decisions are defensible?”
  • In other words, “What is your argument that you can make the right promotion decision?”

Before the programme could begin making their argument, they had several questions that needed to be answered.

  • How should their argument be structured?
  • By what standard would it be evaluated?
  • Which audience(s) would levy judgement?

새로운 수사학이 이 사건을 어떻게 알려줄 수 있을까?
How can new rhetoric inform this case?

프로그램 리더들은 그들의 타당성 주장이 각 [이해관계자 그룹]에 반영될 필요가 있다는 것을 인식한다. 따라서 그들의 주장은 많은 다른 기대에 부응해야 한다.

  • 프로그램 리더는 먼저 어떤 이해관계자가 청중으로 봉사하는 것이 가장 중요한지 확인하고, 그들의 가치를 이해하려고 시도하며, 각 이해관계자 집단이 수용할 수 있을 때까지 그들의 타당성 주장을 반복적으로 구성, 평가 및 다듬는다.
  • 인증 및 인증 기관은 이 특정 PGME 프로그램의 성과와 후과에 관심이 있습니다. 따라서 프로그램의 타당성 주장에는 졸업생들이 돌보는 환자들이 양질의 진료를 받는다는 증거가 포함된다.
  • 대조적으로, 학습자들은 평가 관행의 공정성과 형평성에 대해 염려한다. 따라서 프로그램의 타당성 주장에는 다양한 학습자 정체성 그룹(예: 인종, 민족성, 성 정체성, 장애 상태)이 평가되는 방법과 그룹에 대한 편향의 증거가 있는지에 대한 양적 및 질적 데이터가 포함된다.

The programme leaders recognise that their validity arguments needs to resonate with each stakeholder group; therefore, their argument must to respond to many different expectations.

  • The programme leaders first identify which stakeholders are most important to serve as audiences, attempt to understand their values, and iteratively construct, evaluate, and refine their validity argument until it is acceptable to each stakeholder gorup.
  • Accrediting and certifying bodies are interested in the outcomes and consequences of this specific PGME programme. Therefore, the programme's validity argument includes evidence that patients cared for by graduates receive high-quality care.
  • In contrast, learners are concerned about equity and fairness in assessment practices. Therefore, the programme's validity argument includes quantitative and qualitative data on how different learner identity groups (e.g. race, ethnicity, gender identity, disability status) are assessed and whether there is evidence of bias against any groups.

비공식 논리가 어떻게 이 사건을 알릴 수 있을까?
How can informal logic inform this case?

프로그램 리더는 상당한 양의 타당성 증거를 수집하지만, 처음에는 이해관계자가 평가할 수 있는 설득력 있는 주장으로 정리되지 않았다. [툴민의 모델]을 사용하여 프로그램 리더는 주장, 데이터, 영장warrants, 반박 및 기타 중요한 요소를 signpost하여 청중의 분석을 용이하게 한다. 프로그램 리더와 이해관계자는 타당성 주장이 관련성, 수용성 및 충분성의 측면에서 평가될 것이며 툴민의 모델이 부적절하다고 판단되는 주장의 모든 측면을 식별하는데 사용될 것이라는 데 동의한다.
Programme leaders collect significant amounts of validity evidence, but initially do not have it organised into a cogent argument for stakeholders to evaluate. Using Toulmin's model, the programme leaders signpost claims, data, warrants, rebuttals, and other salient elements, facilitating easier analysis by the audience. Programme leaders and stakeholders agree that the validity arguments will be evaluated in terms of relevance, acceptability, and sufficiency, and that Toulmin's model will be used to identify any aspects of the argument that are deemed inadequate.

논쟁은 언제 완료됩니까?
When is an argument complete?

두 이해관계자 그룹은 프로그램의 [최초 타당성 주장]이 부적절하다고 판단하여, 다른 주장 측면에 대한 [추가 증거와 해명]을 요구했다. 프로그램 리더들은 두 그룹 모두 주장이 받아들여질 수 있다는 것을 발견할 때까지 증거를 수집하고 평가하기 위해 이해관계자들과 반복적으로 협력했다. 프로그램 리더는 유사한 타당성 주장 과정에 다른 이해관계자 집단을 참여시키는 데 자원을 집중할 수 있다.

Both stakeholder groups found the programme's initial validity argument to be inadequate, asking for additional evidence and clarification on different argument aspects. Programme leaders worked iteratively with stakeholders to collect and evaluate evidence until both groups found the argument to be acceptable. Programme leaders could then focus resources on engaging other stakeholder groups in similar validity argumentation processes.


 

1.1 HPE 내부 및 외부의 유효성 주장
1.1 Validity arguments within and beyond HPE

  • [타당성validity]은 [평가 점수에 관한 것]이 아니라, 그 [점수의 해석과 사용]에 관한 것이다.
  • [타당화validation]는 그러한 [해석과 사용을 뒷받침하는 주장을 개발하는 과정]이다.
  • [타당성 주장validity argument]은 [방어 가능한 추론 사슬]을 형성하기 위한, 연결되는 주장(즉, 관련된 현상에 대한 주장)으로 구성된다.

예를 들어, 우리는 역량이 어떻게 정의되는지, 어떻게 그것이 관찰될 수 있는지, 그리고 어떻게 평가될 수 있는지에 대한 주장claims을 한다. 그러나, 이러한 주장claims은 사실의 진술이 아니다; 대신에, 논의되고, 받아들여지고, 반박될 수 있는 주장들assertions이다. 만약 타당성 주장validity argument 내의 주장claims을 객관적이고 정적이며 비활동적인 선언으로 본다면, 그것은 그 안에 내재된 주장 전략argumentation strategies이 너무 널리 사용되고 받아들여져서 우리는 더 이상 그것들을 경쟁 가능한 것으로 인식하지 않기 때문이다. HPE 평가 결정이 근거로 하는 타당성 주장 주장validity argument claims은 논쟁argumentation에 몰두한 주장assertion일 뿐이므로 논쟁의 여지가 있다.

  • Validity is not about assessment scores but rather the interpretations and uses of those scores.27-30 
  • Validation is the process of developing an argument to support those interpretations and uses.29 
  • Validity arguments are comprised of claims—i.e. assertions about the phenomena engaged with—that connect to form a defensible chain of reasoning.

For instance, we make claims about how competence is defined,31 how it can be observed,32 and how it can be assessed.33 However, these claims are not statements of fact; instead, they are assertions that can be debated, accepted, or refuted. If the claims within a validity argument are viewed as objective, static, and inactive declarations, it is because the argumentation strategies embedded therein have become so pervasively used and accepted that we no longer recognise them as contestable. The validity argument claims upon which HPE assessment decisions rest are merely assertions steeped in argumentation and so are up for debate.


[주장argument으로서의 타당성validity의 개념]은 수십 년 동안 존재해 왔고 발전해 왔다. 비록 많은 HPE 학자들이 메식스나 케인의 타당성 논증 개념화를 사용하여 활동하지만, HPE 외부의 학자들은 다른 접근법을 제시한다.

  • Bachman은 타당화 작업이 [평가 활용 논증]에 해당하며, 이것은 평가 [수행]을 [해석]에 연결하는 [평가 타당성 논증]과 [해석]과 [결정]을 연결하는 [평가 활용화 논증]로 구성된다고 한다.
  • Kane은 유사하게 평가 점수의 사용에 내재된 추론과 가정을 명시하는 [해석/사용 논증]를 제안한다.
  • Mislevy는 평가를 뒷받침하는 주장들이 평가 시스템의 설계와 구현에 통합되는 검증에 대한 [증거 중심 설계 접근법]을 설명한다.

The concept of validity as argument has existed and evolved for decades.34-36 Although many HPE scholars operate using Messick's or Kane's conceptualization of validity argumentation,1, 3, 26, 37-43 scholars outside HPE present other approaches.44 

  • Bachman advocates validation work should entail an assessment use argument, which is comprised of
    • an assessment validity argument linking assessment performance to an interpretation and
    • an assessment utilisation argument linking interpretations to a decision.4546 
  • Kane similarly proposes an interpretation/use argument that explicitly states the inferences and assumptions ingrained within use of assessment scores.647 
  • Mislevy describes an evidence-centreed design approach to validation in which the arguments underpinning assessment are integrated into the design and implementation of assessment systems.4849 

이 세 명의 비 HPE 학자들은 모두 [스티븐 툴민]이 제시한 주장 구조를 사용하지만, 검증에 사용되는 기초적인 주장 지향만을 표면적으로 다룬다. 불행하게도, 툴민의 구조는 아직 HPE 검증의 담론에 들어가지 않았다. 이러한 누락은 HPE에 문제를 발생시킨다. HPE의 타당성 주장에는 우리가 종종 인식하지도, 비판하지도 못하는 가정과 사고 방식이 포함되어 있다. 이 실패는

  • [타당성 주장이 객관적인 진리]라고 가정하면서,
  • [(특정 이데올로기에 생명을 불어넣는) 추론을 위한 구조가 아니]라고 가정할 위험이 있다.

다시 말해, [우리의 평가 결정]과 그 [타당성에 대한 개념화에 entrench된 주장]은 우리가 각 결정이 언제 그리고 어떻게 타당한지를 의도적으로 고려할 수 있도록 명시되어야 한다. [논증 이론argumentation theory]은 우리가 그 명확성을 성취하는 것을 도울 수 있다.

These three non-HPE scholars all employ argument structures put forth by Stephen Toulmin,27, 29, 45, 48-51 but they only superficially address the underlying argumentation orientation utilised for validation. Unfortunately, Toulmin's structures—much less argument orientations—have yet to enter the discourse of HPE validation. This omission generates problems for HPE. Embedded within HPE's validity arguments are assumptions and ways of thinking that we often fail to recognise and critique. This failure risks assuming that

  • the validity arguments are objective truths and
  • not structures for reasoning that bring certain ideologies to life.

In other words, the arguments entrenched in our assessment decisions and in our conceptualizations of their validity must be made explicit so that we can deliberately consider when and how each decision is valid. Argumentation theory can help us achieve that clarity.

1.2 논증 이론
1.2 Argumentation theory

논증 이론은 논리학, 언어학, 철학, 심리학, 법학과 같은 여러 학문에서 끌어내어 논증적 담론의 생산, 분석, 평가를 다루는 학문이다. 다양한 학문 분야의 학자들이 논쟁 이론의 태피스트리에 독특한 실타래를 추가하는 등 몇 가지 지향점이 존재한다. Van Eemeren 등은 논증 이론의 핵심인 몇 가지 측면을 포함하는 [논증의 정의]를 제공한다.

Argumentation theory is not a single unified theory; instead, it is a field of study that draws from multiple disciplines (e.g. Logic, Speech, Linguistics, Philosophy, Psychology, and Law) to grapple with the production, analysis, and evaluation of argumentative discourse (spoken or written).52, 53 Several orientations exist, with scholars from a wide range of academic disciplines adding unique threads to the tapestry of argumentation theory. Van Eemeren et al. provide a definition of argumentation that includes several aspects that are key to argumentation theories:

논증(論 is)은 이성적인 판사 앞에
논점을 정당화하거나 반박하기 위한 명제들의 집합을 제시함으로써,
청취자나 독자에게 논쟁적인 관점의 수용성을 증가(또는 감소)시키는 것을 목표로 하는
추론의 언어적이고 사회적인 활동이다. 
Argumentation is a verbal and social activity of reason
aimed at increasing (or decreasing) the acceptability of a controversial standpoint for the listener or reader,
by putting forward a constellation of propositions intended to justify or refute the standpoint before a rational judge.52

이러한 개념화는 [논증]이 [사람들(사회) 간에 교환되는 언어(언어)에 의존하는 노력(활동)]임을 강조한다. 이 의사소통은 목표 지향적이다; 목표청중(단일 청취자, 독자 또는 청취자 또는 독자의 그룹)이 특정한 관점이나 해석(관점)에 동의하거나 동의하지 않도록 설득하는 것이다. 중요한 것은, 논쟁은 옹호되는 관점이 청중들에 의해 논쟁의 여지가 있는 사회적 상황에서 존재한다. 따라서, 주장(명제 별자리)청중(합리적 판단자)이 주장자와 일치하도록 설득할 관점에 대한 특정한 해석을 제시하기 위해 만들어진다. 

> This conceptualization highlights that argumentation is an endeavour (activity) that relies on language (verbal) being exchanged between people (social).
> This communication is goal oriented (aimed); the goal is to convince an audience (single listener or reader or groups of listeners or readers) to agree (increase acceptability) or disagree (decrease acceptability) with a particular viewpoint or interpretation (standpoint).
> Importantly, argumentation exists in social situations where the viewpoint being espoused is disputable (controversial) by an audience.
> Therefore, arguments (constellations of propositions) are created to present a particular interpretation of the viewpoint (justify or refute the standpoint) that will convince the audience (rational judge) to align themselves with the arguer.

프로세스와 표준에 대한 공유된 개념이 없다면 논쟁은 헛된 것이다.
Without a shared conception of processes and standards, argumentation is futile.52

많은 다른 논쟁 이론들이 어떻게 주장이 실현될 수 있는지를 제안한다. 어떤 이들은 [연역적 추론]의 사용을 앞에 두는 반면, 다른 이들은 [대화의 힘]을 강조한다. 어떤 것은 [규범적 기준]을 강조하는 반면, 어떤 것은 [수사적 목적]을 강조한다. 게다가, 논쟁 학자들은 이 이론들을 토론하고 수정하며, 다른 해석을 제공한다. 분명히, 이 전체 학술문헌의 검토는 타당성에 대한 HPE의 사고를 발전시키기 위한 실질적인 통찰력을 쉽게 제공하지 못할 것이다. 그러나 HPE의 평가자와 평가 연구자가 활용할 수 있는 중요한 고려사항과 구체적인 응용을 제공할 수 있는 논쟁 이론의 보다 표적화된 검토. 따라서 HPE의 유효성 주장에 유용하게 적용될 수 있는 이론과 학술적 해석을 선택했다.
Many different theories of argumentation propose how arguments could be realised. Some foreground the use of deductive reasoning,54 whereas others accentuate the power of dialogue.55 Some stress normative standards,56 whereas others emphasise rhetorical aims.57 Furthermore, argumentation scholars debate and revise each of these theories, offering different interpretations. Clearly, a review of this entire body of scholarship would not readily offer practical insights for advancing HPE's thinking about validity. However, a more targeted review of argumentation theories that can offer important considerations and concrete applications that could be harnessed by HPE's assessors and assessment researchers. Therefore, we selected theories and scholarly interpretations thereof that could be usefully applied to validity argumentation in HPE.

2 방법
2 METHODS

우리의 조사는 다음과 같이 물었다.

  • 논증 이론은 어떻게 우리가 새롭고 생성적인 방법으로 HPE 평가 타당성의 본질을 개념화하는 데 도움을 줄 수 있는가? 

이 질문에 답하기 위해 우리는 [비판적 검토]를 실시했다. [비판적 검토]는 [체계적 검토]처럼 일반화될 수 있는 진실을 생산하기 위한 것이 아니다.

  • 오히려 [비판적 검토]는 [구성주의적 존재론과 인식론]에 뿌리를 두고 있으며, "문제를 해석하는 현재의 방법을 다시 구상하기 위해 다른 영역의 문학과 이론을 끌어낸다."
  • 연구팀은 [특정 주제에 관련된 모든 지식을 종합하는 것]을 목표로 하는 대신, 문헌에 대한 [비판적 검토와 주관적 해석을 수행]한다. 따라서 연구팀은 "발견된 문헌을 평가하고 해석하기 위해 그들의 관점을 사용하는 [연구 도구의 역할]을 한다." 

Our investigation asked:

  • How can argumentation theory help us conceptualise the nature of HPE assessment validity in new and generative ways?

To answer this question, we conducted a critical review. Critical reviews are not intended to produce generalizable truths58 like systematic reviews.

  • Rather, critical reviews are rooted in a constructivist ontology and epistemology59 and “draw on literature and theory from different domains to re-envision current ways of interpreting the problem.”60 
  • Instead of aiming to synthesise all knowledge relevant to a particular topic, the research team conducts a critical review and subjective interpretation of a body of literature. The research team thus “acts as a research instrument, using their perspective to appraise and interpret the literature uncovered.”60 

이 접근 방식은 평가 타당성에 대한 가정과 선입견을 조사함으로써 HPE를 발전시킬 수 있는 논쟁 이론의 선택을 설명하려는 우리의 목표와 일치한다. 우리는 이론 뭉치를 생성하고 해당 코퍼스를 분석하기 위해 Kahkee 등이 자세히 설명한 5단계 비판 검토 프로세스를 따랐다. 우리는 아래의 반복적 순환에 관여했다. 

  • 집중(즉, 연구 목표의 구성/설정) 
  • 탐색(즉, 논증 이론에서 보초 관점에 대한 표적 탐색) 
  • 평가(즉, 목적과의 관련성을 위한 원고 평가) 
  • 샘플링(즉, 연구에 대한 통찰력을 제공할 수 있는 원고 결정) 
  • 분석(즉, 각 이론의 타당성 주장에 대한 적용 가능성 평가)을 수행합니다.

This approach aligns with our goal of describing a selection of argumentation theories that can advance HPE by examining the assumptions and preconceptions around assessment validity. We followed the five-step critical review process detailed by Kahlke et al to generate a corpus of theories and to analyse that corpus.60 We engaged in iterative cycles of

  • focusing (i.e. constructing/revising the research aims);
  • searching (i.e. targeted exploration for sentinel perspectives in argumentation theory);
  • appraising (i.e. assessing manuscripts for relevance to our aims);
  • sampling (i.e. determining manuscripts potential to offer insights into our research); and
  • analysing (i.e. assessing each theory's applicability to validity argumentation).

우리의 검색 전략(그림 1)은 논쟁 이론 분야의 선두주자로 간주되는 저자에 의해 쓰여진 인용이 높은 동료 검토 저널 기사를 식별함으로써 논쟁 이론 분야의 주요 저작물을 찾는 것으로 시작되었다. 논쟁 이론이 인문학에 자리 잡고 있다는 점을 고려할 때, 우리는 동료 검토 저널 기사가 유익하겠지만, (이 영역에서 매우 가치 있는 보급 형태인) 책과 교과서로 범위를 넓혀야 할 것이라는 것을 인식했다. 우리는 이러한 원고를 검토하고 그 분야의 역사에서 몇 가지 지점에서 논의의 이론적 및 실제적 측면을 다루는 논쟁 이론의 주요 사고 유형을 매핑했다. 
Our search strategy (Figure 1) began by locating seminal works in the field of argumentation theory by identifying highly cited peer-reviewed journal articles that were written by authors considered leaders in the field of argumentation theory. Given that argumentation theory sits in the humanities, we recognised that, although peer-reviewed journal articles would be informative, we would also have to broaden our scope to books and textbooks since these are highly valued forms of dissemination in this domain. We reviewed these manuscripts and mapped the leading strains of thought in argumentation theory that addressed theoretical and/or practical aspects of argumentation from several points in the field's history.

우리는 논증과 HPE 평가 타당성에 대한 우리의 전문 지식을 사용하여 "연구 질문에 대한 출처의 관련성 및 포함된 정보에 의해 추가된 가치에 대한 그들의 감각에 기초하여 포함을 위한 논문을 평가한다". 주요 저작물에 대한 검토와 병행하여 ERIC, Scopus, Web of Science, PubMed 및 Medline 데이터베이스가 인문학적 및 교육 관련 출판물을 다루는 광범위한 문헌을 인덱싱하기 때문에 이를 검색하기 위해 학술 사서들과 함께 ERIC, Scopus, Web of Science, PubMed 및 Medline 데이터베이스를 검색했다. 우리는 원래 말뭉치에 포함되지 않은 인용도가 높은 책과 동료 검토 저널 기사를 검색했다. 우리는 추가적인 핵심 참조를 식별하기 위해 소급적으로 눈덩이 샘플링을 사용했다(즉, 주요 작업에 나열된 참조 조사).

We used our expertise in argumentation and HPE assessment validity to “appraise papers for inclusion based on their sense of a source's relevance to the research question and the value added by the information it contains.”60 In parallel to our review of seminal works, we worked with an academic librarian to search ERIC, Scopus, Web of Science, PubMed, and Medline databases because they index a wide range of literatures—i.e. both journal articles and books—addressing humanities- and education-related publications. We searched for highly cited books and peer-reviewed journal articles that were not included in our original corpus. We used snowball sampling retrospectively (i.e. investigating references listed in seminal works) to identify additional key references.

BK와 LV는 corpus를 검토하여 [논쟁의 분야]을 형성한 저명한 이론과 학자들의 목록을 독립적으로 작성했다. 이 목록들은 포괄적이게 의도된 것이 아니라 논쟁에서 [가장 영향력 있는 목소리와 관점]을 포착하기 위해서였다. 그런 다음 우리는 합의된 토론을 통해 이것들을 [하나의 목록]으로 비교하고 해결했다. 우리는 HPE에 가장 적합한 주장 이론을 결정하기 위해 합의 목록과 정렬된 corpus의 출처를 검토했다. 구체적으로, 우리는 어떤 이론이 실제 검증 작업과 더 광범위한 학술적 노력의 맥락에서 평가 검증에 관여하는 HPE 학자들에게 유익한 통찰력을 제공하는지를 고려했다. 표 1은 우리가 검토했던 논증 이론 내에서 두드러진 방향을 제시하면서 이 연구의 요약을 제공한다.

BK and LV reviewed the corpus to independently create lists of the pre-eminent theories and scholars that have shaped the field of argumentation. These lists were not intended to be comprehensive, but rather to capture the most influential voices and viewpoints within argumentation. We then compared and resolved these into a single list through consensus discussions. We reviewed sources from the corpus that aligned with the consensus list to determine which argumentation theories were most applicable to HPE. Specifically, we considered which theories would provide beneficial insights to HPE scholars engaged in assessment validation, both in the context of practical validation work and broader scholarly endeavours. Table 1 provides a summary of this work, presenting prominent orientations within argumentation theory which we considered, though some we did not fully discuss in our findings.

2.1 반사율
2.1 Reflexivity

비판적 검토 연구팀은 "발견된 문헌을 평가하고 해석하기 위해 그들의 관점을 이용하는 [연구 도구의 역할]을 한다." 
이 목표를 염두에 두고, 우리의 고유한 관점, 전문 분야 및 개인적 배경이 합성 활동에 정보를 제공했다. 우리 팀은 다양한 관심과 경험을 가진 의학교육 학자로 구성되었다. 두 명의 팀 구성원(BK 및 DS)은 HPE 연구에 적극적으로 참여하는 임상의 교육자입니다. 이 연구의 1차 연구자(BK)는 HPE 박사 과정의 일부로 논쟁 이론 문헌에 몰두했다. 그는 또한 역량 기반 의료 교육, 학습자 평가 및 타당성에 대한 전문 지식을 가지고 있다. 다른 임상 교육자(DS)는 CBME 및 평가 타당성에 대한 전문 지식을 보유하고 있습니다. ED는 학습자 평가, 유효성 및 CBME에 대한 전문 지식을 갖춘 PhD 훈련을 받은 연구원입니다. 본 논문의 선임 연구자(LV)는 논증 이론, 수사학, 전문적 커뮤니케이션에 중점을 둔 박사 훈련을 받은 연구원입니다. 그녀의 통찰력은 팀이 논쟁에서 중요한 학자와 이론을 식별하고 이러한 학자와 이론들이 HPE에서 주장된 타당성에 대한 다른 접근법과 어떻게 일치하는지 되돌아보는 데 도움을 주었다. 팀 연구 토론은 종종 HPE의 타당성에 대한 우려에 어떤 주장 이론이 유용하게 적용될 수 있는지에 대한 토론을 포함한다.

The critical review research team “acts as a research instrument, using their perspectives to appraise and interpret the literature uncovered.”60 With this goal in mind, our unique perspectives, areas of expertise, and personal backgrounds informed the synthesis activity. Our team consisted of medical education scholars with diverse interests and experiences. Two team members (BK and DS) are clinician educators who actively engage in HPE research. The study's primary researcher (BK) immersed himself in the argumentation theory literature as part of his PhD in HPE; he also has expertise in competency-based medical education (CBME), learner assessment, and validity. The other clinician educator (DS) has expertise in CBME and assessment validity. ED is a PhD-trained researcher with expertise in learner assessment, validity, and CBME. The senior researcher on this paper (LV) is a PhD-trained researcher whose graduate work focused on argumentation theory, rhetoric, and professional communication. Her insights helped the team to identify significant scholars and theories in argumentation and to reflect on how these scholars and theories aligned with other approaches to validity espoused in HPE. Team research discussions often involved debates about which argumentation theories could be usefully applied to concerns about validity in HPE.

[방법론적 성찰성] 또한 우리의 연구를 이끌었다. [여러 저자의 이론]과 논쟁 이론의 학파 내 및 학파 간에 보유된 [일반적인 가정]을 검토함으로써, 우리는 HPE 평가 타당성을 위해 가장 생성 가능성이 있다고 생각되는 이론을 선택했다. 우리는 논증 이론의 광범위한 표현을 포함하려고 노력했지만, 주로 우리의 선택에 대한 안내 원칙은 다음과 같았다.

  • 이 이론은 우리가 HPE 맥락에서 타당성 주장을 이해하는 데 실질적으로 도움을 줄 수 있는가?

Methodological reflexivity also guided our research. By reviewing the theories from several authors and the common assumptions held within and across schools of argumentation theory, we selected theories we thought held the most generative possibilities for HPE assessment validity. We sought to include a broad representation of argumentation theories, but the guiding principle primarily informing our selections was:

  • Can this theory substantially help us understand validity arguments in the HPE context?

 

3 결과
3 RESULTS

표 1에서, 우리는 HPE의 타당성 주장에 대한 각 이론의 적용 가능성에 대한 우리의 평가와 함께 [다섯 가지 중요한 주장 이론]의 주요 측면을 개략적으로 설명한다. 반복적인 분석 주기를 통해, 우리는 [새로운 수사학]과 [비공식 논리]의 두 가지 방향이 HPE 평가 타당성에 대한 특히 유용한 통찰력을 제공한다는 것을 결정했다. 이것은 다른 주장 지향이 HPE에 대한 가치가 없다고 말하는 것이 아니다. 대신, 우리의 전문 지식을 기반으로, 우리는 [새로운 수사학]과 [비공식 논리]가 우리 분야의 평가 타당성에 특히 적용될 수 있다고 제안한다. 우리는 먼저 이러한 방향을 검토한 다음 HPE의 타당성 주장과 관련이 있다고 믿는 주장의 세 가지 측면, 즉 청중, 주장 구조 및 평가 표준에 초점을 맞춘다.
In Table 1, we outline key aspects of five prominent theories of argumentation, along with our assessments of each theory's applicability to HPE's validity arguments. Through our iterative cycles of analysis, we determined that two orientations—new rhetoric and informal logic—offered particularly useful insights into HPE assessment validity. This is not to say that other argumentation orientations are without value for HPE; instead, based on our expertise, we suggest that new rhetoric and informal logic are especially applicable to assessment validity in our field. We first review these orientations, then focus on three aspects of argumentation that we believe are relevant to validity argumentation in HPE: audience, argument structure, and evaluation standards.

3.1 새로운 수사학
3.1 New rhetoric


20세기 중반에 두 명의 철학자인 하임 페렐만과 루시 올브레히츠-티테카는 경험적 증명보다는 가치 판단에 더 의존하는 논증 이론을 발전시켰다. [새로운 수사학]은 아리스토텔레스의 수사학과의 유사성, 특히 아리스토텔레스가 논쟁에서 [청중]과 [설득]에 중점을 둔 핵심적 중요성 때문에 그렇게 명명되었다. [새로운 수사학]에서 논쟁의 목표는 절대적 진리의 증명보다는, 논쟁자에 의해 제기되는 [주장에 대한 청중의 수용을 얻는 것]이다. 논쟁의 타당성은 청중들의 설득에 달려있다. 논쟁자들은 [청중의 가치와 신념]에 대해 설명하고 적응해야 하며, 따라서 타당성을 [청중을 설득하는 능력]과 연결시켜야 한다. 청중은 논쟁자의 주장에 대해 [부분적으로 설득]될 수 있기 때문에, 타당성은 [정도의 문제]로 존재한다. 이러한 의미에서, 새로운 수사학은 주장의 타당성을 결정하기 위한 외부 규범적 틀을 제공하지 않는다. 대신, 그것은 수용 가능하고 그럴듯한 것을 결정하기 위해 청중에게 그들의 가치와 규범을 사용하도록 한다. 설득이 합리적인 주장 분석의 필요성을 없애지는 않고, 다만 청중의 가치관 맥락에 합리성을 둔다. 중요한 것은, 설득은 속이거나 조작하는 방법이 아니라, 특정 [청중의 원칙과 예상 기준]을 [평가 기준]으로 고려하고 평가하는 것을 의미한다.

In the mid-20th century two philosophers, Chaim Perelman and Lucie Olbrechts-Tyteca, developed a theory of argumentation that relied more on value judgements than empirical proof.67-70 New rhetoric was so named because of similarities to Aristotle's rhetoric, particularly the central importance Aristotle placed on audience and persuasion in argumentation.61, 71 In new rhetoric, the goal of argumentation is not the demonstration of absolute truth but rather to gain an audience's acceptance of a claim being put forth by an arguer.53, 72 Argument validity is dependent upon audience persuasion. Arguers must account for and adapt to an audience's values and beliefs, thereby linking validity to the ability to convince an audience.57 Validity exists as a matter of degree since an audience might be partially persuaded towards an arguer's claim. In this sense, new rhetoric does not provide an external normative framework for determining argument validity; instead, it relies on an audience to use their own values and norms to determine what is acceptable and plausible. Persuasion does not remove the need for rational argument analysis; it places rationality in the context of an audience's values. Importantly, persuasion is not meant as a way to deceive or manipulate,73 but rather to consider and apprize a particular audience's principles and anticipated standards as evaluative criteria.

[청중의 가치와 기준]이 타당성의 중심이므로, 논쟁자들은 그들이 [의도한 청중]을 명시해야 한다. Perelman과 Olbrects-Tyteca는 [특정 청중]과 [보편적인 청중] 사이에서 논쟁하는 것을 구별한다.

  • [특정 청중]은 논쟁자가 그들의 주장을 다룰 수 있는 실제 사람 또는 그룹(또는 그 대표자)으로 구성된다. 비록 특정 청중이 더 큰 청중집단의 부분집합이나 표본일 수 있지만, 논쟁은 여전히 [구체적인 사람 또는 집단의 가치]를 기준으로 하여 발생한다.
  • 대조적으로, [보편적 청중]은 개념적이며, 논쟁자에 의해 유능하고 합리적인 사람들의 가치와 이상을 가진 집단으로 생각됩니다. 따라서, 보편적인 청중을 가지고, 논쟁자는 [합리적 청중]의 개념에 기초하여 타당성의 가치와 기준을 결정하는 역할을 한다.

Given the centrality of an audience's values and standards to validity, arguers must make explicit their intended audience. Perelman and Olbrects-Tyteca distinguish between arguing to a particular audience and a universal audience.

  • A particular audience consists of a real-world person or group (or representative thereof) to whom an arguer can address their argument.74 Although the particular audience may only be a subset or sample of a larger group, the argument still occurs using a concrete person's or group's values as the standard.
  • In contrast, the universal audience is conceptual, conceived by the arguer as a group holding the values and ideals of competent and reasonable people. Thus, with a universal audience, the arguer plays a role in determining the values and standards of validity based on their notion of a reasonable audience.

새로운 수사학에서 [특정 청중] 및 [보편적 청중]의 구체적인 역할에 대한 논쟁이 있다. 그러나, 특정 청중과 보편적 청중 둘 다, 논쟁자의 목표는 청중들의 순응adherence을 확보하는 것이다. 새로운 수사학은 주장자들이 그들의 [청중을 명시적으로 식별]하도록 강요하며, 주장자들이 [자신의 청중에 대한 지식과 이해]를 소유하도록 동기를 부여한다.

There is debate over the specific roles of particular and universal audiences in new rhetoric74-77; however, with both particular and universal audience, the arguer's goal is securing audience adherence. New rhetoric compels arguers to explicitly identify their audience, and incentivizes arguers to possess knowledge and understanding of their audience.

HPE의 평가 관행을 위한 새로운 수사학의 실질적인 함의는 프로그램 리더가 [관여하고자 하는 각 그룹의 요구]를 충족시키기 위해 타당성 주장을 조정해야 한다는 것을 포함한다.

  • 인가 및 인증 기관을 다룰 때, 논쟁은 훈련의 결과와 결과에 초점을 맞춘 타당성 증거를 강조할 수 있다.
  • 학습자를 다룰 때, 논쟁은 평가 관행의 공정성과 형평성을 강조할 수 있다.

Practical implications of new rhetotic for assessment practices in HPE include the need for programme leaders to tailor their validity arguments to meet the needs of each group they are engaging.

  • When addressing accrediting and certifying bodies, arguments might emphasise validity evidence focused on outcomes and consequences of training.
  • When addressing learners, arguments might emphasise equity and fairness in assessment practices.

3.2 비공식 논리
3.2 Informal logic

[비공식 논리]는 [전제와 결론 사이의 논리적 일관성]을 평가하면서 실제, 사회적 환경, 공개 담론에서 발생하는 주장을 (구조를 통해) 식별하고 (규범적 표준을 통해) 평가하기 위한 절차와 표준을 제공한다. [비공식 논리]는 주장의 타당성을 결정하는 다양한 접근법을 포괄하는 광범위한 포괄적 용어이다. 이 이론이 등장하기 전에 [형식 논리formal logic]는 현실 세계의 논쟁에 무균적이고 탈맥락화된 방식으로 적용되었다. 많은 비공식 논리학자들은 탈맥락적 접근법을 거부했는데, 이는 실제 논증을 평가하는 것을 불가능하게 만드는 잠재적인 왜곡으로 가득 차 있었기 때문이다. 비공식 논리는 문맥적 요인이 제거되지 않고, 주장 구조의 식별을 통해 [실제 논쟁의 지저분하고 암묵적이며 불완전한 성격]을 설명하기 위해 개발되었다.

Informal logic provides procedures and standards for identifying (via structures) and evaluating (via normative standards) arguments that occur in real-world, social environments and public discourse while still valuing logical coherence between premises and conclusions.56, 78 Informal logic is a broad umbrella term covering differing approaches to determining argument validity.79, 80 Before the advent of this theory, formal logic was applied to real-world arguments in a sterile, decontextualized way. Many informal logic scholars rejected this context-free approach because it was fraught with potential distortions that rendered evaluating real-world argumentation impossible. Informal logic was developed to account for the messy, implicit, incomplete nature of real-world argumentation through identification of argument structures without removal from contextual factors.

일단 논쟁의 구조가 맥락적으로 이해되면, 비공식 논리는 논쟁에서 추론의 강도를 결정하기 위한 여러 기준을 제공한다. 한 가지 접근 방식은 논점을 평가하기 위한 [관련성, 수용성 및 충분성]의 기준에 의존한다.

  • 관련성은 전제(즉, 클레임 또는 제안), 이러한 전제로부터 추론된 결론 및 전체적인 주장 사이의 적절한 관계를 요구한다.
  • 수용가능성은 논쟁자, 청중, 비판적 공동체에 의해 결정되는 전제의 진실성 또는 타당성과 관련이 있다.
  • 충분성은 주장을 뒷받침하는 증거가 유형, 수량 및 사용에 있어 적절해야 한다.

비공식 논리에서 주장의 강도를 결정하기 위한 다른 접근법에는 오류(즉, 추론의 오류)를 배제하고, 반례를 사용하고, 주장 체계를 공식화하는 것이 포함된다. 어떤 접근법도 주장의 타당성을 판단하는 방법으로 유일하게 정확하지는 않다. 대신에, [비공식 논리]는 [주장의 힘과 설득력]을 주장의 목표로 앞세운다.

Once an argument's structure is contextually understood, informal logic offers multiple standards for determining the strength of inferences in the argument.56 One approach relies on the criteria of relevance, acceptability, and sufficiency to evaluate arguments.81, 82 

  • Relevance demands adequate relationship between premises (i.e. claims or propositions), conclusions inferred from these premises, and the overall argument.
  • Acceptability relates to the truth or plausibility of premises as determined by the arguer, audience, and critical community.
  • Sufficiency requires that evidence supporting an argument be appropriate in type, quantity, and use.

Other approaches for determining the strength of an argument in informal logic include excluding fallacies83, 84 (i.e. errors of reasoning), using counterexamples, and formulating argumentation schemes.85 No one approach is singularly correct for determining an argument's validity; instead, informal logic foregrounds argument strength and cogency as the goal of argumentation.

철학자 스티븐 툴민은 1958년 저서 《논증의 사용》으로 비공식 논리에 깊은 영향을 끼쳤다. 툴민의 모형에서, 인수는 더 큰 응집 단위의 고유한 요소 부분으로 분해된다.

  • 클레임(claim)은 논쟁의 출발점이 되는 논쟁자에 의해 취해지는 특정한 문제에 대한 관점 또는 의견이다.
  • [클레임]은 증거에 의해 뒷받침되어야하고, 툴민은 이를 데이터data라 불렀다.
  • 그러나, 논쟁자는 [왜 또는 어떻게 특정 데이터가 명시된 주장을 뒷받침하는지]를 상세히 설명해야 한다. 이러한 상세한 설명을 영장warrant이라고 하는데, 이는 클레임claim를 입증하기 위해 특정 데이터를 사용할 수 있는 정당성을 제공한다.

다시 말해, [영장]은 [청구]와 그 뒷받침하는 [데이터] 사이의 가교 역할을 한다. [데이터-보증-청구 유닛data-warrant-claim unit]는 툴민의 주장 구조의 근간을 이루지만 다음과 같은 다른 요소들이 있다.

  • 지원backings (영장 발부의 근거), 
  • 한정자qualifiers (청구의 보편성에 대한 제한 또는 제한) 
  • 반론rebuttals (반론에 대한 선제적 또는 사후 대응적 반응).

Philosopher Stephen Toulmin profoundly influenced informal logic with his 1958 book The Uses of Argument86 in which he provided a framework for organising argument structures to facilitate analysis and evaluation.87, 88 In Toulmin's model, arguments are deconstructed into unique component parts of a larger cohesive unit.

  • claim is a standpoint or opinion on a particular matter taken by an arguer which serves as the point of departure for argumentation.
  • Claims are supported by evidence which Toulmin labels data.
  • However, an arguer must elaborate on how or why particular data support the stated claim. This elaboration is known as a warrant, which provides justification for use of particular data to substantiate a claim. In other words, a warrant provides a bridge between a claim and its supporting data.52 

The data-warrant-claim unit forms the backbone of Toulmin's argumentation structure, though there are other components such as 

  • backings (evidence to support a warrant), 
  • qualifiers (limitations or restrictions on the universality of a claim), and 
  • rebuttals (pre-emptive or reactive responses to counterarguments).

Toulmin의 모델에서, 타당성validity은 영장warrant이 데이터data에서 청구claim로의 도약을 적절하게 정당화한다는 것을 증명하는 데 달려 있다. 그는 유사한 주장 구조가 관련 학문이나 분야field에 관계없이 사용될 수 있다고 믿었다. 따라서, 인수 구조와 인수를 분석할 수 있는 일반적인 절차는 [분야-독립적field independent]이다. 그러나 툴민은 타당성의 많은 측면이 [분야 의존적field-dependent]이라고 믿었는데, 이는 논증이 관련 분야의 규범, 가치, 기준을 사용하여 평가되어야 한다는 것을 의미한다. 이를 위해 툴민은 타당성을 설명할 때 방어 가능, 수용 가능, 견실함 등의 용어를 사용한다. 그러한 [결정을 내리는 청중]은 논쟁에 참여하는 특정 개인이나 집단 또는 논쟁에 관여하지 않지만 그럼에도 불구하고 [판단을 내릴 수 있는 구경꾼onlooker]일 수 있다.
In Toulmin's model, validity hinges on demonstrating that the warrant adequately justifies the leap from data to claim. He believed that similar argument structures could be used regardless of the relevant discipline, or field.86 Thus, argument structure and the general procedure by which arguments could be analysed are field independent. However, Toulmin believed that many aspects of validity are field dependent, meaning that arguments should be evaluated using the norms, values, and criteria of the relevant field. To that end, Toulmin uses terms such as defensible, acceptable, and sound when describing validity. The audience who levies such determinations can be a specific person or group participating in the argument or an onlooker who is not involved in the argument but can make a judgement nonetheless.

HPE의 평가 관행에 대한 [비공식 논리]의 실제적 함의는 교육 프로그램 리더가 논증의 [주장, 데이터, 영장 및 후원]을 게시하는 데 명확하게 signposting함으로써, 이해 당사자들이 시간 가변적인 승진 결정의 타당성을 결정하기 위해 [더 정밀한 조사가 필요한 추론을 명확하게 식별할 수 있도록 하는 것]을 포함한다. Claim이 수용되면, 이것이 진급 결정을 알리는 평가 프로그램과 관련된 다른 주장에 대한 [데이터data 또는 보증서warrant]가 됩니다. 따라서, 시간 변수 결정을 지원하기 위해 명확하게 레이블링된 논쟁의 웹이 형성될 수 있다. 이 웹은 현장 의존적일 것이며, 다른 분야에서는 반드시 그렇지는 않지만 HPE와 관련된 허용 가능성과 건전성 기준을 사용하여 평가될 것이다.
Practical implications of informal logic for assessment practices in HPE include training programme leaders clearly signposting the claims, data, warrants, and backings of their argument, allowing stakeholders to more clearly identify the inferences needing scrutiny to determine the validity of time-variable promotion decisions. Accepted claims then become data or warrants for other arguments related to the programme of assessment informing promotion decisions. Thus, a clearly labelled web of argumentation could be formed to support time-variable decisions. This web would be field dependent, meaning that it would be evaluated using acceptability and soundness criteria that are relevant in HPE, though not necessarily in other disciplines.

4 고찰
4 DISCUSSION

우리는 [비공식 논리]와 [새로운 수사학]이 HPE에서 타당성 주장에 대한 우리의 이해를 심화시킬 수 있는 가능성을 가진 주장 이론이라고 주장한다. 두 접근법 모두 [논쟁에서 맥락의 중요성]을 인정하고, [맥락화되고 실용화된 줌보의 타당성 개념화]와 일치한다.89, 90 우리는 HPE의 타당성 관행이 어떤 특정한 방향에 결합되어야 한다고 주장하는 것이 아니다. 대신, 우리는 우리의 분야가 유용하고 상호적인 관계로부터 이익을 얻을 수 있다고 제안한다. HPE 검증 관행과 확립된 논증 이론 사이에서.  예를 들어, Cook과 Hatala는 Kane의 프레임워크를 사용하여 HPE에서 검증 작업을 수행할 수 있는 우수한 실무 지침을 제공한다.

We contend that informal logic and new rhetoric are theories of argumentation that hold promise to deepen our understanding of validity argumentation in HPE. Both approaches acknowledge the importance of context in argumentation and align with Zumbo's conceptualization of validity as contextualised and pragmatic.89, 90 We are not asserting that HPE's validity practices should be wedded to any particular orientation; instead, we propose that our field could benefit from a useful, reciprocal relationship between HPE validation practices and established argumentation theories.91 For example, Cook and Hatala provide an excellent practical guide for undertaking validation work in HPE using Kane's framework.8 

우리는 다음에 대한 고려를 포함함으로써 이 가이드를 강화할 것을 제안한다. 

  • 주장이 누구에게 지시되어야 하는지(청중),
  • 추론(구조) 내에서 그리고 추론(구조) 사이에 주장을 구성하고 서명하는 방법, 또는
  • 주장이 평가되어야 하는 방법(표준)

We suggest enhancing this guide by including considerations of

  • to whom an argument should be directed (audience),
  • how to organise and signpost arguments within and between inferences (structure), and/or
  • how an argument should be evaluated (standards).

후자에 관해서는 쿡과 하탈라는 새로운 수사학과 비공식 논리를 동시에 인용하는 듯한 언어를 사용하며, 타당성 주장은 "다른 사람들을 설득"하려는 시도와 동시에 증거의 "관련성, 품질, 폭"이 중요하다는 점에 주목한다. 논쟁 분야에서 다양한 지향의 의미, 범위 및 효용성에 대해 토론하는 전통 내 및 다른 학자들과 함께 결정적인 경계가 거의 없는 것처럼, 우리는 HPE가 하나의 주장 지향argumentation orientation으로 스스로를 고립시키지 말아야 한다고 제안한다. HPE 연구원들은 다양한 전통에서 어떤 것을 기반으로 하여 타당성에 대한 우리 분야의 이해를 진전시키는 데 가장 도움이 될 수 있다. 따라서, 우리는 HPE가 [새로운 수사학]과 [비공식 논리]의 측면을 모두 사용하여, 타당성 논쟁에서 청중, 주장 구조 및 평가 표준에 대한 이해를 심화함으로써 이익을 얻을 것이라고 믿는다.
With regard to the latter, Cook and Hatala use language that seems to invoke both new rhetoric and informal logic, noting that validity arguments attempt to “persuade others” while also noting that the “relevance, quality, and breadth” of evidence is important. Just as there are few definitive boundaries in the field of argumentation, with scholars within and across traditions debating the meaning, scope, and utility of various orientations, we suggest that HPE should not silo itself into one argumentation orientation. HPE researchers can draw from various traditions based on which will be most helpful to move our field's understanding of validity forward. Therefore, we believe HPE would benefit from using aspects of both new rhetoric and informal logic to deepen our understanding of audience, argument structure, and evaluation standards in validity argumentation.

4.1 HPE 타당성 주장의 대상자를 정의하는 새로운 수사
4.1 New rhetoric to define HPE validity argumentation's audience

HPE의 새롭고 성장하는 담론은 "사회적 필수impretative로서의 타당성"이다. 그것은 사회와 학습자에 대한 책임감을 강조한다. 다시 말해, HPE 타당성 논쟁은 이해당사자의 요구에 집중된다. [비공식 논리]는 논쟁에서 청중의 중요성을 인식하지만, [새로운 수사법]과 같은 정도는 아니다. [새로운 수사학]은 청중 가치를 논쟁의 중심에 두며, 이해 관계자들과 더 넓은 HPE 커뮤니티 모두를 더 잘 참여시킴으로써 HPE가 완수하도록 요청되고 있는 사회적 요구를 더 잘 충족시키는 데 도움이 될 수 있다.
A new and growing discourse in HPE is that of “validity as social imperative,”4, 17 which emphasises accountability to society and learners. In other words, HPE validity arguments centre on the needs of our stakeholder audiences. Informal logic recognises the importance of audience in argumentation, but not to the same degree as new rhetoric.92 New rhetoric places audience values at the centre of argumentation, and may help us better satisfy the social imperative that HPE is being called to fulfil by better engaging both stakeholders and the broader HPE community.

앞에서 언급한 바와 같이, [새로운 수사학적 주장]은 특정 청중 또는 보편적인 청중을 향할 수 있다. HPE가 타당성 주장에 [새로운 수사학적 접근법]을 채택하기 위해서는, 우리는 청중을 더 잘 정의할 필요가 있을 것이다. 현재 많은 공식적인 HPE 타당성 주장은 저널 검토자, 편집자 및 독자가 청중 역할을 하는 동료 검토 출판물의 형태로 만들어진다.

  • [저널 독자]들은 출판계에서 가장 중요한 청중일 것이다. 그러나 독자들은 (편지나 해설을 쓰는 극소수의 경우를 제외하고) 대화식 청중의 형태를 나타낸다. 그것은 그들의 가치를 알 수 있거나 그들의 판단이 공유될 수 있는 정도를 제한한다. 
  • [검토자와 편집자]는 다른 HPE 학자를 대표하는 [특정 청중]의 역할을 할 수도 있고, 정보에 근거한 판단을 부과하기에 충분한 지식을 가진 유능하고 합리적인 사람들을 대표할 가능성이 가장 높기 때문에 [보편적 청중]의 대표자로 간주될 수도 있다. 사실, 그들은 두 가지 역할을 모두 수행할 수 있습니다

As mentioned previously, new rhetoric arguments can be directed towards a particular audience or a universal audience. For HPE to adopt a new rhetoric approach to validity argumentation, we would need to better define our audiences. Currently, many formal HPE validity arguments are made in the form of peer-reviewed publications, with journal reviewers, editors, and readers serving as audiences.

  • Journal readers may be the most important audience in the publication world. However readers represent a form of noninteractive audience93 (with the exception of the very few who write letters or commentaries), which limits the degree to which their values can be known or their judgements shared.
  • Reviewers and editors could serve as a particular audience representing other HPE scholars, or they could be considered a representation of a universal audience because they are most likely to represent competent and reasonable people with sufficient knowledge to levy informed judgements. They could, in fact, serve both roles.

그러나, 현재 검토자와 편집자는 반드시 타당성 주장이 허용 가능한지 또는 그럴듯한지에 대해 명시적인 판단을 내리지 않고 있다. 주어진 기관이나 프로그램의 맥락에서는 확실히 그렇지 않다. 그보다 , 리뷰어와 에디터는 원고가 HPE 커뮤니티에서 더 넓은 학문적 논의를 진전시키는지에 대한 결정을 내리고 있다. 검토자와 편집자는, 타당성 주장이 부적절하다는 것을 발견할 수 있지만, 원고가 아마도 혁신적인 생각, 방법론적 발전 또는 새로운 결론의 측면에서 저널의 독자들에게 약간의 이익을 제공하기 때문에 여전히 출판을 권고할 수 있다. 따라서, [새로운 수사학]은 (특정 청중으로서) 검토자와 편집자가 출판을 위해 제출된 타당성 주장의 타당성을 명시적으로 판단할 것을 강제할 것이다. 이는 아마도 출판 시 독자에게 판단을 signal하는 방법 중 하나이다.

However, currently reviewers and editors are not necessarily making explicit judgements on whether a validity argument is acceptable or plausible, and certainly not within the context of a given institution or programme. Rather, they are making a determination of whether a manuscript, in toto, moves the broader scholarly discussion forward in the HPE community. Reviewers and editors could, in fact, find a validity argument to be inadequate but still recommend publication because the manuscript provides some benefit to the journal's readers, perhaps in terms of innovative thinking, methodological developments, or novel conclusions. Thus, new rhetoric would compel reviewers and editors—were they to be identified as a particular audience—to explicitly judge the plausibility of validity arguments submitted for publication, perhaps with a way to signal their judgement to readers upon publication.

출판과 함께 발생하는 제한된 청중 상호작용은 HPE가 학술지를 넘어 타당성 논쟁을 확장하도록 의무화할 것이다. HPE는 [학습자, 프로그램 리더, 인가자, 인증자, 기관 및 지급인]을 포함한 여러 이해당사자를 보유하고 있다. 이러한 이해관계자 중 다수는 자신의 맥락과 관련된 타당성 증거가 발표된 기사를 결코 읽지 않을 수 있다. 평가 설계자는 동료 검토 출판물을 포함하지 않는 메커니즘을 통해 이러한 특정 청중에게 주장이 타당한지 확인할 필요가 있다. [비공식 논리]가 논증을 생산물로 제시하는 반면, [새로운 수사학]은 논증을 논증자가 청중과 함께 개발하는 활동 또는 서비스라고 설명한다. 이러한 [활동 기반 지향activity-based orientation]은 Cook과 Hatala의 [프로세스로서의 타당화validation]에 대한 설명과 일치하며, HPE에서 점차 관심을 받고 있는 [공동 생산]의 개념과 일치합니다. 공동 생산에서 소비자의 지식, 경험, 의견은 제품의 수동적 소비보다는 서비스의 창출에 영향을 미친다. 새로운 수사학의 렌즈를 채택하면 HPE가 서비스하고자 하는 사람들의 요구를 가장 잘 충족시키기 위해 일하는 타당성 주장자 및 청중(즉, 이해관계자)과 시간이 지남에 따라 논쟁의 공동생산이 이루어질 수 있다.
The limited audience interaction that occurs with publication would oblige HPE to expand validity argumentation beyond the pages of journals. HPE has several stakeholders in assessment decisions including learners, programme leaders, accreditors, certifiers, institutions, and payors. Many of these stakeholders may never read the articles in which validity evidence relevant to their context is published. Assessment designers would need to ensure that arguments are plausible to these particular audiences, likely via mechanisms that do not involve peer-reviewed publication. Whereas informal logic presents argument as a product, new rhetoric entreats argumentation to be an activity, or service, that an arguer develops with an audience.53 This activity-based orientation aligns with Cook and Hatala's description of validation as a process,8 and with the concept of co-production, which is gaining traction HPE.94, 95 In co-production, the consumers' knowledge, experience, and opinions influence the creation of a service rather than passive consumption of a product.96, 97 Adopting a lens of new rhetoric could the coproduction of arguments over time with validity arguers and audiences (i.e. stakeholders) working to best meet the needs of those who HPE aims to serve.

4.2 HPE 유효성 주장 구조를 명확히 하기 위한 비공식 논리
4.2 Informal logic to clarify HPE validity argumentation structure

HPE 학자들은 정기적으로 메시크와 케인의 프레임워크를 사용하여 타당성 증거를 구성하지만, [완전한 주장 구조]를 명시하지는 않는다. 실제로 케인은 툴민의 주장 구조(영장, 데이터, 지원, 반박)를 호출하지만, 이 모델은 언어 테스트와 같은 다른 분야에서 주로 나타났다. Toulmin의 모델은 HPE에 확인되지 않는 존재이며, 말뭉치 내에서 거의 표면화되지 않는다. 케인의 프레임워크는 논쟁자들이 [평가 데이터의 의도된 해석과 사용]을 명확히 진술할 것을 요구하는데, 이것은 주장 주장argument claim의 역할을 한다. 

HPE scholars regularly organise validity evidence using frameworks from Messick and Kane,2, 3 but do not make full argument structure explicit. Indeed, Kane invokes Toulmin's argumentation structure (warrants, data, backings, rebuttals),27, 29, 47, 50 though this model has mostly appeared in other fields such as language testing.98 Toulmin's model exists as a cryptid in HPE, rarely (if ever) surfacing within our corpus. Kane's framework requires arguers to clearly state an intended interpretation and use of assessment data,6, 29 which serves as the argument claim.

그러나, HPE 학자들은 케인의 추론 사슬을 단순히 사용하는 것이 아니라, 특히 상당한 정밀 조사가 필요한 고위험 의사결정의 경우 분석을 강화하기 위해 주장의 전체 구조를 명시적으로 만들 수 있다. 사실 케인의 추론의 사슬에는 몇 가지 주장arguments이 내재되어 있을 가능성이 높지만, 명시적이고 구조적인 보고가 없다면 간과될 수 있다. 프로그램적 평가에서 발견될 가능성이 있는 [복잡한 타당성 주장]은 어떻게 [확립된 주장]이 더 긴 일련의 논쟁에서 [후속 주장에 대한 데이터나 영장warrant이 되는지]를 보여주면서 계획될 수 있다.

However, rather than simply using Kane's chain of inferences, HPE scholars could make explicit the full structure of their arguments to augment analysis, particularly for high-stakes decisions that require significant scrutiny. In fact, there are likely to be several arguments embedded within Kane's chain of inferences,28 which may go overlooked without explicit and structured reporting. Complex validity arguments that are likely to be found in programmatic assessment could be mapped out, showing how an established claim becomes data or a warrant for a subsequent argument in a longer chain of argumentation.

타당화 과정이 얼마나 많은 구조를 가져야 하는지에 대한 타당성 학자들 사이에 논쟁이 있지만, 현재 HPE는 타당성 주장을 구성, 식별 또는 서명 게시하기 위한 명확하거나 합의된 접근법이 없다. 종종 "주장arguments"라고 불리는 것은 명확한 주장 구조는 없는 데이터의 집합이다. Toulmin의 모델은 이해관계자들에게 증거를 제시하고, 해석하고, 우선순위를 정하고, 논쟁하는 데 도움이 될 수 있다.

Though there is debate amongst validity scholars as to how much structure the validation process should have,44 currently HPE has no clear or agreed-upon approach for organising, identifying, or signposting validity arguments. Often what are labelled “arguments” are collections of data that lack an explicit argument structure. Toulmin's model could help to present, interpret, prioritise, and argue the evidence to stakeholders.

 

4.3 타당성 주장을 평가하기 위한 표준을 설명하기 위한 비공식 논리 또는 새로운 수사
4.3 Informal logic or new rhetoric to elucidate standards for evaluating validity arguments

[비공식 논리]나 [새로운 수사학]도 보편적 진실을 제공한다고 주장하지는 않지만, 겉으로 보기에 끝이 없어 보이는 검증 노력이 언제 방어 가능한 정지점stopping point에 도달했는지에 대한 정보를 제공할 수 있다(적어도 새로운 주장이 제기되거나 새로운 청중이 고려되기 전 까지는).

  • [새로운 수사학]은 설득과 청중의 집착을 추구한다.
  • [비공식 논리]는 논증자의 학문이나 분야에 의해 정의되는 관련성, 충분성, 수용성 측면에서 논증적 타당성을 추구한다.

두 렌즈 모두 HPE 내에서 잘 작동합니다. 그러므로, 어떤 것을 사용할 것인가를 선택하는 것은 개인의 철학적 세계관에 달려있을 수 있다. 
Neither informal logic nor new rhetoric claim to provide a universal truth, but they could inform when seemingly unending validation efforts have reached defensible stopping points (at least until new arguments are put forth or new audiences are considered). New rhetoric seeks persuasion and audience adherence. Informal logic seeks argument cogency, often in terms of relevance, sufficiency, and acceptability as defined by the arguer's discipline or field. Both lenses would work well within HPE; therefore, choosing which to use may depend on one's philosophical worldview.

비공식 논리는 [후기 실증주의 세계관]과 잘 일치할 수 있는 반면, 새로운 수사학은 [구성주의나 비판적 현실주의] 관점과 더 잘 일치할 수 있다. 그러나, 비공식 논리와 새로운 수사학은 특정한 세계관에 제한되지 않는다. HPE의 이질적인 철학적 세계관을 고려할 때, 모든 주장자와 청중에게 맞는 하나의 주장 지향성을 기대하는 것이 합리적인가? 아마 아닐 겁니다. 그러나 우리는 타당성 작업을 수행할 때 우리의 주장 패러다임을 분명히 인정해야 하며, 특히 청중들의 주장도 고려해야 한다. 그렇게 하면 HPE 검증 작업에서 충돌을 일으킬 수 있는 세계관과 주장 패러다임의 오해를 피하는 데 도움이 될 수 있다. Tavares 외 연구진은 평가에서 호환성 원칙compatibility principle을 다음과 같이 설명했다. "평가 계획 사이에 또는 평가 계획 내에 서로 다른 철학적 입장이 존재할 수 있으며, 이러한 입장이 평가 설계자에게 특정 아이디어와 가정을 위임한다는 것을 인식할 의무" 우리는 호환성 원칙이 HPE 타당성에 짜여진 논쟁의 철학에도 적용된다고 믿는다.

Informal logic may align well with post-positivist worldviews,99, 100 whereas new rhetoric likely aligns better with constructionist or critical realist views.101, 102 However, informal logic and new rhetoric are not restricted to any specific worldview; each will manifest in different ways when employed with different philosophical beliefs. Given the heterogenous philosophical worldviews in HPE, is it reasonable to expect one argumentation orientation to fit all arguers and audiences? Likely not. But we should explicitly acknowledge our argumentation paradigms when undertaking validity work, and specifically consider our audience's as well. Doing so can help avoid misunderstanding of worldviews and argumentation paradigms that could cause conflict in HPE validation work.103 Tavares et al described a compatibility principle in assessment as “the obligation to recognize that different philosophical positions can exist between and within assessment plans and that these positions commit assessment designers to particular ideas and assumptions.”104 We believe the compatibility principle also applies to the philosophies of argumentation woven into HPE validity.

4.4 HPE 평가 검증에서 논증을 사용하는 나머지 과제
4.4 Remaining challenges of using argumentation in HPE assessment validation

우리는 비공식 논리와 새로운 수사법이 HPE 타당성 주장을 위한 유용한 방향이라고 믿지만, 몇 가지 과제는 여전히 해결되어야 한다.

  • 첫째, 어떤 주장 방향이 학습자, 프로그램 리더, 인가자 및 인증자와 같은 HPE 이해 관계자에게 공명하는지에 대해서는 거의 알려져 있지 않다. 향후 연구는 이러한 그룹들이 가질 수 있는 잠재적인 주장 가정을 발견하기 시작할 수 있다.
  • 둘째, 여러 청중의 가치에 영합하는 것은 타당성 논쟁을 새로운 수사 패러다임에서 벅찬 과제로 만들 수 있다. 각 이해관계자 그룹은 평가와 타당성에 대한 가치 및 이해도가 다를 수 있습니다. 교육자들이 각 집단마다 고유한 타당성 주장이나, 설득력 있고 모두가 받아들일 수 있는 단일 주장을 개발할 수 있을지는 불분명하다.
  • 셋째, 특히 청중 가치와 평가 기준과 관련하여 HPE 내의 헤게모니 및 형평성에 대한 검증에 비공식 논리 또는 새로운 수사학을 주입하는 영향을 고려하고 연구해야 한다.

Though we believe informal logic and new rhetoric are useful orientations for HPE validity argumentation, several challenges must still be addressed.

  • First, little is known about which argumentation orientations resonate with HPE stakeholders such as learners, programme leaders, accreditors, and certifiers. Future research could begin to unearth the latent argumentation assumptions that these groups may carry.
  • Second, catering to the values of multiple audiences could make validity argumentation a daunting task in a new rhetoric paradigm. Each stakeholder group likely has different values and understandings of assessment and validity. It is unclear if educators can develop a validity argument that is unique to each group, or a single argument that is persuasive and acceptable to all.
  • Third, we must consider and study the impact of infusing informal logic or new rhetoric into validation on hegemony and equity within HPE, particularly with regard to audience values and evaluative standards.

Addey 등은 "민주적 공간"을 요구하였으며, 그래야만 "정당하게 다양한 주장과 의도가 인식, 고려, 조립 및 표시될 수 있다." 고 말하였다. 그런 민주적 공간을 만들면 모든 이해관계자들의 목소리가 확실히 들릴 수 있다. 마지막으로, 우리는 Toulmin의 주장 모델이 HPE 유효성 주장의 분석과 평가를 개선할 수 있다고 믿지만, 이 가설을 테스트하기 위해서는 경험적 연구가 필요하다. HPE 커뮤니티가 이러한 한계와 과제를 탐구할 때까지 평가 타당성 주장은 사례 연구의 경우와 같은 프로그램의 블랙박스로 남을 것이다.

Addey et al call for “democratic spaces” in which “legitimately diverse arguments and intentions can be recognized, considered, assembled, and displayed.”105 Creating such democratic spaces can ensure that all stakeholder voices are heard. Finally, although we believe Toulmin's argumentation model could allow for improved analysis and evaluation of HPE validity arguments, empirical studies are needed to test this hypothesis. Until the HPE community explores these limitations and challenges, assessment validity argumentation will remain a black box for programmes such as the one in our case study.

4.5 한계
4.5 Limitations

우리의 저자 그룹은 HPE 타당성 주장에 가장 유용한 비공식 논리와 새로운 수사학을 선택했지만, 우리가 선택하지 않은 몇 가지 다른 주장 지향이 있다(작은 선택 사항은 표 1에 제시됨). 우리는 다른 학자들이 HPE에 이러한 다른 방향들이 특히 이산적 구조(형식 변증법 및 실용적 변증법)를 중시하거나 실증주의 세계관을 가질 경우 더 유용할 수 있다는 것을 인정한다. 우리는 또한 논쟁 이론의 길고 풍부한 역사를 고려할 때, 우리가 모든 방향과 접근방식을 완전히 검토하는 것은 불가능했다는 것을 인정한다.
Though our author group selected informal logic and new rhetoric as most useful for HPE validity argumentation, there are several other argumentation orientations that we did not select (a small selection is presented in Table 1). We acknowledge that other scholars might find these other orientations more useful to HPE, particularly if they value discursive structure (formal dialectics and pragma-dialectics) or have positivist worldviews (formal logic). We also acknowledge that given the long and rich history of argumentation theory, it was impossible for us to fully review every orientation and approach therein.

4.6 결론
4.6 Conclusion


HPE 학자들은 Messick5 또는 Kane의 일반적으로 사용되는 프레임워크 내에서 조직된 다양한 평가 결정에 대한 강력한 타당성 증거를 발표했다. 비록 이것들이 타당성 증거를 구성하는 방법의 훌륭한 예를 제공하지만, 다음의 것들을 명시적으로 설명하지 않는다.

  • 누가 증거를 평가해야 하는가? 
  • (증거뿐만 아니라) 논쟁이 취해야 할 구조는 무엇인가?
  • 평가를 위해 어떤 기준을 사용해야 하는가?

이러한 누락은 [증거]가 [주장]과 동일하고, [증거]를 단순히 배치함으로써 타당성 판단이 내려졌다는 개념을 전파한다. 이 원고에서는 비공식 논리와 새로운 수사법이 평가에서 타당성을 가지고 HPE의 진행 중인 작업을 진전시키는 데 어떻게 도움이 될 수 있는지 자세히 설명하였다. 각 이론은 모호하고 비활성적인 HPE 평가 타당성 증거를 더 명확하고 생동감 있는 타당성 주장으로 변환하기 위한 여지를 제공한다.

HPE scholars have published robust validity evidence13, 38-40, 106 for various assessment decisions organised within the commonly used frameworks of Messick5 or Kane.27 Although these provide excellent examples of how to organise validity evidence, they do not explicitly describe

  • who should evaluate the evidence (audience),
  • what structure the argument (not just the evidence) should take, and
  • what criteria should be used for evaluation.

This omission propagates the notion that evidence equals argument and that a validity judgement has been rendered by simply laying out the evidence. In this manuscript, we have detailed how informal logic and new rhetoric can help advance HPE's ongoing work with validity in assessment. Each theory offers affordances for transforming ambiguous, inert HPE assessment validity evidence into clearer, animate validity arguments.

 


Med Educ. 2022 Jul 19.

 doi: 10.1111/medu.14882. Online ahead of print.

How argumentation theory can inform assessment validity: A critical review

Affiliations collapse

Affiliations

1Department of Pediatrics, University of Cincinnati College of Medicine, Cincinnati, Ohio, USA.

2School of Health Professions Education (SHE), Maastricht University, Maastricht, The Netherlands.

3School of Health Professions Education Faculty of Health, Medicine and Life Sciences of Maastricht University, Maastricht, The Netherlands.

4Uniformed Services University of the Health Sciences, Bethesda, Maryland, USA.

PMID: 35851965

DOI: 10.1111/medu.14882

Abstract

Introduction: Many health professions education (HPE) scholars frame assessment validity as a form of argumentation in which interpretations and uses of assessment scores must be supported by evidence. However, what are purported to be validity arguments are often merely clusters of evidence without a guiding framework to evaluate, prioritise, or debate their merits. Argumentation theory is a field of study dedicated to understanding the production, analysis, and evaluation of arguments (spoken or written). The aim of this study is to describe argumentation theory, articulating the unique insights it can offer to HPE assessment, and presenting how different argumentation orientations can help reconceptualize the nature of validity in generative ways.

Methods: The authors followed a five-step critical review process consisting of iterative cycles of focusing, searching, appraising, sampling, and analysing the argumentation theory literature. The authors generated and synthesised a corpus of manuscripts on argumentation orientations deemed to be most applicable to HPE.

Results: We selected two argumentation orientations that we considered particularly constructive for informing HPE assessment validity: New rhetoric and informal logic. In new rhetoric, the goal of argumentation is to persuade, with a focus on an audience's values and standards. Informal logic centres on identifying, structuring, and evaluating arguments in real-world settings, with a variety of normative standards used to evaluate argument validity.

Discussion: Both new rhetoric and informal logic provide philosophical, theoretical, or practical groundings that can advance HPE validity argumentation. New rhetoric's foregrounding of audience aligns with HPE's social imperative to be accountable to specific stakeholders such as the public and learners. Informal logic provides tools for identifying and structuring validity arguments for analysis and evaluation.

역설적 진실과 사라지지 않는 미신: 팀 역량 대화를 리프레이밍하기(J Contin Educ Health Prof, 2016)
Paradoxical Truths and Persistent Myths: Reframing the Team Competence Conversation 
Lorelei Lingard, PhD

 

 

의학은 매우 개인주의적인 문화이다. 우리는 개인을 선발한다. 우리는 개인을 교육하고 평가합니다. 우리는 개인에게 라이센스를 부여하고, 고용하고, 급여를 지급합니다. 우리는 개인을 규제하고 치료한다. 그렇다면, 의학이 똑똑하고, 숙련되고, 헌신적인 임상의와 같은 유능한 사람들로 가득하다는 것은 놀랄 일이 아니다. 불행히도, 유능한 개인은 양질의 의료 서비스를 제공하지 못한다. 
Medicine is a highly individualist culture. We select individuals. We train and assess individuals. We license, hire, and pay individuals. We regulate and remediate individuals. It should come as no surprise, then, that medicine is full of competent individuals: smart, skilled, dedicated clinicians. Unfortunately, competent individuals do not equal quality health care. 

보건의료의 가장 시급한 문제들 중 일부는 무능한 개인이 아닌 무능한 팀들로 거슬러 올라갈 수 있다. 예를 들어 홈케어를 받는 노인들 사이에서 10-13%의 위험 발생률은 고객의 집을 통과하는 많은 의료 서비스 제공자들 사이의 조정과 의사소통 문제 때문이다. 그것은 개인의 역량의 문제가 아니며, 책임 있는 개인을 찾고 그들을 교정하는 우리의 통상적인 전술로는 해결될 수 없다. 우리는 개인의 능력 이상의 것을 생각할 필요가 있다. 왜냐하면 그것은 필요하지만, 양질의 의료 서비스를 위해 충분하지 않기 때문이다.
Some of health care's most pressing problems can be traced back to incompetent teams rather than incompetent individuals. For instance, the alarming 10–13% adverse event rate among seniors receiving homecare is due to problems of coordination and communication among the many health care providers passing through the client's home.1 That is not a problem of individual competence, and it cannot be solved by our usual tactic of looking for the responsible individual and remediating them. We need to think beyond individual competence because, although it is necessary, it is not sufficient for quality health care.

나는 거의 20년 동안 건강관리 팀워크를 공부해 왔다. 제 연구 그룹은 수술실, 중환자실, 입원환자 의료 및 소아과, 뇌졸중 재활실, 다장기 이식실, 심부전 클리닉, 가족 보건팀 등 직장에서 팀을 관찰하는데 수천 시간을 보냈습니다. 우리는 수백 명의 임상의들과 그들의 팀이 어떻게 소통하고 협력하는지에 대해 이야기를 나누었고, 우리는 어떻게 교육생들이 이러한 팀 관행과 가치를 습득하게 되었는지 탐구했습니다. 그리고 일반적으로 사회과학자가 복잡하고 유동적인 사회세계에서 안정된 진리의 존재를 선언하는 것은 신성불가침으로 여겨지지만, 저는 그것을 하려고 합니다. 우리가 연구한 모든 팀에게 다음과 같은 진술이 들어맞기 때문입니다.
I have been studying health care teamwork for almost 20 years. My research group has spent thousands of hours watching teams at work—in operating rooms, critical care units, inpatient medicine and pediatric units, stroke rehabilitation units, multiorgan transplant units, heart failure clinics, family health teams. We have talked with hundreds of clinicians about how their teams communicate and collaborate, and we have explored how trainees come to acquire these team practices and values. And while it is generally deemed sacrilegious for a social scientist to declare the presence of stable truths in a complex and fluid social world, I am about to do just that. Because the following statements hold true across all the teams we have studied:

  • 유능한 개인은 무능한 팀을 구성할 수 있다.
  • 한 팀원이 무능해도 팀은 유능할 수 있다.
  • 한 명의 무능한 팀원이 팀 전체를 좌절시킬 수도 있지만, 어떤 팀은 그러한 팀원과 함께 나아간다.
  • 동일한 팀도 한 상황에서 유능하고, 다른 상황에서 무능력할 수 있다.
  • Competent individuals can form an incompetent team.
  • Teams can be competent even when one team member is incompetent.
  • An incompetent team member can derail one team, but another team carries on around her.
  • The same team can be competent in one situation and incompetent in another.

한편으로, 이러한 사실들은 놀랍지 않다. 모든 임상의는 "드림팀"이었어야 했던 팀이 그저 그런 팀으로 변해버린 시절을 경험한다. 모든 교육자는 임상 환경의 교육이 작동하는 이유는, 부분적으로 초보자의 존재를 나머지 팀이 보상하기 때문임을 알고 있습니다. 모든 유닛 리더는 리소스의 변화가 팀이 성과를 유지하는데 어려움을 겪을 수 있다는 것을 인식하고 있습니다.
On the one hand, these truths are not surprising. Every clinician has experienced those days when what should have been a “dream team” turned sour. Every educator knows that teaching in clinical settings works in part because teams compensate for the presence of novices. Every unit leader recognizes that a change in resources can cause teams to struggle to maintain their performance.

반면에, 이러한 사실들은 놀랍기만 한 것이 아니라 역설적이다. 그들은 우리가 능력에 대해 진실이라고 믿는 것에 도전한다. 우리는 전통적으로 역량이 개인의 자질이라고 믿는다. 선택에서 훈련과 규제를 통해, 의학은 충분한 훈련을 통해 달성될 수 있고 주기적인 업데이트로 유지될 수 있는 상태로서 개인이 소유한 어떤 것으로 역량에 접근한다. 개념적으로, 이 접근법은 역량이 맥락에 구애받지 않는다는 것을 의미한다. 그렇다고 해서 우리가 맥락이 중요하다는 것을 인식하지 못한다는 것은 아니다. 

  • 현실적으로 말해서, 우리는 역량이 임상의, 환자, 조직 환경 및 기타 요인들 사이의 복잡한 상호작용을 수반한다는 것을 알고 있다. 
  • 그러나 개념적인 수준에서, 역량에 대한 우리의 전통적인 개별적인 접근법은 한 환경에서 유능한 의사가 다른 환경에서 유능할 것이라고 가정한다. 

어느 정도, 역량에 대한 이러한 믿음은 개인에게 전제된 [허가와 규제 시스템에 대한 믿음]을 갖기 위해 필요하다.

On the other hand, these truths are not just surprising, they are paradoxical. They fly in the face of what we believe to be true about competence. We conventionally believe that competence is a quality of the individual. From selection, through training and regulation, medicine approaches competence as something individuals possess, as a state that can be achieved through sufficient training and maintained with periodic updates. Conceptually, this approach also implies that competence is context-free. That is not to say that we do not recognize that context matters:

  • practically-speaking, we know that competence involves a complex interaction among clinician, patient, organizational setting, and other factors.
  • But at a conceptual level, our conventional, individual approach to competence assumes that a physician competent in one setting will be competent in another.

To some degree, these beliefs about competence are necessary in order to have faith in a system of licensing and regulation that is predicated on the individual.

위에서 요약한 네 가지 진리는 개인의 역량에 대한 전통적인 개념화에 도전한다. 사실, 이 역설적인 진리는 [집단적 역량]을 참고해야만 설명할 수 있습니다. [집단적 역량]은 시스템의 분산된 능력으로, 개인에게 쉽게 환원될 수 없다. 
그것은 역동적이고 문맥과 강하게 연관되어 있다.

  • 그래서 유능한 개인들은 무능한 팀을 구성할 수 있는데, 왜냐하면 팀워크는 그 부분의 합보다 더 중요하기 때문이다; 그것은 사회적 상호작용, 공유된 경험, 그리고 암묵적인 지식을 필요로 한다.
  • 마찬가지로, 팀워크는 공동의 인지적 성취이기 때문에 한 구성원이 무능력하더라도 팀은 유능할 수 있다.
  • 무능한 팀원이 어떤 팀을 마비시킬 수 있지만, 다른 팀은 마비시킬 수 없다. 왜냐하면 그 개인에 대한 집단적 대응이 관건이지 개인 자신이 아니기 때문이다.
  • 그리고 마지막으로, 한 팀은 다음이 아닌 한 상황에서 유능할 수 있습니다. 왜냐하면 집단적 역량은 진화하고, 불안정하며, 그들의 다양한 사회적 관계와 그 순간에 팀워크를 지원하거나 구속할 수 있는 물질적 조건을 가진 상황에 기반을 두고 있기 때문입니다.
    • [사회적 관계]는 갈등, 권력, 존중, 신뢰와 같은 이슈들에 의해 형성되는 복잡하고 미묘한 것이다.4-6
    • [물질적 조건material condition]도 중요하다: 교대 근무 시간표부터 "자료" 변경과 같은 프라이버시 법률까지 팀의 집단적 역량도 중요하다.7

The four truths outlined above challenge this conventional conceptualization of individual competence. In fact, we can explain these paradoxical truths only by reference to collective competence. Collective competence is a distributed capacity of a system, not easily reducible to an individual; it is dynamic and strongly tied to context.2 

  • So competent individuals can form incompetent teams because teamwork is more than the sum of the parts; it requires social interaction, shared experience, and tacit knowledge.
  • Similarly, a team can be competent even if one member is incompetent because teamwork is a joint cognitive accomplishment.3
  • An incompetent team member can paralyze one team but not another because how the collective responds to that individual is the key, not the individual him/herself.
  • And finally, a team can be competent in one situation and not the next because collective competence is evolving, unstable and based in situations with their varying social relations and material conditions that can support or constrain teamwork in the moment. Social relations on teams are complex and nuanced, shaped by issues such as conflict, power, respect, and trust.4–6 And material conditions matter too: from shift schedules to privacy legislation as such “materials” change so does the collective competence of the team.7

비록 우리가 집단 역량의 개념을 통해 이러한 역설적인 진리를 인정하고 설명할 수 있지만, 몇몇 강력한 신화는 팀워크에 대한 일상적인 대화에서 지속된다.
Even while we can acknowledge and, through the concept of collective competence, we can explain these paradoxical truths, some powerful myths persist in everyday conversations about teamwork:

  • 우리가 각자 맡은 일을 제대로 해낸다면, 이 팀은 효과적일 것이다.
  • 만약 우리가 서로의 역할을 이해한다면, 이 팀은 유능할 것이다.
  • 만약 우리가 분명한 리더십과 책임감이 있다면, 이 팀은 잘 기능할 것이다.
  • 우리 모두가 환자에게만 집중한다면, 이 팀은 부드럽게 작동할 거예요.
  • If we each did our job properly, then this team would be effective.
  • If we understood each other's roles, then this team would be competent.
  • If we had clear leadership and accountability, then this team would function well.
  • If we all just focused on the patient, then this team would work smoothly.

이러한 미신은 우리 모두가 "좋은 것"이라고 동의할 수 있는 것에 중점을 두고 있다. 그것은 바로 개인의 우수성, 역할 이해, 명확한 리더십 및 환자 중심성. 그럼 왜 이것을 "미신"라고 불러야 할까요? 왜냐하면 선의 핵심에도 불구하고, 그것들은 팀이 어떻게 일하는지에 대한 잘못된 믿음이기 때문입니다. 사실, 이 미신은 너무 단순해서 위험하다.

Each of these myths centers on something we would all agree is a “good”: individual excellence, role understanding, clear leadership, and patient centeredness. Why, then, do I call them “myths?” Because, notwithstanding the kernels of good, they are false beliefs about how teams work. In fact, I would argue that they are dangerous oversimplifications.

  • 첫 번째 신화는 - 우리가 각자 맡은 일을 제대로 했다면 - 이라는 말은 [협소한 개인주의]이다. 그것은 능력의 개별적인 차원을 반영하고 위에서 설명한 집단적 차원을 무시한다. 
  • 두 번째는, 만약 우리가 서로의 역할을 이해했다면, 이라는 말은 [고정적]이라는 문제가 있다. 이는 보건 전문가의 역할이 안정적이고 뚜렷하다는 것을 암시하는 반면, 팀워크에 대한 민족학 연구는 역할이 유동적이고 중복될 수 있다는 것을 입증했다.
  • 세 번째는, 만약 우리가 분명한 리더십을 가지고 있다면, 이라는 말은 [낭만적으로 향수를 불러일으키는 것]이다. 그것은 의사들이 의료 서비스 제공의 "리더"였던 시대로 거슬러 올라가지만, 최근의 연구는 의료 팀에서의 리더십은 복잡한 협상이며 "가장 책임 있는 의사"는 명확하게 식별되지 않을 수 있다고 주장한다.
  • 네 번째는, 우리 모두가 환자에게만 초점을 맞춘다면, 이라는 말은 [천진난만한 이상주의]입니다. 나는 환자 중심주의를 공유된 핵심 가치로 반대하는 것이 아니다. 그러나 의료 팀워크는 종종 경쟁적인 많은 동기들에 의해 형성됩니다.
    • 적시에 환자 치료를 제공하려는 욕구,
    • 부족한 자원을 보존해야 하는 필요성,
    • 환자 안전을 보장해야 하는 요구 사항,
    • 교육생이 자신의 기술을 연습할 수 있도록 해야 하는 의무  
      • ...등 모든 것이 팀이 임상 상황의 진화에 따라 협상하고 우선순위를 다시 정해야 하는 정당한 동기이다. 그리고 의료팀의 개인들은 이러한 동기를 다르게 해석하고 제정할 수 있다.

 

  • The first myth—if we each did our job properly—is narrowly individualistic. It reflects the individual dimensions of competence and ignores the collective dimensions described above.
  • The second—if we understood each other's roles—is problematically static. It implies that health professional roles are stable and distinct, while ethnographic studies of teamwork have demonstrated that roles can be fluid and overlapping.8 
  • The third—if we had clear leadership—is romantically nostalgic. It harkens back to a time when physicians were the unchallenged “leaders” of health care delivery, but recent research argues that leadership on health care teams is a complex negotiation9 and the “most responsible physician” may not be clearly identifiable.4 
  • And the fourth—if we all just focused on the patient—is naively idealistic. I am not arguing against patient-centeredness as a shared, core value. But health care teamwork is shaped by many, and often competing, motivations. The desire to provide timely patient care, the need to conserve scarce resources, the requirement to ensure patient safety, the mandate to allow trainees to practice their skills—all are legitimate motivations that teams must negotiate and reprioritize as a clinical situation evolves. And individuals in the health care team may interpret and enact these motivations differently.10,11

이러한 신화는 의도하지 않은 방법으로 보건 전문가 교육에 영향을 미칠 수 있다. 예를 들어, 전문가 간 협업 및 전문가 간 교육(IPE)을 지원하기 위해 강력한 프레임워크가 개발되었지만, 제한된 교육 시간과 참여로 인해 이러한 프레임워크는 종종 단순화된 방식으로 구현된다. 이 경우, 강력한 모델은 "팀에서 전문적인 역할을 이해하는" 학습 목표로 축소될 수 있습니다. 역할에 대해 배우는 것이 중요하지만, 연구 결과 역할이 종종 유동적이고 중복되는 것으로 나타남에도, 이같은 접근법은 보건 전문가 역할이 실제로 안정적이고 뚜렷하다는 암묵적인 메시지를 전달할 수 있다. 임상 전 IPE 커리큘럼은 [역할을 명확하게 설명하는] "기본" 시나리오[역할 유동성과 모호성을 설명하여 인위적으로 구분하지 않게 하는] "고급" 시나리오를 모두 제시하여 의도하지 않은 메시지로부터 보호할 수 있다. 학생과 전문가를 위한 실무 기반 IPE 이니셔티브는 실제 임상 상황에서 의료 제공자와 환자 간의 역할 복잡성과 역할 교차점을 가르치는 강력한 방법이 될 수 있다.
These myths can influence health professional education in unintended ways. For instance, while robust frameworks have been developed to support interprofessional collaboration and interprofessional education (IPE),12 these are often implemented in simplified ways due to limited curricular time and engagement. When this happens, the robust model can be reduced to the learning objective to “understand professional roles on the team.” While learning about roles is important, this approach can send the implicit message that health professional roles are stable and distinct in practice, when research has shown that roles are often fluid and overlapping.4 Preclinical IPE curricula can guard against this unintended message by presenting both “basic” scenarios that illustrate roles distinctly and more “advanced” scenarios that trouble artificial distinctions by illustrating role fluidity and ambiguity. Practice-based IPE initiatives, for students and for experts, may also be a powerful way to teach both role complexity and role intersection among health care providers and patients in real clinical situations.13

우리가 북미에서 역량 기반 의학교육으로 전환함에 따라, 우리는 이러한 신화가 그러한 노력에 미치는 영향에도 주의를 기울여야 한다. 예를 들어, 리더십은 지속적인 전문 개발 환경에서처럼 대학원 교육을 위한 역량 프레임워크에서 두드러지게 나타납니다. 리더십도 중요하지만 연구 결과에서 알 수 있듯이 팀 협업과의 관계는 복잡하다. 만약 이 미묘한 관계가 주의 깊게 지켜지지 않는다면, 우리는 "강한 리더십"이 팀워크를 해치는 만병통치약이라는 신화를 영속시킬 위험이 있다. "강력한 리더십"이 수반하는 것은 임상적 맥락에 따라 달라질 것이지만, 기존의 지식은 주로 "행동팀action teams"이라 불리는 것을 작업하는 중환자 치료, 외과, 소생 및 외상 팀에서 파생된다. 이러한 지식을 오늘날의 만성적이고 복잡한 질병 시대에 더 분산된 팀의 리더십의 특성에 비판적으로 적응시키기 위해 주의를 기울여야 한다. 행동 팀에서 효과적인 것으로 밝혀진 [지시적 또는 적응적 리더십]과 같은 전략은, "리더"가 팀에서 덜 안정적이고 가시적인 실체entity가 될 수 있는 [만성적인 치료 상황]에서 효과적이려면 신중한 번역translation을 요구할 수 있다.
As we shift to competency-based medical education in North America, we must also attend to the influence of these myths on those efforts. For instance, leadership features prominently in competency frameworks for postgraduate training14 as it does in the continuing professional development landscape.15 Leadership is important, but it is in complex relation to team collaboration, as research has shown.5 If this nuanced relation is not carefully attended to, we risk perpetuating the myth that “strong leadership” is the panacea for what ails teamwork. What “strong leadership” entails will vary according to clinical context, yet existing knowledge is derived largely from critical care, surgical, resuscitation and trauma teams, whose members work on what are called “action teams,” collocated space and time.16 Care must be taken to critically adapt such knowledge to the nature of leadership on more distributed teams in today's chronic, complex disease era.17,18 Strategies such as directive or adaptive leadership, found to be effective in action teams,16 may require careful translation to be effective in chronic care contexts where “leader” may be a less stable, visible entity on the team.

이러한 진실과 신화는 우리의 가정이 의료 팀워크의 복잡한 현실과 맞지 않을 수 있는 곳으로 우리의 관심을 끈다. 이러한 가정에 대한 비판적 탐구는 개인과 집단적 역량을 인식하고 촉진하는 교육 관행에 더 가까이 다가갈 것이다.

These truths and myths draw our attention to places where our assumptions may not fit the complex realities of health care teamwork. Critical exploration of these assumptions will bring us closer to educational practices that recognize and promote both individual and collective competence.

 


J Contin Educ Health Prof. Summer 2016;36 Suppl 1:S19-21. doi: 10.1097/CEH.0000000000000078.

Paradoxical Truths and Persistent Myths: Reframing the Team Competence Conversation

Affiliations collapse

Affiliation

1Dr. Lingard: Director, Centre for Education Research and Innovation Professor, Department of Medicine, Schulich School of Medicine and Dentistry, University of Western Ontario, London, Ontario, Canada.

PMID: 27584064

DOI: 10.1097/CEH.0000000000000078

Abstract

Medicine has conventionally had an individualist orientation to competence. Individual competence is conceptualized as a stable possession that, once acquired, holds across contexts. Individual competence is necessary; however, it is insufficient for quality health care. We also need to attend to collective competence in order to grapple with paradoxical truths about teamwork, such as: competent individuals can form incompetent teams. Collective competence is conceptualized as a distributed capacity of a system, an evolving, relational phenomenon that emerges from the resources and constraints of particular contexts. This article outlines a set of paradoxical truths about teamwork in health care and uses the concept of collective competence to explain how they can hold true. It then considers a set of persistent myths about teamwork which have their roots in an individualist orientation, exploring how they hold us back from meaningful change in how we educate for, and practice as, health care teams. Finally, the article briefly considers the implications of these truths and myths for educational issues such as interprofessional education and competency-based health professional education.

성찰은 비누와 같은 것인가? 의학교육연구에서 성찰에 대한 비판적 엄브렐라 리뷰(Adv Health Sci Educ Theory Pract. 2022)
Is reflection like soap? a critical narrative umbrella review of approaches to reflection in medical education research
Sven P. C. Schaepkens1 · M. Veen1 · A. de la Croix2

 

서론
Introduction

성찰의 개념은 유능한 전문가가 되기 위해 무엇이 중요한지에 대한 새로운 통찰력을 바탕으로 의학 교육에 들어갔다(Sandars, 2009). 많은 학부 및 전문 의료 교육 프로그램에는 의료 교육생들이 유능한 전문 인력으로 발전할 수 있도록 돕는 성찰이 포함되어 있다. 또한 학습에 대한 다양한 이론은 모델에 성찰을 통합하는데, 그 중 콜브의 경험적 학습이 두드러진 예이다(Caty et al., 2015; Coffield et al., 2004; Roessger, 2014). 의학교육에 대한 성찰 연구의 주된 목적은 실천과 실천자를 지원하는 것이다. 그럼에도 불구하고 이론과 실제 사이에는 긴장감이 존재한다(van Enk & Regehr, 2018).
The concept of reflection entered medical education based on new insights about what matters for becoming a competent professional (Sandars, 2009). Many undergraduate and specialty medical education programs include reflection to help medical trainees develop into competent professionals. Additionally, various theories about learning integrate reflection in their models, of which Kolb’s experiential learning is a prominent example (Caty et al., 2015; Coffield et al., 2004; Roessger, 2014). The main purpose of research on reflection in medical education is to support practice and its practitioners. Nonetheless, there is tension between theory and practice (van Enk & Regehr, 2018).

전문성으로 가는 성찰적 길reflective path은 비누처럼 미끄럽다. 성찰은 이론적으로 통일된 개념이 결여된 복잡한 현상이다. 반사에 대한 경험적 연구는 다양한 방법론적 접근 방식을 보여준다(Fragkos, 2016; Mann et al., 2007). 일부는 이것이 "반성 자체의 복잡성, 합의의 결여, 그리고 교육자들의 반성과정에 대한 이해의 다양성" 때문이라고 제안한다(Uygur et al., 2019, 페이지 13). 현재 존재하는 다수의 정의와 반사 모델은 "반사의 다중 의미 발생"에 기여한다(Nguyen et al., 2014, 페이지 1184; Chapey et al., 2012; Koole et al., 2011; Marshall, 2019; Roessger, 2014).
The reflective path towards professionalism is slippery like soap. Reflection is a complex phenomenon that lacks a theoretically unified concept. Empirical research on reflection shows a wide variety of methodological approaches (Fragkos, 2016; Mann et al., 2007). Some suggest that this is “due to the complexity of reflection itself, lack of consensus, and variability in educators’ understanding of the reflective process” (Uygur et al., 2019, p. 13). The multitude of definitions and models of reflection that currently exist contribute “to the accrual of multiple meanings of reflection” (Nguyen et al., 2014, p. 1184; Chaffey et al., 2012; Koole et al., 2011; Marshall, 2019; Roessger, 2014).

근본적인 과학적 문제는 유추analogy로 포착할 수 있다.

  • 만약 어른들에게 비누를 정의하라고 한다면, 그들은 비누가 기름, 잿물, 물, 그리고 향기로 구성되어 있다고 대답할 것이다.
  • 만약 우리가 아이에게 같은 질문을 한다면, 그녀는 더러운 손을 닦는 것은 미끄러운 것이라고 말할 수 있습니다.
  • 세 번째 대답은 Francis Pongge의 Soap처럼 그것이 개구리와 물고기처럼 행동한다는 시적인 것일 수 있다. (Pongge, 2015)
  • 화학자는 C17H35COO- + Na + 또는 K +로 응답한다(Brenntag, 2021).

다음 중 비누의 본질을 포착한 것은 무엇인가? 화학자의 정의가 아이의 정의보다 더 근본적인가? 아니면 다 합칠까요? 간단히 말해서, 어떤 제형이 비누에 대한 우리의 이해를 통합시키는가?
The underlying scientific problem can be captured in an analogy.

  • If we ask adults to define soap, they might reply that soap consists of oil, lye, water and fragrance.
  • If we ask a child the same question, she could say that it is a slippery thing that cleans dirty hands.
  • A third reply might be poetic, like Francis Ponge’s Soap, that it behaves like a frog and a fish (Ponge, 2015).
  • A chemist replies with C17H35COO- plus Na + or K + (Brenntag, 2021).

Which of these descriptions captures the essence of soap? Is the chemist’s definition more fundamental than the child’s? Or should we combine them all? In short, what formulation unifies our understanding of soap?

의학 교육 연구는 종종 [정확한 예측과 '개념적 우아함'을 지닌 이론의 생성]이라는 [과학적 이상]을 위해 노력한다(van Enk & Regehr, 2018). 그러나 성찰이 복잡한 관행이고, 비누처럼 동작하는 경우, 광범위한 설명을 지원할 수 있다. 바로 그 본성으로 인해 [예측가능성과 개념적 우아함]이 동일시되는 [과학적 엄격함]의 이상에 저항할 수 있다. (하이데거, 2002) 의학교육에 성찰과 같은 개념이 중요할 때, 우리가 그것을 과학적으로 측정하거나 평가할 수 있다는 것은 자동적으로 뒤따르지 않는다. (Veen & Cianciolo, 2020) 이것은 의학 교육에 대한 성찰에 대한 연구에 무엇을 의미합니까?
Medical education research often strives for the scientific ideal of producing theory that can predict accurately and has ‘conceptual elegance’ (van Enk & Regehr, 2018). However, if reflection is a complex practice and behaves like soap, it might support a wide range of descriptions. Its very nature might resist the ideal of scientific rigor that equates to predictability and conceptual elegance (Heidegger, 2002). When a concept like reflection is important for medical education, it does not automatically follow that we can scientifically measure or assess it (Veen & Cianciolo, 2020). What does this imply for research on reflection in medical education?

[회의론자들]은 성찰을 연구하는 것은 겸손함을 필요로 한다고 주장할 수 있다. 왜냐하면 그것은 인간으로서 매우 기본적이기 때문이다. 이 개념은 "너무 크고, 너무 일반적이고, 모호하며, 효과적인 실제 적용에 적합하지 않다"입니다(Cornford, 2002, 페이지 226). 한편, 회의론자들과는 달리, 우리는 개념을 운용하는 다른 방법이 연구에 어떻게 영향을 미치는지 이해한다면 성찰에 대한 의학 교육 연구가 합리적이라고 주장한다. 이를 위해서는 한 걸음 물러서서, 의학교육 연구가 어떻게 하면 개념적, 방법론적 무결성을 잃지 않고 성찰적 실천에 정의를 내릴 수 있는지 명확히 해야 한다.
A skeptic could argue that researching reflection requires modesty because it is so fundamental to being human. The concept is “just too big, that is, too general and vague, for effective, real world application” (Cornford, 2002, p. 226). Contrary to such skeptics, we argue that medical education research on reflection is sensible, provided we understand how different ways of operationalizing the concept affect the research. This requires us to take a step back, and clarify how medical education research can do justice to reflective practice without losing its conceptual and methodological integrity.

본 연구에서는 성찰의 개념 자체에 대한 이질적인 이해로 인해 어려움을 겪고 있는 성찰에 대한 학술적 논쟁에 대한 철학적 분석을 수행한다. 우리는 미래의 개념 개발이 어떻게 형성될 수 있는지에 대한 제안을 제공하는 것을 목표로 한다(Grant & Booth, 2009). 따라서 우리는 '성찰을 개념화하고 조작화하기 위하여 가능한 과학적 접근법은 무엇이며, 이러한 접근법이 실제로 성찰에 대한 지식 생산에 어떻게 영향을 미치는가?'라는 질문을 다룬다.
In this study, we conduct a philosophical analysis of the scholarly debate on reflection, which is challenged by its heterogeneous understanding of the concept of reflection itself. We aim to provide suggestions on how future conceptual development can take shape (Grant & Booth, 2009). Therefore, we address the questions, ‘what are the possible scientific approaches to conceptualizing and operationalizing reflection, and how do these influence knowledge production on reflection in practice?’.

방법들
Methods

연구설계
Study design

우리는 반사에 대한 연구에 대한 비판적인 서술적 우산 검토를 수행했다(Ng et al., 2015). 이는 리뷰의 검토였으며, 이전 작업을 '재고'하고 평가하기 위한 분석이 포함되었다(Grant & Booth, 2009). 우리는 많은 체계적인 검토가 이미 개념적 합의를 도출하지 않고 수행되었기 때문에 이 비체계적인 검토를 선택했다.

We conducted a critical narrative umbrella review of research on reflection (Ng et al., 2015). This was a review of reviews, and included an analysis to ‘take stock’ and evaluate the previous body of work (Grant & Booth, 2009). We opted for this non-systematic review since many systematic reviews have already been performed without resulting in conceptual consensus.

데이터 수집
Data collection

우리는 체계적 검토에서 영어로 된 서술적 검토에 이르기까지 가장 넓은 의미의 반사에 대한 연구 리뷰를 분석했다. SS는 2000년부터 2020년 7월 6일까지 데이터베이스, 웹메디드, 과학, 출판에 이어 2020년 7월 6일까지 검색 문자열('반사' 또는 '리플렉스'), '리플렉스' 및 '리플렉스' 및 '리플렉스' 및 '리플렉스'로 검색을 수행했다. 본 연구에 포함할 수 있는 검토는 의료 교육 및/또는 의료 보건 직업에 대한 (의 특정 측면) 반영에 대한 경험적 연구를 보고해야 하거나, 또는 그들의 규율 초점과 관계없이, 반사 개념에 대한 상당한 이론적 토론을 제공해야 한다(브라운 외, 2019). 반성에 대한 학제간 이론적 논의를 다룰 때 교원교육 분야 등 의학교육 이외의 분야의 리뷰를 포함했다. 우리는 비의학 교육 맥락에서 성찰에 대한 경험적 연구만을 다룬 연구를 제외했다. 이러한 내부 및 제외 기준은 우리가 분석한 47개의 기사를 낳았다(cf. references with *).
We analyzed reviews of research on reflection in the broadest sense, ranging from systematic to narrative reviews in English. SS conducted a search with the search string (‘REFLECTION’ OR ‘REFLEXIVE’) AND (‘REVIEW’), and (‘REFLECTION’ OR ‘REFLEXIVE’) AND (‘SYSTEMATIC REVIEW’ OR ‘LITERATURE REVIEW’ OR ‘NARRATIVE REVIEW’ OR ‘CRITICAL REVIEW’) from 2000 until 6 July 2020 in the following databases: EMBASE, PubMed, Scopus, and Web of Science. Reviews eligible for inclusion in this study either had to report empirical research on (certain aspects of) reflection in medical education and/or medical health professions, or alternatively, regardless of their disciplinary focus, provide a substantial theoretical discussion on the concept of reflection (Brown et al., 2019). We included reviews from fields other than medical education, such as the teacher education field, when they dealt with cross-disciplinary theoretical discussions on reflection. We excluded studies that solely dealt with empirical research on reflection in non-medical education contexts. These in- and exclusion criteria resulted in 47 articles that we analyzed (cf. references with *).

분석.
Analysis

종종 검토의 목적은 경험적 데이터를 수집하고 평가하거나 모델 또는 이론적 프레임워크의 현상에 대한 문헌을 합성하는 것이다. 그러나 우리 연구의 경우, 검토 자체에서 연구와 합성된 프레임워크에 대한 평가가 철학적 분석의 대상이었다. [철학]은 넓은 분야이지만, 우리는 그것을 "이론 구성의 더 넓은 과정을 분석하고 이해하고, 그것의 숨겨진 배경 전제에 의문을 제기하고, 인간의 관행에 영향을 미치는 (…) 가치를 밝히고 조사하는 데 특화된 학문 분야"로 이해한다(Ruitenberg, 2009, 페이지 325; Holma, 2009). 철학은 어떤 접근법이 적절한지 즉시 명확하지 않기 때문에 성찰에 대한 다른 이론적 방향을 식별하고 그들 사이에서의 "브로커 또는 협상가 역할"을 도울 수 있다. (Veen & Cianciolo, 2020, 페이지 5).

Often, the purpose of reviews is to pool and assess empirical data, or synthesize literature about a phenomenon in a model or theoretical framework. For our study, however, the assessment of research and synthesized frameworks in the reviews themselves were the object of philosophical analysis. Philosophy is a broad field, but we understand it as “an academic discipline specialized in analyzing and understanding the wider processes of the constructing of theories, questioning their hidden background premises, and revealing and examining the values affecting (…) human practices” (Ruitenberg, 2009, p. 325; Holma, 2009). Philosophy can help identify different theoretical orientations on reflection, and “act as a broker or negotiator” between them, because it is not immediately obvious which approach is appropriate (Veen & Cianciolo, 2020, p. 5).

우리는 리뷰를 뒷받침하는 기초적인 철학적 연구와 그들의 성찰 연구에 대한 평가를 대조하여 성찰 연구에 대한 문헌 리뷰를 분석했다. 이 연구에서, 우리는 트렌드가 무엇인지 설명하는 것이 아니라, 연구가 어떻게 성찰의 이론적 토대와 일치하여 성찰에 대한 과학적 지식을 생산하는지 분석한다. 이 연구에서 기초 문헌을 사용하는 것은 '주관론 렌즈'와 같은 기능을 한다(Varpio et al., 2020). 렌즈는 개념적 문제를 강조하기 위한 분석 병렬 배치에 중요한 분야의 주요 경향을 인식하는 데 도움이 된다(Biesta, 2009; Davis, 2009).

We analyzed literature reviews on reflection research by contrasting the foundational philosophical work that underpins the reviews with their assessments of reflection research. In this study, we do not describe what the trends are, but analyze how research produces scientific knowledge on reflection in alignment with reflection’s theoretical underpinnings. Using the foundational literature in this study functions like a ‘subjectivist lens’ (Varpio et al., 2020). The lens helps us recognize the field’s main tendencies that are valuable for analytical juxtaposition to highlight conceptual problems (Biesta, 2009; Davis, 2009).

결과.
Results

우리는 이제 [성찰 연구에 대한 두 가지 뚜렷한 접근 방식]을 먼저 설명함으로써 분석 결과를 제시한다. 그런 다음 각 접근 방식을 더 자세히 설명하고, 분석 렌즈를 기반으로 각 접근 방식이 서로 어떻게 관련되어 있는지 논의하고, 추가 권장 사항을 제공한다.
We now present the results of our analysis by first describing the two distinct approaches to reflection research. We then describe each approach in more detail, discuss how they relate to each other based on our analytical lens, and provide further recommendations.

두 가지 접근 방식
Two approaches

우리는 성찰의 '퍼지 개념'을 연구하는 두 가지 주요 접근법을 구분했다.

  • 첫 번째 접근법은 [개념적 모호성을 해소하는 것]을 목표로 한다(Nguyen et al., 2014). 이 접근 방식은 이론과 반사에 대한 경험적 연구 사이에 통합된 개념적 토대가 절실한 필요성을 보여준다(Koole et al., 2011; Kuiper & Pesut, 2004; Kurt, 2018; Marshall, 2019; Nguyen et al., 2014). 대조적으로,
  • 두 번째 접근법은 성찰의 모든 개념을 포함하는 모호성을 해소하는 것을 목표로 하지 않는다. 대신 [성찰에 대한 이질적인 이해]를 성찰에 대한 연구가 갖춰야 할 [필수적인 특질vital quality]로 통합한다(Mantzoukas, 2008; Ng, 2012; Ng 등, 2015; Ng 등, 2015; Norrie 등, 2012; Platt, 2014; Ven 등, 2018).

We distinguished two main approaches to studying the ‘fuzzy concept’ of reflection.

  • The first approach aims to dissolve conceptual ambiguity (Nguyen et al., 2014). This approach portrays a pressing need for unified conceptual ground between theories and empirical studies on reflection (Koole et al., 2011; Kuiper & Pesut, 2004; Kurt, 2018; Marshall, 2019; Nguyen et al., 2014).
  • The second approach, in contrast, does not aim at dissolving ambiguity with an all-encompassing concept of reflection; instead, it incorporates the heterogeneous understanding of reflection as a vital quality in research on reflection (Mantzoukas, 2008; Ng, 2012; Ng et al., 2015; Norrie et al., 2012; Platt, 2014; van Beveren et al., 2018).

검토된 연구는 이 분야에서 영향력 있는 하버마스나 콜바와 같은 다양한 학자들을 언급하지만, 분명히 대다수는 듀이 및 쇤의 연구를 근간으로 언급하고 있다(얼랜슨 & 비치, 2008; 펜들러, 2003; 프래그코스, 2016; 쿨 외, 2011; 미라글리아, 2015; 리처드 외, 2018; 반, 2018). 듀이와 쇤의 연구는 성찰 연구에 대한 두 가지 접근방식을 뒷받침한다. 비록 쇤이 듀이에 비판적으로 반응하지만, 그들 사이에는 뚜렷한 공통점이 있다. 성찰에 대한 연구를 통해, 그들은 [이론과 실제 사이의 관계를 재고]하고, [실천을 무대의 중심]에 둔다(Erlandson & Beach, 2008; Farrell, 2012). 일부 연구는 듀이와 쇤이 얼마나 성공했는지에 대해 의문을 제기한다. 그럼에도 불구하고, 그들의 반성에 대한 연구는 이 논의의 중추적인 지점을 나타낸다(Hébert, 2015; Newman, 1999). 따라서 철학적 분석에서 우리의 '움직임'은 듀이와 쇤의 사상을 우리의 분석 렌즈로 채택하는 것이었다. 그들의 연구에서 우리는 이론-실천 논쟁과 일치하는 기술자적 rationale역동성적 rationale의 특징을 도출했다. 우리는 이 두 가지 이유를 성찰에 대한 현대 과학 지식 생산에 적용했다. 
The reviewed studies mention various scholars such as Habermas or Kolb as influential in this field, but a clear majority refer to the work of Dewey and/or Schön as foundational (Erlandson & Beach, 2008; Fendler, 2003; Fragkos, 2016; Koole et al., 2011; Miraglia, 2015; Ng et al., 2015; Richard et al., 2019; van Beveren et al., 2018). Dewey’s and Schön’s work underpin both approaches to studying reflection. Although Schön responds critically to Dewey, there is a distinct commonality between them. With their study of reflection, they rethink the relation between theory and practice, and grant practice center stage (Erlandson & Beach, 2008; Farrell, 2012). Some studies question how far Dewey and Schön succeed; nevertheless, their work on reflection marks a pivotal point in this discussion (Hébert, 2015; Newman, 1999). Our ‘move’ in the philosophical analysis was, therefore, to adopt Dewey’s and Schön’s ideas as our analytical lens. From their work, we drew the qualities of a technicist and a dynamic rationale, that tie in with the theory–practice debate. We applied these two rationales to the contemporary scientific knowledge production on reflection. 


우리가 [기술자]라는 용어를 사용하는 것은, 쇤이 '기술적 합리성'이라고 설명한 것에서 비롯됩니다(킨셀라, 2007; 쇤, 1983). [기술자]는 [전문적 문제]가 명확히 구분된 다음, [이론과 기술을 엄격하게 적용함]으로써 문제를 해결함을 나타낸다. '적용applying'은 규범적 위계질서를 의미하며, 여기서 "일반 원칙은 가장 높은 수준을 차지하고, 가장 낮은 수준을 해결하는 구체적인 문제"를 의미한다(Schön, 1983, 페이지 24; Garison et al., 2012). 이론과 실제는 대부분 서로 분리된 것으로 인식되는데, 여기서 [이론]은 [현실의 혼돈에 질서를 가져다주는 체계적인 도구]이다. (킨셀라, 2007) 듀이와 쇤은 모두 합리성실천 사이의 이 이원론에 도전한다(Garrison et al., 2012).

Our use of the term technicist stems from what Schön describes as ‘Technical Rationality’ (Kinsella, 2007; Schön, 1983). Technicist indicates that professional problems are clearly demarcated and then solved by rigorously applying (scientific) theory and techniques in practice. ‘Applying’ implies a normative hierarchy, wherein “general principles occupy the highest level and concrete problem solving the lowest” (Schön, 1983, p. 24; Garrison et al., 2012). Theory and practice are mostly perceived as separated from each other, wherein theory is the systematic instrument bringing order to reality’s chaos (Kinsella, 2007). Both Dewey and Schön challenge this dualism between rationality and practice (Garrison et al., 2012).

우리가 [역동적dynamic] 이라는 용어를 사용하는 것은 듀이와 쇤이 [경험과 실습]을 제공한다는 설명에서 비롯된다. [실천 속의 문제]들이 [칼로 나누듯 구분되는 것이 아니라 상호 연관되어 있다는 점]에서, 그것들은 역동적이다. 실천은 혼란스럽고 혼란스러우며, 실천을 불확정상태로 만드는 규범적 긴장, 무질서 및 갈등으로 가득 차 있다(킨셀라, 2007; Ng et al., 2020; 쇤, 1983). 게다가, "시간이 지남에 따라 경험에서 합리성이 나타난다" (Garrison et al., 2012, 페이지 42). 논리logic는 변하지 않고 맥락에 무관심한 반면, 사고는 항상 "어떤 맥락에 대한 참조"를 가지고 있기 때문에 (사고는) 계속해서 변화하는 과정이다. (Dewey, 1933, 페이지 72) 다음 섹션에서는 두 가지 접근 방식에 대해 자세히 설명합니다. 
Our use of the term dynamic originates with the description that Dewey and Schön give of experience and practice. They are dynamic, in the sense that problems in practice are not clear-cut but interconnected. Practice is messy, turbulent, filled with normative tensions, disorder, and conflict which make practice indeterminate (Kinsella, 2007; Ng et al., 2020; Schön, 1983). Furthermore, “rationality emerges over time in experience” (Garrison et al., 2012, p. 42). Whereas logic is unchanging and indifferent to context, “thinking is a process” that continuously changes because thinking always “has reference to some context” (Dewey, 1933, p. 72). In the next section, we will discuss the two approaches in detail.

성찰에 대한 기술자적 접근 방식
The technicist approach to reflection

의학교육 연구 분야에 걸친 학문은 성찰이 복잡한 현상임을 강조한다. 성찰은 교육생이 켜거나 끌 수 있는 스위치처럼 단일하고 1차원으로 보이지 않는다. 대신, 성찰은 시간이 지남에 따라 발생하는 연속체를 따라 움직인다(Koole et al., 2011; Marshall, 2019; Nguyen et al., 2014; Uygur et al., 2019). 이러한 해석은 [성찰적 실천]이 [명확한 순서가 없다는 것]을 인정하기 때문에, 성찰에 대한 [역동적 해석]과 잘 일치한다. 그럼에도 불구하고, 더 자세히 살펴보면, [성찰이 복잡하다고 주장하는 연구]는 여전히 특정 기술자 연구 문제와 방법론적 해결책으로 이어지는 기술자적 전제를 지지하고 있다.
Scholarship across the field of medical education research emphasizes that reflection is a complex phenomenon. Reflection is not seen as monolithic and one-dimensional like a switch that trainees can turn on or off. Instead, reflection moves along a continuum that happens over time (Koole et al., 2011; Marshall, 2019; Nguyen et al., 2014; Uygur et al., 2019). Such interpretations align well with a dynamic interpretation of reflection because it acknowledges that reflective practice has no clear-cut order. Nonetheless, upon closer scrutiny, studies that claim reflection is complex can still uphold technicist presuppositions that lead to particular technicist research problems and methodological solutions.


많은 리뷰는 성찰을 연구하는 데 사용되는 [광범위한 방법론이 문제가 있다]고 결론짓는다. 그들은 다수의 프레임워크가 사용되고 있기 때문에 성찰의 효과를 정량화하고 측정하기 어렵다고 주장한다. 강력한 증거를 수집하기 위한 교차 비교 연구 결과는 제한된 결과를 산출한다(Anderson et al., 2019; Bjerkik & Hilli, 2019; Buckley et al., 2009; Chen & Forbes, 2014; Choperena et al., 2019; Contreras et al., 2020; Mann et al., 2007; 2015; Roess Gurel, 2014; 2014; 2014; 2014). [성찰의 정의]에 대한 지속적인 이론적 불일치는 타당성과 증거 기반 관행에 해로운 것으로 인식된다(Marshall, 2019). (성찰의 정의에 대한) 합의의 부재는 "[반성]을 가장 잘 육성하는 방법에 대한 상당한 불확실성"을 영속화 시키거나, 성찰이 효과적인지 알 수 없게 한다(Roessger, 2014; Winkel et al., 2017). 따라서, "더 명확한 성과를 가진, 보다 명확한 성찰의 구조는 학생들의 진도progress를 추적하거나, 연구 성과를 측정하는 데 유용한 벤치마크를 개발할 수 있다." (Chaffey et al., 2012, 페이지 202).

Many reviews conclude that the wide range of methodologies used to study reflection is problematic. They claim that effects of reflection are difficult to quantify and measure because multiple frameworks are in use. Cross-comparing research outcomes to harvest strong evidence yields limited results (Anderson et al., 2019; Bjerkvik & Hilli, 2019; Buckley et al., 2009; Chen & Forbes, 2014; Choperena et al., 2019; Contreras et al., 2020; Mann et al., 2007; McGillivray et al, 2015; Roessger, 2014; Uygur et al., 2019; Winkel et al., 2017). Ongoing theoretical disagreement over the definition of reflection is perceived as detrimental to validity and evidence-based practice (Marshall, 2019). The lack of consensus is seen as perpetuating “considerable uncertainty about how to best foster [reflection]” (Koole et al., 2011, p. 7), or prevents us from knowing if reflection is effective (Roessger, 2014; Winkel et al., 2017). Therefore, “a more defined construct of reflection, with clear outcomes, could lead to the development of benchmarks useful in tracking student progress and as research outcome measures” (Chaffey et al., 2012, p. 202).

[방법론적 과제]를 해결하기 위해, 기술자 지향의 연구는 모델과 정의에서 [성찰의 일반적인 특성을 합성synthesize]한다. 그들은 개념을 검증하는 합의를 도출하기 위해 "성찰에 대한 포괄적이면서도 정확한 이해"를 목표로 한다(Marshall, 2019, 페이지 397; Koole et al., 2011; Kuiper & Pesut, 2004; Nguyen et al., 2014). 연구는 일반적인 용어로 성찰을 정의하여, 개념을 자급자족하고 조작화가 용이하도록 외적 요소에 결합시키는 경향이 있다. "따라서 성찰은 맥락에 관계없이 보편적으로 적용 가능하고 이해할 수 있다." (응우옌 외, 2014, 페이지 1185) 다양한 리뷰는 개념적 양면성을 완화하기 위해 경계를 명확히 정의하는, 이러한 [체계화된, 비맥락화된 모델의 추구]를 환영한다(Uygur et al., 2019).
To address the methodological challenges, studies with a technicist orientation synthesize common traits of reflection in models and definitions. They aim for “a comprehensive yet precise understanding of reflection” to accrue consensus that validates the concept (Marshall, 2019, p. 397; Koole et al., 2011; Kuiper & Pesut, 2004; Nguyen et al., 2014). Research tends to define reflection in generic terms to make the concept self-contained and untied to extrinsic elements for easier operationalization. “Reflection thus remains universally applicable and understandable independent of context” (Nguyen et al., 2014, p. 1185). Various reviews welcome such pursuits of systematized, de-contextualized models that clearly demarcate boundaries to mitigate conceptual ambivalence (Uygur et al., 2019).

[기술자 지향]의 문헌고찰은 [개념의 명확성과 동질성]에 대한 교육의 필요성을 강조한다.

  • 첫째, [실용적인 지침과 검증된 평가 및 피드백 도구]를 찾는 커리큘럼 리더를 대상으로 합니다. 이러한 도구는 교육생이 필요한 기술, 지식 및 태도를 습득하고, 보다 집중적이고 구조적이며 효과적인 피드백을 제공하는지 여부를 보여준다(Chaffey et al., 2012; Kool et al., 2011; Nguyen et al., 2014). 또한 표준화된 모델과 도구는 교육자가 반영 결과를 균일하고 공정하게 평가하는 데 도움이 된다.
  • 둘째, 이 접근법은 훈련생들이 [숙달될 수 있는, 차원이 다른 특정 단계를 거치는 과정]으로서 [성찰에 대한 절차적 이해]를 얻는 데 도움이 된다.

Reviews with a technicist orientation stress the educational need for conceptual clarity and homogeneity. First, it caters to curriculum leaders who seek practical guidelines and validated assessment and feedback instruments. Such tools show whether trainees obtained the required skills, knowledge and attitudes and allow for more focused, structured and effective feedback (Chaffey et al., 2012; Koole et al., 2011; Nguyen et al., 2014). Moreover, standardized models and instruments help educators assess reflection outcomes uniformly and thus fairly. Second, this approach helps trainees gain a procedural understanding of reflection as a process that goes through certain phases with different dimensions that can be mastered.


앞서 언급한 [실천에 대한 이점]은 매우 큽니다. 그러나, 이 시점까지, 현장 자체는 효과를 정확하게 측정하거나 연구를 효과적으로 교차 비교하여 일반화할 수 있는 [증거를 생성하지 못한 체계적인 실패]를 인정한다. 기술적 관점에서, 해결책은 [과학적 표준화를 허용하는 개념적 동질성과 합의]에 있다. 따라서, 성찰의 문제는 복잡하지만, "좋은 이론만큼 실용적인 것이 없기 때문에" 시간이 지나면 성찰의 복잡성은 도구적으로 길들여질 수 있다. (응우옌 외, 2014, 페이지 1187) 좌절에도 불구하고, 성찰의 진실은 방법론적 엄격함, 정확한 모델 및 엄격한 정의에 기초한 사실을 참조하여 [궁극적으로 시험할 수 있는 것]으로 인식된다. (Schön, 1983)
The aforementioned benefits to practice are significant. However, up to this point, the field itself acknowledges its systematic failure to accurately measure effects or validly cross-compare studies to produce generalizable evidence. From the technical perspective, the solution lies with conceptual homogeneity and consensus that allows scientific standardization. Thus, the problem of reflection is complex, but in time its complexity can be instrumentally tamed because “there is nothing as practical as good theory” (Nguyen et al., 2014, p. 1187). Despite setbacks, the truth of reflection is ultimately perceived as testable in reference to the facts based on methodological rigor, accurate models and strict definitions (Schön, 1983).

성찰에 대한 동적 접근
The dynamic approach to reflection

[기술자 중심의 연구]처럼, 성찰 연구에 [역동적 접근 방식을 채택하는 연구]도 성찰의 복잡성을 강조한다. 그러나 기술주의자들의 연구와는 달리, 그들은 이론적으로 [실천의 지저분한 본성에 중점]을 두고, 이것을 [개념적 합의와 보편적인 정의]보다 우선시한다. "실천은 불확실성, 불안정성, 고유성, 가치 충돌로 특징지어지며, (…) 여기서 실천의 중요한 질문이 논의된다." (킨셀라, 2009, 페이지 6; 만주카스, 2008; Ng et al., 2015) 따라서 성찰적 실천은 "[고정된 특질trait]으로서가 아니라, 개인의 경험과 지식의 원천에서 발생하는 [역동적 상태state]"이다(Ng et al., 2020, 페이지 6). 이러한 관점은 성찰이 [복잡]할 뿐만 아니라, 더 중요하게는 [개방적open]이라는 주장을 뒷받침한다. "다양한 사고 방식과 형태가 성찰로 간주될 수 있으며, 성찰을 가르친다는 것은 광범위한 교육적 가치와 목적의 다양성 덕분이다." (van Beveren et al., 2018, 페이지 7; Beauchamp, 2015) [반성적 실천에 대한 미묘한nuanced 관점]을 개발하는 것은 "'진짜' (…) 성찰을 촉진한다고 주장하는 단일한 솔루션"을 거부합니다(Platt, 2014, 페이지 50).

Like technicist oriented studies, those that adopt a dynamic approach to studying reflection also emphasize its complexity. Contrary to techniscist studies, however, they place theoretical emphasis on the messy nature of practice, and prioritize this over conceptual consensus and a universal definition. “Practice is characterized by uncertainty, instability, uniqueness, and value conflict, and (…) this is where the important questions of practice are negotiated” (Kinsella, 2009, p. 6; Mantzoukas, 2008; Ng et al., 2015). Reflective practice is thus “not as a fixed trait, but, rather, a dynamic state arising out of personal experience and sources of knowledge” (Ng et al., 2020, p. 6). This view supports the argument that reflection is not only complex, but more importantly, open. “Different practices and forms of thinking are considered reflective and the teaching of reflection is attributed to a broad diversity of educational values and purposes” (van Beveren et al., 2018, p. 7; Beauchamp, 2015). Developing a nuanced view on reflective practice rejects “a one-sized solution for facilitating ‘real’ (…) reflection” (Platt, 2014, p. 50).

성찰에 대한 다양한 견해는 현장에서 경험적으로 식별할 수 있다. 노리 외 연구진(2012)은 리뷰에서 의료 전문가들 간의 성찰 이해에 상당한 차이가 있다고 결론짓는다. "의료적 맥락에서 볼 때, 전문적 관행(…)을 개선하는 데 초점을 맞추고 있습니다. 대조적으로, 다른 전문직[예: 간호학]에서는, 반사적 실천이 각 집단의 자율적인 전문적 정체성을 주장하는 방법으로 더 접근된다." (노리 외, 2012, 페이지 573). 의료 분야의 연구는 [평가와 기술 습득에 중점]을 두고, [성과 지향적인 현실적이고 실용적인 접근 방식]을 선호하는 경향이 있다. 간호학은 [보다 가치 지향적이고 건설적인 접근법]을 채택한다. 이처럼 다양한 성찰 연구가 생산되는 것은 "전문직 내 역사와 전통뿐만 아니라, 국가적인 논쟁과 정책적 의무의 발전과도 관련이 있다" (Norrie et al., 2012, 페이지 574). 따라서 [역동적 접근법의 요점]은 [널리 채택된 성찰 이론을 하나의 중요한 객관적 개념으로 합성하는 것]이 아니라, [반성의 의미]는 자신의 전통과 역사를 가진 실천에서 비롯된, 전문적 가치에 단단히 자리잡고entrench] 있다. 성찰의 개념은 [보편적]이 아니라, [개방적이고 사회적으로 의존적contingent]이다(Beauchamp, 2015).

Divergent views on reflection are empirically identifiable across the field. In their review, Norrie et al. (2012) conclude that there are significant variations in understanding reflection between healthcare professions. “In the medical context, the focus is on improving professional practice (…). In contrast, in other professions [e.g. nursing], reflective practice is approached more as a way of asserting each group’s autonomous professional identity” (Norrie et al., 2012, p. 573). Research in the medical field tends to favor a realist and pragmatic approach that is outcome oriented, with an emphasis on assessment and skill acquisition. Nursing adopts a more constructivist approach that is value-oriented. This varied production of reflection literature “is related to the history and traditions within the professions as well as to evolving national debates and policy imperatives” (Norrie et al., 2012, p. 574). Thus, the point of dynamic approaches is not synthesizing widely adopted reflective theories into one overarching, objective concept; rather, the meaning of reflection is entrenched in professional values stemming from practice with its own traditions and history. The concept of reflection is not universal, but open and socially contingent (Beauchamp, 2015).

[역동적 접근법]은 [일반화가능한 증거의 재평가]를 제안한다. 예를 들어, 만주카스(Mantzoukas, 2008)는 성찰을 위한 증거 기반 관행의 황금 표준이 항상 RCT는 아니라고 주장한다. 반대로, 간호사들은 "성찰이 실천을 위한 유효한 증거를 제공할 수 있을 뿐만 아니라, 보다 실질적이고 유용하며 효과적인 증거를 제공할 수 있는 더 나은 위치에 그들을 배치할 수 있도록 허용한다"는 것을 깨닫게 된다(Mantzoukas, 2008, 페이지 221). 롤프는 "필요한 것은 [큰 수의 과학]이 아니라 [유일성unique의 과학]이다. (…)  간호 과학은 [개인에 대한 이론]이 필요하다"고 주장하는데, 이는 개인 실무자들로부터도 나올 수 있다. (롤프, 2006, 페이지 40)
Dynamic approaches suggest a revaluation of generalizable evidence. For instance, Mantzoukas (Mantzoukas, 2008) argues that the gold standard in Evidence Based Practice for reflection is not always a Randomized Control Trial. On the contrary, nurses “come to realize that reflection can provide not only valid evidences for practice, but possibly [allows them to be] positioned in a better place to provide more practical, useful and effective evidences” (Mantzoukas, 2008, p. 221). Rolfe argues that “what is required is not a science of large numbers, but a science of the unique. (…) [N]ursing science requires theories about individual persons,” that can also come from individual practitioners (Rolfe, 2006, p. 40).

[역동적 성찰]이라는 관점을 채택하는 학문의 중심 메시지는 "이 분야는 [성찰이 무엇인지, 성찰이 어떤 철학적 맥락에서 도출되는지, 그리고 현재 의학교육의 사회정치적 맥락에서 그 목적이 무엇인지]에 대한 [개념화를 확장하고, 이해를 심화시켜야] 한다"는 것이다(Ng et al., 2015, 페이지 469). [정확한 모델]을 가지고 성찰의 [개방성을 축소]시키는 대신, 다양한 실천에 의해 주입되는 [개방성을 수용]해야 한다. 또한, 맥락특이적인 사회-정치적 차원을 다루는 것이 논쟁을 불러일으키며, "의학 교육의 복잡한 과제에 대한 다양한 사고 방식"을 촉발한다(Ng et al., 2015, 페이지 469).
The central message of scholarship that adopts a dynamic view of reflection is that “the field must broaden its conceptualization and deepen its understanding of what reflection is, from what philosophical contexts it derives, and what its purposes in the current socio-political context of medical education can be” (Ng et al., 2015, p. 469). Instead of diminishing reflection’s openness with precise models, scholarship should embrace openness that is infused by divergent practices. Furthermore, addressing context-specific socio-political dimensions incites debate, instigating “multiple ways of thinking about complex challenges in medical education” (Ng et al., 2015, p. 469).

논의
Discussion

역설
A paradox

지금까지, 우리는 기술자적 렌즈와 역동적 렌즈의 접근법을 통해 내러티브로 성찰에 대한 연구를 구성했다. 이러한 접근 방식은 성찰의 복잡성을 해결하는 두 가지 다른 방법을 구현한다. 성찰 연구에 대한 [기술자 접근법]은 예를 들어 교육 개발자, 교육생 및 실무자에게 일반화되고 검증된 지침을 제공함으로써 [실무에 장점]이 있다. 그러나 이 장점은 [성찰의 개념에 대한 합의]에 기반하여, 이를 [견고한 경험적 검증]를 받게 한다. [역동적 관점]에서 이 합의는 여전히 (지나치게) 이상적이거나, 혹은 불가능한 것으로 남아있다. 두 위치에 대한 이해를 높이기 위해 기술자와 동적 접근 방식을 병치한다.

Thus far, we have organized the research on reflection in a narrative, perceived through the lens of technicist and dynamic approaches. These approaches embody two different ways of tackling reflection’s complexity. A technicist approach to studying reflection has merit for practice, for instance by offering generalized and validated guidelines for education developers, trainees and practitioners. However, this merit is based on a consensus on the concept of reflection in order to subject it to solid empirical testing. From the dynamic perspective, this consensus still remains an ideal (Williams et al., 2019)–or rather, an impossibility. To further our understanding of both positions, we juxtapose the technicist and dynamic approaches.

우리는 특히 연구가 언제 어디서든 개념이 기능하기를 원할 때, 우리는 성찰의 연구자들이 실천과 이론 사이의 상호적인 긴장과 씨름하는 것을 볼 수 있다. [기술자적 관점]에서, [성찰을 필수요소essence로 환원]시키는 [자기충족적self-contained 개념]은 어떤 맥락에서든 적용될 수 있다. [역동적 관점]에서, 그러한 환원주의적 정의는 '이중 구속'으로 끝날 수 있다(Ng et al., 2015). 즉, 자기충족적 개념은 필연적으로 무수한 대안을 배제하기 위해 [현상의 핵심 요소]를 일반화하지만, 그 과정에서 [전달하고자 하는 복잡성과 타협]하고 마는 것이다(Kinsella, 2009). "실제로 발생하는 많은 것들에 대해 사용하지 못하게 되는 단점"이 생긴다(Sacks, 1985, 페이지 25). [현실]이 [추상화된 처방]과 완전히 일치하는 경우는 드물기 때문이다.
We can see researchers of reflection struggle with a reciprocal tension between practice and theory, especially when research wants concepts to function anywhere, at any time and any place. From a technicist perspective, self-contained concepts that reduce reflection to its essence can be applied in any context. From a dynamic perspective, such reductionist definitions can end up in a ‘double bind’ (Ng et al., 2015): a self-contained concept that necessarily generalizes key components of the phenomenon to exclude alternatives, but in the process compromises the complexity which it wishes to convey (Kinsella, 2009). The disadvantage is that “many things that actually occur are debarred from use” (Sacks, 1985, p. 25). Conversely, reality rarely fully corresponds with abstracted prescriptions (Nofke & Brennan, 2005).

일반적으로 복잡한 개념은 이론과 실제 사이의 긴장을 보인다. 연구가 성찰와 같은 연구 대상을 [자기충족적 개념으로 공허하게 외삽]할 때 긴장이 겉으로 드러난다. 비트겐슈타인의 저작을 차용하여, 개념은 그 위치에 있는 사용에서 실질과 중요성을 얻는다(Newman, 1999; 비트겐슈타인, 1958).

  • 예를 들어, 'soap'은 손을 씻는다는 맥락 속에서 구체적인 의미를 얻는다.
  • 시인 Ponge와 이야기 하자면, 비누는 자연에서 발견된 어떤 돌과도 같지 않다. 그것은 물과 결혼한 후에 거의 무진장 여러분에게 주어집니다. (Ponge, 2015)
  • 비누는 순수하게 화학적 맥락에서 친수성이며 소수성이며, '물을 좋아하는' 또는 '물을 두려워하는' 것일 수 있다.

Generally, complex concepts show tensions between theory and practice. Tensions become tangible when research extrapolates the research object, like reflection, in a void as a self-contained concept. Borrowing from Wittgenstein’s work, concepts gain substance and significance in their situated use (Newman, 1999; Wittgenstein, 1958).

  • For example, ‘soap’ gains concrete meaning within the context of washing your hands.
  • To speak with the poet Ponge, soap is like no other stone found in nature. It gifts itself to you almost inexhaustibly after you marry it with water (Ponge, 2015).
  • From a purely chemical context, soap is hydrophilic and hydrophobic; it can be ‘water-loving’ or ‘water-fearing’.

간단히 말해서, 어떤 현상도 중복되는 것을 보여주는 뚜렷한 관행에서 다르게 나타나지만, 그것들은 결코 완전히 동일하지는 않다. 마찬가지로, 각각의 성찰은 "같은 가족에 속한 사람들의 얼굴처럼 많은 다른 방식으로 다른 사람들과 닮았다"지만 그들 사이의 [필수적 본질vital essence을 정의하는 것은 거의 불가능]하다. (Pears, 1970, 페이지 108; Wittgenstein, 1958) 복잡한 개념의 의미는 "사건과 과정의 미세한 입자"에 있습니다(Davis, 2009, 페이지 372).
In short, any phenomenon appears differently in distinct practices that show some overlap, but they are never completely identical. Likewise, each instance of reflection “resemble[s] others in many different ways, like the faces of people belonging to the same family,” but defining the vital essence between them is nigh impossible (Pears, 1970, p. 108; Wittgenstein, 1958). Meaning of complex concepts is in “the fine grain of events and processes” (Davis, 2009, p. 372).

[성찰을 모든 것을 포괄하는 개념으로 포착]하고자 시도함과 동시에 [성찰의 복잡성과 풍부함을 보존하는 것]역설을 수반한 연구를 제공한다. 우리가 어떤 개념을 생각할 때마다, 우리는 [일상 속에서 사용하는 특정한 적용]으로부터 그 [개념의 의미를 추론하고 재구성]한다. 반대로, 모든 다양한 용도를 염두에 두는 것은 불가능하다. (Newman, 1999)

  • 가능한 한 모든 다양한 용도를 포괄해야 하는 개념은 너무 광범위해지고 그 과정에서 힘을 잃게 될 것이다(거의 모든 것을 반영이라고 할 수 있다).
  • 동시에, 그 개념은 너무 좁고 정확해질 수 있고, 반사적으로 보일 수도 있는 것들을 잘라낼 수 있다.

역설이 학자들이 성찰이 정의하기 어렵기로 악명높다고 주장하는 이유를 설명한다. 그럼에도 불구하고, "맥락이 없다면, 개념의 생명은 산소 없이 남겨둔 것과 같다." (Nauta, 1984, 페이지 364; Boud & Walker, 1998; Flyvbjerg, 2006) 이것은 의문을 제기한다: 성찰에 대한 연구에서 그 역설은 왜 그렇게도 흔하게 나타날 수 있는가?
To preserve the complexity and richness of reflection while trying to capture it in an all-encompassing concept provides research with a paradox. Each time we think of concepts, we deduce and reconstitute their meaning from their specific application in everyday use. Conversely, it is impossible to bring all varied uses to mind (Newman, 1999). A concept that needs to encompass all varied uses as much as possible will become too broad and will lose its power in the process (nearly everything can be called reflection). Simultaneously, the concept can become too narrow and precise, and cut away things that can also be seen as reflection. This paradox explains why scholars claim that reflection is notoriously difficult to define. Nonetheless, “without a context, the life of a concept is left without oxygen” (Nauta, 1984, p. 364; Boud & Walker, 1998; Flyvbjerg, 2006). This raises the question: why can the paradox manifest itself so prevalently in research on reflection?

두꺼운 개념으로 반영
Reflection as a thick concept

우리는 [너무 좁거나 너무 넓게 개념을 공식화하는 역설]은 성찰를 [두꺼운 개념thick concept]으로 생각함으로써 풀 수 있다고 제안한다(Kirchin, 2013; Kroes & Meijers, 2016).

  • [얇은 개념]들은 평가적인 차원evaluative dimension을 가지고 있다. 가장 간단한 예는 'pro'와 'con'으로, 어떤 것을 좋아하거나 싫어하는 가장 단순한 형태를 나타낸다.
  • [두꺼운 개념]들도 이러한 평가적 기능을 가지고 있지만, 여기에 더해서 우리에게 어떤 현상에 대해 무언가를 말해준다. 예를 들어, 어떤 것은 그것이 <a, b, c >의 특징을 가지고 있을 때 성찰이고, < d, e >일 때 성찰이 아니다. "여기서 중요한 문제는 우리가 [현상]의 모든 사례를 포착할 것이라고 확신할 수 있느냐 하는 것입니다." (Kirchin, 2013, 페이지 9)

We suggest that the paradox of formulating concepts too narrowly and too broadly, can be unpacked by thinking of reflection as a thick concept (Kirchin, 2013; Kroes & Meijers, 2016).

  • On the one hand, thin concepts have an evaluative dimension. The barest examples are the words ‘pro’ and ‘con’, that indicate the simplest form of favoring or disfavoring something.
  • On the other hand, thick concepts also have this evaluative function, but in addition they tell us something about a phenomenon. For instance, something is reflection when it has features of < a, b, c > , and is not reflection when < d, and e > . “The key problem here is whether we can be certain that we will ever capture all of [the phenomenon’s] instances” (Kirchin, 2013, p. 9). 

개념이 두꺼울수록 더 국소적local으로 변한다.

  • 찬성-반대는 거의 보편적으로 사용될 수 있으며, 관행과 의미의 별개의 웹을 넘어 이동할 수 있습니다(Harcourt & Thomas, 2013, 페이지 24).
  • 그러나, [두꺼운 개념]본질적으로 [참여자들 사이에서 실행 중인 특정한 형태의 합의로부터 자라나는thrive 실천에 구속bound to]된다(Medina, 2004). 문제의 핵심은 [사회적으로 복잡한 현상들]이 [상호 연관된 수많은 요소]들을 포함하기 때문에 [끊임없이 해석되고 있다]는 것이다; 그 의미는 "직접 관찰로 단순히 '읽어낼 수' 수 없다." (Davis, 2017, 페이지 293).

The thicker the concept the more local it becomes.

  • ‘Pro’ and ‘con’ can be used almost universally, and can be transported beyond a distinct web of practices and meanings (Harcourt & Thomas, 2013, p. 24).
  • Thicker concepts, however, are inherently bound to practice that thrives on some form of agreement in action among its participants (Medina, 2004). The crux of the matter is that socially complex phenomena are under constant interpretation because they involve countless interrelated elements; their meaning “cannot be simply ‘read off’ by direct observation” (Davis, 2017, p. 293).

우리는 의학교육에 대한 성찰이 [성찰 그 자체를 위한 것이 아니라는 것]을 잊어서는 안 된다. 성찰의 목적이나 지점은 항상 있지만, 성찰적 실천은 (규범적인) 해석이 필요하기 때문에 결코 완전히 안정적이지 않다. 이 점은 전통에 달려 있으며, 사회 문화적 역사와 진행 중인 논쟁에서 발전한다(Norrie et al., 2012). 예를 들어, 실제 성찰의 경우 대체로 두 가지 반대되는 점이 있습니다.

  • 한 쪽에서, 성찰은 [새로운 상황과의 조정alignment]을 의미할 수 있으며, 이 때 요점은 [진행 중인 사회화]이다. 이러한 유형의 성찰은 어느 정도까지 측정 및 평가될 수 있다. 예를 들어, 연습생 측의 '효과적이고 숙련된 성찰'은 [잠재적인 지식 격차를 성찰적 포트폴리오에서 식별]하여, 학습 목표로 다루어야 한다. [지식 격차를 성공적으로 식별한 것]은 성찰이 효과적이었음을 나타낸다.
  • 다른 한 쪽으로는, 성찰은 [현재의 관행에 대한 명시적 비판자가 되게 함]으로써 [제도적 규범으로부터 일탈deviation]을 유발한다고 주장할 수도 있다. 따라서 [비판적 성찰의 측정과 평가]는 무의미한데nonsensical, 평가가 비판적 성찰이 의문을 던져야 할 바로 그 제도적 이상을 보호하기 때문이다(Hodges, 2015; Ng et al., 2020; Procee, 2006).

We should not forget that reflection in medical education is not there for its own sake. There is always a purpose or point to reflection, but reflective practice is never fully stable because it needs (normative) interpretation. The point hinges on traditions and evolves from its socio-cultural history and ongoing debates (Norrie et al., 2012). For example, in the case of reflection in practice, there are broadly speaking two opposing points.

  • On the one hand, reflection could imply alignment with new situations, and the point is ongoing socialization. This type of reflection could be, up to some degree, measured and assessed. ‘Effective and skilled reflection’ on the part of the trainee entails that potential gaps of knowledge are identified, for example, in reflective portfolios and subsequently addressed as learning goals. Successful identification of knowledge gaps indicates that reflection was effective.
  • On the other hand, one could argue that reflection instigates deviation from institutional norms by becoming explicitly critical of current practice. Measuring and assessing critical reflection is nonsensical, because assessment safeguards the very institutional ideals that critical reflection is supposed to question (Hodges, 2015; Ng et al., 2020; Procee, 2006).

다른 논쟁점은 다음과 같다:

  • 성찰은 감정에 관한 것이어야 하는가, 또는 그것이 이성적이어야 한다면 감정과는 거리가 멀어야 하는가?(Birden & Usherwood, 2013; Nguyen et al., 2014; Wald, 2015),
  • 성찰은 혼자하는 활동인가 또는 대인관계 활동인가? (Kotzee, 2012),
  • 성찰이 유해한 반추로 이어질 수 있는가? (Lengelle et al., 2016).
  • 성찰을 측정할 수 있는가? (Aukees et al., 2007; de la Croix & Veen, 2018; Veen et al., 2020)

이러한 영역을 비롯하여 수많은 다른 논쟁적 영역들이 있어, 성찰적 실천은 언제나 부담을 지니고 있다at stake. 다양한 측면에서 일치하지 않기에, 성찰에 대한 보편적인 설명이 구체화되는 것은 어려워진다. [얇은 개념]보다 [두꺼운 개념]은 그 개념이 기능하는 사회적 상황을 설명하는데 더 많은 요구를 하는 반면, 어떤 개념이든 사용자에게 일을 해야 하는 이유를 제공한다(Harcourt & Thomas, 2013). 각 개념화 및 실제 반영 적용은 학계와 교육기관의 규범적 논쟁을 임시로 묘사한 것이다(Gu-Ze'ev et al., 2001; Norrie et al., 2012). 이것은 연구를 도전으로 남깁니다: 어떻게 우리가 성찰과 같은 논쟁적인 개념을 연구할 수 있을까요? 

Other points of contention are:

  • should reflection be about emotions, or if it should be rational, debar from emoting (Birden & Usherwood, 2013; Nguyen et al., 2014; Wald, 2015),
  • is reflection a solitary or interpersonal activity (Kotzee, 2012),
  • can reflection lead to harmful rumination (Lengelle et al., 2016), and
  • can we measure reflection (Aukes et al., 2007; de la Croix & Veen, 2018; Veen et al., 2020)?

With each of these and other contested areas, the point of reflective practice is always at stake. Various points are incongruent and prevent a universal description of reflection from materializing. Thicker concepts place more demands on explaining the social situation they function in than thin concepts, while any concept equips the user with reasons for doing things (Harcourt & Thomas, 2013). Each conceptualization and application of reflection in practice is a temporary depiction of the normative debate in academia and educational institutes (Gu-Ze'ev et al., 2001; Norrie et al., 2012). This leaves research with the challenge: how can we study a debated concept like reflection?

우리는 어떻게 성찰을 연구할 수 있을까?
How can we study reflection?

성찰의 경합 상태를 고려할 때, 우리는 그것을 어떻게 연구해야 하는가? 우리의 접근 방식의 핵심 한계는 철학적 토대를 가능한 일관되고 일관성 있게 해석하지만, [결정적인 해석은 존재하지 않는다]는 것이다. 그럼에도 불구하고, 의학 교육은 종종 학제 간 분야를 제공하지만, 현실은 대부분의 의학 교육 연구가 여전히 의학 연구의 관점에서 이루어지고 있다는 것이다(Albert et al., 2020). 아마도 우리는 기술자적 접근과 역동적 접근 방식 사이의 유익한 대화를 통해 '다학제적 에지 효과'(Varpio & MacLeod, 2020)를 달성할 수 있을 것이다.
Given the contested state of reflection, how should we study it? The key limitation of our approach is that we interpret the philosophical underpinnings as coherently and consistently as possible, but that no conclusive interpretation exists. Nonetheless, medical education often proffers to be an interdisciplinary field, but the reality is that most medical education research is still done from the perspective of medical research (Albert et al., 2020). Perhaps we can achieve a ‘multidisciplinary edge effect’ (Varpio & MacLeod, 2020) through fruitful dialogue between technicist and dynamic approaches.

[기술자 접근법]을 채택하는 연구자들은 [과학에 대한 그들의 관점]이 [의학 연구의 인식론적 문화]와 더 일치하며, 대부분 [방법론적으로 연역적]이라는 것을 알아야 한다(Varpio & MacLeod, 2020). 이는 성찰을 [사전에 개념화하고 다양한 환경에서 테스트한다는 것]을 의미한다. 이 접근 방식의 가치는 설문지, 포트폴리오, 러브릭 또는 학습 결과의 (통계적) 분석과 같은 데이터 세트를 사용하여 선택한 변수가 특정 관행에서 결과로 나타나는지 확인하는 데 있다. 일반적으로 이 접근법은 [초기 개념화에서 채택된 성찰의 특징]이 반드시 성과에 나타날 것임을 받아들인다. 즉, '미리 계획한 것을 발견할 것이다'. 마찬가지로 사전에 개념화되지 않은 특징은 결과에 나타나지 않는다(Sacks, 1985; Uygur et al., 2019). 그 연구는 대부분 규범적이다. 

  • 첫째, 연구는 규범적인 의미에서 [처방적]인데, 개념화는 실제로 일어나야 할 일을 규정하기 때문이다(van Enk & Regehr, 2018). 단순하게 말하면, 성찰을 순전히 '사건들의 이성적인 해부'로 개념화한다면, 감정적인 순간은 반성으로 표시되지 않는다.  
  • 둘째, 듀이와 일맥상통하듯, 연구는 방법론적인 의미에서 [처방적]이다. 왜냐하면 모든 탐구는 개념을 담고 있기 때문이다concept-laden. 개념이 [관찰을 지시]하고, 무관한 정보와 관련성있는 정보를 가른다(Garrison et al., 2012). 만약 우리가 (두꺼운) 개념의 선택이 일시적이고 제한적이라는 것을 명심한다면, 이것은 문제가 될 필요가 없다. 개념은 우발적이며 지속적인 재구성의 대상이 된다. 이용 가능한 모든 이론을 종합하여 개념적 보편성을 주장하는 것은 우리가 보기에 이상주의적인 것으로 남을 것이다.

Researchers who adopt a technicist approach should be aware that their outlook on science is more in alignment with the epistemic culture from medical research, and mostly methodologically deductive in nature (Varpio & MacLeod, 2020). This means that reflection is usually conceptualized upfront and tested in diverse circumstances. The value of this approach is in checking if the chosen variables appear as outcomes in specific practices by using datasets like questionnaires, portfolios, rubrics or (statistical) analyses of learning outcomes. In general, this approach accepts that only features of reflection in practice that are adopted in the initial conceptualization will necessarily appear in the outcomes–‘you will find what you formulate upfront’. Those features that have not been conceptualized upfront will likewise not appear in the results (Sacks, 1985; Uygur et al., 2019). The research is mostly prescriptive.

  • First, research is prescriptive in a normative sense, because the conceptualization prescribes what should happen in practice (van Enk & Regehr, 2018). Simplified, if one were to conceptualize reflection as a purely ‘rational dissection of events,’ then emotional moments are not flagged as reflective.
  • Second, and in line with Dewey, research is prescriptive in a methodological sense because all inquiry is concept-laden. Concepts direct observation and demarcate relevant from irrelevant information (Garrison et al., 2012). This need not be a problem, if we keep in mind that the selection of a (thick) concept is temporary and limited. Concepts are contingent and subject to continuous reconstruction. Claiming conceptual universality by aggregating all available theories will remain, in our view, idealistic.



[기술적 접근방식]은 조작화를 촉진하기 위해 일반적인 표현으로 말하면 [자급자족 개념self-contained concept]을 목표로 한다. "예를 들어, 쇤의 모델과 달리, 쇤의 저작에 대한 긴 탐구 없이는 쉽게 파악할 수 없습니다." 예를 들어, 마셜의 성찰에 대한 개념은 다른 전문적 맥락에 걸쳐 이론들을 종합한 후 다음과 같이 정리된다: "성찰은 표현과 재/평가의 지속적인 순환을 통해 새로운 통찰력을 창출하기 위한 세심한 검토와 아이디어의 집합입니다." (Marshall, 2019, 페이지 411) 이론적으로만 보자면, 이
개념은 '올바른' 개념이며, 연구가 첫 발을 내딛는 데 도움이 된다. 하지만 역동적 접근법 또는 비트겐슈타인의 관점에서 보면, 그것은 거의 의미가 없을 정도로 추상적인 것으로 남아 있다. '주의 깊은 검토', '아이디어의 결합', '진행 중인 표현 주기', '재/평가'는 어떤 모습입니까? 실무자들은 어떻게 그러한 업적을 성취할 것인가? 그들은 무엇을 하고, 말하고, 침묵을 지키고 있는가? 그 개념은 여전히 실천과 밀접하게 일치함으로써 살아날 필요가 있다.

Technical approaches aim for self-contained concepts in generic wording to facilitate operationalization, “unlike, for example, Schön’s model, which is not easy to grasp without lengthy exploration of his writing” (Nguyen et al., 2014, p. 1185; Koole et al., 2011). For example, Marshall’s concept of reflection, after synthesizing theories across different professional contexts, reads as follows: “Reflection is a careful examination and bringing together of ideas to create new insight through ongoing cycles of expression and re/evaluation” (Marshall, 2019, p. 411). This concept is theoretically ‘correct’ and helps research gain a first footing, but from a dynamic and Wittgensteinian perspective, it remains abstract, up to the point that it means very little. What do ‘careful examination,’ ‘bringing together ideas,’ ‘ongoing cycles of expression’ and ‘re/evaluation’ look like? How do practitioners go about accomplishing such feats? What do they do, say or remain silent on? The concept still needs to come alive by aligning it closely with practice.

[역동적 접근 방식]에서 [(단일) 사례 연구의 가치]를 본다(Flyvbjerg, 2006; Newman, 1999; Rolfe, 2002, 2006). 사례 연구는 추상적 개념에 산소를 제공한다. 역동적 관점에서 사례 연구는 모든 사람에게 동일한 의미를 가지도록 설계되지 않았습니다. 사례 연구는 연습 자체를 모방한 매우 많은 측면들로 충분히 풍부해야 하며, "서로 다른 독자마다 사례의 서로 다른 것들에 의해 끌리거나 반발할 수 있다. 독자들은 어떤 [하나의 이론적 경로]를 가리키거나, [마지막엔 진실이 놓여있을 것]이라는 인상을 받지 않는다." (Flyvbjerg, 2006, 페이지 238) 사례 연구는 "'성찰적 실천'이라는 단일 용어에 의해 암시되는 어떤 하나의 의미에 대한 확실성"을 거부한다(Newman, 1999, 페이지 160). 현재 연구 분야에서, 우리는 [기술자적 추상]에 더 많은 [역동성]을 제공하기 위해 현장에서 성찰적 실천을 연구하는 것은 여전히 잘 표현되지 않고underrepresent 있음을 알 수 있다. 예를 들어, 성찰 그룹 세션의 대화 분석(van Braak et al., 2018; Veen & de la Croix, 2016) 또는 현상학적 접근(Rietmeijer et al., 2021)을 통해 '실제로 성찰이 일어나는 순간'에 그것을 조사하는 연구는 추가적인 역동성을 제공할 수 있다.

From the dynamic approach, we take the value of (single) case studies (Flyvbjerg, 2006; Newman, 1999; Rolfe, 2002, 2006). Case studies give abstract concepts oxygen. From the dynamic perspective, case studies are not designed to mean the same thing to all people. The case study should be sufficiently rich with so many facets, mimicking practice itself, that “different readers may be attracted, or repelled, by different things in the case. Readers are not pointed down any one theoretical path or given the impression that truth might lie at the end” (Flyvbjerg, 2006, p. 238). The case studies reject “the certainty of any one meaning implied by the single term ‘reflective practice’” (Newman, 1999, p. 160). In the current research field, we see that researching reflective practice in situ to provide more dynamism to technicist abstractions is still underrepresented. Studies that examine reflection ‘as it occurs in practice,’ for instance with conversation analysis of reflection group sessions (van Braak et al., 2018; Veen & de la Croix, 2016), or phenomenological approaches (Rietmeijer et al., 2021) can provide additional dynamism.

결론
Conclusion

우리는 성찰을 개념화하고 조작화하기 위한 가능한 과학적 접근법은 무엇이며, 이것들이 실제로 성찰에 대한 지식 생산에 어떤 영향을 미치는지 물었다. 성찰에 대한 의학 교육 문헌의 분석은 성찰의 개념적 비결정성에 대해 두 가지 주요 반응이 있다는 것을 보여주었다.

  • [기술자 접근법]과 [역동적 접근법]은 둘 다 성찰이 복잡하다는 것에 동의하지만, [기술자 접근법]은 성찰에 대한 개념적 합의를 추구함으로써 그것의 복잡성을 길들이려고 시도한다. 컨센서스는 연구를 표준화 및 교차 비교하고 성찰이 어떻게 효과적인지를 이해하는 데 도움이 됩니다.
  • 반대로 [역동적 접근법]은 성찰의 개념적 개방성을 수용하고 지역local 관행의 중요성을 강조한다. 관행은 역사적으로 우발적이며, 지속적으로 진화하고 있으며, 따라서 성찰은 이론적으로 가변적이다. 우리는 성찰을 두꺼운 개념으로 해석했고, 현재 연구는 [성찰을 어떻게 개념화하더라도 너무 광범위하거나 너무 협소해지는 패러독스]에 얽매여 있다고 주장했다. 우발적 실천은 어떤 이론의 도달 범위를 제한하며, 보편적 성찰의 공식formulation은 강한 한계를 갖는다.
  • 또한, 두 가지 접근법은 [상호 보완적]일 수 있다. 일반화된 기술자 이론은 (단일) 사례 연구 증거를 제공함으로써 살아날 수 있다.

We asked what the possible scientific approaches to conceptualizing and operationalizing reflection are, and how these influence knowledge production on reflection in practice. Our analysis of medical educational literature on reflection showed that there are two main responses to reflection’s conceptual indeterminacy.

  • The technicist and dynamic approaches both agree that reflection is complex, but technicists attempt to tame its complexity by seeking conceptual consensus on reflection. Consensus is beneficial to standardize and cross-compare research and understand how reflection is effective.
  • Conversely, the dynamic approach embraces reflection’s conceptual openness, and emphasizes the importance of local practice. Practices are historically contingent and evolving, and thus reflection is theoretically variable. We interpreted reflection as a thick concept, and argued that research is bound to the paradox that any conceptualization is either too broad or too narrow. Contingent practice limits the reach of any theory, and universal formulations of reflection have strong limitations.
  • Furthermore, the two approaches can be complementary; generalized technicist theory can come alive by providing (single) case study evidence of practice.

마지막으로, 우리는 비누를 묘사하려고 했던 시인 친구 폰게에게 돌아왔습니다. 폰지는 비누를 묘사하려고 했지만, 너무 많은 말이 있어서 비누를 접시 위에 되돌려 놓았습니다. 폰지가 패배한 것처럼 보인다. 그러나 우리는 이 문제에 대한 그의 시의 마지막 말이 매우 중요하다고 생각한다. "… 엄밀한 외관, 엄격한 타원형, 건조한 인내력, 그리고 다시 서브할 수 있는 힘을 가진 접시로 되돌려 놓을 필요가 있다." (Ponge, 2015) 비누를 이해하고 묘사하려는 노력처럼, 성찰을 개념화하는 것의 핵심은 그것의 사용과 목적에 있고, 이것이 어떤 묘사에든 영감을 줄 것이다. 비누에 대한 어린이의 정의가 화학자의 정의와 다르다는 것을 고려하는 것은 중요하다. 비누나 성찰에 대한 각각의 정의는 서로 다른 일을 할 것이다. 모든 사건을 결합하여 확정적이고 보편적인 정의를 찾는 것은 우리에게 이상주의적인 것으로 남을 것입니다. 하지만, 우리가 (과소평가해서는 안 되는) 실천으로 돌아간다면, 비누와 같이, 성찰은 다시 한번 도움이 될 것이다.

Finally, we come back to our poet friend, Ponge, who tried to describe soap, but there was so much to say that he returned it to its saucer. It appears as if Ponge is defeated. However, we feel that his poem’s last words on the matter are of key importance: “… it is necessary to return it to its saucer, to its strict appearance, its austere oval, its dry patience, and its power to serve again” (Ponge, 2015). Like an effort to understand and describe soap, the key to conceptualizing reflection lies in its use and purpose that inspires any description. Taking into account that a child’s definition of soap is different from that of a chemist is crucial. Each definition of soap or reflection will do different work. Combining all occurrences to find that definitive, universal definition will remain, for us, idealistic. However, reflection, like soap, will serve again if we return to its practice, which should not be underestimated.

 

 


Adv Health Sci Educ Theory Pract. 2022 May;27(2):537-551.

 doi: 10.1007/s10459-021-10082-7. Epub 2021 Nov 12.

Is reflection like soap? a critical narrative umbrella review of approaches to reflection in medical education research

Affiliations collapse

Affiliations

1Department of General Practice, Erasmus University Medical Center, Postbus 2040, 3000 CA, Rotterdam, The Netherlands. s.schaepkens@erasmusmc.nl.

2Department of General Practice, Erasmus University Medical Center, Postbus 2040, 3000 CA, Rotterdam, The Netherlands.

3Faculty of Medicine, Vrije Universiteit Amsterdam, Postbus 7057, 1007 MB, Amsterdam, The Netherlands.

PMID: 34767115

PMCID: PMC9117338

DOI: 10.1007/s10459-021-10082-7

Free PMC article

Abstract

Reflection is a complex concept in medical education research. No consensus exists on what reflection exactly entails; thus far, cross-comparing empirical findings has not resulted in definite evidence on how to foster reflection. The concept is as slippery as soap. This leaves the research field with the question, 'how can research approach the conceptual indeterminacy of reflection to produce knowledge?'. The authors conducted a critical narrative umbrella review of research on reflection in medical education. Forty-seven review studies on reflection research from 2000 onwards were reviewed. The authors used the foundational literature on reflection from Dewey and Schön as an analytical lens to identify and critically juxtapose common approaches in reflection research that tackle the conceptual complexity. Research on reflection must deal with the paradox that every conceptualization of reflection is either too sharp or too broad because it is entrenched in practice. The key to conceptualizing reflection lies in its use and purpose, which can be provided by in situ research of reflective practices.

Keywords: Critical narrative umbrella review; Philosophy; Reflection; Technicist and dynamic; Theory and practice.

안쓰러운 늘어진 여성: 의과대학생을 위한 골반진찰 학습자료의 상황분석(Med Educ, 2022)
‘Poorly relaxed women’: A situational analysis of pelvic examination learning materials for medical students
Sarah Towle

 

1 소개
1 INTRODUCTION

[환자 중심적이고 문화적으로 역량있는 의료]는 환자 경험을 개선하고 건강 격차를 최소화하는 중복된 방법으로 의학교육에서 옹호된다. 논란의 여지 없이, 이러한 접근법은 골반 검사(PE)와 같은 민감한 절차에서 추가적인 중요성을 가진다. 환자 취약성에 대한 검사의 성향과 관련 건강 차이(상세히 아래에 나와 있음)는 모두 검사가 임상적으로 시행될 때 이러한 접근법의 필요성을 강조한다. 
Patient-centred and culturally competent care are championed in medical education as overlapping methods of improving patient experiences and minimising health disparities.1-4 Arguably, these approaches hold added significance in sensitive procedures such as the pelvic examination (PE). Both the examination's proclivity for patient vulnerability and its associated health disparities (detailed below) highlight the necessity of these approaches when the examination is clinically administered.5-10

[환자 중심 진료]는 20세기 중반에 시작되었다. 여성 건강 운동의 영향을 받아, 그것은 부분적으로 '질병 중심의 의학'과 [의학적 가부장주의]에 대한 반발로 나타났다. 임상 의사, 의료 교육자 및 의료 기관의 실천 모델로 채택되었지만 [환자 중심 진료]의 [정의]를 둘러싼 논란은 여전하다.  기본적으로 환자 중심의 치료는 환자를 정확하게 진단하는 것 외에도, 임상의가 환자를 [한 명의 사람으로 알고 있다]는 생각을 중심으로 이루어진다. 이 접근법의 가치와 원칙에는 사회 세계의 맥락에서 환자를 인정하고, 정확하고 시의 적절한 의료 정보를 제공하며, 환자 선호도를 존중하며, 정보에 입각한 의사 결정에 환자를 참여시키는 것이 포함된다. 
Patient-centred care has origins in the mid-20th century. Influenced by the women's health movement, it emerged partly as backlash to both ‘illness-oriented medicine’ and medical paternalism.11 Though it has been adopted as a model of practice by clinicians, medical educators and healthcare institutions, debate remains surrounding the definition of patient-centred care.11 Fundamentally, patient-centred care revolves around the idea of the clinician knowing the patient as a person, in addition to accurately diagnosing disease.12 Values and tenets of this approach include

  • acknowledging the patient in the context of their social worlds,
  • providing accurate and timely medical information,
  • respecting patient preferences and
  • engaging patients in informed decision making.1-4

[환자 중심 진료]와 맞물려, 의학에서 [문화적 역량]은 다양한 사회적 문화적 배경을 가진 환자들을 치료하는 능력을 의미한다. 문화적 역량을 갖춘 진료를 운영하려면, [환자 배경에 대한 인식]과 [그 배경이 임상적 만남에서 권력의 차이에 어떻게 영향]을 미치는지, 그리고 [잠재적인 문화적 수용을 제공하는 것]이 모두 필요하다. 비록 의과대학 커리큘럼에 문화적 역량을 통합하려는 상당한 움직임이 있었지만, 그 틀과 학습자의 저항에는 여전히 과제가 남아 있다. 종종 임상 기술이 커리큘럼에서 우선시되고, 학생에게 문화적 역량이란 '소프트 사이언스'보다 학생들이 선호된다고 한다.
Aligned with patient-centred care, cultural competence in medicine refers to the ability to treat patients of diverse social and cultural backgrounds.13 Administering culturally competent care involves having both an awareness of patient background and how that background affects power differentials in clinical encounters, as well as providing potential cultural accommodations.3, 14 Though there have been considerable moves to incorporate cultural competence into the medical school curriculum,13 challenges remain in its framing and learner resistance; it is said that clinical skills are often prioritised in the curricula and favoured by students over the ‘soft-science’ of cultural competence.13, 15

PE는 다음과 같은 것들로 구성된다.

  • 외부 생식기 검사. 
  • 질 및 자궁경부 검체검사(샘플 채취가 가능한 경우) 
  • 부속지, 자궁, 난소 및 방광의 양면 검사 
  • 때로는 직장이나 직장-질 검진

PE가 비록 외래 환자 시술이지만 신체적, 심리적 의원성iatrogenic 효과를 일으키는 것으로 유명하다. 여기에는 출혈, 경련, 불편함, 고통, 두려움, 불안, 취약성, 수치심, 당혹감, 타락, 통제력 및 존엄성 상실 등의 느낌도 포함된다. 젊은 환자, 성폭행 생존자, LGBTQ+ 커뮤니티 회원, 흑인 여성 등에서 부정적 반응이 높아지는 것으로 나타났다. 이러한 집단에서 산부인과학적 건강 격차는 지속되며, 이는 과거에 검사에서 겪은 부정적인 경험과 관련이 있다. 

The PE consists of

  • an inspection of the external genitalia;
  • a speculum examination of the vagina and cervix (where samples may be taken);
  • a bimanual examination of the adnexa, uterus, ovaries and bladder; and
  • sometimes a rectal or rectovaginal examination.1617 

Though an out-patient procedure, it is noted for causing physical and psychological iatrogenic effects: bleeding,18-20 cramping,20 discomfort or pain,6, 17, 18, 21, 22 as well as feelings of fear,6, 17 anxiety,17 vulnerability,17 shame,23 embarrassment,5, 6 degradation,5 and loss of control and dignity.24, 25 Negative reactions have been shown to be heightened in young patients,6, 22, 26, 27 survivors of sexual assault,28-30 members of the LGBTQ+ community31, 32 and Black women.28 Gynaecological health disparities persist in these populations and have been linked to previous negative experiences with the examination.7, 10, 33


페미니스트 연구 결과에 의해 뒷받침된 학자들과 제공자들은 골반 건강 관리pelvic health care에 있어, [환자 중심주의와 문화적 역량]의 중요성을 오랫동안 지적해 왔다. 일반적으로 환자 경험을 개선하는 것으로 알려진 수정사항에는 다음이 포함된다.

  • 샤페론 허용,
  • 사용 발 받침대 포기,
  • 일상적인 양면 검사 중단(일부에서는 의학적으로 불필요하다고 간주)
  • 검체 자가 삽입 제공

특정 모집단에 대해서는 다른 변형이 유용할 수 있습니다.

  • 신체 부위에 대한 선호 용어 체크(성별 다양성 환자)
  • 환자(생존 환자 및 불안 환자)에게 검사 통제권이 유지되게끔 확인

Feminist scholars and providers—backed by research findings—have long noted the importance of patient-centeredness and cultural competence in pelvic health care.2434-38 Modifications known to generally improve patient experience include

  • allowing for chaperones,39 
  • forgoing the use footrests,38 
  • ceasing the routine bimanual examination (deemed by some to be medically unnecessary)1617 and
  • offering speculum self-insertion.2435 

Other modifications may be of value for specific populations:

  • checking in on preferred terminology for body parts (gender diverse patients),24 as well as
  • ensuring control of the examination remains with the patient (survivors and/or anxious patients).2435 

최근 개발된 인간유두종 바이러스에 대한 [환자 자가 샘플링]은 자궁경부암 검진에 대한 환자 참여를 개선하며, 트랜스 및 원주민 환자 사이에서 선호된다. 그 결과 양성 소견이 발견되었을 때 과소 선별된 모집단에 대한 후속 조치가 증가한다. 임상적 수용이 부족하기 때문에, 이러한 접근법의 일부와 관련하여 의료 훈련에서 보다 효과적인 인식 전략이 필요하다는 의견이 제시되었다. 

Patient self-sampling for human-papilloma virus—a recent development—improves patient participation in cervical cancer screening, is preferred among trans and Indigenous patients, and results in increased follow-up in under-screened populations when a positive result is found.40-43 It has been suggested that more effective awareness strategies are needed in medical training regarding some of these approaches, given their lack of clinical uptake.44

[산부인과 교육 협력자(GTA) — 교육 목적으로 PE를 받고, 의대생에게 피드백을 제공하는 여성 자원봉사자]의 도입을 포함하여, 이러한 접근 방식의 교리를 바탕으로 [PE 학습 practice]을 추가로 주입하기 위한 의료 커리큘럼의 진전이 이루어졌다. 그러나 커리큘럼의 단점은 여전히 존재한다. GTA 프로그램은 주로 백인 자원봉사자 46명으로 구성되며, 경우에 따라서는 어떤 행위는 자원봉사자들에게 부정적인 영향을 미치는 것으로 비판을 받아왔다.1 또 다른 흔하지만 문제가 되는 PE 학습 방법은 의료 교육생들이 [사전 동의 없이 마취 하에 환자를 대상으로 검사를 수행]할 때 발생한다. 이러한 관행이 대중에게 [환자 자율성 위반]으로 특징지어지며, 이를 [금지하려는 입법 움직임]이 있음에도, 학생들과 임상의사들 사이에서 받아들여지고 있다. 이 모든 것은 학생들이 환자 커뮤니티와 상호 작용하기 전에 환자 중심적이고 문화적으로 적합한 PE 접근법에 대한 개선된 노출이 필요할 수 있음을 시사한다. — 궁극적으로 사전 교육, 즉, 강의실 환경에서 이뤄져야 한다.
Strides have been made in the medical curriculum to further instil PE learning practices with the tenets of these approaches, including the introduction of gynaecological teaching associates (GTAs)—female volunteers who undergo PEs for educational purposes and provide feedback to medical students.45-47 However, curriculum shortcomings still exist. GTA programmes have been criticised for both consisting of predominantly White volunteers46 and, in some cases, maintaining practices that negatively impact volunteers.1 Another common yet problematic PE learning method occurs when medical trainees perform exams on patients under anaesthesia without prior consent.1-4, 47, 56 This practice has garnered acceptance among students and clinicians despite its public characterisation as a violation of patient autonomy and legislative moves to ban the practice.57-59 All this suggests that students may need improved exposure to patient-centred and culturally competent approaches to the PE before they interact with patient communities—ultimately in pre-clinical, classroom settings.

이 연구는 학부 의과대학 커리큘럼에서 PE를 수행하는 방법에 대한 텍스트 및 시각 기반 학습 자료를 조사한다. 이러한 자료들은 학생들이 체육을 처음 접하고 나중에 그 과정을 수행할 수 있는 기초를 형성한다. 그러한 자료의 분석은 수천 명의 의료 전문가에게 주어진 기술 정보에 대한 중요한 통찰력을 제공하며, 그 안의 메시지는 학생들의 의학에 대한 장기적인 믿음과 인식에 영향을 미칠 수 있다. 비판적으로 샘플링된 문서의 상황 분석을 통해, 본 연구는 의료 교육의 지식 격차를 메우고 텍스트 및 시각 기반 PE 학습 자료를 개선하여, 이후의 임상 학습에서 부족할 수 있는, 보다 [환자 중심적이고 문화적으로 적합한 접근 방식]을 포함할 수 있는지 여부 및 그 방법에 대한 정보를 제공하는 것을 목표로 한다.
This study investigates text- and visual-based learning materials on how to perform the PE in undergraduate medical school curricula. Materials such as these serve as the first introduction students have to the PE and form the foundation through which they later perform the procedure. Analyses of such materials provide important insight into the technical information given to thousands of medical professionals,60 and messages therein may impact students' long-term beliefs and perceptions in medicine.60, 61 Through a situational analysis of critically sampled documents, this study aims to fill a knowledge gap in medical education and provide information on if and/or how text- and visual-based PE learning materials could be improved upon to include more patient-centred and culturally competent approaches that may be lacking in later clinical learning.

2 방법
2 METHODS

저는 캐나다 대학 의과대학에서 체육에 필요한 필수 텍스트 기반 학습 자료에 대한 상황 분석을 수행했습니다. [상황 분석]은 'theory/methods package'로 묘사되며, 페미니스트 보건 연구에서 강한 역사를 가지고 있으며, 종종 [근거이론이라는 정성적 방법론의 확장]으로 간주된다. [근거 이론]이 데이터 내에서 발생하는 기본적인 사회적 프로세스를 밝히는 것을 목표로 한다면, [상황 분석]은 [전반적인 관심 상황에 대한 인식]을 통합한다. 연구자들은 사회적 구조, 집단, 제도 및 역사/현재의 현실 내에서 주제를 정하기 위해 [하드 데이터]를 뛰어넘는다. 
I conducted a situational analysis of required text-based learning materials on the PE from undergraduate Canadian medical schools. Described as a ‘theory/methods package’, situational analysis has a strong history in feminist health research and is often considered an extension of the qualitative methodology of grounded theory.62 Where grounded theory aims to uncover basic social processes occurring within the data, a situational analysis incorporates an awareness of the overall situation of concern; researchers go beyond the hard data to situate their topic within social structures, collectives, institutions and histories/present-day realities.63

[상황 분석]은 또한 [지배적인 담론이 개인, 집단, 지식 및 관점을 배제하거나 삭제할 수 있는 권력을 가지고 있다]는 [푸코의 담론적 권력의 후기 구조주의 이론]에 근거한다. 기존의 정성적 분석이 이러한 학습 자료의 내용에 대한 설명을 초래하는 반면, 상황 분석은 환자와 연습생에 대한 PE의 현실에 내 데이터를 배치하고, 이러한 문서의 지배적인 담론이 학생들의 관점과 미래의 임상적 만남을 형성할 수 있는 방법을 밝혀준다. 

Situational analyses also draw on Foucault's post-structuralist theories of discursive power—that dominant discourses have the power to exclude or erase individuals, groups, knowledges and perspectives.62, 64 Whereas conventional qualitative analyses would result in descriptions of the content in these learning materials, a situational analysis situates my data in the realities of the PE for patients and trainees and brings to light how dominant discourses in these documents can shape students' perspectives and future clinical encounters.65, 66

내 데이터는 캐나다에서 가장 큰 5개 학부 의과대학에서 의도적으로 샘플링되었고 학생들에게 PE를 수행하는 방법을 보여주는 모든 필수 교과서, 임상 기술 가이드 및 PowerPoint 프레젠테이션으로 구성되었다. 이 학교들은 캐나다에서 가장 많은 수의 의사들을 훈련시키기 때문에 선택되었습니다. 캐나다에 위치한 연구원으로서, 나의 목표는 국가 차원의 의료 교육자들에게 PE에 대한 전반적인 커리큘럼 피드백을 제공하는 것이었다. 이 연구는 캐나다 의대에 초점을 맞추고 있지만, 북미 의과대학에는 특정한 형태의 학습 표준화가 존재하며, 이 연구의 결과는 캐나다와 미국 전역의 의과대학에 일반화될 수 있다.
My data were purposively sampled67 from the five largest undergraduate medical schools in Canada and composed of all required textbooks, clinical skills guides and PowerPoint presentations that demonstrated to students how to perform the PE. These schools were selected because they train the largest number of doctors in Canada. As a researcher situated in Canada, my goal was to provide overall curricula feedback on the PE for medical educators at a national level. Though this study focuses on Canadian medical schools, certain forms of standardisation in learning exist in North American medical schools, and the results of this study could be generalised to medical schools across Canada and the United States.

공공 웹사이트 검색은 물론, 의과대학의 관리자, 교수진 및/또는 개인 정보 보호 담당자들에게 연락하고 요청하는 것을 포함했다. 

  • (i) 학부 의대생을 위한 필수 교과서 목록 
  • (ii) 임상 기술 및/또는 PE의 교육에 사용되는 내부 자료 

학생들이 여전히 교과서를 참조하는지 여부에 대한 의문이 있었지만, 필수 구매 및 필수 읽기로 지정된 내용만 포함되었다. 이를 통해 가능한 한 포괄적인 PE 학습 자료를 검사할 수 있었습니다. PE의 묘사를 포함할 수 있는 재료의 총 수는 28개였다. 이 28개에서 PE의 묘사가 포함되지 않은 자료를 제거하고 중복 자료를 제거한 후, 10개의 교육 자료 샘플이 남아 있었다(표 1에 나열). 특정 교과서는 맥길 대학교 도서관을 통해 온라인 또는 실제 사본으로 접근되었다. 내부 자료는 공개적으로 사용할 수 없는 경우 익명으로 나열됩니다.

Data collection involved searching public websites as well as reaching out to administrators, faculty and/or privacy officers at the medical schools and requesting

  • (i) a list of any required textbooks for undergraduate medical students and
  • (ii) any internal materials used for learning clinical skills and/or the teaching of the PE.

Though questions arise as to whether students still refer to textbooks, only those that were specified as required purchases and/or required reading were included. This allowed for an examination of PE learning materials that was as comprehensive as possible. The total number of materials that could contain depictions of PEs was 28.2 After eliminating materials within this 28 that did not contain depictions of the PE and removing duplicates, a sample of 10 educational materials remained (listed in Table 1). Specific textbooks were accessed via McGill University Library, either online or in physical copy. Internal materials are listed anonymously given that they are not publicly available.

 

데이터를 분석하기 위해, 나는 discursive data와 관련하여 일반적으로 사용되는 상황 분석의 분석 도구 중 하나인 [위치 매핑positional mapping]을 사용했다. [위치 맵position map]을 사용하면 데이터가 질적으로 코딩되지만, [취해진 위치와 담론에서의 침묵]에도 주의를 기울인다. 그런 다음 이러한 결과는 [좌표 지도]에 표시되며, [축]은 [논쟁 중인 문제]를 나타내고, [플롯 점]의 위치는 [위치의 prevalence]을 나타냅니다. 이론으로 정점을 찍기 보다는, 지도는 데이터 내의 모순과 부재는 물론 여러 위치를 완전히 표현할 수 있게 해준다. 

To analyse the data, I employed positional mapping, one of the analytic tools of situational analysis commonly used in relation to discursive data.62, 63 With position maps, data are qualitatively coded, but attention is paid to positions taken and silences in the discourses. These results are then plotted on coordinate maps, with the axes representing contested issues and the location of the plot point representing the position's prevalence. Rather than culminating in a theory, the maps allow for multiple positions as well as contradictions and absences within the data to be fully articulated.62, 63

샘플의 초기 판독은 세트에 익숙해지도록 수행되었다. 이후 10개의 샘플을 정성 데이터 소프트웨어 NVivo(NVivo 12, QSR International, USA)로 가져오고, 프로그램의 코딩('노드'라고도 함) 프레임워크를 사용하여 콘텐츠(담화 및 이미지)를 귀납적으로 코딩하는 수동 프로세스가 수행되었다. 분석은 다음 질문에 의해 유도되었다.

  • 환자 중심성 및 문화적 역량과 관련하여 의대생이 사용하는 PE 학습 자료에서 환자를 어떻게 대표하고 있는가?

이 심층적인 프로세스에는 데이터의 반복적 검토, 기본 및 최종 보조 코드/노드 적용, 세부 메모가 포함되었습니다. '데이터에서 취한 위치'는 코드에서 나온 반면, '침묵silences'은 메모 작성 과정에서 구체화되었다. 예를 들어, 메모를 하면서, 나는 더 광범위한 관심 상황(환자 중심적이고 문화적으로 유능한 PE) 중에서 [어떤 개념이 데이터에 제한되거나 누락되어있는지limited or absent] 주목했다.

An initial reading of the samples was undertaken to become familiar with the set. The 10 samples were then imported into the qualitative data software NVivo (NVivo 12, QSR International, USA), and the manual process of inductively coding the content (discourse and images) was carried out using the program's coding (also called ‘nodes’) framework. The analysis was guided by the following question:

  • How are patients represented in PE learning materials used by medical students with respect to patient-centeredness and cultural competencies?

This in-depth process involved multiple passes of the data, applying primary and eventual secondary codes/nodes, and the taking of detailed memos. The ‘positions taken in the data’ emerged from the codes, whereas the ‘silences’ materialised during the memo-making process. For instance, while making memos, I noted which concepts of the broader situation of concern (a patient-centred and culturally competent PE) may be limited or absent in the data.


몇 번의 검토passes 후 코딩 및 메모 작성 프로세스에서 [새로운 위치와 새로운 침묵]이 더 이상 나타나지 않을 때(이 방법을 '분석적 충분성' 62라 칭함), 결과는 스프레드시트로 내보내고 주제와 관련된 그룹으로 정리되었다. 여기서부터 지도 축은 데이터의 일반적인 긴장 영역을 식별하여 개발되었다. 

  • (i) 환자 불편과 피할 수 없는 장애에 대한 PE 과제와 그에 대한 임상적 인식 
  • (ii) 임상 의사의 행동 대 환자의 목소리 

그 다음 이 방법에 의해 제안된 템플릿을 사용하여 마이크로소프트 워드의 지도에 해당하는 위치와 정적을 표시하였다.

After several passes and when new positions and silences were no longer emerging from the coding and memo-making process (what this method refers to as ‘analytic sufficiency62), the results were exported into a spreadsheet and organised into thematically related groups. From here, map axes were developed by identifying common areas of tension in the data:

  • (i) a clinical awareness of PE challenges versus the inescapability of patient discomfort and
  • (ii) the clinician's actions versus the patient's voice.

Corresponding positions and silences were then plotted onto maps in Microsoft Word using templates suggested by this method.

이 연구는 문서 분석에 초점을 맞추고 인간 참여자들에 대한 연구나 실험을 포함하지 않았기 때문에, 맥길 대학 의학부의 맥길 기관 검토 위원회의 규정에 따라 윤리 승인이 필요하지 않았다.
Because this study focused on analysing documents and did not involve research or experimentation with human participants, ethics approval was not required as per the rules of the McGill Institutional Review Board in the Faculty of Medicine at McGill University.

 

3 결과 
3 RESULTS

상황 분석 결과는 두 개의 위치 지도에 표시된다(그림 S1 및 S2). 아래에서는 이 분석의 세 가지 중요한 주제에 대해 논의합니다.
Results of the situational analysis are depicted in two positional maps (Figs S1 and S2). Below, I discuss three overarching themes from this analysis.

3.1 균질하고 규범적인 신체: 시대에 뒤떨어진 언어
3.1 Homogeneous and normative bodies: Outdated language

자료에서 나타난 가장 일반적인 주제는 [신체에 대한 동질적이고 규범적인 개념]이었다. 시각적으로나 담론적으로, 대부분의 문서(80%)에서 환자들은 [백인의, 시스젠더의, 장애가 없는, 가임 연령의, 이전 외상 이력이 없는 것]으로 구성되었다. 규범적이거나 '표준화된' 신체는 기초 기술을 배우기 위한 의료 훈련에서 선호되는 경우가 많으며, 이는 부분적으로 이러한 동질성을 설명할 수 있다.
The most prevalent theme that emerged from the data was a homogeneous and normative notion of the body. Both visually and discursively, patients were constructed as White, cis-gendered, abled-bodied, of child-bearing age and without a previous history of trauma in most (80%) of the documents. Normative or ‘standardised’ bodies are often preferred in medical training for learning foundational skills, which may partially explain this homogeneity.

신체 변화가 언급되더라도, 그것은 [심지어 이 표준 구조 내에서조차, 특정 신체들이 어떻게 임상의에게 PE를 더 도전적으로 만들 수 있는지]에 대한 언급이었다.
When bodily variation was mentioned, it was in reference to how, even within this normative construct, certain bodies can make the PE more challenging for the clinician:

 

많은 처녀질 오리피스는 하나의 검사 손가락을 인정한다…
만약 introitus이 위축되고 타이트해진다면, 나이 든 여성에게도 유사한 기술이 나타날 수 있다.

Many virginal vaginal orifices admit a single examining finger … Similar techniques may be indicated in elderly women if the introitus has become atrophied and tight. (Bickley and Szilagyi, p. 30, emphasis added)

그레이브스 경첩은 옆쪽이 더 넓고, 더 높고, 구부러진 날을 가지고 있다. 대부분의 경산부 여성에게 가장 적합하다.
그것의 넓고 구부러진 날들은 시각화를 위해 경산부 여성의 느슨한 질벽을 유지한다.
The Graves speculum has blades that are wider, higher, and curved on the sides; it is more appropriate for most parous women. Its wider, curved blades keep the looser vaginal walls of multiparous women separated for visualization. (Beckmann, p. 13, emphasis added)

난소는 비만이나 잘 이완되지 않은 여성에게서 촉진되기 어렵다
Ovaries are difficult to palpate in obese or poorly relaxed women. (Clinical Skills Guide 3, p. 8, emphasis added)


여기서의 언어 선택은 성차별적이고 불필요하게 성차별화된 담론을 나타낸다. 예를 들어, 여성 순결의 사회적 구조는 유지되고, 경산 여성은 질적으로 '느슨한' 것으로 묘사된다. 또한, 프로시져가 참아내기 어려운 것이 아니라, (PEs의 유일한 수용자로 생각되는) 여성이 '잘 이완되지 않은 것'으로 묘사된다. 여기서, 우리는 환자의 동질적(비다양적) 묘사와 여성 신체와 관련된 [시대에 뒤떨어지고, 종종 낙인적인 용어와 개념]의 사용과 관련하여 자료에서 문화적 역량이 부족하다는 것을 주목할 수 있다. 이러한 강연들은 의학 및 사회에서 성별과 성 고정관념을 영속시키는 역할을 한다.

The language choices here are indicative of sexist and unnecessarily sexualised discourse. The social construct of female virginity is upheld, multiparous women are described as vaginally ‘loose,’ and women (suggested to be the sole receiver of PEs) are ‘poorly relaxed’ rather than the procedure being challenging to tolerate, for instance. Here, one can note a lack of cultural competency in the materials both with respect to homogeneous (non-diverse) depictions of patients and with the use of outdated and often stigmatising terms and concepts related to the female body. These discourses serve to perpetuate gender and sexuality stereotypes in medicine and in society more broadly.

대부분의 문서가 신체에 대한 규범적 개념을 설명했지만, 두 개의 내부 가이드는 분명히 다양한 환자를 언급하였다. 하나는 퀴어 및 트랜스 환자를 위한 성별을 포함하는 접근 방식을 강조하고 다른 하나는 원주민과 LGBTQ+ 관점을 포함하는 외상 정보 치료의 원칙에 대한 두 페이지를 할애하였다.

Though most of the documents depicted normative notions of the body, two internal guides did overtly refer to diverse patients: one emphasising a gender-inclusive approach for queer and trans patients and the other dedicating two pages to the principles of trauma-informed care inclusive of Indigenous and LGBTQ+ perspectives (Clinical Skills Guide 3, pp. 11–12; PowerPoint Presentation 2, pp. 20–23).

 

3.2 환자의 주체성과 선호도가 제한된다.
3.2 Limited patient agency and preferences

모든 문서에서 강조된 것은 [환자가 PE 수행 여부를 결정할 수 없다]는 개념이었다. 임상의가 PE가 표시된 것으로 판단한 경우, PE가 발생하게 됩니다. 두 개의 교과서 및 한 개의 내부 가이드의 다음 예는 이러한 권한을 보여줍니다.

Underscored in all documents was the notion that patients were not in control of deciding whether the PE was to be performed. If the clinician had determined that a PE was indicated, it was to occur. The following examples from two textbooks and one internal guide demonstrate this authority:

 

환자에게 당신의 시험 계획을 설명하시오. (Smith 등, 페이지 328; 강조 추가)
Explain to the patient your plans for the exam. (Smith et al., p. 328; emphasis added)

내진을 할 때 앞으로 일어날 모든 것을 그것이 일어나기 전에 설명해야 합니다. 
Everything that is going to happen during the pelvic examination should be explained before it occurs. (Beckmann, p. 11; emphasis added)

환자로부터 진행 허가를 받습니다. 
[Obtain] permission from the patient to proceed. (Clinical Skills Guide 2, p. 3)


여기서는 환자의 의사input과 관계없이, 이미 검사가 결정되었습니다. 환자 동의(또는 때때로 표현된 '허락')가 언급되지만, [이미 검사가 진행 중이거나 결정된 것]이라는 구성 내에 있다. [임상적 권위]는 문서 내에 너무나도 팽배해서, [환자가 검사를 거부할 경우] 어떻게 해야 할지 아무도 제안하지 않았고, [우려를 하는 환자에 대한 대안적인 행동 방침]이 제시되지 않았다.

Here, the examination has been decided upon before, independent of patient input. Though patient consent—or ‘permission’ as it was sometimes phrased—is mentioned, it is within the construct of the examination already being in motion or decided on. Clinical authority was so prevalent in the documents that none suggested what to do if a patient declined an examination; no alternative courses of actions were suggested for apprehensive patients.

환자의 주체성agency가 문서에 나타나 있을 경우에는(40%), [이미 하고 있는 프로시져]를 환자에게 맞춤화할 수 있는 방법과 관련하여 다음이 언급된다.

  • 거울 사용(임상 기술 가이드 2 및 PowerPoint 프레젠테이션 2) 
  • 시술 중 신발 착용(비클리와 실라지) 또는 
  • 산만함을 위한 기술 장치 사용(임상 기술 가이드 3) 

When patient agency was represented in the documents (40%), it occurred with respect to how the patient could customise an already occurring procedure:

  • use of a mirror (Clinical Skills Guide 2 and PowerPoint Presentation 2),
  • wearing shoes during the procedure (Bickley and Szilagyi) or
  • using technological devices for distraction (Clinical Skills Guide 3).

PE 경험을 개선하는 것으로 알려진 최근 및 거의 틀림없이 더 효과적인 아래와 같은 옵션들은 없었다. 

  • 일상적인 상황에서 bimanual examination을 포기한다. (딱 하나에만 있었음)
  • 발판 사용 금지,
  • 스페큘럼의 자가 삽입 또는 자기 스왑 테크닉

Recent and arguably more effective options known to improve the PE experience were absent:

  • forgoing the bimanual examination in routine circumstances (excluded from all but one),
  • disuse of footrests,
  • self-insertion of speculum and/or self-swabbing techniques.

이러한 측면에서 자료는 환자 중심의 치료 원칙(일부 환자의 선호도 존중)을 지지했지만, [특정 모집단에 대한 검사를 개선하는 것으로 알려진 것을 포함하여], 모든 가능한 옵션에 대해 학생들에게 경고하기에는alerting 불충분했다. 이전 연구의 결론은, [의료 훈련단계에서 학생은 아직 임상행위를 습득하기 전이므로, 새로운 PE 옵션을 도입하기에 이상적인 시기]인 것으로 확인되었다. 그렇지 않으면 학생들은 이러한 원천 자료에 노출되지 않을 수도 있다.

In this regard, although the materials upheld a tenet of patient-centred care—respect for (some) patient preferences—they were inadequate in alerting students to all options, including those known to improve the examination for specific populations. Conclusions from previous studies have identified medical training as the ideal introduction to novel PE options given their current lack of uptake in clinical practice.44 Students may otherwise never be exposed to these techniques if not in these source materials.

3.3 환자는 [PE가 이뤄지는 도중]이라는 특정 단계에서 [취약성과 제한된 능력]을 경험한다.
3.3 Patients are vulnerable and experience limited capacity at specific stages during the PE

데이터에서 나타난 분명한 주제는, PE의 임상 부분 동안 (임상의사 및 연습생에 대한) 환자의 상대적 취약성이었다. 데이터의 담화는 PE에는 두 가지 뚜렷한 사회적 요소인 [PE 전후]와 [PE 중]이 있음을 보여주었다. 다음 예제는 환자 참여(질문할 능력, 동의할 능력, 결과 수신 능력 등) [전후 구성 요소에서 얼마나 강하게 indicate되는지], 그리고 [옷을 벗은 것]이 환자의 능력capacity에 대한 취약성과 중단을 어떻게 의미하는지 보여줍니다.

A clear theme that emerged from the data was patient vulnerability relatively to the clinician and/or trainee during the clinical portion of the PE. Discourses in the data demonstrated that there were two distinct social components of the PE: the before/after and the during. The following example demonstrates how patient engagement—such as the ability to ask questions, give permission and receive results—is heavily indicated in the before/after component and how being unclothed signifies both a vulnerability and a disruption to the capacity of the patient:

 

[프로시져 중의 취약성]이라는 주제는 임상의에게도 적용된다. 몇몇 문서에서는 임상의사(특히 교육생 및/또는 남성)가 '의료법적 보호'를 위해 환자가 알지 못하는 [샤프롱chaperones]을 병실에 배치해야 하는 방법을 강조하였다(임상기술지침서 1, 페이지 1).

Themes of vulnerability during the procedure also applied to the clinicians; several documents highlighted how clinicians—specifically trainees and/or males—must have chaperones unknown to the patient in the room for ‘medico-legal protection’ (Clinical Skills Guide 1, p. 1).

검사의 두 번째 구성 요소(프로시져 자체)에서, 담론은 [환자의 편안함]에서 벗어나, [PE의 임상적 스텝]으로 이동했습니다. 학습 목적을 위한 절차를 묘사하는 동안 임상적 초점을 어느 정도 맞출 것으로 예상된다. 비록 본문들이 [프로시져가 이뤄지는 동안 환자와의 의사소통의 필요성]을 일찍이 강조했지만, 종종 이 개념은

  • (i) 임상 단계 동안 전혀 언급되지 않거나 
  • (ii) 허가를 구하는 질문이나 이의 제기 기회가 아닌. [진술]로 표현된다.
    • '만지는 느낌이 날거에요',
    • '경경을 삽입하려고 한다는 것을 환자에게 말한다',
    • '불편한 환자에게 긁는 느낌이 들 수 있다고 알려준다'

이러한 재료는 PE의 두 구성 요소 사이에서 접근 방식이 달랐다고 할 수 있다. [환자와 환자 참여]는 프로시져 전후에, [임상 스킬]은 프로시져 동안에 중요하게 다뤄졌다.

In the second component of the examination (the procedure itself), discourses shifted away from patient comfort and towards the clinical steps of the PE. An amount of clinical focus during depictions of any procedure for learning purposes is to be expected. Though texts had earlier highlighted the need for patient communication during the procedure, often, this concept was either

  • (i) not referenced at all during the clinical steps or
  • (ii) expressed as statements rather than permission-seeking questions or opportunities for dissent (i.e. ‘you are going to feel touch’, ‘let the patient know you are about to insert the speculum’ and ‘inform patient she may feel an uncomfortable scraping sensation’).

It could be said that these materials diverged in their approach between the two components of the PE: patients and patient engagement were centred in the before/after, whereas clinical skills were centred during.

4 토론
4 DISCUSSION

내 분석은 캐나다 학부 의과대학에서 샘플링된 PE를 수행하는 방법에 대한 텍스트 및 시각 기반 학습 자료가 이 연구의 프레임워크에 명시된 [환자 중심 치료 및 문화적 역량의 원칙]에 대해 환자를 적절하게 나타내지 못한다는 것을 보여준다. 환자의 다양성, (언어를 통한) 존중, 환자의 선호와 주체성agency는 모두 다 프로시져를 묘사할 때 결여되어 있었다. 하지만 이러한 개념은 부가적인 비중을 가지고 있으며, 다른 형태의 학습에서 학생들에게 소개되지 않을 수도 있다. 이와 같은 강의실 자료는 의학 교육에서 하나의 요소에 불과할지 모르지만, 그러나, 나는 이러한 묘사가 여전히 여기서 그리고 의학 교육과정에 더 광범위하게 중요하다고 주장한다.

My analysis demonstrates that text- and visual-based learning materials on how to perform the PE sampled from Canadian undergraduate medical schools inadequately represent patients with respect to the tenets of patient-centred care and cultural competence set out in this study's framework. Patient diversity, respect (via language), preferences and agency were all limited in depictions of a procedure where these concepts arguably carry added weight and may not be introduced to students in other forms of learning. Classroom materials such as these may illustrate a single component of medical education; however, I argue that these depictions still matter here and for the medical curriculum more broadly.

[환자 중심성]과 관련하여, [환자 관점에 대한 노출]이 [의대생의 자신감과 정보 보유를 크게 향상시킨다]는 연구 결과가 나오면서, 이 치료 모델은 전체 의료 커리큘럼의 중요한 측면으로 반복적으로 확인되었다. 앞서 언급한 바와 같이, PE는 환자와 학생 모두에게 예외적인 절차입니다. 프로시져 학습 자료에서 환자 중심의 접근 방식을 강조한다면, PE가 적어도 하나의 우선 순위가 되어야 한다고 추정할 수 있다. 
With respect to patient-centeredness, this model of care has repeatedly been identified as an important aspect of the entire medical curriculum,11, 68 with research demonstrating that exposure to the patient perspective significantly improves medical students' confidence and retention of information.69 As mentioned, the PE is an exceptional procedure for both patients and students.70 If patient-centred approaches were to be emphasised in procedural learning materials, it could be presumed that the PE should be at least one priority.

이 사례들에서 환자중심적 접근방식이 배제되었음을 확인하며 배운 것이, [환자 중심주의가 필수적이라고 여겨지는 다른 분야의 결함]도 말해 줄 수 있다. 예를 들어 만성 통증, 장애 또는 말기 질환을 앓고 있는 환자 또는 산부인과 환자가 있다. 학생들은 교육과정 전반에 걸쳐 환자 중심주의를 보다 명시적으로 가르칠 필요가 있다고 보고했고, 학부 커리큘럼은 환자 중심적인 관점보다 '질병 기반 관점'에 더 치우친 것으로 나타났다. 이 연구의 결과는 교실 학습 자료가 환자 중심주의를 개선할 수 있는 의료 교육의 한 측면이 될 수 있음을 보여준다.

What we learn from their exclusion in these cases may speak to deficiencies in other fields where patient-centeredness has been identified as imperative: patients with chronic pain,71 disabilities72 or terminal illness,73 or in obstetrics,74-76 for instance. Students have reported that patient-centeredness needs to be more explicitly taught throughout the curriculum,77 and undergraduate curricula have been shown to be more inclined towards ‘disease-based perspectives’ over patient-centred ones.78 The results of this study demonstrate that classroom learning materials could be one aspect of medical education where patient-centeredness could be improved upon.

문화적 역량과 관련하여, 본 연구의 분석은 의료 커리큘럼에서 환자 묘사를 다양화하기 위해 추가 작업이 필요할 수 있음을 보여준다. 이는 이 주제에 대한 다른 조사 결과와 일치합니다. 피부과와 같은 다른 의학 분야의 학습 자료에서 인종적 동질성은 예를 들어 학생들의 진단 기술을 저해하는 것으로 알려져 왔다. 또한 특정 모집단의 부재(심지어 술기 장비technical material 수준의 부재조차)는 의사들이 [인종과 질병 위험 사이의 연관성]이 있게 만듦으로써, 기존 건강 격차를 유지하거나 악화시킬 수 있다는 점에 주목했다. 북미 의대생들은 [성소수자(LGBTQ+) 환자와 관련된 주제]에 대해 학부 커리큘럼에 적은 시간을 할애하고 있으며, 이 모집단에 적절한 상담을 제공할 준비가 되어 있지 않다고 느낀다고 보고한다. 페미니스트 이론가들에 따르면, 의학교육에서 [환자를 동질적으로 묘사하는 것]은 [신-식민지주의neo-colonialism의 한 형태]로 간주되며, 모든 신체가 아니라 [일부 신체에만 복무하도록 설계된 '우생학의 논리']를 영속시킨다. 강의실 자료를 포함한 포괄적인 리소스는 다양한 환자 그룹과 상호작용하는 데 있어 학생들의 문화적 역량을 향상시키기 위한 중요한 방법으로 확인되었습니다. 본 연구의 결과는 환자 표현이 개선되어야 하는 커리큘럼의 한 측면(PE 강의실 자료)을 드러내지만, 또한 의료 훈련의 모든 단계에서 문화적 역량 기술이 얼마나 더 강조되어야 하는지에 대한 더 광범위한 예시로도 작용한다.
With respect to cultural competency, the analysis from this study demonstrates that further work may be needed to diversify patient depictions in the medical curriculum. This aligns with other findings on this topic. Racial homogeneity in learning materials from other fields of medicine—such as dermatology—has been noted to impede diagnostic skills of students,79 for instance. It has also been noted that the absence of certain populations—even at the level of technical materials—may inform the association doctors make between race and disease risk, thereby maintaining or exacerbating existing health disparities.60, 61 North American medical students report that a small amount of time is dedicated in the undergraduate curriculum to topics related to LGBTQ+ patients80 and that they feel unprepared to provide appropriate counselling to this population.81 According to feminist theorists, homogeneous depictions of patients in medical education are considered a form of neo-colonialism82 and perpetuate a ‘logic of eugenics’ designed to serve some bodies instead of all.83 Comprehensive resources—including classroom materials—have been identified as a critical method for improving cultural competency in students by heightening their awareness of and comfort in interacting with diverse patient groups.84 The results of this study reveal one aspect of the curriculum where patient representation needs to be improved (PE classroom materials) but also serve as a broader example of how cultural competency skills may need further emphasis across all stages of medical training.


본 연구의 한계 측면에서, 이 프로젝트의 범위는 중요한 사례 표본을 추출할 수 있도록 허용되었으며, 학교 커리큘럼에 따른 차이가 존재한다는 점에 유의해야 한다. 앞서 언급한 바와 같이, 이 난해한 데이터에 존재하는 특정 결함은 의료 훈련의 다른 곳에서 다루어질 수 있다. 이 주제에 대한 추가 연구는 학습 자료를 더 광범위하게 조사할 수 있다. 

  • 넓은 관점(즉, 강의실 및 표준화된 환자 세션에서 학습에 대한 더 많은 문서 또는 민족지학적 관찰)
  • 샘플 관점(즉, 더 많은 학교)

미래의 연구는 또한 다른 '예외적' 절차 또는 일반적으로 PE를 통한 환자 관점에 대한 지식과 인식과 관련하여 의대생들의 학습 경험에 대해 인터뷰할 수 있다.

In terms of limitations of this study, the scope of this project allowed for a critical-case sampling, and it must be noted that jurisdictional variations across school curricula do exist. As previously mentioned, certain deficiencies present in this discursive data may be addressed elsewhere in medical training. Further research into this subject could examine learning materials more extensively, from both

  • a breadth perspective (i.e. more documents and/or ethnographic observations of learning in classroom and standardised patient sessions) and
  • a sample perspective (i.e. more schools).

Future studies could also interview medical students about their learning experiences with respect to their knowledge and awareness of patient perspectives with the PE, with other ‘exceptional’ procedures or in general.

5 결론
5 CONCLUSION

PE의 가르침은 의학 교육의 문제를 제기했으며, 계속해서 그러하고 있다. 텍스트 및 시각 기반 커리큘럼은 의대생들이 배우는 방법의 한 측면을 나타내지만, 이러한 자료에서 담론은 중요하고, 그들의 해석은 다양한 환자 커뮤니티의 경험과 건강 결과에 영향을 미칠 수 있다. 이러한 이유로 교과서와 기술 기술 지침서의 기본 수준에서도 환자 중심적이고 문화적으로 유능한 접근법이 의료 커리큘럼뿐만 아니라 PE의 사례 연구에서도 더욱 강조되어야 한다. PE 훈련은 큰 진전을 이뤘고, 이 연구의 특이치 사례에서 볼 수 있듯이, 여전히 그것의 교육을 개선하기 위한 노력이 이루어지고 있다. 그러나 보다 [다양하고 포용적인 의료행위를 향한 진전]은 결코 유한하지 않으며, 바이오메디컬도 예외가 아니다. 커리큘럼은 지속적인 분석과 개선이 필요하며, PE와 다른 '예외' 절차에 대한 묘사는 특정한 주의를 필요로 할 수 있다.

The teaching of the PE has posed and continues to pose challenges in medical education. Text and visual-based curricula represent one facet of how medical students learn, but discourses in these materials matter, and their interpretations can impact the experiences and health outcomes of various patient communities. It is for these reasons that—even at the basic level of textbooks and technical skills guides—patient-centred and culturally competent approaches must be further emphasised both here in this case study of the PE as well as in the medical curriculum more broadly. PE training has come a long way, and efforts are still being made to improve its teaching, as reflected in this study's outlier cases. But progress towards more diverse and inclusive practices is never finite, and biomedicine is no exception. Curricula need constant analysis and improvement, and depictions of the PE and other ‘exceptional’ procedures may require specific attention.

 


Med Educ. 2022 Jan 27. doi: 10.1111/medu.14737. Online ahead of print.

'Poorly relaxed women': A situational analysis of pelvic examination learning materials for medical students

Affiliations collapse

Affiliation

1Faculty of Medicine, McGill University, Montreal, Quebec, Canada.

PMID: 35086164

DOI: 10.1111/medu.14737

Abstract

Background: Certain clinical pelvic examination (PE) teaching methods have been critiqued for prioritising student learning over patient autonomy and for not accurately representing diverse patient communities. As such, patient-centred and culturally competent approaches to the PE may need further emphasis in the medical curriculum-in particular, in content delivered to students before patient interaction. Classroom materials serve as students' first exposure to the sensitive procedure. This research explores how patients are represented in these materials.

Methods: A situational analysis was conducted on 10 purposively sampled PE learning materials for the 2019/20 academic year from five undergraduate medical schools in Canada. Situational analysis focuses on analysing discourse but is epistemically aligned with post-structuralism (most notably Foucault's theories involving discursive power) and allows for specific consideration of 'silences' in the data. Collected data were analysed using cartographic approaches according to this methodology, with particular attention paid to the tenets and frameworks of patient-centred and culturally competent care.

Results: Overall, content in these materials misrepresented and under-represented patients. Materials contained both outdated and unnecessarily sexualised language, in addition to a lack of patient diversity. Clinical authority was often centred over patient agency, and several updated PE techniques known to improve patient experience were absent. Patient-centred and culturally competent approaches were therefore inadequately highlighted in most of the materials.

Conclusions: Depictions contained in these materials may be perpetuating stereotypes and biases in medicine and may be working to maintain teaching practices that cause harm to patients (standardised and regular) who students interact with in both clinical and educational settings. Efforts may be needed to improve classroom materials on the PE so that they more adequately centre patients and provide opportunities to discuss culturally competent approaches to the procedure that (i) may not be covered in other parts of the PE curriculum and (ii) can reduce known health disparities.

+ Recent posts