피드백을 효과적으로 만드는 것은 무엇인가? 학생과 교수의 관점(Assessment & Evaluation in Higher Education, 2018)
What makes for effective feedback: staff and student perspectives

Phillip Dawsona , Michael Hendersonb , Paige Mahoneya, Michael Phillipsb ,
Tracii Ryanb , David Bouda and Elizabeth Molloyc

 

소개
Introduction

피드백은 학생 학습에 가장 강력한 영향 중 하나가 될 수 있다. 연구 문헌에는 효과적인 것으로 간주되는 피드백 접근법에 대한 수많은 연구가 포함되어 있으며, 이는 여러 검토 연구(Hattie and Timperley 2007; Shute 2008)에서 통합되었다. 피드백에 대한 증거 기반은 피드백이 수행되어야 하는 방법에 대한 이해에 영향을 미친 몇 가지 개념 모델을 개발하는 데에도 사용되었다(Carless et al. 2011; Boud and Molloy 2013). 따라서 피드백이 더 효과적으로 만들어질 수 있는 방법에 대한 실질적인 조언을 얻을 수 있다. 
Feedback can be one of the most powerful influences on student learning (Hattie and Timperley 2007). The research literature contains numerous studies on feedback approaches that are regarded as effective, and these have been synthesised in several review studies (Hattie and Timperley 2007; Shute 2008). The evidence base on feedback has also been used to develop several conceptual models that have been influential in our understandings of how feedback should be done (Carless et al. 2011; Boud and Molloy 2013). Substantial advice is thus available on how feedback might be made more effective.

문헌에 설명된 효과적인 피드백 가능성과는 달리, 학생들은 일반적으로 고등교육에서 피드백이 다른 측면과 비교하여 잘 수행되지 않는다고 조사에서 보고한다(Carroll 2014; 영국 고등교육 기금 지원 위원회; Bell and Brooks committee for England committee for higher Education funding 2014; Bell and brooks comks 곧 발표). 그러나 학생 만족도 조사(특히 영국 전국 학생 조사 및 호주 등가물)의 실질적인 문제는 피드백에 대한 구시대적인 이해에 기초한다는 것이다. 질문은 학생들이 교육자(윈스톤과 피트 2017)로부터 받은 코멘트의 양과 질에 대해 만족하는지 묻는 경향이 있다. 이는 지난 10년 동안 추가적인 학습으로 이어지는 과정으로서 피드백에 대한 이해를 지향하는 문헌의 강한 변화와는 대조적이다(Sadler 2010; Carless et al. 2011; Molloy 20).13).  
In contrast to the effective feedback possibilities expounded in the literature, students generally report in surveys that feedback is done poorly in higher education, compared with other aspects of their studies (Carroll 2014; Higher Education Funding Council for England 2014; Bell and Brooks forthcoming). However, a substantial problem with student satisfaction surveys (particularly the UK’s National Student Survey and its Australian equivalent) is that they are based on an outmoded understanding of feedback. Questions tend to ask if students are happy with the volume or quality of comments they receive from their educators (Winstone and Pitt 2017); this contrasts with a strong shift in the literature over the past decade towards understandings of feedback as a process that leads to further learning (Sadler 2010; Carless et al. 2011; Molloy and Boud 2013).

평가 및 피드백 분야에서 다양한 용어의 의미는 최근 수십 년 동안 변화했다(Cookson). 2010년대 초에는 피드백에 대한 이해가 [학생들에게 '주어지는' 것]에서 [학생들이 능동적인 역할을 수행하는 과정]으로 변화하였다. 슈트(2008)의 피드백 검토는 '학습자에게 전달된 정보'에 초점을 맞추고, 해티와 팀펄리(2007)는 '에이전트가 제공한 정보'에 초점을 맞춘 반면, 보다 최근의 이해는 피드백을 생물학 또는 공학에 대한 개념적 근간을 두고, [작업의 개선으로 이어지는 과정]으로 피드백을 재배치한다(Boud and Moloy 2013). 피드백이 이해되는 방법의 이러한 변화는 교육자부터 학생까지의 '희망적으로 유용한' 의견 제공보다 피드백의 특징에 더 많은 중점을 둔다. 현재 문헌에서 두드러지는 피드백의 개념화에서는 전체 피드백 프로세스를 고려한다. 즉, 교육자보다는 [학생에 의해 주도]되고 [다수의 참여자가 참여]하며, 그리고 필수적으로 [학생이 변화를 일으키기 위해 정보를 사용하는 것]이다. 따라서 문헌은 피드백을 이해하는 방식으로 발전해 왔지만 피드백에 관련된 사람들이 피드백과 함께 참여했는지는 명확하지 않다.

The meanings of various terms in the field of assessment and feedback have changed over recent decades (Cookson forthcoming). The early 2010s marked a shift in how feedback was positioned within the literature, with understandings of feedback moving from something ‘given’ to students towards feedback as a process in which students have an active role to play. Where Shute’s (2008) review of feedback focused on ‘information communicated to the learner’, and Hattie and Timperley (2007) focused on ‘information provided by an agent’, more recent understandings reposition feedback within its conceptual roots in biology or engineering, as a process leading to improved work (Boud and Molloy 2013). This shift in how feedback is understood places emphasis on many more features of feedback than just the provision of ‘hopefully useful’ comments from educators to students. The conceptualisations of feedback currently prominent in the literature consider the entire feedback process, driven by the student rather than the educator, involving a multitude of players, and necessarily involving the student making use of information to effect change. The literature has thus moved forward in how it understands feedback – but it is not clear if those involved in feedback have been brought along with it.

2010년대 초 이러한 변화 이전에는 피드백에 대한 직원과 학생의 인식에 대한 다양한 연구가 있었다. 몇몇은 학생들이 생각하는 것에만 집중했습니다. 예를 들어, Poulos와 Mahony(2008)는 호주의 한 대학의 보건 학생들이 형식과 시기적절함뿐만 아니라 피드백 출처의 신뢰도에도 관심이 있다는 것을 발견했다. 직원과 학생의 관점을 모두 고려한 연구에서 피드백 실천에 대한 학생과 교육자의 인식 사이에는 일반적으로 불일치가 있었다. 예를 들어, 홍콩의 한 연구에서 교육자들은 피드백에 대한 비슷한 질문을 받았을 때 학생들보다 훨씬 더 긍정적인 그림을 보고하는 경향이 있었다(Carless 2006). 호주의 한 연구에서는 교육자들의 지지된 피드백 이론과 실습이 실제 피드백 행동과 유사한 불일치를 보였으며, 실제 실습은 종종 개인의 이상에 미치지 못한다는 것을 발견했다(Orrell 2006). 일반적으로 보면, 실제 실습, 교육자 관점 및 학생 관점 사이의 불일치가 있는 것으로 보인다(Li 및 De Luca 2014).

Prior to this shift in the early 2010s, there had been a range of studies about staff and student perceptions of feedback. Some focused only on what students thought. For example, Poulos and Mahony (2008) found that health students at an Australian university were interested not just in modality and timeliness, but also the credibility of the feedback source. In studies that considered both staff and student perspectives, there were generally discrepancies between student and educator perceptions of feedback practices. For example, in one Hong Kong study, educators tended to report a much more positive picture than students when both were asked similar questions about feedback (Carless 2006). An Australian study found a similar mismatch between educators’ espoused feedback theories and practices and their actual feedback behaviours, with actual practices often falling short of individuals’ ideals (Orrell 2006). The general message appears to be one of inconsistencies between understandings of actual practices, educator perspectives and student perspectives (Li and De Luca 2014).

그러나 2010년대 초반 연구자 및 전문가 피드백 이해도가 변화한 이후 직원과 학생들이 효과적인 피드백으로 경험하는 것에 대한 연구는 부족했다. 특히 다양한 제도적·징계적 맥락의 교직원과 학생이 모두 포함된 공부가 부족했다. 피드백에 대한 인식에 대한 일반적인 2010년 이후의 연구는 단일 기관의 단일 분야에 초점을 맞추고 있으며, 학생 연구 참여자는 200명 미만이고 직원 참여자는 없다(예: Dowden et al. 2013; Robinson, Pope and Holyoak 2013; Bayerlein 2014; Pitt and Norton 2017). 소수의 직원 또는 여러 분야(예: Orsmond and Merry 2011; Sanchez and Dunworth 2015; Mulliner and Tucker 2017)를 포함하는 소수의 연구가 있었지만, 이들은 여전히 특정 성별에 치우쳐 있고 제한된 분야 그룹에 집중된 공동 조직 연구였다. 피드백 연구를 일반화할 때 주의해야 할 필요성에 대한 새들러(2010)의 주의를 고려할 때, 학문, 제도, 연도 수준, 성별 및 기타 특성 측면에서 더 포괄적이고 포괄적인 연구가 필요하다.

However, since the shift in researcher and expert understandings of feedback in the early 2010s, there has been a dearth of studies on what staff and students experience as effective feedback. In particular, there has been a lack of studies that include both staff and students from a range of institutional and disciplinary contexts. The typical post-2010 study on perceptions of feedback focuses on a single discipline at a single institution, with a convenience sample of less than 200 student research participants and no staff participants (e.g. Dowden et al. 2013; Robinson, Pope, and Holyoak 2013; Bayerlein 2014; Pitt and Norton 2017). While there have been a handful of studies that also include a small number of staff or several disciplines (e.g. Orsmond and Merry 2011; Sanchez and Dunworth 2015; Mulliner and Tucker 2017), these have still largely been single-institution studies with cohorts skewed toward particular genders and concentrated in limited discipline groups. Given Sadler’s (2010) caution about the need to be careful when generalising in feedback research, there is a need for studies that are more inclusive and comprehensive in terms of disciplines, institutions, year levels, gender and other characteristics.

피드백에 대한 직원과 학생의 인식에 대한 광범위한 연구가 부족한 것은 문제가 되는데, [문헌에서 일어나는 피드백에 대한 이해의 변화]와 함께 [직원과 학생의 변화]가 어느 정도까지 오게 되었는지 알 수 없기 때문이다. 평가에서 교육자는 학생들이 무엇을 할 것으로 예상되는지를 설계하는 사람들이며, [무엇이 효과적인지에 대한 그들의 의견]은 [무엇이 일어나는지에 대한 연구 증거]보다 더 영향력이 있을 수 있다(Bearman et al. 2017). 마찬가지로, 프로세스 중심의 피드백 개념화에서 학생들은 주요 행위자(Boud and Molloy 2013)이며, 피드백이 무엇에 적합한지, 무엇을 효과적으로 만드는지에 대한 그들의 이해는 정교한 디자인을 구현하기 위해 필요하다.
The lack of broader studies on staff and student perceptions of feedback is problematic, because we do not know to what extent staff and students have been brought along with the changing understandings of feedback occurring in the literature. In assessment more broadly, educators are the people who design what students are expected to do, and their opinions about what is effective may be more influential than research evidence about what occurs (Bearman et al. 2017). Similarly, in a process-oriented conceptualisation of feedback, students are the main actors (Boud and Molloy 2013), and their understandings of what feedback is for and what makes it effective are necessary to implement sophisticated designs.

본 논문은 대규모 피드백 설문조사의 의도적인 샘플에 대한 정성적 분석을 통해 교육자와 학생들이 피드백이 무엇에 대한 것이라고 생각하고 효과적인 피드백을 위해 무엇을 만드는지에 대한 이해의 격차를 해소한다. 특히 다음과 같은 연구 질문을 다룬다.

This paper addresses a gap in our understanding around what educators and students think feedback is for, and what they think makes for effective feedback, through qualitative analysis of a purposive sample from a large-scale feedback survey. In particular, it addresses the following research questions:

RQ1: 직원과 학생들은 피드백의 목적이 무엇이라고 생각하나요?
RQ1: What do staff and students think is the purpose of feedback?

RQ2: 직원과 학생들은 무엇이 효과적인 피드백을 만든다고 생각하는가?
RQ2: What do staff and students think makes for effective feedback?

방법
Method

우리는 2016-2017년에 호주 2개 대학의 직원과 학생들을 대상으로 피드백에 대한 대규모 설문조사를 실시했습니다. Creative Commons ShareAlike 4.0 International License에 따라 무료로 사용할 수 있습니다. 4514명의 학생과 406명의 직원으로부터 유효한 답변을 받았습니다. 설문조사는 주로 양적이었지만, 공개 응답 항목도 소수 포함되어 있었다. 본 논문은 평가 책임이 있는 직원(즉, 교육자)과 학생들이 피드백이 무엇에 대한 것이라고 생각하는지, 무엇을 효과적인 피드백으로 구성한다고 생각하는지, 경험했던 효과적인 피드백의 예를 제공하는 공개 응답 데이터의 하위 집합에 대한 정성적 분석에 대해 보고한다.
We administered a large-scale survey about feedback to staff and students at two Australian universities in 2016–2017. The survey instrument is available at www.feedbackforlearning.org/wp-content/uploads/Feedback_for_Learning_Survey.pdf and is free to use under a Creative Commons ShareAlike 4.0 International Licence. Valid responses were received from 4514 students and 406 staff. The survey was primarily quantitative, but it also included a small number of open response items. This paper reports on our qualitative analysis of a subset of the open response data where staff with assessment responsibilities (i.e. educators) and students discussed what they thought feedback was for, what they thought constituted effective feedback, and gave examples of effective feedback they had experienced.

이 조사 데이터는 호주 정부 학습 및 교육 사무소가 자금을 지원하는 연구 프로젝트의 첫 번째 단계의 일부로 수집되었으며 두 개의 호주 대학이 수행했다. 이 프로젝트는 코스워크 학생과 대학 직원(학술 및 전문직 모두)의 피드백 경험과 실천을 이해하는 데 광범위한 초점을 맞췄다. 모든 데이터를 수집하기 전에 두 대학의 인간 연구 윤리 위원회로부터 승인을 받았다. 설문 참여는 자발적이었고, 참가자들은 작은 인센티브를 위해 경품 추첨에 들어갈 수 있는 기회가 제공되었다. 우리는 연구의 옵트인 성격과 인센티브가 모집된 참가자의 대표성에 영향을 미칠 수 있다는 것을 인정한다.
The survey data were collected as part of the first phase of a research project funded by the Australian government Office for Learning and Teaching and undertaken by two Australian universities. The project had the broad focus of seeking to understand the feedback experiences and practices of coursework students and university staff (both academic and professional). Approval was received from the Human Research Ethics Committees of both universities prior to all data collection. Participation in the survey was voluntary, and participants were offered the opportunity to go into a prize draw for a small incentive. We acknowledge that both the opt-in nature of the study and the incentive may affect the representativeness of the participants recruited.

샘플
Sample

리소스 제약으로 인해 심층적인 정성 분석을 수행하기 위해 데이터를 샘플링해야 했습니다. 따라서 성별, 국제/학생 등록, 온라인/학생 등록 및 교수진 측면에서 전체 모집단의 특성을 대표하는 각 기관의 학생 응답 표본 200개(총 N = 400)를 선택했다. 교육자의 전체 데이터 세트가 비슷한 크기(n = 323명 참가자)였기 때문에 샘플 대신 교육 직원의 모든 데이터를 사용하기로 결정했습니다.

Resource constraints dictated that we needed to sample the data in order to conduct in-depth qualitative analysis. We therefore opted for a sample of 200 student responses from each institution (total N = 400) that was representative of the characteristics of the overall populations in terms of gender, international/domestic enrolment, online/on-campus enrolment, and faculty. As the entire data-set of educators was of comparable size (n = 323 participants) we opted to use all data from teaching staff rather than a sample.

분석.
Analysis

이 논문에서 분석은 두 개의 개방형 응답 질문의 하위 집합에 초점을 맞췄다. 평가 책임이 있는 학생과 교직원은

  • (a) 피드백의 목적으로 본 것을 진술하고,
  • (b) 최근 스스로 선택한 피드백 사례가 효과적이었다고 생각하는 이유를 진술하도록 요청받았다.

For this paper, analysis focused on a subset of two open-response questions. Students and staff with assessment responsibilities were asked to:

  • (a) state what they saw as the purpose of feedback; and
  • (b) state why they considered a recent, self-selected instance of feedback had been effective.


브라운과 클라크(2006)가 설명한 프로세스와 유사한 데이터의 주제 분석을 실시했다. 다른 주제 분석과 마찬가지로, 개발된 주제와 분석 결과를 형성하는 연구 설계 동안 일련의 선택이 이루어졌다. 존재론적으로 이 연구는 광범위하게 현실주의에 기초한다(Maxwell 2012). 우리는 참가자들이 피드백을 실제처럼 경험하며, 교육자와 학생들이 동일한 피드백 현실에서 매우 다른 경험을 할 수 있다고 생각한다. 우리는 피드백 연구자로서 일련의 도메인 이론을 주제에 가져오고, 데이터로부터 수동적으로 'emerge'되도록 하기보다는 적극적으로 주제를 구성한다는 것을 인정하여 귀납적 분석을 수행했다(Varpio 등 2017). 잠재된 의미를 식별하는 것보다 참가자들이 명시적으로 쓴 내용에 더 관심이 있었기 때문에 우리는 '의미적' 주제(Braun과 Clarke 2006)를 개발했다. 개방형 질적 조사 질문에 대한 응답은 종종 더 깊은 형태의 분석을 지원하기에는 너무 '얇은' 경향이 있다.

We conducted a thematic analysis of the data similar to the process described by Braun and Clarke (2006). As with any thematic analysis, a series of choices were made during the research design that shaped the themes developed and the outcomes of the analysis. Ontologically, the study is broadly based in realism (Maxwell 2012); we think the participants experience feedback as a real thing, and it is possible for educators and students to have very different experiences of the same feedback reality. We undertook an inductive analysis, with the acknowledgement that as feedback researchers we bring a set of domain theory to the topic, and that we actively construct themes rather than have them passively ‘emerge’ from the data (Varpio et al. 2017). We developed ‘semantic’ themes (Braun and Clarke 2006), because we were more interested in what our participants explicitly wrote than we were in identifying latent meanings; responses to open-ended qualitative survey questions often tend to be too ‘thin’ to support deeper forms of analysis (LaDonna, Taylor, and Lingard 2018).

우리의 코딩 프레임워크는 데이터의 하위 세트를 읽고, 노트를 공유하고, 예비 코드를 테스트하는 반복적인 프로세스를 통해 개발되었다. 이 과정에는 4명의 연구원(MH, PD, MP, TR)이 5번의 주요 반복 과정을 거쳤다. 이 과정을 통해 예비 프레임워크가 개발되면, 개발(PM)에 관여하지 않은 다른 연구원과 코드북으로 공유되었고, 연구팀의 두 구성원(PD, MH)과 협의하여 코드를 수정하기 전에 50명의 참가자의 데이터를 코드화했다. 최종 프레임워크는 전체 샘플에 적용되었습니다.
Our coding framework was developed through an iterative process of reading subsets of the data, sharing notes and testing preliminary codes. This process involved four researchers (MH, PD, MP, TR) going through five major iterations. Once a preliminary framework was developed through this process it was shared as a codebook with another researcher not involved in its development (PM), who then coded data from 50 participants before making minor amendments to the codes in consultation with two members of the research team (PD, MH). The final framework was then applied to the entire sample.

결과 및 토론.
Results and discussion

RQ1: 직원과 학생들은 피드백의 목적이 무엇이라고 생각하나요?
RQ1: What do staff and students think is the purpose of feedback?

참가자들은 피드백의 네 가지 주요 목적을 나타냈다: 성적 정당화, 일의 장단점 확인, 개선, 정서적 목적. 이러한 목적의 확산은 우리가 관찰한 하위 주제와 함께 표 1에 제시되어 있다. 개별 참가자의 데이터가 여러 테마로 코딩되었을 수 있기 때문에 표에 제시된 데이터가 100% 이상 추가될 수 있다는 점에 유의해야 한다.

Participants indicated four main purposes of feedback:

  • justifying grades;
  • identifying strengths and weaknesses of work;
  • improvement; and
  • affective purposes.

The prevalence of each of these purposes is presented in Table 1, along with subthemes where we observed them. It should be noted that data presented in tables may add up to more than 100% because individual participants’ data may have been coded in multiple themes.

 

 

피드백은 성적 향상에 대한 것인가, 아니면 성적을 정당화하는 것인가?
Is feedback about improvement, or justifying a grade?

대다수의 응답자가 피드백의 목적으로 학생 90%, 교직원 89%가 일종의 개선을 언급할 정도로 피드백은 개선에 관한 것이라고 표현했다. 직원의 경우 피드백의 개선 목적이 성적 정당화 목적보다 10배 우세했고, 학생의 경우 개선 목적이 정당화 목적보다 20배 이상 우세했다. 일부 참여자들은 개선을 피드백의 '명백한' 목적이라고 여겼는데, 이는 이 주제가 널리 퍼지고 있다는 점을 고려할 때 놀라운 일이 아닐 수 있다. Carless 등(2011), Sadler(2010), Boud and Molloy(2013)가 제안한 의견과 같은 대중적인 피드백 아이디어의 기본 요소이기 때문에 개선 가능성이 높은 것은 고무적이다. 그러나 학생과 교직원이 개선에 대해 글을 쓸 때 표 2에 요약된 것처럼 개선 대상으로 간주하는 부분에서 현저한 차이가 있었다.
The vast majority of responses expressed that feedback is about improvement, with 90% of students and 89% of staff mentioning some sort of improvement as a purpose of feedback. For staff, an improvement purpose of feedback was ten times as prevalent as a grade justification purpose; for students, improvement was more than twenty times as prevalent as justification. Improvement was regarded by some participants as an ‘obvious’ purpose of feedback, which is perhaps unsurprising given the prevalence of this theme. It is heartening to see such a high prevalence for improvement, as it is the fundamental element of popular feedback ideas such as those proposed by Carless et al. (2011), Sadler (2010) and Boud and Molloy (2013). However, when students and staff wrote about improvement, there was a marked difference in what they regarded as the object of improvement, as outlined in Table 2.

참석자들이 가장 많이 응답한 내용은 피드백의 목적이 개선이지만 개선의 대상을 밝히지 않았다는 것이었다. 특정되지 않은 개선을 언급한 참여자들은 암묵적으로 개선의 일부 기본 초점을 가정하였거나 전반적인 일반적인 개선을 가정했을 수 있다.

The most common response by participants was that the purpose of feedback was improvement but they did not state an object of the improvement. Those participants who referred to unspecified improvement may have implicitly assumed some default focus of improvement or an overall, general improvement.

참가자들이 개선을 위해 특별히 초점을 맞춘다면, 그것은 보통 학생들의 공부, 이해의 향상 또는 학습이나 공부 전략의 향상이었다. Boud and Molloy(2013)의 연구를 바탕으로 Carless(2015)는 피드백을 '학습자가 다양한 출처의 정보를 이해하고 이를 활용하여 작업이나 학습 전략의 질을 높이는 대화 과정'으로 정의했다.(192쪽) 데이터의 작업 전략과 학습 전략 모두에 대한 개선이 널리 퍼진다는 것은 일부 교육자와 학생이 피드백의 목적에 대한 우리의 이해를 공유한다는 것을 시사한다. 또한 해티와 팀펄리(2007)가 피드백이 자율성 향상에 초점을 맞춰야 한다고 권고한 일부 측면이 교육자와 학생의 이해로 나타날 수 있음을 시사한다.
Where participants did specify a particular focus for improvement, it was usually improvements to students’ work, improvements in understanding, or improvements in learning or study strategies. Building on work by Boud and Molloy (2013), Carless (2015) defined feedback as ‘a dialogic process in which learners make sense of information from varied sources and use it to enhance the quality of their work or learning strategies.’ (p. 192). The prevalence of improvements to both work and learning strategies in the data suggests that some educators and students share our own understanding of the purpose of feedback. It also suggests that some aspects of Hattie and Timperley’s (2007) recommendation that feedback should focus on improving self-regulation may be represented in the understandings of educators and students.


평가 및 피드백 문헌은 최근 '평가적 판단evaluative judgement'으로 알려진 품질에 대한 학생들의 이해와 양질의 작업에 대한 의사 결정 능력 개발에 초점을 맞추고 있다. 소수의 참여자들은 평가 판단과 관련된 개선 사항(예: 자기 평가 개선 또는 기준 이해 향상)에 대해 썼다. 그러나, 중요한 능력으로서의 평가적 판단은 데이터 세트에 비중있는 존재는 아니었다. 교육자들과 학생들은 주로 일의 개선과 일의 생산 능력 향상에 초점을 맞추었고, 학생들의 업무 평가 능력 향상은 아니었다.

The assessment and feedback literature has recently increased its focus on the development of students’ understandings of quality and their ability to make decisions about quality work, known as ‘evaluative judgement’ (Tai et al. forthcoming). A small set of participants wrote about improvements related to evaluative judgement, such as improved self-evaluation or improved understanding of standards. However, evaluative judgement as an overarching capability was not a substantive presence in the data-set. Educators and students were predominantly focused on improvements to work, and an improvement in the ability to produce work, not on an improvement in the ability of students to evaluate work.

장점과 단점을 지적하는 것
Pointing out strengths and weaknesses

학생 작업의 강점과 약점을 식별하는 것은 때때로 개선을 위한 정보의 사용에 대한 언급 없이 참여자들에 의해 보고되었다. 이것은 피드백의 목적에 대한 [비교적 오래된 정보 중심의 이해]와 일치할 수 있는데, 피드백은 학생들에게 일의 좋은 점과 나쁜 점을 알려주는 것이지만, 학생들에게 그것을 개선하는 방법을 알려주거나 학생들에게 그 정보를 개선을 위해 사용하는 것에 대한 것이 아니다. 이 주제에 대한 전형적인 표현은 한 교육자에 의해 만들어졌는데, 한 교육자는 피드백의 목적이 '학생들이 그 과제에 대한 자신의 장단점이 어디에 있는지 알 수 있게 하는 것'이라고 말했다.

The identification of strengths and weaknesses in student work was sometimes reported by participants without mention of the use of that information for improvement. This perhaps corresponds to older, information-centric understandings of the purpose of feedback, such that feedback is about telling students what is good and bad about their work, but not about telling students how to improve it or students using the information for improvement. A typical expression of this theme was made by one educator, who said the purpose of feedback was ‘to allow the student to see where their strengths and weaknesses for that task lie.’

학생들의 기분을 좋게 만들고 동기를 부여하는 피드백
Feedback to motivate and make students feel good

소수의 직원과 소수의 학생들이 피드백을 위해 정서적인 목적을 언급했습니다. 이러한 참가자들에게 피드백의 목적 중 하나는 학생들이 일을 더 잘하도록 동기를 부여하고, 학생들의 노력을 인정하거나, 학생들을 격려하거나, 그들의 일에 대해 좋게 느끼도록 하는 것이었다. 한 학생은 그것이 피드백의 주된 목적은 아니지만, 정서적인 목적이 결과에 반영되지 않으면 상처를 입을 수 있다고 언급했다.
A small number of staff, and a smaller number of students, mentioned affective purposes for feedback. For these participants, one of the purposes of feedback was to motivate students to do better work, to acknowledge student effort, to encourage students, or to make them feel good about their work. One student noted that although it is not the primary purpose of feedback, if affective purposes are not attended to the results can be hurtful:

[피드백의 목적은] 주로 미래의 개선을 위한 것이지만, 또한 칭찬과 동기를 부여하고 노력한 시간과 노력을 긍정적으로 강화하는 것입니다. 평가자가 아무런 긍정도 없이 트집잡고 비판만 할 때 그것은 완전히 산산조각이 납니다.
[The purpose of feedback is] primarily to improve in future, but also to compliment and motivate and provide positive reinforcement to the effort and time put in. It’s absolutely shattering when the assessor does nothing but nit-pick and criticise with no positivity at all.

이것은 영향을 피드백의 목적으로서 고려하는 다소 일반적인 방법이었다.
This was a somewhat common way of considering affect as a purpose of feedback: as a secondary but essential purpose.

RQ2: 직원과 학생들은 무엇이 효과적인 피드백을 만든다고 생각하는가?
RQ2: What do staff and students think makes for effective feedback?

피드백의 목적보다 효과적인 피드백을 위해 무엇이 만들어지는지에 대해 직원과 학생이 더 의견이 갈렸습니다. 직원과 학생들이 피드백 경험을 효과적으로 만드는 것을 설명할 때, 눈에 띄는 주제는 의견의 내용, 피드백 설계의 측면 및 피드백 정보의 출처였다. 이러한 각 최상위 테마의 분포는 표 3에 나와 있습니다.
Staff and students diverged more on what makes for effective feedback than they did for the purpose of feedback. When staff and students were describing what made a feedback experience effective, the prominent themes were the content of the comments, aspects of the feedback design and the source of the feedback information. The prevalence of each of these top-level themes is shown in Table 3.

 

피드백 설계
Feedback design

앞에서 논의한 바와 같이, 피드백 문헌은 학생에게 더 나은 정보를 제공하는 것(예: 학생 업무에 대한 피드백 의견)의 초점에서 학생이 참여하는 과제와 활동의 설계(예: 학생이 두 번째 과제에서 피드백 의견을 사용하도록 요구하는 것)로 이동했다. 교육자 중 많은 수가 그들의 수업에서 피드백을 효과적으로 만드는 것으로 디자인을 언급했지만, 상대적으로 적은 수의 학생들이 디자인을 언급했습니다. 구체적인 특징은 표 4에 요약되어 있다.

As discussed earlier, the feedback literature has moved from a focus on providing better information to students (e.g. feedback comments on student work) to also consider designing the tasks and activities in which students engage (e.g. requiring students to use feedback comments from their first assignment in their second assignment). A slight majority of educators mentioned design as what made feedback in their classes effective; however, relatively few students mentioned design at all. The specific features are summarised in Table 4.

학생들과 비교했을 때, 더 많은 비율의 직원들이 디자인을 그들이 논의한 스스로 선택한 효과적인 피드백 사례를 뒷받침한다고 생각했다. 이것은 일반적으로 디자인에 적용되었고 피드백 설계의 거의 모든 특정 특징에 적용되었다. 이에 대한 한 가지 가능한 설명은 교육자들이 학생들보다 디자인에 대해 더 잘 알고 있을 수 있다는 것이다. 피드백 디자인은 교육자들에게 상당한 시간과 고려가 필요한 반면, 학생들은 디자인을 알아차리지 못하고 대신 디자인에서 만들어진 제품product에 초점을 맞출 수 있다(예: 코멘트).

Compared with students, a higher proportion of staff thought design was what supported the self-selected effective feedback instance they discussed. This was true for design in general, and for almost all specific features of feedback design. One possible explanation for this is that educators may be more aware of design than students; feedback design can take educators significant time and consideration, whereas students may not notice the design and instead focus on the products of the design (e.g. comments).

학생들은 종종 더 시기적절한 피드백을 원하는 것으로 간주되며(Li와 De Luca 2014), 교육기관에서는 특정 기간 내에 피드백 코멘트를 학생들에게 제공하도록 요구하는 것이 일반적이다. 피드백의 신속한 제공turnaround은 소수의 학생들, 그리고 10%의 교육자들에 의해 언급되었다. 그러나 피드백의 즉각적인 전환은 실제로 2차 관심사라고 주장할 수 있다. 시기적절성에 대한 가장 중요한 우려는 학생들이 다음 과제를 수행할 때 제때 피드백 정보를 이용할 수 있다는 것이다. 피드백 정보를 학생이 필요로 할 때 이용할 수 있는 형태의 적시성은 학생들에 의해 언급되지 않았고, 매우 적은 수의 직원들에 의해 언급되었다. 우리는 후속 작업을 위한 피드백 코멘트의 적시 제공 여부를 피드백이 전혀 발생하지 않는 근본적인 요구 사항으로 간주할 것이며, 이 테마의 상대적 희소성은 이 견해를 많은 학생과 교육자가 보유하고 있지 않거나, 애초에 언급할 가치가 없다고 간주함을 시사한다.
Students are often regarded as wanting more timely feedback (Li and De Luca 2014), and it is common for institutions to require feedback comments be provided to students within a particular timeframe. Prompt turnaround of feedback was mentioned by a very small number of students, and 10% of educators. However, we would argue that prompt turnaround of feedback is actually a second-order concern; the most important concern for timeliness is that feedback information is available to students in time for them to undertake the next task. Timeliness in the form of feedback information being available when the student needs it was not mentioned by students, and was mentioned by a very small number of staff. We would regard the availability of feedback comments in time to do subsequent work as a fundamental requirement for feedback to occur at all, and the relative scarcity of this theme suggests this view is either not held by many students and educators, or it is perhaps so taken-for-granted that it was not considered worth mentioning.


피드백의 또 다른 당연시되는 특징은 피드백이 반복적이거나 연결되어야 한다는 것이다. 학생들은 한 과제에서 다음 과제로 개선을 입증할 수 있는 방식으로 구성된 과제를 가져야 한다(Boud and Molloy 2013). 효과적인 피드백의 특징으로 이를 언급한 교육자와 학생은 거의 없었다. 학생들이 이 주제를 언급할 때, 그들은 피드백이 동일한 과제에 대한 반복적인 시도, 유사한 과제에 대한 반복적인 시도, 과제들을 조각으로 나누어 피드백이 산재된 것, 또는 개선된 제출에 대한 피드백에 따른 피드백에 의해 효과적으로 만들어졌다고 말했다. 그러나 상대적으로 적은 수의 학생들에 의해 언급되었음에도 불구하고, 그 학생들 중 몇 명은 그들의 특정한 피드백 사례를 효과적으로 만드는 유일한 특징으로 이것을 언급했다. 마찬가지로, 수업에서 효과적인 피드백의 특징으로 반복적이거나 연결된 과제를 언급한 많은 직원의 경우, 데이터에서 이 주제가 유일한 주제였다.

Another potentially taken for granted feature of feedback is that it needs to be iterative or connected; students need to have tasks structured in such a way that they can demonstrate their improvement from one task to the next (Boud and Molloy 2013). Few educators and fewer students mentioned this as a feature of effective feedback. Where students mentioned this theme, they said feedback was made effective either by repeated attempts at the same task, repeated attempts at similar tasks, tasks split into pieces and interspersed with feedback, or in-class feedback followed by feedback on an improved submission. However, despite being mentioned by relatively few students, several of those students mentioned this as the only feature that made their specific instance of feedback effective. Similarly, for many of the staff who mentioned iterative or connected tasks as a feature of effective feedback in their classes, this was the only theme found in their data.

일부 특정 피드백 설계 기능은 최근 몇 년 동안 피드백 문헌에서 인기를 끌었다. 특히 동료 피드백, 예시 및 피드백 조정의 사용 등이 그것이다. [동료 피드백의 거의 부재]는 우리의 맥락 내에서 동료 피드백을 일부 사용하는 것을 알고 있지만 학생과 교육자의 이러한 접근 방식에 대한 저항도 알고 있기 때문에 잠재적으로 놀랍지 않다. (Liu 및 Carless 2006; Tai 외 2016; Adachi, Tai 및 Dawson 2018) [모범적 접근법]의 부재는 교육자와 학생들이 피드백 프로세스의 일부로 보지 않는 모범적 접근법으로 설명될 수 있다. 모범적 접근법은 피드백 마크 2(Boud and Molloy 2013)와 같은 모델과 호환되지만, 일상적인 교육자나 학생의 피드백 정의에는 맞지 않을 수 있다. [피드백 조정]에 대한 코멘트가 부족한 것은 이 과정이 학생들에게 거의 보이지 않거나 상대적으로 니치 프락티스이기 때문일 수 있다. 

Some specific feedback design features have gained popularity in feedback literature over recent years; in particular peer feedback, the use of exemplars and feedback moderation. The near absence of peer feedback is potentially unsurprising, as although we are aware of some use of peer feedback within our contexts, we are also aware of resistance to these approaches from students and educators (Liu and Carless 2006; Tai et al. 2016; Adachi, Tai, and Dawson 2018). The absence of exemplar approaches may be explained by exemplars not being viewed by educators and students as part of feedback processes; although exemplars are compatible with models like Feedback Mark 2 (Boud and Molloy 2013), they may not fit within everyday educator or student definitions of feedback. We suspect the lack of comments about feedback moderation (the review of educator feedback comments by other educators, as described in Broadbent, Panadero, and Boud 2018) may be due to this process being largely nonvisible to students, or it being a relatively niche practice.

학생들이 가장 많이 언급한 설계 요소는 양식, 즉 피드백 정보가 제공되는 형태와 관련이 있습니다. 이러한 논평은 특정 양식의 인식된 수용성과 관련된 경향이 있었다. 즉, 

  • 루브릭스는 '정확한' 또는 '상세적인' 것으로 기록되었고, 
  • 디지털 녹음은 '이해하기 쉬운' 또는 더 많은 양이었으며, 
  • 대면 피드백은 개인화되고 철저했다. 

자동화된 소스(예: 형성적 객관식 퀴즈)에 대한 학생들의 의견 부족은 아마도 놀랍다. 그러나, 이것은 이러한 소스가 효과적이지 않다는 것을 의미하는 것이 아니다. 그것은 단지 그것들이 이러한 학생들에게 가장 효과적인 최근 피드백 경험의 일부가 아니었다는 것을 의미한다(또는 잠재적으로 피드백으로 간주되지 않는다).
The design elements most mentioned by students related to modalities – that is, the forms in which feedback information was provided. These comments tended to relate to the perceived affordances of particular modalities:

  • rubrics were noted as ‘accurate’ or ‘detailed’;
  • digital recordings were ‘easy to understand’ or more voluminous;
  • face-to-face feedback was personalised and thorough.

The lack of comments from students around automated sources (e.g. formative multiple-choice quizzes) is perhaps surprising. However, this does not imply these sources are ineffective; it merely implies they were not a part of the most effective recent feedback experience for these students (or, potentially, are not considered to be feedback as such).


본 논문에서 채택된 피드백의 개념화 내에서, 코멘트는 학생들이 적극적으로 사용할 때까지 '데이터를 물고 늘어지는 것'(Sadler 1989, 페이지 121)이다. 피드백을 효과적으로 만드는 것 중 직접적으로 [학생들의 역할]을 언급한 교육자와 학생은 매우 소수였다. 예를 들어, 한 교육자는 이러한 디자인의 측면이 피드백을 효과적으로 만드는 것이라고 말했다.

Within the conceptualisation of feedback adopted in this paper, comments are ‘dangling data’ (per Sadler 1989, p. 121) until they are actively used by students. A small number of educators and a very small number of students directly referred to students taking an active role as what had made feedback effective. For example, one educator said that this aspect of design was what made feedback effective:

학생들은 에세이 초안에 대해 매우 상세한 코멘트를 받았다. 그들은 최종 초안과 초안에 대한 의견을 설명/정당하게 하는 성찰적인 내용을 작성해야 했다.
Students were given very detailed comments on an essay draft. They were required to produce a final draft, and a reflective piece that explained/justified their response to comments on their draft.

 

피드백 루프를 완료하여 피드백의 자격을 갖추기 위해 피드백을 제정해야 한다는 것이 점점 더 받아들여질 수 있지만, 학생들을 피드백의 행위자로 만든 설계의 상대적 부족은 다소 놀라웠다. 또한, 이 테마의 데이터가 학생들이 활동적인 것을 반영했지만, 일반적으로 피드백 추구와 같은 대리인, 학생 주도적인 관행을 설명하지는 않았다.
While it may be increasingly accepted that feedback needs to be enacted in order to complete the feedback loop and thus qualify as feedback, the relative scarcity of designs that made students the actors in feedback was somewhat surprising. In addition, although data in this theme reflected students as active, it did not usually describe agentic, student-driven practices such as feedback-seeking.

피드백 코멘트
Feedback comments

학생 응답에서 확인된 가장 일반적인 최상위 테마는 [양질의 '피드백 정보']가 효과적인 피드백의 일부라는 것이었다. 이는 학생들이 가장 원하는 피드백의 특징 중 일부가 '개인적이고, 설명할 수 있고, 준거-참조적이고, 객관적이고, 추가 개선에 적용할 수 있다'는 점에 주목한 Li와 De Luca의 2014년 체계적 검토 결과와 일치한다(390쪽). 하지만, 우리는 상대적으로 적은 수의 교육자들이 피드백 정보의 질을 언급하는 것을 보고 놀랐습니다. 교육자와 학생이 언급한 피드백 코멘트의 구체적인 특징은 표 5에 요약되어 있다.

By far the most common top-level theme identified in student responses was that high-quality ‘feedback information’ is part of effective feedback. This aligns with findings from Li and De Luca’s (2014) systematic review that noted some of the features of feedback most desired by students were that it was ‘personal, explicable, criteria-referenced, objective, and applicable to further improvement’ (p. 390). However, we were surprised to see that the quality of feedback information was mentioned by proportionally fewer educators. The specific features of feedback comments noted by educators and students are summarised in Table 5.

 

코멘트에 대한 데이터에서 가장 두드러진 주제는 학생들은 '사용가능한' 코멘트를 효과적으로 보았다는 것이다. 본 논문에서 채택된 피드백의 개념화를 고려할 때, 그러한 진술은 근본적이거나 심지어 동조적으로 들릴 수 있다. 그러나 그 보급률을 감안할 때, 학생의 관점에서 효과적인 피드백에 있어 가장 일반적인 활성화 요소는 [개선되어야 할 사항을 전달하는 것]이었다는 것을 강조할 필요가 있다. 이것은 보통 학생들의 공부나 이해도 향상으로 표현되지만, 일부 학생들은 학습 전략 향상에 초점을 맞춘 피드백도 효과적이었다고 언급했다.
The most prominent theme in the data about comments is that students found usable comments effective. Given the conceptualisation of feedback adopted in this paper, such a statement may sound fundamental or even tautological. However, given its prevalence, it is worth emphasising that the most common active ingredient in effective feedback from the student perspective was communicating what needs to be improved. While this was usually expressed in terms of improvements to the students’ work or understanding, some students also mentioned that feedback which focused on improvements to learning strategy was also effective.


그 다음으로 학생들이 가장 많이 생각하는 코멘트 내용은 피드백이 상세하고 구체적이거나 철저해야 한다는 것이었다. '자세한 피드백'을 언급한 많은 학생들에게는, 이것이 피드백을 효과적으로 만드는 유일한 특징이었다. 관련되어있지만, 덜 흔한 주제는 피드백이 명확하고, 집중적이고, 정확해야 하며, 직접적이어야 한다는 것이었다. 
The next most prevalent theme for students in terms of the content of comments was that feedback needs to be detailed, specific or thorough. For many students who mentioned detail, it was the sole feature that made their instance of feedback effective. A related, less common theme was that feedback needed to be clear, focused, precise or direct.

일부 학생들은 자신의 피드백 경험이 개인화되거나 개인화됨으로써 효과적이라고 언급했다. 이러한 설명은 용어의 의미에 대한 설명 없이 '개인화'와 같은 용어를 자주 사용했기 때문에 분석하기 어려운 것으로 밝혀졌다. 이 설문 조사의 일부 응답을 명확히 하기 위해 수행된 탐색적 포커스 그룹에서 우리는 학생들에게 '개인화'라는 용어가 무엇을 의미하는지 물었고, 우리는 학생들이 평가자가 실제로 자신의 과제물을 읽고, 이에 대해 구체적으로 언급할 때 피드백을 개인화했다고 생각하는 일관된 응답을 받았다. 코호트의 작업에 대한 일반적인 피드백 정보를 받는 것에 반대된다. 이를 바탕으로, 우리는 개별화된 주제와 개인화된 주제를 분리할 수 없는 것으로 간주한다. 그러나 우리는 그것이 조사 데이터에서 독립적인 것으로 보았기 때문에 여기서 그것들을 구별되는 코드로 보고한다. 대조적으로, 일반적인 피드백 의견(개인화된 피드백의 반대)이 효과적이라는 것을 발견한 소수의 학생과 교직원도 있었다. 

Some students mentioned that their feedback experience was made effective by being personalised or individualised. These descriptions proved difficult to analyse as they often used a term like ‘personalised’ without explanation of what the term meant. In exploratory focus groups conducted to clarify some responses from this survey, we asked students (n = 28) what the term ‘personalised’ meant to them, and we received the consistent response that students thought feedback was personalised when they felt the assessor had actually read their work and was making comments specifically about it – as opposed to receiving generic feedback information about the cohort’s work. Based on this, we consider the individualised and personalised themes to be perhaps inseparable; however, we report them as distinct codes here because that was what we saw in the survey data as standalone. In contrast, there was also a small set of students and staff who found generic feedback comments (the opposite of personalised feedback) effective.

소수의 학생들은 자신의 작품에 대한 코멘트가 친절하고 긍정적이거나 건설적이거나 지지적이거나 격려적이거나 동기부여가 되는 광범위한 감성적인 특징 덕분에 최근의 효과적인 피드백 경험이 효과적이라고 말했다. 이 두 가지 주제를 논의한 소수의 학생들에게는 이 주제만이 언급되었지만, 대부분의 학생들에게는 이 주제들이 다른 특징들과 함께 언급되었다. 
A small number of students indicated that their recent effective feedback experience was made effective thanks to broadly affective features of the comments made about their work: the comments were nice, positive or constructive, or supportive, encouraging or motivating. For a substantial minority of students who discussed either of these themes it was the only theme mentioned; however, for most students these themes were mentioned alongside other features.


Li와 De Luca(2014)의 검토와 평가 판단에 대한 최근 작업(Tai 등)을 바탕으로, 우리는 스태프와 그보다 덜한 범위의 학생들이 표준이나 기준을 참조하는 의견을 가치 있게 여길 것으로 예상했다. 다른 질적 연구의 학생 참여자(예: Poulos와 Mahony 2008)는 종종 피드백의 효과적인 기준점으로 '준거criteria'
를 언급했다. 놀랍게도, 우리 연구에서 이러한 특징을 언급한 직원이나 학생은 매우 적었고, 피드백 설계에서 루빅 양식 하위 테마를 다시 확인했을 때도 표준이나 기준에 대한 명시적인 언급이 거의 없었다. 지속 가능한 피드백(Carless et al. 2011) 또는 피드백 마크 2(Boud and Molloy 2013)와 같은 정교한 피드백 모델은 [해당 표준에 대한 학생의 이해를 높이기 위해 표준을 명시적으로 참조하는 피드백]에 일부 의존한다. '기준Standard'이 많은 직원과 학생들에게 효과적인 피드백 경험의 특징이 아니었다는 것은 우려스럽다. 대부분의 학생들은 개선 방법을 식별한 코멘트를 언급했지만, 그러한 개선의 기준점을 언급한 학생은 거의 없었다.

Based on Li and De Luca’s (2014) review, as well as recent work on evaluative judgement (Tai et al. forthcoming), we expected that staff, and to a lesser extent students, would value comments that made reference to standards or criteria. Student participants in other qualitative studies (e.g. Poulos and Mahony 2008) often mentioned criteria as an effective reference point for feedback. To our surprise, very few staff or students in our study mentioned these features, and even when we re-checked the rubric modality subtheme from feedback design, there was little explicit mention of standards or criteria. Sophisticated feedback models like sustainable feedback (Carless et al. 2011) or Feedback Mark 2 (Boud and Molloy 2013) are dependent in some part on feedback that makes explicit reference to standards, in order to develop student understanding of those standards; it is concerning that standards were not a feature of effective feedback experiences for many staff and students. Most students mentioned comments that identified how to improve, but few mentioned the reference point for those improvements.

결론
Conclusion

본 연구의 연구 질문으로 돌아가서, 우리는 대체로 직원과 학생들이 피드백의 목적이 개선이라고 생각한다는 것을 발견했습니다.

  • 직원의 관점에서 피드백은 주로 타이밍, 방식, 연결된 작업과 같은 [설계 관련 문제]를 통해 효과적으로 만들어졌습니다.
  • 학생 입장에서 피드백은 [사용가능하고, 충분히 상세하고, 감정에 신경쓰고, 자신의 과제와 관련있는 듯 보이는 양질의 코멘트]일 때 효과적이었다.

Returning to the research questions for this study, we have found that, broadly speaking, staff and students think the purpose of feedback is improvement.

  • From the staff perspective, feedback was made effective primarily through design concerns like timing, modalities and connected tasks.
  • From the student perspective, feedback was made effective through high-quality comments which were usable, sufficiently detailed, attended to affect and appeared to be about the student’s own work.

그러나, 효과적인 피드백에 대해서 종종 서로 모순되는 듯한 의견도 있었다. 예를 들어, 많은 학생들이 자신에게 맞춘 피드백 정보를 효과적인 피드백 경험이라고 언급한 한 반면, 다른 학생들은 일반적인 의견을 높이 평가하였다. 여기서 직원과 학생들의 경험은 새들러(2010)가 피드백에 대한 4개의 리뷰 연구에서 관찰한 것과 일치하는 것으로 보인다.
However, we were also very interested to find other, sometimes seemingly incongruous experiences of effective feedback. For example, while many students had effective feedback experiences involving feedback information tailored to them, some others appreciated generic comments. Here, the experiences of staff and students seem to concur with what Sadler (2010) observed from four review studies on feedback:

피드백에 대해 알려진 것의 복잡성을 얼버무릴 위험을 무릅쓰고, 일반적인 그림은 형태, 시기 및 효과 사이의 관계가 복잡하고 가변적이라서, 마법의 공식이란 없다는 것이다. (Sadler 2010, 페이지 536)
At the risk of glossing over the complexities of what is known about feedback, the general picture is that the relationship between its form, timing and effectiveness is complex and variable, with no magic formulas. (Sadler 2010, p. 536)


교수는 [피드백 설계]에 초점을 맞추고, 학생은 [피드백 코멘트]에 초점을 맞추면 직원과 학생이 가장 쉽게 알아볼 수 있는 피드백 프로세스 요소를 반영할 수 있습니다. 피드백을 개선함에 있어 학생들이 학습에 도움이 되는 디자인 요소에 집중하고 성찰하는 것이 도움이 될 수 있다. 피드백 설계에 대한 더 나은 이해는 Winstone 등(2017)이 피드백에 대한 더 많은 에이전트 참여를 지지하는 것으로 발견한 '평가 문해력' 피드백 수신자 프로세스의 요소이다. 또한, '더 나은 피드백 코멘트'가 아니라 '더 나은 피드백 디자인'
으로 학생들의 요구가 바뀐다면, 피드백 방식을 바꾸기를 원하는 교육자들을 지원할 수 있습니다.

The staff focus on feedback designs and the student focus on feedback comments may reflect the elements of feedback processes that are most readily noticeable to staff and students. In improving feedback, it may be helpful for students to attend to and reflect on the design elements that support their learning. Better understandings of feedback designs are an element of the ‘assessment literacy’ feedback recipience process that Winstone et al. (2017) find to be supportive of more agentic engagement in feedback. In addition, student demand for better feedback designs – rather than just better feedback comments – may support educators who wish to change how they do feedback.

직원들과 학생들은 때때로 피드백에 대한 퇴행적인 관점을 가지고 있다는 편견이 있는데, 우리는 우리의 샘플 대부분이 그렇지 않다는 것을 알고 용기를 얻었습니다. 우리의 참가자들은 특히 그 목적에 관하여 우리가 상대적으로 긍정적이고 정교한 피드백의 관점을 가지고 있었다. 그러나 피드백에 대해 더 많이 생각하는 교육자와 학생들이 잠재적으로 주제에 대한 설문조사를 완료할 가능성이 더 높기 때문에 선택 편향의 결과일 수 있음을 경고한다. 
Staff and students are sometimes stereotyped as holding regressive views of feedback, and we were heartened to find that this was not the case with most of our sample. Our participants held what we would regard as relatively positive and sophisticated views of feedback, especially with respect to its purpose. However, we caution that this could be a result of selection bias, with educators and students who think more about feedback potentially more likely to complete a survey on the topic.


그러나 이러한 정교함에도 불구하고, 우리의 참여자들에 대한 최근 효과적인 피드백 경험에 포함되지 않은 피드백에 대한 몇 가지 주제들이 여전히 존재한다. 평가적 판단, 동료 피드백, 예시 및 피드백 조정은 연구자들에 의해 보유 메리트로 간주되는 개념 또는 실천이다(Liu와 Carless 2006; Carless와 Chan 2016; Broadbent, Panadero, Boud 2018; Tai 등). 그러나 참가자들에 의해 가장 효과적인 것으로 인식되거나 경험 또는 우선순위화되지 않았다. 

However, despite this sophistication there are still several frontier topics in feedback that have not featured in recent effective feedback experiences for our participants. Evaluative judgement, peer feedback, exemplars and feedback moderation are concepts or practices that are regarded as holding merit by researchers (Liu and Carless 2006; Carless and Chan 2016; Broadbent, Panadero, and Boud 2018; Tai et al. forthcoming), but either weren’t noticed, experienced or prioritised as most effective by our participants.

이 연구는 연구원과 학술 개발자들이 그들의 노력에 다시 집중할 수 있도록 도울 수 있다. 예를 들어, 피드백이 [학점을 정당화하는 것]이 아니라 [향상에 관한 것]이라는 것을 교육자와 학생들의 표본에 납득시키기 위한 개입은 거만한 것처럼 보일 수 있다. 그러나, 학생들에게 '코멘트의 질'에 초점을 맞추는 것에서 '그들이 그 코멘트로 무엇을 하는지'에 초점을 바꾸도록 하는 개입은 좋은 평가를 받을 수 있다. 왜냐하면, 학생들이 코멘트의 품질에 중점을 두었지만, 효과적인 코멘트의 가장 일반적으로 확인된 특징은 사용 가능하다는 것이었기 때문이다. 이 연구에서는 정서적, 관계적 문제가 크게 부각되지 않았다. 그러나, 우리는 다른 연구를 통해 이러한 문제들이 결정적이고 학생들의 다른 신체에 다르게 영향을 미친다는 것을 알고 있다. 이러한 교육자들과 학생들과의 정서적 문제에 대한 발전을 목표로 하는 것은 가치가 있을 수 있다.

This study may assist researchers and academic developers in refocusing their efforts. For example, interventions to convince this sample of educators and students that feedback is about improvement rather than justifying a grade may seem patronising. However, interventions to shift students from a focus on the quality of comments towards what they do with those comments may be well received, as, although there was a strong focus on the quality of comments, the most commonly identified feature of effective feedback comments was that they were usable. Affective and relational matters did not feature strongly in this study; however, we know from other research that these matters are crucial and impact different bodies of students differently (Telio, Ajjawi, and Regehr 2015; Ryan and Henderson forthcoming). It may be worthwhile to target development around affective matters with these educators and students.


본 연구의 분석은 피드백이 무엇인지에 대한 현대적인 이해에 바탕을 두고 있다. 즉, 피드백이란 [교육자가 설계하고 학습자가 수행하는 프로세스로서, 필연적으로 개선에 관한 것]이다. 피드백 연구 분야가 이러한 종류의 피드백 개념화를 적절하게 채택하려면, 이 프레임워크 내에서 해당 분야의 기본적인 발견과 가정을 재검토할 필요가 있을 수 있다. 비록 귀납적 접근법을 취했지만, 우리는 최근 몇 년간의 주요 개념적 주장을 무시할 수 없었다. 다른 귀납적 분석은 이 프레임 내에서 수행될 경우 피드백의 직원과 학생 경험에 대한 새로운 통찰력을 제공할 수 있다. 실용적인 관점에서도 제도적, 국가적 조사를 피드백의 보다 현대적이고 정교한 개념화로 옮겨갈 필요성이 크다(윈스톤과 피트 2017).

The analysis in this study was informed by a modern understanding of what feedback is: a process, designed by educators, undertaken by learners, which is necessarily about improvement. If the field of feedback research is to properly adopt this sort of conceptualisation of feedback, there may be a need to re-examine some of the fundamental findings and assumptions of the field within this framework. Although we took an inductive approach, we were unable to ignore key conceptual arguments from recent years; other inductive analyses may similarly yield new insights on the staff and student experience of feedback if conducted within this frame. From a practical perspective, there is also a great need to move institutional and national surveys toward more modern and sophisticated conceptualisations of feedback (Winstone and Pitt 2017).

그러나 우리의 현대적인 틀에도 불구하고, 우리는 몇몇 구식의 생각들이 여전히 널리 퍼져있다는 것을 발견했다. 예를 들어, 학생들은 피드백을 효과적으로 만든 것에 대해 '코멘트의 내용'에 압도적으로 집중했는데, 이는 언뜻 피드백 마크 2(Boud and Molloy 2013)와 같은 모델과 배치되는 것으로 보인다. 그러나 이에 비해 학생들의 관점에서 효과적인 코멘트의 가장 일반적인 특징은 '사용가능한 코멘트'였다. 
Despite our modern framing, however, we found that some old-fashioned ideas remain prevalent. For example, students had an overwhelming focus on the content of comments as what had made feedback effective, which at first glance appears to run counter to models like Feedback Mark 2 (Boud and Molloy 2013). However, balanced against this, the most common feature of comments that made them effective from the student perspective was that they were usable.

이 연구는 교육자들과 학생들이 때때로 그들이 인정받는 것보다 더 정교한 피드백의 관점을 가질 수 있다는 것을 증명했다. 그러나 효과적인 피드백을 만드는 것에 대한 직원과 학생의 차이에도 불구하고, 피드백 연구자로서 피드백의 목적과 효과성을 고려하는 참여자와 저자의 차이가 가장 극명했다. 학생과 교직원은 코멘트를 '제공'하는 데 있다고 계속 믿고 있었고, 이는 피드백이 개선으로 이어질거라는 (종종 모호한) 생각과 관련된다. 그러나 그러한 믿음은 우리가 양질의 입력(정보 제공)이 어떤 모습인지에 대한 명확한 감각을 가지고 있다는 생각을 지나치게 강조한다. 대신, 우리는 피드백이 [학생들이 그들의 일에 대한 정보로 무엇을 하는지], 그리고 [이것이 그들의 일과 학습 전략에 어떻게 입증 가능한 개선으로 귀결되는지]를 보고 판단해야 한다고 주장한다. 즉, 효과적인 피드백은 효과를 입증할 필요가 있습니다. 그렇게 함으로써 우리는 의견의 형태를 포함한 전체 피드백 시스템을 가장 잘 판단하고 그에 따라 조정할 수 있습니다.

This study has demonstrated that educators and students may hold more sophisticated views of feedback than they are sometimes credited with. But despite the differences between staff and students around what makes for effective feedback, the starkest differences were between the participants and what we the authors, as feedback researchers, regard as the purpose of feedback and what makes it effective. Students and staff continue to believe the purpose of feedback is largely to ‘provide’ comments with (often vague) notions that it leads to improvement. However, such beliefs overemphasise the idea that we have a clear sense of what quality input (provision of information) looks like. Instead, we argue that feedback should be judged by looking at what students do with information about their work, and how this results in demonstrable improvements to their work and learning strategies. In other words, effective feedback needs to demonstrate an effect. In doing so we can best judge, and adapt accordingly, the entire feedback system, including the form of comments.

 


 

Abstract

Since the early 2010s the literature has shifted to view feedback as a process that students do where they make sense of information about work they have done, and use it to improve the quality of their subsequent work. In this view, effective feedback needs to demonstrate effects. However, it is unclear if educators and students share this understanding of feedback. This paper reports a qualitative investigation of what educators and students think the purpose of feedback is, and what they think makes feedback effective. We administered a survey on feedback that was completed by 406 staff and 4514 students from two Australian universities. Inductive thematic analysis was conducted on data from a sample of 323 staff with assessment responsibilities and 400 students. Staff and students largely thought the purpose of feedback was improvement. With respect to what makes feedback effective, staff mostly discussed feedback design matters like timing, modalities and connected tasks. In contrast, students mostly wrote that high-quality feedback comments make feedback effective – especially comments that are usable, detailed, considerate of affect and personalised to the student’s own work. This study may assist researchers, educators and academic developers in refocusing their efforts in improving feedback.

 

전문직 정체형 형성을 촉진하기: 코칭 대 역량(Acad Med, 2020)

Coaching Versus Competency to Facilitate Professional Identity Formation
Adam P. Sawatsky, MD, MS, Brandon M. Huffman, MD, and Frederic W. Hafferty, PhD

 

 

"실패가 선택지에 없다면, 우리는 배움, 창의력, 혁신을 잊을 것이다." -브레네 브라운, 대어링 그레이트: 연약해지기 위한 용기가 우리가 살아가는 방식, 사랑, 부모, 리드1을 변화시키는 방법
“When failure is not an option we can forget about learning, creativity, and innovation.” ―Brené Brown, Daring Greatly: How the Courage to Be Vulnerable Transforms the Way We Live, Love, Parent, and Lead1

 

나는 매치데이에 레지던트 업무실에 들어갔다.* 내년에 주민들이 펠로우십을 어디로 향할지 기대가 컸다. 주민들이 환자 차트를 스캔하고 그날 경과 노트를 끝내자 컴퓨터가 줄지어 있는 병실은 아수라장이었다. 시니어 레지던트 중 한 명의 등을 두드렸어요. 그녀는 돌아서서 쭈뼛쭈뼛한 표정을 지으며 내 혀끝에서 질문을 하지 말라고 눈짓으로 부탁했다. 그날 그녀가 이미 너무도 고통스럽게 대답한 질문이었다. 나는 어쩔 수 없이 돌아서서 걸어갔다. 나는 나중에 그녀가 하위 전문 펠로우쉽에 매칭이 되지 않았다는 것을 알았다.
I entered the resident work room on Match Day.* I was excited to see where the residents were headed for fellowship next year. The room, lined with computers, was abuzz as residents scanned patient charts and finished progress notes for the day. I tapped one of the senior residents on the back. She turned and looked crestfallen, bidding me with her eyes not to ask the question on the tip of my tongue. It was a question that she had painfully answered too many times already that day. I obliged, turned, and walked away. I found out later that she had not matched into a subspecialty fellowship.

나는 레지던트 생활 동안 그녀와 정기적으로 함께 일했었다. 레지던트 연속성 클리닉에서 환자를 소개할 때, 그녀는 정기적으로 질문을 하고, 성장의 기회를 쉽게 인정하며, 진정으로 배움에 참여했습니다. 그녀는 주치의들에게 자신감과 결단력을 발휘하기 위해 그것을 피하기보다는 불확실성을 인정하고 포용하면서 환자들을 위한 사려 깊은 치료 계획을 제시했다. 어느 순간, 그녀는 제 사무실에 들러 환자 치료를 지연시킨 실수를 한 사건에 대해 논의했고, 개선을 위한 피드백을 구하고, 그 상황에서 비롯된 죄책감에 대해 논의했습니다. 시니어 레지던트가 되면서, 그녀는 1학년 레지던트들과 의대생들의 질문에 기꺼이 "모른다"고 대답하고 그들의 질문에 대한 답을 찾는 데 참여했습니다. 이러한 자질들이 의심할 여지 없이 그녀가 훌륭한 의사로 성장하도록 도왔지만, 저는 이러한 자질들을 진실로 보여주는 것이 펠로우 매치에서 그녀에게 상처를 입혔을지도 모른다고 생각하지 않을 수 없었습니다. 나는 그녀가 직업적 정체성의 발전과 그녀의 미래 경력에 실질적인 결과를 가져온 공식적인 평가 시스템 사이에 끼어있는 것을 보았다.

I had worked with her regularly during residency. When presenting patients in resident continuity clinic, she regularly asked questions, readily admitted opportunities for growth, and genuinely engaged in learning. She presented thoughtful treatment plans for her patients while acknowledging and embracing uncertainty, rather than avoiding it in an attempt to exude confidence and decisiveness to her attending physicians. At one point, she stopped into my office to discuss a case where she had made an error that delayed care for a patient, seeking feedback for improvement and discussing the guilt she experienced that resulted from the situation. As she became a senior resident, she was willing to say “I don’t know” to questions from first-year residents and medical students and engage with them in finding the answers to their questions. While these qualities had undoubtedly facilitated her growth into the excellent doctor that she was, I could not help but think that authentically presenting these same qualities may have hurt her in the fellowship match. I saw her as being caught between the development of her professional identity and a formal assessment system that had real consequences for her future career.

우리가 이렇게 접한 많은 이야기들은 의학 교육에서 직업적 정체성 형성의 복잡성에 대해 성찰해 볼 것을 간청했다. 이 관점에서는 의료 교육에서 직업적 정체성 형성의 이상적인 과정, 현재의 의료 교육 환경 내에서 이러한 이상적인 과정을 구현하기 위한 도전, 그리고 앞으로 나아갈 수 있는 잠재적인 단계들에 대해 논의할 것이다.

The many stories we have encountered like this implored us to reflect on the complexities of professional identity formation in medical education. In this Perspective, we will discuss the ideal process of professional identity formation in medical education, the challenge to implementing this ideal process within the current medical education environment, and potential steps forward.

직업적 가치, 행동, 포부를 개발하는 데 초점을 맞춘 직업적 정체성 형성은 의학 교육의 이상적인 목표이다. 자비스-셀링거와 동료들은 의학 교육에서 전문직 정체성 형성에 대한 논의를 "두 가지 수준에서 동시에 일어나는 적응적이고 발달적인 과정"이라고 강조함으로써 틀을 잡았다. 

  • (1) 개인의 수준에서, 그것은 그 사람의 심리적인 발달과 관련이 있다. 
  • (2) 집단적 수준에서, 공동체 활동에 참여하는 적절한 역할과 형태로 개인의 사회화를 수반한다. 

Professional identity formation, with its focus on the development of professional values, actions, and aspirations, is the ideal goal of medical education.2 Jarvis-Selinger and colleagues framed the discussion of professional identity formation in medical education by highlighting that it is “an adaptive, developmental process that happens simultaneously at two levels:

  • (1) at the level of the individual, which involves the psychological development of the person and
  • (2) at the collective level, which involves a socialization of the person into appropriate roles and forms of participation in the community’s work.”3 

크루스(Cruess)와 동료들은 인지 심리학(즉, 개인 정체성 형성의 단계)과 사회학(즉, 위치 학습과 실천 공동체에 대한 벵거의 연구)의 작업을 통합하여, 의사의 직업적 정체성을 형성하는 과정을 위한 모델을 제안했으며, 이에 따르면 기존의 개인적 정체성을 가진 비전문가는, 필요한 지식, 기술, 태도를 의식적으로 그리고 무의식적으로 습득함으로써, 전문직 공동체 내에서의 경험에 참여하고, 그 결과 의사처럼 생각하고, 행동하고, 느끼는 전문직이 된다.

Cruess and colleagues, incorporating work from cognitive psychology (i.e., Kegan’s stages of personal identity formation4) and sociology (i.e., Wenger’s work on situated learning and communities of practice5), have proposed a model for the process of shaping a physician’s professional identity, wherein a layperson with an existing personal identity engages in experiences within the professional community through conscious and unconscious acquisition of the knowledge, skills, and attitudes needed to become a professional who “think[s], act[s], and feel[s] like a physician.”6

Cruess와 동료들은 실천 공동체 이론이 의학교육의 기본 프레임워크가 될 수 있는지를 설명했다. 의학교육은 개인이 합법적인 주변 참여에서 전문직의 온전한 성원full membership으로 전환되는 과정을 상세히 설명하는 전문적 정체성 형성 과정임을 주장했다. 이 틀에서, 직업의 활동에 참여함으로써, 초보자가 받아들여지고 공동체의 일부가 되는 동시에 공동체의 공유된 이상을 떠맡게 된다.

Cruess and colleagues have further advocated that the theory of communities of practice could serve as a foundational framework for medical education, including curricular, instructional, and assessment practices, and the process of professional identity formation that details how an individual would move from legitimate peripheral participation to full membership in the profession.7 In this framework, by engaging in the activities of the profession, a novice is accepted and becomes part of the community, while taking on the shared ideals of community.

의료 교육에 대한 접근법과 직업적 정체성 형성 과정을 실천 공동체 이론에서 구체화하는 것은 학습자에게 시사하는 바가 있다. 예를 들어, 실천하는 공동체의 일원이 되기 위해 학습자들은 먼저 공동체의 활동에 참여하고, 공동체의 일원으로서 자신을 상상하고, 공동체의 가치에 맞춰야 하는 식별이라는 과정에 들어가야 한다. 학습자의 정체성은 실천공동체를 거쳐가면서 형성되며, 이는 종종 학습자의 [개인적 정체성], [전문직업적 정체성], [전문직 공동체] 사이의 긴장을 유발합니다.8 위의 이야기에서 이러한 긴장감은 학습자의 개인적·전문적 성장에 대한 욕구와 학습자의 성장과 발전을 위한 전문가 커뮤니티의 평가 활용, 그리고 다음 단계의 훈련으로 진출할 사람을 선택하는 수단에서 나타났다. 이러한 긴장 때문에, 전문적인 정체성 형성 과정에는 종종 실패의 경험과 강렬한 감정이 수반됩니다.8 

Framing the approach to medical education and the process of professional identity formation in the theory of communities of practice has implications for learners. For example, to become part of a community of practice, learners must first enter into a process called identification, which requires engaging in the activities of the community, imagining themselves as part of the community, and aligning with the values of the community.8 A learner’s identity is shaped as they move through the community of practice, which often generates tensions between the learner’s personal identity, professional identity, and professional community.8 In the story above, this tension was manifested in the learner’s desire for personal and professional growth and the professional community’s use of assessment for learner growth and development and as a means for choosing who to advance to the next level of training. Because of these tensions, the process of professional identity formation will often involve experiences of failure and intense emotions as learners navigate these tensions.8 

그렇다면, 의학 교육에서 전문적인 정체성 형성은 어떻게 함양되어야 하는가? 우리는 [코치]가 의학 교육에서 전문직 정체성 형성을 촉진하는 이상적인 수단을 제공한다고 믿는다. Watling과 LaDonna는 코칭에 대한 질적 연구를 통해 임상 코칭의 핵심 측면을 코치와 학습자가 공유하는 몇 가지 철학으로 개념화했습니다.

  • 인간의 잠재력을 끌어내기unlock 위한 목적을 가지고, 성장과 발전을 향한 상호 지향
  • 성찰을 가치있게 여기고, 성장을 지속하기 위한 지속적 성찰을 육성
  • 실패를 포용하고, 실패를 통한 학습의 가치를 지지

So, how should professional identity formation be fostered in medical education? Coaching, we believe, provides an ideal means for promoting professional identity formation in medical education. Through their qualitative work on coaching, Watling and LaDonna conceptualized the core aspects of clinical coaching as several philosophies that are shared by the coach and the learner:

  1. Mutual orientation toward growth and development, with the purpose of unlocking human potential,
  2. Valuing reflection and nurturing continuous reflection in the learner to maintain growth, and
  3. Embracing failure and endorsing the learning value of failure.10

 

코칭은 학습자가 직업적 정체성 형성에 큰 영향을 미치는 모든 요소인 역할 모델, 멘토, 경험, 성찰과 정기적으로 참여할 수 있는 기회를 제공한다. 코칭에는 상호 참여와 파트너십, 개인의 성장에 대한 헌신, 취약성을 수용하고, 학습자에게 "잘 실패"하도록 가르치는 의미가 담겨 있습니다. 이와 같이 코칭은 전문직 정체성 형성에 학습자를 참여시키기에 매우 적합합니다. 학습자는 자신의 개인적 정체성, 직업적 정체성, 직업적 공동체 사이에서 직면하는 긴장을 받아들이고 경험에 참여하고 의사로서 자신에게 필요한 지식, 기술 및 태도를 배우면서 이러한 긴장과 결과적 감정을 임상 코치와 함께 처리할 수 있습니다. 우리는 코칭이 의학 교육에서 전문적인 정체성 형성을 촉진하기 위한 이상적인 환경을 제공한다고 믿지만, 의학 교육에서 코칭을 구현하는 데는 어려움이 있다.

Coaching provides the opportunity for learners to regularly engage with role models, mentors, experiences, and reflection, all factors that have a large impact on professional identity formation.6,11 Coaching carries a connotation of mutual engagement and partnership, of dedication to the growth of an individual, and of embracing vulnerability and teaching the learner to “fail well.”10 As such, it is well suited for engaging learners in professional identity formation. Learners can embrace the tensions that they face between their personal identity, professional identity, and professional community and process these tensions and the resulting emotions with their clinical coaches as they engage with experiences and learn the knowledge, skills, and attitudes that are required of them as a physician. While, we believe, coaching provides an ideal setting to foster professional identity formation in medical education, there are challenges to implementing coaching in medical education.

전문직 정체성 형성을 긍정적으로 촉진하는 환경을 조성하기 위해서는 공동체의 모든 구성원이 다음을 하는 것이 중요하다.

  • 직업의 이상을 명확히 정의하고 
  • 학습자를 환영하는 공동체를 만들고, 
  • 학습자가 완전한 참여로 가는 여정에 참여시키고, 
  • 전문직 정체성 형성에 영향을 미치는 주요 요인들을 명확하게 다루는 것 

To create an environment that positively fosters professional identity formation, it is crucial that full members of the community

  • clearly define the ideals of the profession,
  • create a welcoming community for learners,
  • engage learners in their journey to full participation, and
  • “explicitly address the major factors influencing professional identity formation.”7 

의료계는 직업적 정체성 형성의 과정을 뒷받침하는 [직업적 이상professional ideals]을 명확히 정의하려고 노력해왔다. 예를 들어, 의료 교육의 원하는 결과는 특히 대학원 의료 교육 인증 위원회(ACGME)와 CanMEDS의 의사 역량 프레임워크에 의해 명시되었다.

The medical community has sought to clearly define the professional ideals that underpin the process of professional identity formation. For example, the desired outcomes of medical education have been specified, most notably by the Accreditation Council for Graduate Medical Education (ACGME)12 and CanMEDS13 physician competency frameworks.

이러한 역량 프레임워크는 의료 교육의 목표를 명시적으로 개괄적으로 설명하고, 전문가가 어떻게 보여야 하는지를 정의하며, 커리큘럼 개발 및 학습자 평가에 대한 지침을 제공한다. 프레임워크가 개략적으로 설명하는 역량은 학습자가 교육을 진행하면서 여러 번 정기적으로 평가하는 강력한 평가 프로그램을 위한 구조를 제공합니다. 예를 들어, ACGME는 거주자와 동료에게 투명한 성과요건을 제공하고, 전공의와 펠로우 평가에 대한 프레임워크를 제공하며, 인증기관과 인증위원회에 대한 보고를 개선하기 위해 이정표 평가를 도입하였다. 

These competency frameworks explicitly outline the goals of medical education, define what a professional should look like, and provide guidelines for curriculum development and learner assessment.14 The competencies the frameworks outline provide a structure for robust programs of assessment with multiple and regular assessments of learners as they progress through their training. For example, the ACGME instituted milestone assessments to provide transparent performance requirements for residents and fellows, provide a framework for resident and fellow assessments, and improve reporting to accrediting bodies and certification boards.15

직접적인 관찰과 공식적인 평가, 수많은 서면 평가와 함께 역량 기반 의료 교육(CBME)을 추진하는 것이 교육생들에게 어떤 영향을 미쳤는가? CBME의 이상은 전문적인 성장을 지원하기 위한 학습자에 대한 정기적인 저부담 평가입니다. 그럼에도 불구하고, 전공의는 모든 관찰을 평가로 보는 경향이 있으며, 자신의 성과에 대한 일부 및 모든 측면이 "공식 평가, [그들의] 영구 기록, 심지어 훈련이나 경력 증진"에 영향을 미칠 수 있다고 의심한다. 이와 같이, 영구적인 서면 평가와 결합할 경우 낮은 평가도 종종 거주자들에게 높은 이해 관계로 인식되어 교수진과의 상호작용을 형성한다.

How has this push for competency-based medical education (CBME), with increased direct observations and formal assessments and numerous written evaluations, affected trainees? The ideal of CBME is regular low-stakes programmatic assessments of learners that support professional growth.16 Nonetheless, residents tend to view all observation as assessment and suspect that any and all aspects of their performance have implications for “formal assessment, [their] permanent record, and even their training or career advancement.”17 As such, even low-stakes assessments, if coupled with permanent written evaluations, are often perceived by residents as high stakes and thus shape their interactions with faculty members.

실천 공동체의 렌즈는 의료계에 사회화 과정의 개요를 제공하지만, 이 난제를 설명하는 것은 불충분하다. 그 대신에, 공식적인 평가가 직업적 정체성 형성에 어떻게 영향을 미치는지 탐구하기 위한 더 확실한 렌즈를 제공할 수 있는 다른 이론들이 있다. Goffman은 그의 작품인 "일상생활에서의 자아 표현"에서 인상관리 이론을 제시한다. 여기에 따르면, [한 사람이 타인의 존재presence로 들어갈 때, 상황과 자신에게 기대되는 것을 이해하려 한 뒤, 그 정보를 그 상황 내의 다른 사람들로부터 특정한 반응을 얻을 수 있는 방식으로 행동하기 위해 사용]한다. 또한 [개인이 염두에 두고 있는 특정 목표나 그 목표를 갖게 된 동기에 상관없이, 다른 사람들의 행동, 특히 그에 대한 그들의 반응적인 대우responseive treatment를 통제하는 것이 더 이익에 부합할 것]이라고 썼다

While the communities of practice lens provides an overview of the process of socialization into the medical profession, it is inadequate to explain this conundrum. Alternatively, there are other theories that can provide a more telling lens for exploring how formal assessment influences professional identity formation. Goffman, in his work, The Presentation of Self in Everyday Life, presents his theory of impression management, which holds that when people enter into the presence of others, they seek to understand the situation and what is expected of them and use that information to act in a manner that will get certain responses from the other people within the situation.18 He writes that “regardless of the particular objective which the individual has in mind and of his motive for having this objective, it will be in his interests to control the conduct of the others, especially their responsive treatment of him.”18 

이러한 관점에서 [공식적인 평가]는 두 개의 팀(즉 수행자로서의 학습자 vs 그 수행에 대한 청중으로서의 교수진)으로 구성됩니다. 의학 교육에서 이러한 성과를 보여주는 몇 가지 예가 있다. 많은 과에서 전공의들은 관찰이 등급화되고 그 등급이 그들의 경력 발전에 영향을 미칠 것이라고 생각했기 때문에 관찰할 때 정기적으로 [공연staged a performance]을 했다. 외과 수련에서 레지던트들은 종종 그들의 주치의들을 위해 자신감과 결단력을 보여주기 위해 공연을 한다. 인상을 관리함으로써, 전공의들은 긍정적인 평판을 쌓고, 상사의 평가를 형성하고, 더 많은 배움의 기회를 얻기를 희망할 수 있다. 레지던트들은 또한 인상 관리를 잘 하지 못하면, 자신의 교육과 웰빙이 저해받고, 궁극적으로 환자 치료에도 영향을 미칠 수 있다는 것을 인식한다.19 우리의 경험에 따르면 레지던트들은 종종 그들의 진료에서 더 큰 자율성을 얻기 위한 자신감 있는 척 연기를 한다.

From this perspective, formal assessment sets up 2 teams—the learner as a performer and the faculty member as an audience to the learner’s performance.18 There are several examples of this performance in medical education. Residents across specialties at one institution regularly staged a performance when observed because that observation was graded and they thought that grade would have consequences for their career advancement.17 In surgical training, residents often put on a performance for their attending physicians, attempting to display confidence and decisiveness.19 By managing impressions, residents may hope to build a positive reputation, shape their supervisor’s evaluations, and attain more learning opportunities; residents may also recognize that impression management hinders their education and wellness, and ultimately may impact patient care.19 In our experience, based on our work in internal medicine, residents often stage a performance to portray confidence to gain greater autonomy in their practice.

또한, 고프만은 공연이 이뤄지는 프론트스테이지를 설명한다. 프론트 스테이지에서는 "활동의 일부 측면이 표현적으로 강조되고 육성된 인상을 훼손할 수 있는 다른 측면은 억압됩니다." 따라서 "억압된 사실들이 등장하는" 백스테이지도 있다. 백스테이지(Backstage)는 학습자가 자신의 프론트스테이지 공연을 연습하는 공간으로서, 불확실성이 자주 드러나고, 프론트스테이지 공연에서는 보여지지 않는 공간이다. 프론트 스테이지 공연의 예로는 레지던트가 주치의에게 라운드 방식으로 정식으로 사례발표를 하고, 백스테이지에서는 레지던트가 선배 레지던트와 사례발표를 통해 사건의 세부내용을 해결하는 것이다.

Further, Goffman describes the frontstage where the performance occurs; in the front stage, “some aspects of the activity are expressively accentuated and other aspects, which might discredit the fostered impression, are suppressed.”18 There is also the backstage “where the suppressed facts make an appearance.”18 The backstage is where learners can work out their frontstage performances; it is a place where their uncertainty is often manifested and can remain hidden from the frontstage performance. An example of a frontstage performance is a resident’s formal case presentation to the attending on rounds, while in the backstage, the resident had talked though the case with a senior resident to work out the details of the case.

이러한 이론적 틀을 고려할 때, 의료 교육자는 환자가 사례를 제시하고 상사와 임상 결정을 논의할 때 공식적인 평가가 레지던트의 전면 단계 성과를 어떻게 형성할 수 있는지 확인할 수 있다. 공식 평가의 보편적 특성, 역량의 명시적 목표, 서면 평가의 인지도가 높은 특성 때문에, 교수 앞에서 레지던트 수행의 목표는 종종 모든 평가 영역에서 역량을 보여주고 평가 점수를 낮출 수 있는 약점을 숨기는 것이다. 따라서 현재의 CBME 중심의 의료 교육 환경에서 [실천공동체의 게이트키퍼]는 무의식적으로 학습자가 인지한 약점을 숨기도록 동기를 부여할 수 있는 시스템을 구축하여, 결국 개인적, 직업적 정체성 형성에 부정적인 영향을 미치게 된다. 이 시스템에서 역량은 더 이상 훈련의 최종 목표로 여겨지지 않는다.
Given this theoretical framing, medical educators can see how formal assessment may shape the frontstage performance of residents when they present cases and discuss clinical decisions with their supervisors. Because of the ubiquitous nature of formal assessment, the stated goal of competence, and the perceived high-stakes nature of written evaluations, the goal of residents’ performances in front of faculty members is often to portray competence in all assessment domains and hide any weakness that might get them a lower evaluation score. Therefore, within the current CBME-driven medical education environment, community of practice gatekeepers unwittingly set up a system that may incentivize learners to hide their perceived weaknesses, negatively affecting their personal and professional identity formation, a system in which competency is no longer seen as the end goal of training but is the perceived goal of every observation encounter.

그렇다면 이것이 의학 교육계를 어떻게 만들까요? 학습 평가와 CBME 내 학습 평가 사이의 상계 긴장 속에서 의료 교육자들은 "전문적 가치, 행동 및 포부의 개발인 전문직 정체성 형성이 의료 교육의 주요 초점이 되어야 한다"고 진정으로 믿고 있는가? 만약 그렇다면, 의학 교육은 현재의 평가 모델을 전문적인 정체성 형성을 지원하는 모델로 어떻게 바꿀 수 있을까?
So where does this leave the medical education community? Within the countervailing tensions between assessment of learning and assessment for learning within CBME, do medical educators truly believe that “professional identity formation—the development of professional values, actions, and aspirations—should be a major focus of medical education”?2 If so, then how can medical education shift the current assessment model to one that supports professional identity formation?

[코칭 프레임워크]는

  • 학습자가 성장 기회가 있다고 느끼는 영역을 공개하고 해당 영역에 대한 피드백을 받을 수 있도록 합니다.
  • 이 모델에서 인상 관리는 기능 장애dysfunctional로 간주된다.
  • 코칭 모델은 취약성과 진정성을 지원하여, 학습자가 자신의 약점을 성장의 기회로 드러내도록 유도합니다. 
  • 코칭 모델 내 평가의 목표는 학습자와 코치가 진행 상황을 추적하고 코치가 성장에 대한 피드백을 제공하는 것입니다. 


The coaching framework

  • makes it acceptable for learners to reveal areas where they feel there is opportunity for growth and receive feedback on those areas.
  • Under this model, impression management is viewed as dysfunctional.
  • The coaching model supports vulnerability and authenticity, encouraging the learner to reveal their weaknesses as opportunities for growth.
  • The goal of assessment within a coaching model is for the learner and coach to track progress and for the coach to provide feedback for growth.

그럼에도 불구하고, 현재의 문화가 취약성에 편치 않고 전문적인 성장을 위한 코칭과 성과 평가를 위한 감독 사이의 경계가 정기적으로 모호하다는 점을 고려할 때, 코칭 모델을 뒷받침하는 철학은 의료계의 현재 커뮤니티 내에서 특히 실현하기 어려울 수 있다. 그리하여, 관찰의 목적을 코칭으로 보는 경우가 드물기 때문에 전공의들은 일상적으로 '관찰자의 비위를 맞추기' 위해 행동한다. 교육자들이 의료 교육에서 코칭을 수용하려면 문화 변화가 필요한데, 그 중에서도 의료 교육이 어떻게 공식적인 역량 평가를 구조화하는지 다룰 필요가 있을 것이다.

Nonetheless, the philosophies that underpin a coaching model may be particularly difficult to realize within medicine’s current community of practice, given that the current culture is not comfortable with vulnerability and that the lines between coaching for professional growth and supervision for assessment of performance are regularly blurred.10 As a consequence, residents routinely act to “please the observer” because they rarely see the purpose of observation as coaching.17 If educators are to embrace coaching in medical education, there needs to be a culture change, which, among other things, will need to address how medical education structures formal assessment of competency.

CBME는 의료 교육에 대한 명확한 결과를 제공했으며, 역량 평가는 훈련 프로그램이 졸업하는 의사가 의료 행위를 수행하는 데 필요한 역량을 가지고 있음을 인증 기관과 사회에 증명할 수 있도록 한다. 공식적인 평가의 이러한 기능은 대체될 수 없지만, 교육자들은 공식적 평가가 전문직 정체성 형성에 미치는 부정적인 영향을 최소화할 필요가 있다. 교육자들은 또한 훈련 초기에 핵심 역량과 성과에 집중하는 것이 타당할 수 있지만, 훈련을 통해 훈련자가 발전함에 따라 "역량은 점진적으로 '전인적 의사 정체성'을 향하여 통합된다"는 것을 깨달아야 한다.
CBME has provided clear outcomes for medical education, and competency assessment allows training programs to prove to accrediting bodies and society at large that the physicians being graduated have the necessary competencies to practice medicine. While this function of formal assessment cannot be replaced, educators need to minimize the negative impact that it has on professional identity formation. Educators also need to realize that focusing on core competencies and performance early in training may make sense, but as a trainee progresses through training, there is “a gradual integration of competencies into a more holistic identity as a physician.”3

위의 내용을 고려할 때, 의학 교육은 현재의 평가 모델을 전문적인 정체성 형성을 촉진하기 위한 모델로서 코칭을 지원하는 평가 모델로 어떻게 전환합니까? 코칭은 전문직 정체성 형성에 매우 적합하기 때문에, 교육자들은 코칭 관계를 구축할 수 있는 공간을 CBME 내에 마련해야 합니다. 교육자가 의료교육에서 코칭을 현실화하려면 코칭을 의료교육에 통합할 때 다음 질문을 고려해야 한다.
Given the above, how does medical education shift the current assessment model to one that supports coaching as a model for facilitating professional identity formation? As coaching is well suited for professional identity formation, educators need to make space within CBME for building coaching relationships. If educators want to make coaching a reality in medical education, they need to consider the following questions when integrating coaching into medical education:

  • 의학 교육은 어떻게 형성적 평가와 피드백을 공식적인 평가 과정으로부터 분리하며, 이로서 전문적인 정체성 형성을 위한 코칭을 위한 공간을 어떻게 제공합니까?
  • 레지던트 훈련 프로그램을 졸업하는 의사들이 역량이 있음을 보증하기 위해 실제로 얼마나 많은 공식적인 평가가 필요한가?
  • 예를 들어, 공식 평가의 목적이 개인의 역량에 대한 평가에서 모든 역량을 의학의 실천에 통합하는 전체론적 정체성의 코칭으로 어떻게 이동할 수 있는가?
  1. How does medical education separate formative assessment and feedback from the formal assessment process, therefore, allowing space for coaching for professional identity formation?
  2. How much formal assessment is actually necessary to ensure that the physicians graduating from residency training programs are competent?
  3. How might formal assessment look different across the continuum of medical education; for example, how might the purpose of formal assessment move from the assessment of individual competencies to the coaching of a holistic identity that integrates all the competencies into the practice of medicine?

 

마지막으로, 이러한 질문들은 제외하고 의료 교육이 실천 공동체로서 다루어야 할 더 큰 문제도 있다. 의학 교육자들은 [약점을 드러내는 것]과 [성장의 기회]가 의사의 사회화 과정 중 어디에 적합한지를 결정할 필요가 있다.

  • 교육자들은 취약점이 학습자의 지역사회 수용과 미래의 훈련 및 직업에 대한 권력을 쥐고 있는 교수진으로부터 숨겨져 직업적 정체성 형성에 부정적인 영향을 미치는 백스테이지로 계속 제한되기를 원합니까?
  • 아니면, 교육자들은 취약점을 프런트 스테이지 성과에 도입하여 전문직업적 이상ideal의 일부로 받아들이고, 교육생들의 전체적인 직업적 정체성의 성장과 발전을 허용하기를 원합니까?

Lastly, apart from these questions is the larger question that medical education needs to address as a community of practice. Medical educators need to decide where the demonstration of weaknesses and opportunities for growth fit into the process of socializing physicians.

  • Do educators want vulnerability to continue to be limited to the backstage, hidden from faculty members who hold power over learners’ acceptance into the community and their future training and jobs, and, therefore, negatively impacting professional identity formation?
  • Alternatively, do educators want to bring vulnerability into the frontstage performance, accepting it as part of the ideal of the profession, and allow it to shape the growth and development of a holistic professional identity in trainees?

의료교육에 코칭에 참여하기 위해서 교육자는 두 가지 중 하나를 선택해야 한다. 하나는 '기대'를 전환함으로써 전공의들이 안전하게 프론트 스테이지 공연의 일환으로 약점을 드러낼 수 있도록 하는 것이고, 다른 하나는 전공의에게 약점을 드러내고 성장에 대한 피드백을 구할 수 있는 적절한 백스테이지 공간을 제공하는 것이다. 의학 교육자는 지적이고 감정적인 솔직함을 통해 취약성을 모델링할 수 있으며, 취약성에 대한 공간, 공개 토론, 코칭, 궁극적으로는 이상에 가장 가까운 직업적 정체성 형성을 허용하는 학습 환경을 조성합니다. 이런 유형의 학습환경은 역량의 성과를 내세우고 약점을 숨기는 것이 아니라 전공의들이 자신의 진정한 모습을 그려내고 코칭을 통해 형성적 피드백을 받으며 자신의 경험에 터놓고 참여할 수 있는 공간을 제공할 것이다.

To engage with coaching in medical education, educators either need to shift expectations and allow residents to safely reveal weakness as part of their frontstage performance or provide residents with adequate backstage space to reveal their weaknesses and seek feedback for growth. Medical educators can role model vulnerability through intellectual20 and emotional21 candor, creating a learning environment that allows space for vulnerability, open discussion, coaching, and, ultimately, the professional identity formation that is closest to the ideal. This type of learning environment would provide space where residents can engage with their experiences openly, portraying their authentic self and receiving formative feedback through coaching, instead of putting on a performance of competence and hiding their weaknesses.

펠로우십 매치의 날에 만난 레지던트로 돌아와 보니 누군가가 공식적인 평가의 현실에 사로잡혀 있었고, 결국 그녀가 원하는 실천 공동체로부터 불이익을 받는 것을 보았다. 그녀는 코치로서 교수진에게 접근했지만 안타깝게도 코치와 어울리지 않는 평가 모델에 묶여 있었다. 저는 그녀가 취약성을 배움과 성장의 기회로 받아들이기 때문에 궁극적으로 잘 해낼 것이라고 믿습니다. 그럼에도 불구하고 현재의 역량 위주의 형식평가제도가 어떻게 지금의 학습환경에서 자신의 약점을 포용할 용기가 있는 학습자뿐만 아니라 자신의 약점을 숨기기로 선택한 학습자들에게 계속 불이익을 줄지 걱정이다.

Returning to the resident I ran into that fellowship Match Day, I saw someone caught up in the realities of formal assessment and ultimately disadvantaged by her desired community of practice because she embraced vulnerability. She approached her faculty members as coaches but was unfortunately tied to an assessment model that was incongruous with coaching. I believe that she ultimately will do well because she embraces vulnerability as an opportunity for learning and growth. Nonetheless, I worry about how the current competency-based formal assessment system may continue to disadvantage learners like her who have the courage to embrace their weaknesses in the current learning environment as well as those learners who choose to hide their weaknesses from those that could help them grow.


 

Acad Med. 2020 Oct;95(10):1511-1514.

 doi: 10.1097/ACM.0000000000003144.

Coaching Versus Competency to Facilitate Professional Identity Formation

Affiliations collapse

Affiliations

1A.P. Sawatsky is assistant professor of medicine, Division of General Internal Medicine, Mayo Clinic, Rochester, Minnesota; ORCID: http://orcid.org/0000-0003-4050-7984.

2B.M. Huffman was associate consultant, Division of Hospital Internal Medicine, Mayo Clinic, Rochester, Minnesota, at the time of writing. He is now chief resident, Department of Medicine, Mayo Clinic, Rochester, Minnesota.

3F.W. Hafferty is professor of medical education, Program in Professionalism and Values, Mayo Clinic, Rochester, Minnesota.

PMID: 31895702

DOI: 10.1097/ACM.0000000000003144

Abstract

Professional identity formation, with its focus on the development of professional values, actions, and aspirations, is the ideal goal of medical education. Medicine is a community of practice, and medical education is a socialization process by which novice trainees become full community members. The authors believe coaching provides an ideal means for promoting this socialization process to develop a learner's identity as they engage in the community. Coaching involves an orientation toward growth and development, valuing reflection and nurturing continuous reflection, and embracing failure as an opportunity for learning. However, there are challenges to implementing coaching in medical education. Competency-based medical education has provided clear outcomes (competencies) for medical education and programs of assessment around these competencies. Yet, there is a tension in medical training between professional identity formation (the process of socialization into the profession) and the formal assessment process. The ideal of multiple low-stakes assessments and written evaluations, intended as formative assessments, are perceived by residents as high-stakes evaluations with significant consequences for their future. The authors present a resident story that highlights this tension. They outline Goffman's theory of impression management, postulating that medicine's assessment system encourages residents to stage a performance for evaluators that displays their competence and conceals their perceived weaknesses. This performance hinders coaching and the formation of an appropriate professional identity. Coaching, the authors believe, provides a model that aligns assessment and professional identity formation. Given the challenges to implementing coaching in medical education, the authors propose several questions to contemplate when integrating coaching into medical education to facilitate the goal of professional identity formation.

 

피드백과 코칭(Eur J Pediatr, 2022)

Feedback and coaching
Adelle Atkinson1 & Christopher J. Watling2 & Paul L. P. Brand3,4,5

 

 

임상교육 시나리오
Clinical teaching scenario

소아과 레지던트 1년차 제니스(Janice)를 지도하고 있다. 제니스는 11개월 영아에 대한 평가를 방금 마쳤습니다. 잠재적인 총운동 발달 지연에 대한 우려로요. 만남이 끝난 후, 재니스는 잠시 시간을 내어 정리하고 당신에게 사건을 발표합니다. 독자 분이 첫 번째로 알아차린 것은, 그녀의 사례 발표가 총운동 발달에 초점을 맞추고 있지만, 그녀는 부모에게 아기의 다른 중요한 발달 영역의 이정표에 대해 물어보지 않았고, 그것들은 검사의 일부로 포함되지 않았다는 것입니다. 당신은 제니스에 대한 이전 경험이 없습니다. 당신은 제니스와 이 환자에 대한 그녀의 평가에 대해 어떻게 피드백 대화를 나눌 건가요?
You are supervising Janice, a 1st year pediatric resident, who has just completed her evaluation of an 11-month old infant referred for concerns about potential gross motor developmental delay. After the encounter, Janice takes a moment to organize herself and then presents the case to you. The first thing you notice is that while her case presentation does focus on gross motor development, she did not ask the parents about milestones in the infant’s other important developmental domains and they were not included as part of her examination. You have no previous experience with Janice. How do you approach the feedback conversation which you are going to have with Janice about her evaluation of this patient?

정의들
Definitions

피드백과 코칭은 임상 학습을 가속화할 수 있다. 이들의 잠재력이 실현되기 위해서는 우리가 무엇을 왜 하고 있는지에 대해 명확히 해야 합니다(표 1).

  • 전통적으로 피드백은 [학습자가 원하는 기준과 실제 성과를 비교하고, 그 차이를 개선하기 위한 조치를 취할 수 있는 정보]로 정의되어 왔다[1, 2].
  • 피드백에 대한 보다 최근의 정의는 [피드백의 근본적으로 사회적인 성격을 강조]하고자, "학습자(및 교육자의)의 성장 지원, 행동 또는 존재being에 관한 사고방식에 도전할 목적으로, 안전하고 상호 존중되는 관계의 맥락에서, 역동적이며 공동-구성적인 상호작용"으로 규정한다. [3].

이 미묘한 정의는 피드백을 단순한 거래가 아닌 대화로 생각하도록 장려합니다.
Used thoughtfully and with intent, feedback and coaching can accelerate clinical learning. For their potential to be realized, we need to be clear about what we are doing and why (Table 1).

  • Traditionally, feedback has been defined as information that allows learners to compare their actual performance with that of a standard to which they aspire, and that enables them to take action to remedy the gap between the two [12].
  • More recent definitions of feedback highlight its fundamentally social nature, framing it as a “dynamic and co-constructive interaction in the context of a safe and mutually respectful relationship for the purpose of challenging a learner’s (and educator’s) ways of thinking, acting or being to support growth” [3].

This more nuanced definition encourages us to think of feedback as a conversation and not a simple transaction.


표 1 피드백, 코칭 및 평가에 대한 정의
Table 1 Definitions of feedback, coaching, and assessment

피드백:
- 내용: 학습자가 자신의 실제 성과를 자신이 열망하는 기준과 비교할 수 있는 정보이며, 이를 통해 학습자는 이 차이를 개선하기 위한 조치를 취할 수 있습니다.
- 관계(Relations): 안전하고 상호 존중되는 관계의 맥락에서 이뤄지는, 역동적이고 공동구성적 상호작용으로, 학습자(또는 교수자)의 사고, 행동, 존재 방식에 도전challenge하려는 목적이 있다.

Feedback:
- Content: information allowing learners to compare their actual performance with that of a standard to which they aspire, and that enables them to take action to remedy the gap between the two.
- Relationship: dynamic and co-constructive interaction in the context of a safe andmutually respectful relationship for the purpose of challenging a learner’s (and educator’s) ways of thinking, acting, or being to support growth.

코칭: 학습, 성과향상, 개인적 또는 전문적 성장을 강조하여 학습자가 잠재력을 실현할 수 있도록 돕는 교육철학입니다.
- 일상적 코칭: 학습자와 감독자 간의 일상적인 코칭 상호작용이 학습자의 성과 향상으로 이어짐 
- 지속적 코칭: 학습자와 멘토 간의 종적 관계, 학습자의 성과에 대한 성찰 및 새로운 학습 목표 수립 촉진
Coaching: An educational philosophy dedicated to helping learners to realize their potential, emphasizing learning, performance improvement, and personal or professional growth.
- Coaching in the moment: daily coaching interactions between learner and supervisor leading to the learner’s performance improvement 
- Coaching over time: longitudinal relationship between a learner and a mentor, promoting the learner’s reflection on their performance and formulation of new learning objectives

평가: 학습자 성과에 대한 평가
- 학습을 위한 평가: 학습자가 지식과 스킬을 미세 조정하는 데 도움이 되는 대화를 유도하기 위한 평가의 형성적 활용
- 학습의 평가: 학습자의 성과를 표준과 비교하여 종합 판단

Assessment: A judgment of the quality of a learner’s performance
- Assessment for learning: formative use of assessment to fuel conversations that help learners to fine-tune knowledge and skills
- Assessment of learning: summative judgment of a learner’s performance compared against a standard

성장 마인드: 암묵적인 마음가짐이 두 극단과 함께 연속체를 따라 위치한다고 제안하는 동기 이론. 연속체의 한쪽 끝에는 지성과 능력이 정적이라고 믿는 고정된 사고방식을 가진 사람들이 있고, 이들에게 재능은 타고난 것이다. 성장형 마음가짐을 가진 사람들은 이러한 특성들이 유연하고 노력이 성공을 이끌 수 있다고 믿는다. 개인으로서, 우리의 사고방식은 나이와 맥락을 포함한 여러 요소에 따라 연속체에 따라 달라질 수 있다[33]. 

Growth mindset: A motivation theory proposing that implicit mindsets are situated along a continuum with two extremes. At one end of the continuum are individuals with a fixed mindset who believe intelligence and ability are static, and talent is something you are born with. Individuals with a growth mindset believe these traits are malleable and effort can lead to success. As individuals, our mindset can vary along the continuum depending on a number of factors including age and context [33]. 


코칭과 피드백은 서로 얽혀있기 때문에 서로 어떤 관계가 있는지 고려하는 것이 유용하다.

  • [피드백]이 교육 도구인 반면,
  • [코칭]은 학습자가 잠재력을 실현할 수 있도록 돕는 데 전념하는 교육 철학입니다(상자 1)[4].

코칭은 학습, 성과 향상, 개인적 또는 전문적 성장을 강조합니다[5]. 코치는 피드백을 이 업trade의 필수적인 도구로 사용하지만, 코치의 '업'이란 직접적 관찰, 목표 설정, 성찰 습관 등 다른 여러 요소들을 포함한다. 의학 교육에서 코치와 학습자 사이의 관계는 본질적으로 위계적이어서 학습자가 의심이나 우려를 드러낼 수 있는 잠재적인 장벽이 된다. 이 위계를 줄이는 것은 쉬운 일이 아닙니다. 신뢰를 기반으로 한 종적 코칭-학습자 관계는 유의미한 성과 개선에 필요한 취약성이 학습자에게 더 안전하다고 느껴지도록 하는 데 도움이 될 수 있다[4].
Coaching and feedback intertwine, so it is useful to consider how they relate to one another. While feedback is an educational tool, coaching is an educational philosophy dedicated to helping learners to realize their potential (box 1) [4]. Coaching emphasizes learning, performance improvement, and personal or professional growth [5]. Coaches use feedback as an essential tool of the trade, but their work encompasses a number of other elements, including direct observation, targeted goal-setting, and habits of reflection. In medical education, the relationships between coaches and learners are inherently hierarchical, which is a potential barrier for learners to show doubts or concerns. Reducing this hierarchy is no easy feat. Longitudinal coach-learner relationships built on trust can help to ensure that the vulnerability required for meaningful performance improvements feels safer for learners [4].

피드백? 판단?
Feedback or judgment?

평가는 때때로 코칭의 적으로 여겨지기도 하지만, 실제로 필수적인 파트너입니다. 평가란 학습자의 수행의 질을 판단하는 것이다(표 1). 학습자의 장점과 단점에 대한 건전한 이해는 건설적인 피드백과 효과적인 코칭 모두에 필요한 기초입니다. 그러나 피드백과 코칭에 참여할 때 평가의 의도를 명확하게 파악해야 합니다. 평가는 교육생이 스킬(피드백 및 코칭)을 미세 조정하는 데 도움이 되는 대화를 촉진하기 위해 형성적으로 사용될 수 있지만, 평가는 또한 교육생을 표준과 비교하는 더 중요한 판단을 하기 위해 총괄적으로 사용될 수 있다[7]. 사회는 의료 교육계가 이러한 최소한의 기준을 달성하지 못한 교육생이 의료 개업의 면허를 취득하지 못하도록 보장하기를 기대하기 때문에 교육생을 미래의 의사 성과에 대한 최소 허용 수준과 비교하는 것이 중요하다[8, 9]. 학습 기간 종료 시 이 공식적인 고위험 판단("학습의 평가")은 이 시리즈의 별도 논문에서 다루어질 것이다. 이번 기사에서는 교육생들이 주니어 의사로서 지식과 기술, 역량 향상을 위해 임상감독관이 피드백과 코칭을 어떻게 제공할 수 있는지('학습을 위한 평가') 중점적으로 살펴본다. 이러한 구별의 중요성은 25년 이상 인식되어 왔지만[10년] 피드백과 합산 판단의 혼합은 여전히 일반적이다[11년]. 이는 피드백의 유용성과 효과를 감소시키기 때문에 바람직하지 않습니다 [12, 13].

Assessment has sometimes been positioned as the enemy of coaching [6], but in fact is an essential partner. To assess is to judge the quality of a learner’s performance (Table 1). A sound understanding of a learner’s strengths and weaknesses is a necessary foundation for both constructive feedback and effective coaching. But we must remain clear-eyed about the intent of our assessment when engaging in feedback and coaching. While assessment may be used formatively to fuel conversations that help trainees fine-tune skills (feedback and coaching), assessment may also be used summatively, to make more consequential judgments that compare trainees against a standard [7]. Comparing trainees against the minimally acceptable level for future doctor performance is important because society expects the medical education community to ensure that trainees who fail to attain these minimal standards are not allowed to obtain a license to practice medicine [8, 9]. This formal high-stakes judgment at the end of a learning period (“assessment of learning”) will be addressed in a separate paper in this series. In the present article, we will focus on how clinical supervisors can provide feedback and coaching to help trainees improve their knowledge, skills, and competence as a junior doctor (“assessment for learning”). Although the importance of making this distinction has been recognized for over 25 years [10], mixing up feedback and summative judgments remains common [11]. This is undesirable because it reduces the usefulness and effectiveness of feedback [12, 13].


https://link.springer.com/journal/431/topicalCollection/AC_e314ed3eec7624b8b754c8cc17194a18


효과적인 피드백 조건
Conditions for effective feedback

피드백이 매우 효과적일 수 있다는 좋은 증거가 있다[14,15,16]. 의료 교육의 모든 단계에서 학습자가 환자와의 만남에서 경험적 학습 기회를 최대한 활용할 수 있도록 지도자의 피드백을 받는다. 학습자는 건설적인 피드백을 바탕으로 행동을 일관되게 변화시킬 의지와 능력이 있으며, 이를 통해 감독 없이 독립적으로 실습할 수 있습니다[17]. 그러나 피드백은 특정 조건 (표 2)을 충족하는 경우에만 유효할 것으로 예상할 수 있습니다 [16, 18, 19].
There is good evidence that feedback can be highly effective [14,15,16]. Feedback from their supervisors helps learners at all stages of medical education to make the most of the experiential learning opportunities in encounters with patients. Learners are willing and able to change their behavior consistently based on constructive feedback, and this helps them to work towards practicing independently, without supervision [17]. However, feedback can only be expected to be effective if it meets certain conditions (Table 2) [16, 18, 19].

 

피드백은 코칭의 주요 기술적 요소이며, 구체적인 학습 상황에 대한 목적적인 성찰을 위한 순간적 도구momentary tool입니다.

  • 피드백은 학습자가 수행한 과제를 목표로, 건설적이고 실행 가능한 방식으로 전달된다면 학습자의 행동 변화에 가장 큰 도움이 될 것입니다. 
  • 피드백은 소문이나 간접 정보가 아닌 관찰된 행동에 관한 것이어야 한다[20]. 
  • 학습자는 신뢰할 수 있는 출처에서 피드백이 오는 경우 피드백을 더 잘 수용합니다[14]. 
  • [감독자로부터 학습자에게 일방적인 정보 전달] 대신 [학습자와 감독자 사이의 대화]로 피드백을 제시하는 것은 인간 관계의 사회적, 정서적 복잡성을 인정하고, 제공된 피드백을 수용하고 이에 따라 행동학 만든다[21]. 
  • 관찰된 작업의 핵심 지점 1~3개로 피드백 양을 제한하는 방법도 중요하다.

Feedback is the main technical component of coaching, a momentary tool for purposeful reflection on a concrete learning situation.

  • Feedback is most likely to help learners change their behavior if it is delivered in a constructive and actionable fashion, aimed at the task that the learner has performed.
  • Feedback should be about observed behaviors, not about rumors or indirect information [20].
  • Learners are more receptive to feedback if it comes from a source that they perceive as credible [14].
  • Presenting feedback in a dialogue between learner and supervisor instead of a one-way transfer of information from supervisor to learner acknowledges the social and emotional intricacies of human relationships, which also supports acceptance of the feedback provided, and acting upon it [21].
  • This is also supported by limiting the amount of feedback to one to three key points of the observed task.

효과적인 피드백과 비효과적인 피드백의 핵심적인 차이는 그 목적에 있다. 

  • 의과대학생과 레지던트는 피드백이 성과에 대한 총괄적 판단으로 제시되거나 인식되는 경우 피드백을 덜 수용한다[13]. 그들은 단지 시험을 통과하고 잘했다고 확신하기를 원하며, 이러한 고부담 평가와 관련된 피드백을 무시하거나 폐기하는 경향이 있다[22, 23]. 직장 기반 평가를 고득점 시험으로 인식하는 전공의들은 긍정적인 피드백만을 추구하는 "게임play the game" 경향이 있다(즉, 자신이 잘했다고 생각하는 과제나 절차에 대한 피드백만 요청). [22, 24] 전공의는 유능해보이는 이미지로 보이려고 이 전략 및 기타 인상 관리 전략을 사용할 수 있다[24, 25].
  • 반대로, 의대생과 레지던트들가 피드백을 저부담의 학습 기회로 여길 경우 피드백에 상당히 더 수용적이다. 특히, 임상 기술 향상을 목표로 시간이 지남에 따라 반복적인 코칭으로 구성될 경우, 숙련되고 헌신적인 감독자의 건설적인 피드백이 학습자에게 받아들여지고 특히 작업 관계에서 발전한 관계 배경에 반하여 행동할 가능성이 높다[26].

The key distinction between effective and ineffective feedback lies in its aim. Medical students and residents are less receptive to feedback if it is presented or perceived as a summative judgment of their performance [13].

  • They just want to pass the test and be reassured that they did a good job, and tend to ignore or discard the feedback associated with these high-stakes assessments [2223]. Residents who perceive workplace-based assessments as high-stakes exams tend to “play the game” of seeking only positive feedback (i.e., only ask for feedback on a task or procedure they think they did well) [2224]. Residents may employ this and other impression management strategies to portray an image of competence [2425].
  • Conversely, medical students and residents are considerably more receptive to feedback when it is presented as a low-stakes learning opportunity. Particularly, when it is framed as repeated coaching over time aimed at improving clinical skills, constructive feedback from skilled and dedicated supervisors is likely to be accepted by the learners and acted upon, especially against the background of established rapport that evolves from the working relationship [26].

이는 운전 교습 및 운전면허 시험과 같습니다. 사람들은 운전 교습 중에는 피드백을 수용하지만(학습 모드에 있음) 시험에 합격하고 운전면허(시험 모드)를 따려는 경우에는 그렇지 않습니다[13]. 당신의 의대생과 레지던트들이 당신의 의견을 받아들여 행동하기를 원한다면, 피드백은, 학습자를 판단하는 것이 아니라, 당신이 그곳에 도움을 주기 위해 있으며, 저부담의 학습 기회로 제시하라. 이를 위해 관리자는 시간과 노력을 들여 코칭 세션의 목적에 동의하고, 학습자를 관찰하며, 학습자의 성찰을 장려하고, 피드백을 논의해야 합니다. 이는 상호 신뢰와 존중을 기반으로 한 발전하는 건설적인 업무 관계로 인해 보다 쉽고 시간이 적게 소요됩니다.
It is like driving lessons and driving tests: people are receptive to feedback during driving lessons (they are in learning mode) but not during the high-stakes driving test when they just want to pass the test and get their driver’s license (exam mode) [13]. If you want your medical students and residents to accept and act upon your feedback, present it as a low-stakes learning opportunity in which you are there to support and help, not judge, the learner. This requires the supervisor to take the time and the effort to agree on the aim of the coaching session, to observe the learner, encourage reflection by the learner, and discuss the feedback. This becomes easier and less time-consuming with an evolving constructive working relationship built on mutual trust and respect.

직무 기반 코칭에서 피드백 활용
Using feedback in workplace-based coaching

저부담의 환경에서 형성적 피드백과 코칭의 개념(그리고 학습자 성장과 발달에 효과가 있다는 증거)은 역량 기반 의료 교육(CBME)의 개념[27]의 핵심이다. CBME의 맥락에서 직장 기반 평가는 (가급적이면 직접적인) 실제적 임상 환경에서의 관찰, 코칭 및 피드백, 그리고 일부 상호작용의 문서화를 포함한다. 매일 직장 기반 평가를 제공하는 것은 이러한 피드백 대화 각각에 대한 저조한 접근 방식을 지원하고 학습자가 코칭을 실습에 통합할 수 있는 반복적인 기회를 제공합니다.

The notion of formative feedback and coaching in a low-stakes environment, and the evidence of its effectiveness in learner growth and development [8,9,10], is core to the concept of competency-based medical education (CBME) [27]. Workplace-based assessment in the context of CBME includes (preferably direct) observations in the authentic clinical environment, coaching and feedback, and documentation of some of the interactions. Providing workplace-based assessments on a daily basis supports the low-stakes approach of each of these feedback conversations and provides repeated opportunities for the learner to incorporate the coaching into their practice.

포트폴리오에 축적된 직장 기반 평가의 데이터와 학습자의 전문적 성과에 대한 기타 정보가 어느 시점에 검토되어 교육생의 프로그램 진행 상황에 대한 결정을 내리고 적절한 학습 계획을 설계한다(이 시리즈의 평가 논문 참조). 학습자에 대해 완료되는 각 직장 기반 평가(데이터 포인트)는 학습자의 발전과 진행에 대한 전반적인 평가에 기여합니다. CBME에서는 역량 평가의 목표와 학습자에게 지속적인 개발 코칭과 피드백을 제공하는 목표를 의도적으로 병행 개발하는 것이 필수적이다[13]. 이를 위해서는 학습자와 감독 교수진 모두가 코칭 및 평가 프로그램의 가장 중요한 목표에 대한 공통된 정신 모델을 갖추어야 합니다.
Data from workplace-based assessments accumulated in a portfolio, along with other information about the learner’s professional performance, will at some timepoint be reviewed, to make a determination about a trainee’s progress in the program and design an appropriate learning plan (see the paper on assessment in this series). Each workplace-based assessment (data point) completed for a learner will contribute to the overall assessment of their development and progression. In CBME, it is essential that the goal of assessing competence and the goal of providing ongoing developmental coaching and feedback to the learner are intentionally developed in parallel [13]. This requires that both learners and supervising faculty have a shared mental model of the overarching goals of the coaching and assessment program.

교육생과 코치 간의 사회적 관계에 대한 피드백 및 코칭
Feedback and coaching in the social relationship between trainee and coach

피드백이 코칭에 효과적이려면 몇 가지 중요한 개념을 고려해야 합니다.

  • 코칭 관계(연수생과 코치 간),
  • 코칭 상호작용의 질,
  • 코칭 받는 교육생의 마음가짐,
  • 코칭에 대한 조직 문화 등 

In order for feedback to be effective in coaching, one must consider a few important concepts:

  • the coaching relationship (between trainee and coach);
  • the quality of the coaching interaction;
  • the mindset of the trainee who is receiving the coaching; and
  • the organizational culture around coaching.

관계
Relationship

연습생과 코치의 코칭 관계는 중요하고 복잡합니다. 교육생과 코치는 다양한 맥락에서 함께 자신을 발견하는데, 긍정적인 학습 환경 내에서 학습자의 성장을 지원하기 위한 의도적인 계획을 설계할 때 각각이 고려되어야 한다. 이러한 다른 맥락에 대해 생각하는 한 가지 방법은 "일상적 코칭"과 "지속적 코칭"으로 표현된다. [28, 29]

  • "일상적 코칭"은 훈련생과 임상 감독관 사이의 일상적인 상호작용을 기술하여 성과를 개선합니다.
  • "지속적 코칭"은 임상 환경 외부에서의 보다 종단적인 교수-교수 관계를 의미한다. 교육적 파트너십이 교육생의 성과에 대한 성찰, 축적된 데이터, 지속적인 발전을 위한 계획의 공동-개발을 촉진한다

The coaching relationship between trainee and coach is important and complex. Trainees and coaches find themselves in a variety of contexts together, each of which must be considered when designing an intentional plan to support the learner’s growth within a positive learning environment. One way to think about these different contexts has been articulated as “coaching in the moment” and “coaching over time” (see Table 1) [28, 29].

  • Coaching in the moment describes those day-to-day interactions between a trainee and a clinical supervisor that lead to performance improvement.
  • Coaching over time refers to a more longitudinal faculty-trainee relationship outside the clinical environment, in which the educational partnership promotes the trainee’s reflection on his or her performance, the accumulated data, and a co-developed plan for ongoing development.

학습자가 의료인으로서 발달해나갈 수 있도록 지원하고, 새로운 학습 목표를 세울 수 있도록 돕는 것이 "지속적 코칭"의 골자다. 코치와 교육생 간의 협력 관계는 코칭의 가치를 지원하고 지식, 스킬 및 태도 습득을 위한 발전경로path forward를 설계하는 데 도움이 됩니다[13]. 시간이 지남에 따라 성공적인 코칭은 학습자가 지속적인 자기 비판적 성찰을 위해 필요한 태도와 기술을 개발하여 평생 학습하고 피드백을 개방하는 데에도 도움이 될 수 있습니다. 이는 진료의 질, 협업의 효과, 개인적 동기 부여 등에 긍정적인 영향을 미칠 가능성이 높다.

The main goal of coaching over time is to support learners in their progress as medical professionals, and to help them set new learning objectives. A supportive relationship between coach and trainee supports the value of coaching and helps to design the path forward around the acquisition of knowledge, skills, and attitudes [13]. Successful coaching over time may also help learners to develop the attitudes and skills necessary for ongoing, self-critical reflection, and thus for life-long learning and openness to feedback. It is likely that this will have a positive impact on the quality of care, the effectiveness of collaboration, and personal motivation.

코칭 상호작용의 품질
Quality of the coaching interaction

감독관이 단편화되고 수습-감독자의 연속성이 결여된 대규모 부서에서도 "일상적 코칭"은 강력할 수 있습니다[30]. 그러나 효과는 각각의 코칭 상호작용이 유의미하다는 것을 확인하는 데 있습니다. 코칭이 항상 직관적인 것은 아니며, 임상 교수진이 자신의 역할을 이해하고 이 과제를 효과적으로 수행하는 데 필요한 도구를 제공하기 위해 교수 개발(효과적인 피드백 및 코칭 제공에 대한 교육 관리자)이 필요하다[31].

Coaching in the moment may be powerful, even in large departments with fragmented supervision and lack of trainee-supervisor continuity [30]. But effectiveness rests on ensuring that each coaching interaction is meaningful. Coaching is not always intuitive, and faculty development (training supervisors in providing effective feedback and coaching) is needed to ensure clinical faculty understand their roles and are provided with the tools needed to perform this task effectively [31].

R2C2 니모닉은 코칭에서 피드백 상호작용을 위한 유용한 모델이며(표 3) 이러한 필수적인 교수진 개발을 위한 프레임워크를 제공합니다. 궁극적으로 양질의 쌍방향 피드백과 코칭 대화를 이끌어내는 네 가지 단계에 초점을 맞추고 있으며, 관리자-교육자 관계의 핵심 역할에 주의를 기울입니다[32]. 이 모델은 관리자가 교육생과 라뽀를 쌓고 피드백에 대한 자신의 반응을 탐색하여, 상호 작용의 공통된 목표(형성적)를 보장함으로써, 피드백의 구체적인 내용을 다루기 전에, 변화를 위한 코칭(성과 향상)을 하도록 촉구합니다. 이 코칭 상호작용 모델은 일상적 코칭과 지속적 코칭에 모두 사용할 수 있습니다.

The R2C2 mnemonic is a useful model for feedback interactions in coaching (Table 3), and offers a framework for this necessary faculty development. It focuses on four phases that ultimately lead to a high-quality, two-way feedback and coaching conversation, and it attends carefully to the key role of the supervisor-trainee relationship [32]. This model urges the supervisor to build rapport with the trainee and explore his or her reactions to feedback, ensuring a shared (formative) aim of the interaction, before addressing the specific content of the feedback, and coaching for change (performance improvement). This model for coaching interactions can be used both for coaching in the moment and for coaching over time.

 

연습생 마음가짐
Mindset of the trainee

코칭 피드백에 대한 교육생의 수용성은 코칭 상호작용의 성공을 위한 핵심 요소입니다. 이것은 학습자의 마음가짐이 고정된 마음가짐과 성장 마음가짐 사이의 연속선상에서 주어진 순간에 어디에 위치할 수 있는지에 대한 개념을 제기한다. 주로 고정된 사고방식을 가진 사람들은 지능, 능력, 재능이 고정되어 있다고 믿는 반면, 성장 마인드를 가진 사람들은 이러한 특성들이 노력으로 영향을 받을 수 있다고 믿는다. 그러나 분명한 것은 코칭 피드백이 비옥한 기반 위에 놓일 수 있는 성장형 사고방식으로 개인을 움직이기 위한 전략이 있다는 것입니다[33]. 성장 사고방식이 대부분인 개인은 성과 지향적이 아니라 학습 지향적이며 지속적인 스킬 개발을 중요시합니다[17]. 코칭 피드백에 열려 있으며, 피드백을 지속적으로 발전시키기 위한 연습에 반영하기 위해 노력합니다. 이 스킬은 평생 학습자로서의 경력 전반에 걸쳐 매우 중요한 스킬입니다. 성장 마인드를 갖추면 교육생들이 (평가 자료 해석의 총괄적 성격보다) 코칭 피드백의 형성적 성격에 집중할 수 있다.
The receptiveness of trainees to coaching feedback is key to the success of any coaching interaction. This raises the notion of where a learner’s mindset might sit at any given moment, on the continuum between a fixed and a growth mindset. Individuals with a predominantly fixed mindset believe that intelligence, ability, and talent are fixed, while those with a growth mindset believe these traits can be influenced with effort. What is clear, however, is that there are strategies to move an individual in the direction of a growth mindset which allows coaching feedback to fall on fertile ground [33]. Individuals with a predominantly growth mindset are learning-oriented instead of performance-focused, and value ongoing skill development [17]. They are open to coaching feedback, making an effort to incorporate it into their practice to continue to develop, a skill that is invaluable throughout their careers as a life-long learner. Having a growth mindset also helps trainees to focus on the formative nature of the coaching feedback, rather than the summative nature of assessment data interpretation.

코칭을 중심으로 한 조직 문화
Organizational culture around coaching

교육생, 감독관, 조직을 대상으로 하는 구체적인 전략으로 성장 마인드 문화를 조성할 수 있습니다. 예를 들어,

  • 레지던트 오리엔테이션 기간 동안 성장형 마음가짐에 대한 명시적인 세션을 갖는 것이 코칭 피드백 프로세스를 용이하게 하는 것으로 나타났습니다 [33].
  • 관리자는 학습자가 자신의 도전과 약점에 대해 개방적이고 취약성을 드러내며, 성장을 위한 피드백을 구할 수 있도록 심리적 안전을 제공할 필요가 있다[34].
  • 의료진은 자신의 약점과 불확실성에 대해 논의하고 피드백에 대해 공개적으로 수용함으로써 이 행동을 롤모델로 삼을 준비가 되어 있다[35].
  • 조직 차원에서, 모든 수준에서 피드백을 촉진하는 안전하고 정의로운 문화의 촉진은 필수적입니다 [33].
  • 또한, 직접적인 관찰을 장려하고 지원할 수 있는 물리적 공간을 제공하고, 교육생과 감독자 간의 필수적인 신뢰관계를 배양하는 문화를 개발하는 것이 성공적인 코칭에 있어 무엇보다 중요하다.

A growth mindset culture can be nurtured with specific strategies targeted at the trainee, the supervisor, and the organization. For example,

  • having an explicit session on growth mindset during resident orientation has been shown to facilitate the coaching feedback process [33].
  • Supervisors need to provide the psychological safety to ensure that learners can be open and vulnerable about their challenges and weaknesses and seek feedback for growth [34].
  • Clinical faculty are uniquely poised to role model this behavior by discussing their own weaknesses and uncertainties, and by being overtly receptive to feedback themselves [35].
  • At an organizational level, the promotion of a safe and just culture that promotes feedback at all levels is essential [33].
  • In addition, providing the physical space to encourage and support direct observation, and developing a culture that nurtures essential trusting relationships between trainees and supervisors, is paramount to successful coaching.

 

교육 프로그램의 목표와 구조, 그리고 그 안에서 직장 중심의 평가와 코칭이 하는 역할은 교직원과 학습자 모두에게 명확해야 한다. 또한 감독관은 순간 코칭과 시간 경과에 따른 코칭에 효과적인 피드백을 제공할 수 있는 스킬을 개발하도록 교육받아야 합니다. 교수진과 교육생 모두가 성장형 마음가짐을 표현하고, 정기적으로 피드백을 주고받는 프로그램은 학습자가 원하는 임상 역량을 개발할 수 있도록 지원할 가능성이 가장 높다[35].
The goals and structure of the educational program, and the role workplace-based assessments and coaching play in it, should be clear to both faculty and learners. In addition, supervisors should be trained to develop the skills to provide effective feedback in coaching in the moment and coaching over time. A program in which both faculty and trainees express a growth mindset and are open to provide and receive feedback regularly is most likely to support the learners’ development towards the desired level of clinical competence [35].

임상 교육 시나리오—파트 2
Clinical teaching scenario—part 2

원래 시나리오에서 후배 레지던트인 Janice에게 돌아가면서 코칭과 피드백 관점에서 이러한 상호작용에 어떻게 접근할 수 있을까요?

  1. 먼저 코칭 대화를 할 수 있도록 잠시 시간을 내어 지금까지의 외래 환자 진료 경험이 어떠냐고 물어봅니다. 당신은 현재의 코칭 대화는 그녀가 성장하고 발전할 수 있도록 돕기 위한 것이며, 그녀의 역량에 대한 총괄적 평가가 아니라고 그녀를 안심시킵니다.
  2. 임상적 상호작용에 대한 자신의 성찰을 초대하면 그녀의 내용 지식과 통찰력 수준을 평가할 수 있습니다. 당신은 그녀가 무엇이 잘 되었다고 생각하는지 물어봄으로써 이 작품을 시작하고, 당신이 잘 되었다고 느꼈던 것들을 추가하거나 확인할 수 있습니다. 잘 된 것부터 시작하는 것은 학습자의 자신감을 높이는 경향이 있고, 그들이 개선점을 들을 수 있도록 더 수용적이게 만듭니다.
  3. 다음으로, 재니스에게 개선할 수 있는 것이 무엇인지 생각해보라고 한다. 재니스가 다른 발달 영역을 생략했다는 것을 스스로 깨닫고, 자신의 접근 방식이 체계적이지 못했다고 이야기할 수도 있다.
  4. 이렇게 하면 코칭 대화의 다음 파트를 짜는 데 도움이 될 것입니다. 여기서 여러분은 지식이나 조직적 관점에서 개발 마일스톤에 대한 누락 문제를 해결하도록 코칭할 수 있으며, 이 마일스톤이 이 특정 임상 시나리오에서 중요한 이유를 명확하게 설명할 수 있습니다. 무엇이 개선될 수 있는지에 대한 문제뿐만 아니라 이를 어떻게 달성할 것인가가 중요하다.
  5. 보호자에게 질문을 어떻게 제시하고 프레이밍 해야 하는지, 그리고 이 나이대의 아이에게 신체 검사를 어떻게 수행할지에 대한 실용적인 팁을 제공한다면, 그녀가 앞으로 나아가는 데 도움이 될 것이다.
  6. 그런 다음 그녀에게 코칭 대화에서 얻은 점을 요약하고, 포트폴리오에 기록하도록 요청하고, 다음 진료소에서 그녀를 함께 관찰하도록 하고, 그 시간에 대화를 계속하기로 약속할 수 있습니다.

As we return to our junior resident Janice in our original scenario, how could we approach this interaction from a coaching and feedback perspective?

  1. You start by taking a moment to build rapport to enable the coaching conversation, for example by asking her how she is enjoying her outpatient clinic experience so far. You reassure her that the present coaching conversation is intended to help her grow and develop, and is not a summative assessment of her competence.
  2. Inviting her own reflections on the clinical interaction will allow you to assess her content knowledge and her level of insight. You can start this piece by asking what she thinks went well, and then add or confirm the things that you felt went well. Beginning with what went well tends to boost learners’ confidence and makes them more receptive to hear points for improvement.
  3. Next, when you ask her to reflect on what can be improved, she may realize herself that she has omitted the other developmental domains, and articulate that she feels disorganized in her approach.
  4. This will help you frame the next part of the coaching conversation, in which you can coach her to address the omission around the developmental milestones, either from a knowledge or an organizational perspective, articulating why they are important in this particular clinical scenario. It is important to address not only the issue of what can be improved, but also how to accomplish this.
  5. Providing some practical tips on how to organize and frame the questions to the caregiver, and how to perform the physical examination maneuvers on a child of this age, would be helpful for her skill development moving forward.
  6. You can then ask her to summarize what she takes away from the coaching conversation, ask her to record this in her portfolio, arrange to observe her in your next clinic together, and commit to continuing the conversation at that time.

결론
Conclusion

효과적인 피드백과 코칭은 학습자의 개발, 발전, 역량 달성에 필수적이다. 증거 기반 원칙에 주의를 기울인다면, 이러한 활동에 투입된 에너지는 학습자를 지원하고 성공을 보장하는 데 필요한 긍정적인 결과를 산출할 수 있습니다.

Effective feedback and coaching are essential to learner development, progression, and achievement of competence. With mindful attention to evidence-based principles, the energy put into these activities will yield the positive results needed to support our learners and ensure their success.

 


Eur J Pediatr. 2022 Feb;181(2):441-446.

 doi: 10.1007/s00431-021-04118-8. Epub 2021 May 21.

 

Feedback and coaching

Affiliations expand

Abstract

If used thoughtfully and with intent, feedback and coaching will promote learning and growth as well as personal and professional development in our learners. Feedback is an educational tool as well as a social interaction between learner and supervisor, in the context of a respectful and trusting relationship. It challenges the learner's thinking and supports the learner's growth. Coaching is an educational philosophy dedicated to supporting learners' personal and professional development and growth and supporting them to reach their potential. In clinical education, feedback is most effective when it is explicitly distinguished from summative assessment. Importantly, feedback should be about firsthand observed behaviors (which can be direct or indirect) and not about information which comes from a third party. Learners are more receptive to feedback if it comes from a source that they perceive as credible, and with whom they have developed rapport. The coaching relationship between learner and supervisor should also be built on mutual trust and respect. Coaching can be provided in the moment (feedback on everyday clinical activities that leads to performance improvement, even with short interaction with a supervisor) and over time (a longer term relationship with a supervisor in which there is reflection on the learner's development and co-creation of new learning goals). Feedback and coaching are most valuable when the learner and teacher exhibit a growth mindset. At the organizational level, it is important that both the structures and training are in place to ensure a culture of effective feedback and coaching in the clinical workplace.Conclusions: Having a thoughtful and intentional approach to feedback and coaching with learners, as well as applying evidence-based principles, will not only contribute in a significant way to their developmental progression, but will also provide them with the tools they need to have the best chance of achieving competence throughout their training. What is Known: • Feedback and coaching are key to advancing the developmental progression of trainees as they work towards achieving competence. • Feedback is not a one-way delivery of specific information from supervisor to trainee, but rather a social interaction between two individuals in which trust and respect play a key role. • Provision of effective feedback may be hampered by confusing formative (supporting trainee learning and development) and summative (the judgment that is made about a trainee's level of competence) purposes. What is New: • Approaches to both the provision of feedback/coaching and the assessment of competence must be developed in parallel to ensure success in clinical training programs. • Faculty development is essential to provide clinical teachers with the skills to provide effective feedback and coaching. • Coaching's effectiveness relies on nurturing strong trainee-supervisor relationships, ensuring high-quality feedback, nourishing a growth mindset, and encouraging an institutional culture that embraces feedback and coaching.

Keywords: Assessment; Coaching; Feedback; Medical education.

우리나라 의학전문직업성 교육과정에서의 ‘전문직 정체성 형성’ 교육 현황 (KMER, 2021)
Current Status of ‘Professional Identity Formation’ Education in the Medical Professionalism Curriculum in Korea
이영희

Young-Hee Lee
고려대학교 의과대학 의학교육센터

Medical Education Center, Korea University College of Medicine, Seoul, Korea

 

 

 

서 론

의학교육의 궁극적인 목표는 좋은 의사를 양성하는 것이다. 좋은 의사는 임상역량과 의사소통능력을 갖추어야 하며, 윤리적 및법적 이해를 기반으로 수월성, 휴머니즘, 이타주의, 사회적 책무성과같은 핵심 가치를 진료상황에 적용할 수 있어야 한다[1]. 최근 의학교육 추세는 전문직 정체성 형성(professional identity formation)이 의학교육의 핵심이 되어야 한다고 강조하고 있다[2-4]. 전문직 정체성은 의과대학 또는 전공의 교육의 과정에 있는 의과대학생이나 전공의로 하여금 사회가 의사에게 기대하는 일련의 가치와 성향을 자신의 정체성으로 통합시키도록 함으로써 그들이 전문가답게 생각하고, 행동하고, 느끼도록 하는 것이다[3,5]. 전문직 정체성 형성은 전문직으로 살아가는 생애 전 과정에 걸쳐 진행되는 인지적, 사회적, 정서적 능력을 통합하는 평생의 과정이다[6]. 이는 개인적 수준의 발달과 직업적 수준의 발달을 동시에 포함하는 사회적 구성 과정이며[4,7], 직업적 성공, 심리적 건강 및 사회적응과 관련이 있다[8]. 따라서 의과대학에서는 전문직 정체성 형성을 핵심 교육목표로 설정하고 이를 달성하기 위한 교육과정의 설계와 효과적인 교육전략을개발하는 것이 필요하다[3,9].

역사적으로 보면 개념으로서의 전문직 정체성 형성은 히포크라테스 시대부터 있어 왔지만[3], 교육실천으로서의 전문직 정체성형성은 전문직업성 교육의 범주에서 암묵적으로만 다루어지다가 최근 들어 명시적으로 교육할 것이 강조되고 있다. 몇몇 연구에따르면 전문직업성 교육은 덕목 기반, 역량 기반, 정체성 형성의 접근방식으로 강조점이 변해왔다[2,5]. 즉 전문직업성에 대한 개념정의와 인식 틀 또는 가정이 변해감에 따라 교육의 목표와 내용,교수법, 그리고 평가방법도 수정되거나 새롭게 창조되어 왔다고 볼수 있다[2,5].

  • 덕목 기반(virtue-based) 또는 윤리적 접근방식은 품성을 갖춘사람을 좋은 의사로 정의하며, 내적인 마음의 습관, 덕성(moralcharacter), 추론능력, 돌봄과 연민 같은 인간적인 자질을 갖추도록교육할 것을 강조한다.
  • 행동 기반(behavior-based) 접근방식은 좋은 의사는 환자를 돌볼 수 있는 역량을 보여줄 수 있어야 하며,교육에서는 이러한 역량을 입증하기 위한 마일스톤, 역량, 관찰 가능한 행동의 측정을 강조한다.
  • 정체성 형성(identity formation) 접근방식은 의사가 자신의 다양한 지위와 역할뿐만 아니라 다양한 경험을 일관된 자아 이미지로 통합하는 정체성 발달과정과 지역사회에서의 사회화를 강조한다[7].

즉 좋은 의사는 의사에게 사회가 기대하는일련의 가치와 성향을 자신의 정체성으로 통합하기 위해 노력하는사람이며, 교육은 학생들이 더 높은 수준의 전문직 정체성 형성을발달시킬 수 있도록 지원하는 과정이 되어야 한다고 주장한다[2].이와 같은 세 가지 인식 틀의 변화는 전문직업성의 개념이 의사개인의 영역에서 타인과의 관계 및 사회 속에서 의사의 책무를 강조하는 방향으로 확장되고 재구성되고 있음을 보여준다. 최근에는 전문직 정체성 형성을 위한 교육방법과 평가방법에 관한 연구도 활발하게 이루어지고 있다[10-14].

전문직업성(professionalism), 전문직 정체성(professional identity),전문직 정체성 형성(professional identity formation)은 동일한 개념이 아니다.

  • 전문직업성에 대한 많은 정의는 ‘전문가에게 기대되는 행동의 입증’을 강조한다[3]. 예컨대, ‘대중의 의사에 대한 신뢰를뒷받침하는 일련의 가치, 행동 및 관계’라는 Royal College ofPhysicians of London 정의는 전문가의 행동의 입증을 강조한다[3].이러한 정의를 따를 경우, 일련의 특성, 가치 및 신념을 평가하는것이 어렵기 때문에 전문직업성 교육은 개념적 정의를 관찰 가능한 행동으로 조작적으로 재정의하고 측정하는 것에 초점을 두게 된다.
  • ‘전문직 정체성’의 개념은 특정 행동보다는 주체의 자기인식 과정이 강조된다. Erickson [15]에 따르면 정체성은 ‘나는 누구인가와 관련된 자기의식’이다. 즉 ‘자기 내적인 요소들을 종합하여 동일하고 연속적으로 자기를 유지하며, 타인과 사회와의 사이에서 자기인정과 확신을 포함하는 자기의식’이라고 할 수 있다[15]. 이러한 정의를적용하면, ‘의사의 전문직 정체성은 의사직의 특성, 가치 및 규범이내 면화되는 과정으로서 시간이 지남에 따라 단계적으로 달성되어 결과적으로 개인이 의사처럼 생각하고, 행동하고, 느끼게 되는 자아의 표현’이라고 정의할 수 있다[3].
  • ‘전문직 정체성 형성’은 개인적수준과 집단수준에서 동시에 발생하는 ‘적응상의 발달과정’으로,개인수준의 심리발달과 집단수준의 사회화를 포함한다[7]. 이러한정의를 따르면 ‘전문직 정체성 형성’ 교육은 개인의 속성과 집단에서의 역할, 그리고 사회공동체 속에서 특정 행동의 추구를 통해 도달하려는 가치체계와 그것에 대한 자아인식 개발에 교육목표를 두게된다.

그런데 이러한 세 가지 용어는 개념상 차이가 있지만 상호배타적이라기보다는 수단적이거나 포섭적인 관계에 있다고 할 수 있다.즉 전문직업성 교육목표에서 강조되는 의사가 입증해야 할 행동은 의과대학 및 전공의 교육과정에서 전문직 정체성이 발달하고 있는지를 확인하기 위한 수단이 되며[3], 전문적 정체성개념이 담고 있는행동주체의 자아인식전문직 정체성 형성교육에 포함되기 때문이다.

전문직업성 교육에서 의사의 전문적 역할을 [개별적이고 측정 가능한 역량으로 변환하여 측정하는 역량 기반 접근방식]은 ‘의사가 되어가는 것’에 대한 근본적인 의미 탐색과 의사의 역할이 미래의 의사의 정체성 발달과 어떤 연관성이 있는지를 간과하였다[7]. 전문직 정체성 형성에 초점을 두는 접근방식은 의학교육과정 중에 개발된 역량과 의사의 정체성 형성 간의 상호 관련성을 이해하고, 의사가 되어가는 과정을 보다 광범위하게 설명할 수 있는 시야를 제공한다[7]. 따라서 전문직 정체성 형성 교육은 기존의 역량 기반 접근방식을 대체하는 것이 아니라 전문직업성 교육에 대한 보다 다양한 담론을 확장하는 틀로 살펴보아야 한다[3,7]. 이러한 맥락에서 서구에서는전문직 정체성의 형성에 관한 연구가 활발하게 진행되고 있으며[7,16-20], 다양한 심리학 및 발달이론이 이론적 토대가 되고 있다[15,21,22].

우리나라의 경우 전문직업성 교육에 관한 선행연구는 주로 덕목기반 또는 역량 기반 접근방법을 중심으로 수행되었다. 전문직업성은 의사가 갖추어야 할 주요 속성이나 자질과 역량 요소라고 간주하고 각 요소에 대한 학생들의 인식과 자기평가 연구를 수행한 연구들[23,24], 전문직업성 역량을 측정하기 위한 평가도구 개발에 관한 연구들[25,26], 교육과정의 목적을 전문직업성의 기초자질 함양으로 설정하고 교육과정의 평가와 구성을 연구한 것들이 있다[27]. 2017년 ‘한국의과대학․ 의학전문대학원협회’에서 발간한 「기본의학교육 학습성과: 사람과 사회 중심」에는 ‘의사의 직업 정체성’ 용어가 사용되어 ‘전문직 정체성 형성’이 우리나라 기본의학교육의 주요한 학습성과로 기술되었다[28], 최근 들어 전문직 정체성의 단어가 사용되고 있긴 하지만 아직 우리나라에서 전문직 정체성 형성이 전문직업성 교육의 중심 목표로 정착되고 있지 않다.

앞에서 기술한 바와 같이 전문직 전체성 형성은 전문직업성 교육의 범주에서 교육되어왔기 때문에 전문직 정체성 형성 교육현황을 파악하기 위해서는 전문직업성 교육과정에 대한 분석이 필요하다.이에 이 연구는 우리나라 기본의학교육 현장의 전문직업성 교육과정을 검토한 후 전문직 정체성 형성 교육현황을 파악하고 전문직 정체성 형성교육으로 나아가기 위한 교육의 확대방안을 제안하고자한다. 구체적으로 우리나라 전문직업성 관련 교과목의 개설현황(교과목 수, 학점 및 학년), 전문직 정체성 형성교육의 내용구조, 주요 교육방법 및 평가방법을 파악하고 우수사례를 소개하고자 한다.

 

연구대상 및 방법

1. 자료수집 대상 및 방법

이 연구는 전국 40개 의과대학 및 의학전문대학원(이하 의과대학또는 대학)2020학년도를 기준으로 개설된 전문직업성 교육과정을 조사대상으로 하였다. 1차 자료조사와 수집은 각 대학 홈페이지에게시되어 있는 전문직업성 교과목의 명칭과 개설 학년, 필수선택여부, 학점을 열람하여 Microsoft Excel (Microsoft Corp., Redmond,WA, USA)에 정리하는 방식으로 진행하였다. 2차 조사는 각 의과대학의 의학교육 전문가 또는 전문부서에 이메일을 보내 홈페이지에서수집한 내용에 대한 검토와 부정확한 정보의 수정 또는 누락 과목의 보완을 요청하였다. 추가로 전문직업성 관련 교과목별로 주요 수업내용 또는 주제(교육내용), 수업방법, 평가방법을 직접 기술해 달라고 요청하였다. 아울러 화이트코트 세리모니(White Coat Ceremony)와 행동 규범(Honor Code)의 운영 여부를 조사하였다.

일부 항목에 대해 개방형 직접기술방식을 사용한 이유는 전문직업성 교육과정의 특수성과 복잡성 때문이었다. 기초의학 및 임상의학 교육과정과 달리 전문직업성 교육과정은 대학마다 교과목의 명칭이 너무 다르고 교과목별로 포함하는 교육내용의 범위도 매우 상이하다. 따라서 객관식 설문지 제작에 어려움이 있었고, 전문직업성의 개념과 정의조차 조사 응답자 간에 인식의 편차가 클 수 있어서 객관적이고 표준화된 설문조사방식보다는 개방형 자유기술 방식이 각 대학의 교육과정 현황을 있는 그대로 드러내고 응답결과의 타당성을 확보하기에 더 적합하다고 판단하였다. 자유기술 항목에 대해서는 연구자가 예시를 제시하여 응답자의 편의를 도모하였다. 자료수집기간은 2020128일부터 219일까지였다. 40개 조사대상 대학 중 28(70%) 대학이 응답하였다. 분석대상 대학의 소재지와 학생 수는 Table 1과 같다.

2. 분석방법

분석대상 자료는 문서형태였다. 자료의 내용은 서술식 내용과양적 수치로 구성되었기 때문에 분석방법은 자료 특성을 고려하여일반적인 질적 분석과 양적 분석을 병행하였다. 즉 전문직업성 교육과정 개설 교과목 수, 개설 학년, 학점 수, 필수 선택 여부와 같은양적 자료에 대해서는 빈도분석을 하였고, 교과목별 주요 교육내용은 내용분석의 방법을 활용하였다.

구체적인 내용분석의 과정은 Figure 1과 같다. 저자는 먼저 응답자가 직접 기술한 교과목별 주요 교육내용을 여러 번 읽고 탐색하면서 핵심 단어(key word)를 추출하였다. 핵심 단어 추출과정의 타도 확보를 위해 학부 4학년 연구보조원 한 명과 멀티로 작업하였다.연구자는 먼저 연구보조원에게 핵심 단어 추출방법을 상세히 설명하였고, 연구보조원과 연구자가 각각 따로 핵심 단어를 코딩한 후,둘 사이에 불일치하는 단어는 연구자가 2차로 검토하면서 최종 포함하거나 수정 또는 배제하였다. 한 교과목에서 동일한 단어가 반복되는 경우 배제하였고, 어디에도 잘 들어맞지 않는 핵심 단어(: 그리스도, 대중문화 콘텐츠 등)는 따로 메모하면서 비슷한 테마에 포함하거나 배제하였다.

 

핵심 단어 추출과정에서 저자는 교과목 명칭과 개설 학년, 필수 선택 여부 등과 교육내용의 관련성을 탐색하면서 가능한 기술된맥락을 반영하고자 하였고 중요한 단어의 누락이 없도록 고려하였다. 한 교과목에 기술된 내용에서 여러 개의 핵심 단어를 추출할수 있는 경우에는 중복코딩을 하였다. 예컨대 주요 교육내용이 의학에 대한 이해와 주요 의학자 중 역할모델 찾기, 의료정책 및 의사관련 책을 읽고 토론 및 글쓰기, 생명윤리, 의사와 사회, 바람직한 의사상이라고 기술된 경우, 의사 역할 탐구,’ ‘의료정책,’ ‘의학과독서,’ ‘생명윤리,’ ‘의사와 사회,’ ‘바람직한 의사상6개 핵심 단어를 추출하였다.

다음은 추출된 핵심 단어를 토대로 전문직 정체성의 관점에서자료의 의미 있는 패턴을 찾아 범주화하였고, 중요한 범주에 대한 테마(theme) 정하기의 과정을 통해 핵심 단어와 범주, 테마의 관계를 보여주면서 우리나라 전문직업성 교육과정의 내용구조를 조망하고자 하였다. 핵심 단어는 유사성에 따른 범주화(categorizing)와 인접성에 따른 연결(connecting)전략을 사용하면서 분류, 감소, 배열하였다. 범주화 전략은 다양한 교육내용의 유사점과 차이점을 찾아내분류하는 방법이고, 인접성 전략은 자료와 맥락 간의 관계를 연결하여 각 내용 사이에 어떤 관련성이 있는지를 알아내는 방법이다[29].패턴 찾기와 범주화, 테마 정하기와 같은 일련의 자료분석과정은연구자의 경험과 직관에 의존하였다. 이 과정에서 연구자의 통찰력을 확장하기 위해 전문직 정체성 형성 교육에 관한 선행연구를 중간중간에 반복적으로 읽으면서 선행연구자들은 전문직 정체성 형성교육내용의 범위를 어떻게 포함 또는 배제하였는지 지속적인 검토를하였다.

결 과

1. 우리나라 전문직업성 교과목 개설현황

28개 의과대학에 개설된 전문직업성 관련 총 교과목 수는 최대37개에서 최소 5개까지 편차가 큰 것으로 나타났다. 16(57.1%)대학은 모든 개설과목을 필수로 정하고 있었고, 12(42.9%) 대학은 선택과목을 최소 1개에서 최대 18개까지 두었다. 필수과목 수도 최대 33개에서 최소 5개로 대학별 편차가 컸다. 전체 학년에 개설된필수과목 수가 20개 이상인 대학은 2개였고, 20개 미만에서 10개이상인 대학이 18개, 10개 미만인 대학이 8개였다. 대부분 대학은선택과목보다 필수과목의 비중이 컸지만, 일부 대학의 경우 필수과목보다 선택과목 수가 더 많거나(ID12, ID25) 선택과목 비중이 40%이상을 차지하는 대학(ID8, ID13)도 있어서 총 교과목 수가 많다고 해도 학생들이 이수하는 전문직업성 과목이 반드시 비례하는 것은아님을 알 수 있었다. 14개(50%) 대학은 의예과 1학년부터 의학과4학년까지 전 학년에 걸쳐 전문직업성 교과목이 연속적으로 개설되었던 반면 나머지 절반의 대학은 1개에서 3개 학년까지 전문직업성교과목이 개설되지 않았다(Table 2).

 

2. 전문직업성 교육과정에 나타난 '전문직 정체성 형성' 교육의내용구조

교과목별 주요 교육내용을 분석한 결과, 우리나라 전문직 정체성형성 교육의 내용구조는 15개의 범주와 4개의 테마로 축소되었다.즉 교육내용은 전문직업성에 대한 인지 기반이 되는 지식과 이론을포함하여 자신에 대한 이해, 타자와의 관계, 그리고 전체 사회와보건의료시스템 속에서 의사의 역할을 탐색하면서 학습자의 경험을 확장해가는 구조로 이루어져 있었다. 4개 테마의 명칭은 범주의내용 특성을 반영하여

  • (1) 전문직업성에 대한 지식 기반,
  • (2) 자기이해와 발달,
  • (3) 타자와의 상호작용,
  • (4) 사회와 보건의료시스템 속의의사로 명명하였다(Figure 2).

 

 

1) 전문직업성에 대한 지식 기반

테마 1 전문직업성에 대한 지식 기반에는 4개 범주가 포함되었다.

  • 범주 1은 ‘전문직업성의 개념과 의미 탐색’으로, 전문직업성의 의미와 핵심 가치, 의사의 가치관, 의사의 정체성 같은 내용을 포함하였다.
  • 범주 2는 ‘전문가가 갖추어야 할 덕목 또는 역량’으로, 의사에게 기대되는 인성, 자질, 가치관, 소양이나 소통, 협력, 리더십 같은 역량을 기술한 내용이 포함되었다.
  • 범주 3 ‘의사 및 전문직 발달의 역사’에는 의료전문직의 형성과 변화과정, 의학의 역사와 중요한의학적 사건들을 다루는 내용이 포함되었다.
  • 범주 4 ‘인간과 삶에대한 이해를 위한 인문사회학’에는 의학과 철학, 문화, 음악, 심리학등 인간과 삶에 대한 이해의 지평을 넓히는 내용이 포함되었다(범주별 핵심 단어 예시는 부록 1 참조).

교과목별 주요 교육내용에서 테마 1의 핵심 단어를 추출한 방법을 예시하면 다음과 같다.

현대사회는 (중략) 전문성 본래의 의미뿐만 아니라 의료인들이 가져야 할 윤리성, 책무성, 소통능력과 관계성 등을 이론적으로 아는 것과 동시에 실천적 행동을 할 수 있기를 요구하고있다. (중략) 가장 기초적인 전문성의 개념과 의미뿐만 아니라‘윤리,’ ‘책무,’ ‘소통,’ ‘관계’라는 키워드를 중심으로 필요로하는 전문적인 역량에 대해서 이론적 강의와 함께 사례분석과학생들과의 토의 등을 진행할 계획이다. (테마 1: 범주 1, 범주2; 대학 ID=01, “의료전문성과 진로설계 1”, 의학과 1학년,필수, 1학점)

 

2) 자기이해와 발달

인간은 누구나 독특한 개체이다. 테마 2 자기이해와 발달은 개인적 발달과 관련된 3가지 범주를 포함하였다.

  • 범주 1은 ‘자기성찰및 이해’로, 비전과 사명, 삶의 의미, 자기이해(성격, 가치관, 생각,감정 등)와 같은 내용을 포함하였다.
  • 범주 2 ‘자기계발과 자기관리’에는 자기관리, 자기 돌봄, 자기계발, 자아형성, 자기표현 등의 내용을 포함하였다.
  • 범주 3 ‘진로설계와 탐색’에는 진로설계, 진로탐색, 진로개발, 전공탐색, 다양한 직업군 이해를 다루는 내용을 포함하였다(부록 1).

교과목에서 다양한 핵심 단어가 추출되는 경우, 한 교과목의 내용이 여러 개의 범주로 중복 처리되었다(아래 인용문 참조).

현대 의료환경의 급격한 발전과 변화로 의사 직종의 다양화에 대해 이해하고, 자신을 성찰하고 자기관 능력을 키워 진로선택에 활용할 수 있다. (테마 2: 범주 1, 범주 2, 범주 3,대학 ID=08, “의료입문(1): 의학입문 및 체험실습” 예1, 필수, 2학점)

3) 타자와의 상호작용

테마 3 타자와의 상호작용에는 세 가지 범주를 포함하였다.

  • 범주1은 ‘일반적 의사소통’으로, 의사소통에 관한 이론과 지식, 일반인과의 의사소통에 관한 내용이 포함되었다.
  • 범주 2 ‘의료상황에서의 의사소통’은 의학 면담의 기초이론, 환자 및 보호자와의 의사소통,어려운 상황에서 의사소통, 동료 또는 타 직종 의료인과의 의사소통같은 내용을 포함하였다.
  • 범주 3 ‘생명․의료․연구윤리’에는 의료윤리의 원칙, 임상상황에서의 윤리, 연구윤리 관련 내용을 포함하였다. 생명윤리와 연구윤리는 의료윤리와 함께 묶어서 가르치는 대학이많아서 세 가지를 같이 한 범주로 포함하였다.
오늘날 의사들은 의료행위에 대한 여러 가지 법적, 사회적, 그리고 윤리적인 문제들을 인식하고 상황에 따라 적절하게 대처할수 있어야 한다. 본 강좌에서는 이러한 문제들의 내용과 그에합당한 의료행위가 무엇인지 알아보고 적절한 대응능력을 갖추도록 한다. (테마 3: 범주 3, 대학 ID=05, “의료윤리학”, 의학과1학년, 필수, 1학점)

4) 사회와 보건의료시스템 속의 의사

테마 4 사회의 보건의료시스템 속의 의사에는 5개 범주가 포함되었다.

  • 범주 1은 ‘의료와 사회의 관계’로, 의사와 사회, 의료와 사회,의사의 사회적 역할과 기능 등과 관련된 내용이 포함되었다.
  • 범주2 ‘지역사회 이해’에는 일차진료, 지역사회에서 의사의 역할, 지역사회 의료기관 이해에 관한 내용이 포함되었다.
  • 범주 3 ‘보건의료시스템’에는 의료제도, 정책 및 관리체계 등 보건의료 제반 현상에 사회시스템적 접근 관련 지식이 포함되었다.
  • 범주 4 ‘보건의료 행위에 대한 법적 이해’에는 의료 관련법과 의료행위의 법적인 측면을 다루는 내용이 포함되었다.
  • 범주 5 ‘환자안전’에는 의료팀 구성원으로서의 리더십과 전문직종 간 의사소통, 위기관리 등 시스템적 관점에서환자안전과 의료 질을 다루는 내용을 포함하였다.
의사의 사회적 책무를 이해하고, 의사가 갖추어야 할 사회적역량의 함양을 목표로 한다. 의학의 발전과 다양성을 고려한건강의 사회적 맥락을 파악하고, 지역사회의 보건자원 관련지식과 의료커뮤니케이션 기술을 습득한다. 의료제도와 의료윤리 관련 사회적 문제를 이해하고, 해결방법을 제시할 수 있다.(테마 4: 범주 1, 범주 2, 범주 3, 대학 ID=09, “환자 ․ 의사․ 사회 2”, 의학과 2학년, 필수, 1학점)

 

5) 우리나라 ‘전문직 정체성 형성’ 교육내용의 범주별 현황

위에서 기술한 4개 테마와 15개의 범주별 교육내용을 최소 한과목 이상에서 다루고 있는 대학의 현황은 Table 3과 같다. 결과를보면

  • 의료윤리’는 분석대상이 된 28개 모든 대학이 다루고 있었고,
  • 의료상황에서의 의사소통’은 26개(92.9%) 대학이 다루었다.
  • 보건의료행위에 대한 법적 이해’를 다루는 대학은 24개(85.7%)였고,
  • 의료와 사회의 관계’ 22개(78.6%),
  • ‘인간과 삶에 대한 이해를 위한인문사회학적 기초’ 21개(75.0%),
  • ‘전문직업성의 개념과 의미 탐색’과 ‘전문가로서의 덕목, 역량’은 각각 20개(71.4%) 대학이 다루고있었다.

교육내용에 가장 적게 포함된 범주는

  • ‘자기계발 및 자기관리’가 9개(32.1%),
  • 일반적 의사소통 11개(39.3%),
  • ‘진로탐색 및 설계’16개(57.1%)였다.

테마별로 보면, 약 25%–32%의 대학이 ‘전문직업성에 대한 지식 기반’을 다루지 않았고, 자기이해와 발달에서는범주별로 39.3%67.9%의 대학이 가르치지 않았으며, 타자와의 상호작용에서는 일반적 의사소통의료상황에서의 의사소통을각각 60.7%7.1%의 대학이 다루지 않았다. 사회와 보건의료시스템 속의 의사에서는 환자안전 42.9%, 의료와 사회의 관계 21.4%의 대학이 교육내용에 포함하지 않았다.

 

 

3. ‘전문직 정체성 형성’ 교육방법 및 평가방법

1) 교육방법

전문직 정체성 형성교육을 위한 수업방법은 응답자가 전문직업성 관련 교과목별로 직접 기술한 내용을 분석하였다. 자료수집 시에연구자가 예시로 강의, 팀바탕학습, 문제바탕학습, 사례연구, 소그룹토론, 프로젝트학습, 현장체험, 성찰적 글쓰기, 역할모델, 표준화환자 면담, 강점탐구 등의 수업방법을 안내하였고, 응답자들은 예시를포함한 다양한 수업방법을 기술하였다.

결과를 보면 26개 대학에서 총 11개 유형의 수업방법을 사용하는것으로 나타났다(Table 4). 든 대학이 최소 한 과목 이상에서 강의를 사용하고 있었고, 토의 토론22(84.6%), 실습(시뮬레이션) 21(80.8%), 협력학습 20(76.9%) 대학 순으로 많았다.성찰적 글쓰기와 보고서를 한 과목 이상에서 사용하는 대학은 14(53.8%)였다. 현장체험12(46.2%) 대학에서, 코칭과 피드백,’‘역할모델이나 역할극은 각각 11(42.3%) 대학이 활용하고 있었다. 그 밖에 플립러닝, 명상훈련, 인터뷰 방법을 사용하고 있는 것으로 조사되었다.

 

 

2) 평가방법

교과목별로 26개 대학의 응답자가 직접 기술한 평가방법 내용을분석하였다. 자료수집 시에 연구자는 예시로 지필시험, 자기평가,성찰적 글쓰기, 관찰평가, 동료평가, 중요사건 보고서 등의 평가방법을 예시하였다. 결과를 보면 우리나라 의과대학은 10가지의 평가방법을 사용하는 것으로 나타났다(Table 5). 25개 대학이 최소 한 과목이상에서 지필고사를 사용하고 있었고, 과제 및 보고서,’ ‘토론발표22개 대학에서 활용하고 있었다. 면담, 수행평가, 역할극을 포함한관찰평가에세이를 사용하는 대학이 18개였다. 동료평가출석은 각각 15개 대학에서 평가방법으로 사용하고 있었다. 그 밖에 포트폴리오 평가, 프로젝트 평가, 자기평가 방법이 조사되었다.

 

 

4. 상징과 의식: 화이트코트 세리모니와 행동 규범

화이트코트 세리모니는 의과대학에서 임상실습을 시작하기 전에처음으로 흰 가운을 입는 착복식 행사이다. 이 의식은 학생들이 의료현장에서 환자를 직접 만나기 전에 의사의 소명과 의사됨의 의미를 생각해보고 휴머니즘을 겸비한 의사의 자질과 능력을 다시한번 성찰하는 기회가 된다. 행동 규범(Honor Code)은 과정 이수중 또는 임상실습과정 중에 의과대학생들이 적절한 전문적 및 개인적 자질을 갖추었음을 보여주기를 기대하는 행동들이다. 이러한 의식과 규범은 전문직 정체성을 개발하는 데 있어 학생과 교수 모두에게 중요한 역할을 한다[30]. 리나라에서 화이트코트 세리모니 행사를 개최하는 대학은 응답한 대학 중 25개(96.2%)였고, 한 곳(3.8%)만이 시행하지 않는 것으로 조사되었다. 학생 행동 규범을가지고 있거나 제작 중인 대학은 21개(77.8%), 없는 대학은 6개(22.2%)였다.

 

5. 전문직 정체성 형성 교육 우수사례

전문직 정체성 형성 교육 우수사례는 대학별로 응답자가 대표과목으로 선정해준 것과 교과목 내용에 대한 설명을 근거로 연구자가 판단한 12개 교과목(과정) 사례를 선정하였다(부록 2). 이 과목들을 우수사례로 선정한 근거는

  • 첫째, 전문직 정체성과 관련된 의사의자질이나 덕목, 역량을 분절된 지식 위주로 가르치지 않고 통합과정내에서 다루거나 임상상황이나 주제와 연계하여 통합적으로 다룬다는 것이었다(ID 05, ID 09, ID 16, ID 17).
  • 둘째, 진료현장 또는환자체험 기회를 제공하거나(ID 08, ID 22), 의료현장의 목소리를직접 듣기 위해 전공의 또는 외부 연자를 교육에 참여시키는 점이었다(ID 10, ID 17, ID 21).
  • 셋째, 우수 교과목 사례의 교육방법은대부분 강의 외에도 전문직 정체성 형성 교육방법으로 효과적인에세이 쓰기, 딜레마 이슈 또는 증례에 대한 소그룹토론, 실제 환자또는 표준화환자 면담, 문제바탕학습 또는 프로젝트 학습형태의 협력학습 방법을 포함하고 있었다.
  • 넷째, 평가방법은 자기평가, 에세이평가, 자기성찰 보고서, 조별활동 보고서, 토론 및 발표평가 등을활용하고 있었는데, 이러한 평가방법은 전문직 정체성 형성을 위한자기성찰에 도움이 되는 것들이었다(상세한 내용은 부록 2 참조).

 

고 찰

이 연구는 우리나라 전문직 정체성 형성교육현황을 파악하기위하여 전문직업성 교과목 개설현황, 주요 교육내용, 교육방법 및 평가방법을 조사하였다. 결과를 보면 대학별로 개설된 전문직업성관련 총 교과목 수와 학점은 학교마다 편차가 컸다. 총 개설 교과목을필수로 정하고 있는 대학도 있었지만, 선택 비중이 큰 대학도 있어서총 교과목 수가 많다고 해서 학생들이 이수하는 과목 수가 반드시비례한다고 볼 수는 없었다. 분석대상 대학 중 절반은 전 학년에걸쳐 매 학년에 연속적으로 전문직업성 관련 교과목이 개설되어있었고 나머지 절반은 13개 학년에 공백이 있었다. 교육내용은전문직업성에 대한 지식 기반, 자기이해와 발달, 타자와의 상호작용,그리고 사회와 보건의료시스템 속의 의사 역할 탐색으로 이해의지평을 확대하는 구조로 구성되어 있었다. 교육방법은 강의, 토의 토론, 실습, 협력학습, 성찰적 글쓰기, 현장체험, 코칭과 피드백,역할모델 등을 사용하고 있었고, 평가방법은 지필고사, 과제 및 보고서, 관찰평가, 에세이 평가와 동료평가, 포트폴리오, 프로젝트 평가등을 활용하는 것으로 나타났다.

이상의 결과를 토대로 전문직 정체성 형성 교육의 확대방향을다음과 같이 제언하고자 한다.

첫째, 전문직업성 관련 교과목에 ‘전문직 정체성 형성’을 명시적인 학습성과나 교육내용으로 표현해야 한다. 내용분석 결과를 보면우리나라 전문직업성 관련 교과목에 전문직 정체성이라는 단어가자주 사용되지 않았다. 의료 전문가로서의 생각이나 행동은 명확한목표 없이 성공적으로 가르치거나 배우기 어렵다[31]. 과거에는 교육목표가 주로 전문직업성에 대한 지식 기반의 이해에 있었고, 전문직 정체성 형성은 대부분의 교육프로그램에 명시된 목표가 아니었다[3]. 이제는 강조점이 전문직 정체성 형성의 개념을 중심으로 변화되고 있고, 관련 연구와 의학교육자의 이해도 향상되었기 때문에 교과목의 학습성과와 교육내용에 전문직 정체성 형성을 명시하고 의사가 되어감에 대한 교육내용을 확장하고 재구성할 필요가 있다.

둘째, 매 학년에 전문직 정체성 형성 교과목이 연속적, 반복적으로배치되도록 교육과정을 편성․ 조직할 필요가 있다. 기본의학교육기간은 전문직으로의 전환이 시작되는 중요한 시기이다[32]. 의학전(pre-medical), 임상실습 전(pre-clinical), 임상실습 교육과정은학생들에게 질적으로 각기 다른 실세계이며, 학생 개개인의 성숙도와 정체성 발달에 영향을 미치는 학습경험도 다르다.

  • 의과대학 입학시 학생들은 초기 적응 스트레스, 자신의 의학 적성에 대한 확신부족, 우수한 동료와의 비교에 의한 자존감 하락 등으로 인하여의사로서 긍정적인 자기정체성을 개념화하기가 어려울 수 있다.
  • 공부량이 집중되는 의학과 1, 2학년 시기에는 시험성적 불안, 실패에대한 두려움으로 인한 스트레스, 의학 지식과 기술의 불충분, 실제환자와의 접촉 경험 부족 때문에 의사로서 자신의 정체성을 내면화하기 어려울 수 있다[31,33-35].
  • 그러나 임상실습과정 중의 학생은 환자와의 상호작용을 통해 미래 의사로서 자신의 정체성을 빠르게 개념화할 수 있고[36], 실습현장에서 의료시스템의 구조적, 사회적측면을 경험하면서 기존에 자신이 갖고 있던 의사의 역할 가치와병원 위계구조에 대처하는 의료의 엄중함 같은 다양한 전문직 가치를 통합해 가면서 의사의 전문직 정체성을 수정하고 발달시켜간다[34].

학생들은 의사처럼 생각하고, 느끼고, 행동할 수 있지만 그렇다고 해서 아직 의사는 아니고 의사가 된다는 것에 대한 내면화도 부족하다[5]. 따라서 학생들이 학년마다 학생수준에서 고유하게 경험하는 갈등과 위기를 성찰과 자기관리를 통해 주체적 경험으로승화시킬 수 있도록 매 학년에 전문직업성 교육과정을 제공해야한다.

 

셋째, 이 연구결과에서 우리나라의 많은 의과대학들은 전문직업성에 관한 지식 기반, 학생들이 자기와 자신의 미래, 인간과 삶의 의미를 탐색해볼 수 있는 기회, 특히 타인과의 관계, 전체 사회 속에서 의사의 역할에 대한 성찰 기회를 가르치고 있었지만, 일부 대학은 전문직 정체성 형성에 관한 교육내용 중 일부가 전문직업성 교육과정에 아직 포함되지 않은 것으로 나타났다. 그러므로 전문직 정체성형성에 관한 다양한 영역의 교육내용이 누락이 없도록 가능한 모두포함되도록 해야 한다. 앞서 기술하였듯이 전문직 정체성은 인간이 삶을 통해 자신의 경험을 개인적 또는 직업적 자아로 통합해 가면서형성된다[10,37].

이러한 정체성은 개인 정체성, 관계 정체성, 집단정체성의 세 영역에서 발달하는데,

  • 개인 영역은 개인의 특성, 자신의신념, 다양한 삶의 경험에 영향을 받고,
  • 관계 영역은 가족, 친구,멘토와 같은 중요한 타자에 의해 영향을 받으며,
  • 집단 영역은 개인이 속해 있는 사회집단의 영향을 받는다[37].

이런 관점에서 개인 영역에서 자기이해와 발달을 위한 자기성찰, 자기계발과 자기관리, 진로탐색 및 설계를 교육내용에 포함할 필요가 있다. 한편, 인간은 가족,친구, 동아리, 학교, 직장 등 특정 사회집단과 그 집단에서의 역할과 관련해서만 자신의 자아를 알 수 있다[5,38]. 그러므로 타자와 의사소통 역량을 증진시키는 과정은 전문직 정체성 형성과 밀접한 연관을 가지게 된다[39]. 일반인, 환자와 보호자, 동료와의 관계에서 의사소통과 윤리에 대한 주제가 정체성 형성 교육과정에 기본적으로포함되어야 한다[38,40]. 전체 사회와 보건의료시스템과의 관계에서 보면 의료와 정보기술의 발전, 의료에 대한 대중매체의 관심증가, 환자 돌봄에 대한 철학과 관리방식의 변화도 의사 전문직정체성의 변화에 중대한 영향을 미친다[41]. 의과대학에서 환자안전과 의료직종 간 교육이 강조되는 것은 이러한 맥락에서 중요하다. 타 직종 의료인과의 상호작용은 기존에 의사의 역할에 대해 갖고있던 생각과 타 의료직종 전문가의 역할을 비교하고 대조해 봄으로써 의사의 역할과 전문직 정체성에 이해를 밝혀줄 수 있다[42]. 최근연구들은 의사의 전문직 정체성에 대한 기술적 변화의 영향에 대해 개인수준의 전문직 정체성이 지속해서 변화하고 있음을 강조한다[43,44]. 그러므로 전문직 정체성 형성 교육과정에 사회적 맥락을이해하는 과정을 포함해야 한다.

한편, 전문직업성 과정을 개별 교과목으로 개설하지 않고, 기초․ 임상의학 과정과 견고하게 통합되도록 구성하고, 문제바탕학습, 소그룹활동 등 다양한 학습환경에서 자기성찰을 촉진함으로써 전문직 정체성 형성이 잘 통합되도록 구성하는 것도 필요하다[31,45-47]. 예컨대, 의사소통 교육에서 환자의 증상이나 질병에만초점을 두기보다는 전인적 관점에서 환자와 공감적으로 의사소통하는 방식을 가르칠 수 있다. 의사소통 교육은 단순히 의사소통 역량을 키우는 것이 아니라 전문직 정체성 형성 교육을 통합할 수 있도록 구성하는 것이다. 또 다른 예로 치매 환자의 경우, 손상된 뇌에만집중하기보다 치료계획 수립 시 환자의 심리상태와 가족관계 같은심리 사회적인 요인을 고려하고, 환자에게 도움을 제공할 수 있는접근 가능한 의료복지제도를 생각해 보고, 치료계획 수립과정에서동료와 상담하는 방법을 배우고, 자신의 미래 신경과 의사의 역할에대해 생각해 보도록 구성함으로써 전문직 정체성 형성을 도울 수있다[42]. 이 연구결과에서 도출한 우리나라 전문직업성 교육과정의 내용구조는 각 대학에서 개설한 교과목 중 부족한 부분과 보충해야할 범주가 무엇인지에 대한 유용한 정보를 제공할 수 있다.

넷째, 전문직 정체성 형성을 위하여 학생들의 자기성찰을 돕는교육방법이 확대되어야 한다. 이 연구결과, 우리나라 의과대학 중에는 성찰적 글쓰기, 역할모델링, 코칭과 피드백 같은 수업방법을 전문직업성 관련 교과목에서 사용하지 않는 대학들이 다수 있었다. 강의보다는 성찰적 글쓰기, 딜레마 토론, 역할모델, 코칭과 피드백, 강점탐구, 가이드가 있는 토론, 현장학습 등이 성찰학습에 유용하다.

  • 성찰적 글쓰기는 전문직 정체성 형성과정에서 자각을 돕고 자신의경험이 갖는 의미를 깨닫게 하는 데 도움이 된다[42]. 개인의 생각,행동, 경험에 관한 토론 역시 학생들이 자기성찰을 통해 의사로서자신의 삶을 구성해볼 수 있게 한다[31]. 성찰과 토론은 전문직 정체성을 개발하는 데 있어 중요한 교수법임이 다수의 연구에서 보고되었다[45,48-50]. 현장학습 또는 실세계와 유사한 경험의 기회를제공하고, 상황학습 또는 경험을 통한 성찰 기회를 제공하는 것도중요하다[51,52]. 피드백은 대화에 참여하는 학습문화를 통해서 학생들이 자신의 사고방식을 바꿀 수 있게 하여 전문직 정체성 형성을촉진할 수 있다[16,53].
  • 딜레마 토론 또한 전문직 정체성 형성을 위한 유용한 학습방법이다. 수업토론 자료로 제공되는 딜레마 상황은 학생들에게 자신이가지고 있는 현재의 가치와 관점을 재검토할 기회를 제공한다[5,15].도전적인 딜레마 상황은 질문하게 하고 비판적 성찰을 통해 핵심가치와 비판적 행동을 강화함으로써 전문직 정체성의 개발을 조정하고 촉진할 수 있다[42].
  • 학생들이 의과대학 교육과정 중에 경험하는 중요한 사건도 전문직 정체성 형성의 중요한 기회이다. 의과대학입학 후
    • 처음으로 사체를 접하거나,
    • 병원현장에서 의사의 생활을실제로 보는 것,
    • 임상실습과정에서 환자의 죽음을 보는 것,
    • 코로나감염에 대처하는 의료팀을 목격하는 상황
      ...에서 교수자는 학생들에게의사가 된다는 것이 무엇을 의미하는지에 대한 성찰과 의미를 유도하고 전문직으로서의 가치를 내면화하도록 안내함으로써 학생들의전문직 정체성 발달을 촉진해야 한다.
  • 정체성 형성과정은 개인적 차원에서 발생하는 심리적 발달인 동시에 공동체 내에서 개인의 역할과 활동 참여과정에서 이루어지는 사회화 과정이기도 하다[7]. 학생들은 사회적 상호작용과정에서 교수의 역할모델을 통해 긍정적 또는 부정적 영향을 받으며[17,18], 학생들은 교수의 행동을 관찰하고, 신념과 철학을 경청하고, 능력 또는 무능력에 주목하기 때문에 교수는 매우 중요한 사회화 대행자이다[54]. 환자, 보호자, 동료, 타 직종 의료인, 일반 대중, 가족 또는친구가 어떻게 대우받는가 하는 것은 학생들의 의식과 무의식 수준모두에 반응하게 하며 이러한 학습은 대부분 암묵적으로 이루어진다[17,18]. 동료 학생 그룹도 공유된 관심사와 가치를 강화하거나 새로운 가치를 형성하는 데 중요한 역할을 한다[39,55,56]. 또 의사와 간호사가 상호작용하는 과정을 보면서 학생들은 진료팀 내에서 팀원으로서 의사의 능력과 역할에 대해 그 가치를 내면화하는 데 영향을받는다[5]. 이러한 과정에서 학생들은 의사의 역할을 배우고, 의학의언어를 습득하고, 직업구조의 위계와 권력구조를 학습하기 때문에역할모델이 중요한 학습방법이라고 할 수 있다[18].

 

다섯째, 전문직 정체성 형성 교육에 있어서 평가는 매우 중요한문제이다. 전문직 정체성 평가는 자신이 누구인지, 한 인간으로서어떤 사람이 되고 싶은지, 전문가로서 어떤 의사가 되고 싶은지에대한 과정을 측정할 수 있어야 한다. 이러한 평가방법은 자기평가,도덕적 추론평가, 기대되는 전문직업적 정체성의 틀을 기준으로 한 다자간 피드백 평가 등이 활용될 수 있다[5,57]. 이 연구결과, 우리나라 전문직업성 관련 교과목의 평가는 지필고사, 과제와 보고서, 토론발표가 가장 많았고, 80% 이상의 대학은 자기평가나 포트폴리오평가를, 30% 이상의 대학은 글쓰기 평가를 활용하지 않는 것으로나타났다. 선행연구는 글쓰기 평가가 학생들의 자기평가, 성찰 및목표설정을 수행하도록 하여 전문직 정체성 형성 교육에 유용함을보고하고 있다[2,3,5,10,53]. 예컨대 도덕적 딜레마 상황에서 학생들의 도덕적 추론능력을 평가하기 위한 이슈 정하기 테스트(the defining issues test)나 피드백 방법을 활용할 수 있다[53]. 포트폴리오 평가를 활용하여 전문직 정체성 학습계획과 성찰, 평가에 학생들을 주도적으로 참여하게 하는 것도 필요하다. 즉 포트폴리오 기록중 입학 시의 에세이, 과정 중 자기평가, 교수 피드백 등의 내용을 주기적으로 점검하고 성찰하는 자기평가방법을 활용할 수 있다[57].우리나라 의학교육에서 전문직 정체성 형성 평가를 위해서 지필고사이외의 다원적이고 다차원적인 평가 및 평가도구를 개발, 적용 및확대할 필요가 있다.

여섯째, 의과대학 행동 규범이 모든 대학에 확대되어야 한다. 화이트코트 세리모니와 행동 규범에 대한 서약은 학생들이 학습과정에서 의사의 공유된 전문직업적 가치를 지키고 윤리적이고 정직하게 탐구하겠다고 약속하는 전문직 정체성 개발과정의 일부다. 이 연구결과를 보면 대부분 대학이 화이트코트 세리모니를 운영하는 것과달리 행동 규범은 약 22%의 대학이 가지고 있지 않았다. 학생 행동규범은 의료를 경험하기 전에 학습자 및 예비 의사로서 학습행위또는 의사의 의료행위에 대해 중요한 것이 무엇인지를 학생들에게생각하게 한다[30]. 화이트코트 세리모니는 흰색 가운에 의미를 부여하고 학생들이 이전까지 머물렀던 강의실에서 벗어나 의학을 실천하는 것이 무엇인지에 대해 생각하고 배우는 의료현장으로 나아가는시간적, 물리적 경계를 넘나들도록 돕는 의식이다[30]. 의과대학은이러한 의식을 통해 인본주의적, 윤리적 실천을 학생들에게 가르치고 시연하는 것이 중요함을 상기시켜야 한다.

일곱째, 전문직 정체성 형성 교육과정을 설계․실행․평가할 의학교육자를 대상으로 교수개발 교육이 필요하다. 이 연구를 위한 자료수집과정에서 연구자가 느낀 점 중 하나는 우리나라 의학교육자들에게 전문직 정체성 형성또는 전문직업성의 개념과 범위에 대한다양한 생각과 혼동이 있고, 그 결과 각 대학의 전문직업성 관련교과목에 포함 또는 배제되는 내용이 달라진다는 것이었다.

  • 협의로 해석하는 경우, 전문직업성, 의료윤리와 법규, 성찰과 자기계발, 환자 중심 의사소통 등의 내용만을 전문직업성 관련 과목으로 인식하였고,
  • 광의로 해석한 경우에는 행동과학, 지역사회의학, 직업환경의학, 역학 등 의료인문학 교육과정 전반을 포함하는 양상을 보였다.

전문직 정체성 형성 교육은 해당 지식을 특정 교과에서 직접적인교육내용으로 다룰 수도 있고, 기초 임상 의료인문학 교육과정과 견고하게 통합적으로 설계하여 전문직 정체성 형성이라는 학습성과에 도달할 수도 있다. 따라서 협의와 광의의 해석 모두 타당할 수있다. 선행연구들은 전문직업성,’ ‘전문직 정체성,’ ‘전문직 정체성형성개념 구분을 명확히 하고[3], 전문직 정체성 형성에 강조점을두게 되면 교육전략도 달라져야 한다고 주장한다[2,7]. 따라서 교육자는 전문직 정체성 형성의 본질에 대한 내용적 지식을 갖추어야하고 가장 적절한 교육방법과 평가방법에 대해서도 이해하고 있어야한다. 교수개발은 학생들의 사회화 과정과 전문직 정체성 형성을촉진하기 위한 교육프로그램의 확대에 있어서 중요한 조건이 된다[3,58].

 

이 연구가 갖는 제한점은 첫째, 자료분석이 대학별로 응답자가보고한 내용을 기반으로 이루어졌기 때문에 교과목 또는 교과목에대한 설명이 누락되었거나 실제 수업과 다르게 기술된 경우 연구결과와 실제 교육현실에 오차가 있을 수 있다. 둘째, 질적 분석방법을사용한 교육내용의 범주화는 연구자의 경험과 직관에 의존하였기때문에 다른 연구자의 관점에서 보면 새로운 분류가 가능할 수 있다.

이러한 제한점에도 불구하고 이 연구는 우리나라 기본의학교육의 현황을 점검하고 전문직 정체성 교육을 확대하기 위한 유용한통찰을 제공했다는 점에서 의의가 있다. 덕목과 역량 중심의 접근방법을 포함해서 이제는 전문직 정체성 형성이라는 관점에서 의사가되는 것을 포함하는 광범위한 접근을 시도할 때이다. 향후 전문직정체성 형성을 지원하기 위한 교육프로그램을 개발하고, 전문직 정체성 형성 교육에 적합한 교수법과 평가방법을 도입하고, 전 생애적관점에서 우리나라 의과대학생, 전공의, 그리고 의사의 전문직 정체성 발달과정을 종단적으로 추적하는 연구와 전문직 정체성 형성을 촉진하거나 저해하는 개인적 요소와 조직문화적 요소 등에 대한다양한 추가 연구가 필요하다.

 

 


This study examined the current status of the medical professionalism curriculum in Korea to suggest a plan to move towards the formation of a professional identity. Professionalism education data from 28 Korean medical schools were analyzed, including the number of courses, required or elective status, corresponding credits, major course contents, and teaching and evaluation methods. Considerable variation was found in the number of courses and credits in the professionalism curriculum between medical schools. The course contents were structured to expand learners’ experiences, including the essence and knowledge of professionalism, understanding of oneself, social interaction with others, and the role of doctors in society and the healthcare system. The most common teaching methods were lectures and discussions, while reflective writing, coaching, feedback, and role models were used by fewer than 50% of medical schools. Written tests, assignments and reports, discussions, and presentations were frequently used as evaluation methods, but portfolio and self-evaluation rates were relatively low. White coat ceremonies were conducted in 96.2% of medical schools, and 22.2% had no code of conduct. Based on the above results, the author suggests that professional identity formation should be explicitly included in learning outcomes and educational contents, and that professional identity formation courses need to be added to each year of the program. The author also proposes the need to expand teaching methods such as reflective writing, feedback, dilemma discussion, and positive role models, to incorporate various evaluation methods such as portfolios, self-assessment, and moral reasoning, and to strengthen faculty development. 
Keywords: Medical students, Professional identity, Professionalism, Socialization

임포스터 신드롬: 당신 또는 당신의 멘티를 억누르고 있는가? (CHEST, 2019)
Impostor Syndrome Could It Be Holding You or Your Mentees Back?
Subani Chandra, MD, FCCP; Candace A. Huebert, MD, FCCP; Erin Crowley, MD; and Aneesa M. Das, MD, FCCP

 

"여기 있는 모든 사람들은 매우 성공적입니다! 그들은 매우 똑똑하고 재주가 있습니다. 나는 이 그룹에 속하지 않는다. 누군가의 실수로 여기 들어온 건 아닌지 궁금하다" 많은 이들이 직장생활 중 어느 순간 이와 비슷한 생각을 했을 것이다. 그러한 생각은 임포스터 증후군의 징후일 수 있다. 

“Everyone here is so successful! They are so smart and accomplished. I do not belong in this group. I wonder if I got invited by mistake.” Many may have had similar thoughts to this at some point in their career. Such thoughts may be a sign of impostor syndrome (IS). 

IS는 객관적인 증거에도 불구하고 자신의 업적이 부당하다고 믿는 성공한 사람들이 경험하는 사기감fraudulence입니다. IS는 교육생, 고급 진료 제공자, 제휴 의료 전문가, 의사를 포함한 모든 의료 전문가들 사이에서 널리 퍼져 있습니다. 비록 IS를 가진 사람들은 성공했지만, 그들은 스스로를 사기꾼으로 간주하고 그들의 성공을 능력보다는 운과 같은 외부 요인에 돌립니다. 자신들에게 부여된 성공과 성취를 진정으로 누릴 자격이 없거나 자격이 없다는 확신에 따라, 그들은 사기꾼으로 드러날까 두려워하며 살아간다. 
IS the feeling of fraudulence experienced by successful individuals who believe that their achievements are undeserved, despite objective evidence to the contrary. IS is prevalent among all health professionals including trainees, advanced practice providers, allied health professionals, and physicians. Although people with IS are successful, they consider themselves to be frauds and attribute their success to external factors, such as luck, rather than ability. Based on the conviction that they are not truly deserving of, or qualified for, the success and achievements attributed to them, they live in fear of being exposed as impostors. 


IS는 심리적인 고통, 특히 우울증과 불안감과 밀접한 관련이 있으며 의사와 훈련생들에게 점점 더 인식되고 있는 문제인 번아웃과 관련이 있다. IS를 가진 개인들은 일반적으로 잘 지내는 것처럼 보이지만 조용히 고군분투할 수 있는 성취도가 높은 사람들이다. IS 훈련생들은 특히 긍정적인 피드백을 내면화하지 못하고, 다른 이들이 자신의 능력에 대해 거짓으로 높은 인상을 갖고 있다는 생각에 자신이 받은 칭찬을 무시하기 때문에 취약하다. 이러한 접근 방식은 종종 능력이나 지능이 향상될 수 없다는 고정적인 사고방식과 결합되어 IS를 보유한 이들의 성장, 학습 및 신뢰에 큰 제약을 줄 수 있습니다. 실제로 IS는 학습자의 웰니스를 개선하는 데 있어 인식되지 않는 장벽이 될 수 있습니다. 또한 IS는 교육생뿐만 아니라 교수진과 리더십에서도 높은 유병률을 보이고 있으며, 시간, 경험, 성공으로 줄어들지 않습니다. IS를 관리하려면 영향을 받는 개인뿐만 아니라 학습 환경과 교육 방식도 포함하는 다각적인 접근 방식이 필요합니다. 

IS is strongly associated with psychologic distress—especially depression and anxiety—and is linked to burnout, a problem that is increasingly recognized in physicians and trainees. Individuals with IS are typically high achievers who seem to be doing well but may be struggling quietly. Trainees with IS are particularly vulnerable because they fail to internalize positive feedback, and disregard the accolades they receive, in the belief that others have a falsely high impression of their abilities. This approach, often combined with a fixed mindset of believing that ability or intelligence cannot be improved, can pose a significant constraint on the growth, learning, and confidence of those with IS. In fact, IS can be an unrecognized barrier to improving trainee wellness. Additionally, IS has a high prevalence not just in trainees but also in faculty and leadership, and it does not abate with time, experience, or success. Managing IS requires a multifaceted approach involving not only the individual affected but also the learning environment and pedagogic styles. 

정의 및 보급률
Definition and Prevalence

IS는 1970년대 후반 클랜스와 아이메스에 의해 성공을 내재화할 수 없는 성취도가 높은 사람들 사이에서 일어나는 현상이라고 처음 설명되었다. IS의 영향을 받은 이들은 자신들의 성공이 능력이 아닌 우연 때문이라고 확신하고 있으며, 그 성과가 미미하다고 보고 있다. 결과적으로 이들은 자신들이 성공률이 높은 사람들 속에서 사기꾼이고 또래들 사이에 속하지 않는다고 믿기 때문에 '발각될까 봐' 두려워하며 살아간다. 

IS was first described in the late 1970s by psychologists Clance and Imes as a phenomenon occurring among high achievers who are unable to internalize their success. Those affected by IS are convinced that their success is because of chance, rather than ability, and that their achievements are insignificant. Consequently, they believe that they are impostors amid highly successful people and do not belong among their peers, so they live with a fear of being “found out.” 

IS를 가진 사람들은 종종 성취도가 높지만, 그들은 성취도가 아니라 결코 충족되지 않는다고 인식되는 내부 기준에 의해 그들의 역량을 측정합니다. Young은 역량에 대한 자체 평가를 바탕으로 IS의 5가지 하위 유형을 설명합니다(표 1). 

Although people with IS are often high achievers, they measure their competence not by their achievements but by an internal set of standards which are never perceived to be met. Young describes 5 different subtypes of IS based on self-imposed assessments of competence (Table 1). 

 


IS를 가진 개인은 자신의 자아 회의와 사기성 감정을 IS로 인식하지 못할 수 있지만, '발각될 것'에 대한 두려움과 같은 IS의 측면과 쉽게 동일시할 수 있다. IS를 식별하고 IS의 심각성을 평가하는 데 도움이 되는 여러 도구가 개발되었습니다. 검증되고 잘 연구된 척도 중 하나는 클랜스 임포스터 현상 척도(표 2)로, 개인이 IS를 보유하고 있는지 여부와 IS의 심각성을 판단하는 데 사용할 수 있다. 
Individuals with IS may not recognize their feelings of self-doubt and fraudulence as IS, but they may readily identify with aspects of IS, such as the fear of being “found out.” Several instruments have been developed to help identify IS and assess its severity. One validated and well-studied measure is the Clance Impostor Phenomenon Scale (Table 2), which can be used to determine if an individual has IS and, if so, its severity. 






IS는 다양한 문화, 직업, 계급, 그리고 성공의 수준에 걸쳐 남성과 여성 모두에게 영향을 미칩니다. 실제로 많은 연예인들이 임포스터리즘에 대한 감정을 인정했고, 70%의 사람들이 IS를 한 번쯤 경험하게 될 것으로 추산된다. 클랜스와 아이메스는 IS가 여성에게만 일어나는 현상이라고 처음 보고했지만, 이후 연구에 따르면 남성도 IS를 경험하는 것으로 나타났다. 남성도 여성과 마찬가지로 성공에 대한 기대가 낮고 자신의 성취를 행운으로 돌릴 수 있지만, IS의 심각성은 여성에게서 더 높은 경향이 있다는 연구결과도 있다. 
IS affects both men and women across different cultures, occupations, ranks, and levels of success. In fact, many celebrities have acknowledged having feelings of impostorism, and it is estimated that 70% of people will experience IS at least once. Although Clance and Imes initially reported IS as a phenomenon occurring exclusively in women, further work has shown that men experience IS as well. Although men, just like women, can have low expectations of success and attribute their achievements to luck, some studies suggest that the severity of IS tends to be higher in women. 

훈련병 등 의료인이 IS에 특히 취약할 수 있다. 보건전문학교로의 경쟁적인 입학전형은 좋은 성적을 거두기 위해 스스로를 몰아붙이는 사람들을 선발하는 경향이 있다. 일단 선발되면, 이러한 최고의 성과자들은 종종 다른 비슷한 성취도가 높은 사람들에게 둘러싸여 있다는 것을 발견하게 되는데, 이것은 그들 자신의 성취를 비정형적이기 보다는 전형적인 것으로 정상화시킨다. 의료 훈련과 실습으로의 전환 과정에는 새로운 도전이 가득한데, 이는 자아 회의와 사칭의 감정을 고조시킬 수 있다. 헤닝 등은 한 대학의 의대생, 치과생, 간호생, 약대생 477명을 대상으로 IS 확산률을 30%로 집계했다. 빌웍 등은 의대생 138명 중 여성의 약 50%, 남성의 약 25%가 IS의 영향을 받았다고 전했다. 대부분의 연구는 임포스터리즘의 감정이 더 많은 훈련과 경험으로 누그러지지 않는다는 것을 보여준다. 실제로 빌웍 등은 의과대학 4학년이 훈련 초반과 비교해 IS의 증가와 상당한 연관성이 있다는 사실을 밝혀냈다. 대학원 의학교육 등에서도 IS의 높은 유병률이 이어지고 있다. 오리엘 등은 가정의학과 거주자 255명을 대상으로 조사한 결과 약 3분의 1이 IS(여성 41%, 남성 24%)를 보유하고 있는 것으로 나타났다. 캐나다의 48명의 내과 레지던트들을 대상으로 한 또 다른 연구에서 43.8%가 IS를 가지고 있다고 보고했다. 더군다나 외국인 유학생은 국내 졸업생에 비해 IS 보유 확률이 11배 가까이 높았다. 미국에서 수련하고 있는 대학원생과 의사들의 약 4분의 1이 국제적인 의학 졸업생들이라는 점을 고려하면, 이 연구 결과는 특히 주목할 만하다. 성취를 자신의 타고난 능력에 돌리지 못하고, 다음 번에는 운이 따르지 않을 수도 있다는 두려움은 성공이 임포스터리즘의 감정을 영속시키게 한다. 이에 따라 교수진 내 IS 유병률도 비슷하게 높은 것으로 나타났다. 

Medical professionals, including trainees, may be particularly vulnerable to IS. The competitive admissions process into health profession schools tends to select individuals who push themselves to perform well. Once selected, these top performers often find themselves surrounded by other similar high achievers, which normalizes their own achievements as typical rather than atypical. The process of medical training and transition to practice is fraught with new challenges, which can heighten feelings of self-doubt and impostorism. In 477 medical, dental, nursing, and pharmacy students at one university, Henning et al found the prevalence of IS to be 30%. Villwock et al reported that about 50% of women and 25% of men, out of 138 medical students, were affected by IS. Most studies show that impostor feelings do not abate with more years of training and experience. In fact, Villwock et al found that the fourth year of medical school was significantly associated with an increase in IS compared with earlier years in training. The high prevalence of IS continues into graduate medical education and beyond. Oriel et al surveyed 255 family medicine residents and found that about one-third had IS (41% of women and 24% of men). In another study of 48 internal medicine residents in Canada, Legassie et al reported that 43.8% had IS. Furthermore, foreign-trained residents had almost 11 times higher odds of having IS compared with local graduates. Given that approximately one-quarter of postgraduate trainees and physicians practicing in the United States are international medical graduates, this finding is particularly striking. The failure to attribute achievements to one’s inherent ability, and the fear that luck may not be so favorable next time, allows success to perpetuate the feelings of impostorism. As a result, the prevalence rate of IS among faculty also appears to be similarly high. 


영향 
Impact 

IS는 개인의 심리적, 신체적, 직업적 행복에 상당한 영향을 미칩니다(표 3). 성공을 내면화하지 못하는 것, 자기 회의감을 품는 것, 외부의 통제거점을 갖는 것, 능력의 인상을 유지하기 위한 만연한 필요성은 모두 IS를 가진 사람들의 심리적 안녕을 방해한다. IS는 훈련생들의 우울증과 불안감을 포함한 심리적 고통과 상당한 관련이 있다. 실제로 의대·치대·간호대·약대 학생들 사이에서는 IS의 중증도가 연령·성별·인종·결혼 여부·학년·정신건강치료 이력 등 평가된 모든 인구통계학적·인성적 데이터보다 일반적인 심리적 고통과 상관관계가 더 컸다. 
IS has significant impact on an individual’s psychologic, physical, and professional well-being (Table 3). The failure to internalize success, harboring feelings of self-doubt, having an external locus of control, and the pervasive need to maintain the impression of ability all interfere with the psychologic well-being of those with IS. IS is significantly associated with psychologic distress in trainees, including depression and anxiety. In fact, among students in medicine, dentistry, nursing, and pharmacy schools, the severity of IS was more strongly correlated with general psychologic distress than all of the demographic and personality data evaluated, including age, sex, race, marital status, academic year, and history of mental health treatment. 

 

IS를 가진 사람들은 실패를 피하기 위해 많은 압박을 받는 경향이 있습니다. 특히 가시성이 높을 수 있는 과제에 직면했을 때, 잠재적인 실패에 대한 불안감과 비현실적인 높은 기준이 결합되어 완벽주의나 미루는 등 부적응적인 방식으로 반응하게 된다. 과로하고, 과도하게 준비하고, 완벽을 추구하는 사람들은 그들의 성공을 업무에 투입된 일의 양으로 돌린다. 막판에 일을 미루고 집중적인 준비를 하는 사람들은 자신의 성공을 행운으로 돌립니다. IS를 가진 사람들은 어떠한 일탈이 실패의 가능성을 증가시킬 것이라는 두려움 때문에 이러한 부적응적인 업무 습관을 고칠 수 없다. 이는 신체적, 정신적 피로로 이어질 수 있으며, 이러한 사람들은 높은 수준의 성과를 유지하는 능력에 대해 불확실함을 느낄 수 있다. 결과적으로, 그들은 잠재력의 전체 규모에 도달하지 못하는 결과로 중요한 기회를 피할 수 있다. 실제로 IS를 가진 개인들은 성공에 대한 두려움으로 발전할 수 있는데, 그 이유는 거기에 따르는 추가적인 책임감과 가시성 때문이다. 이는 새로운 도전이 끊이지 않고 잦은 수행 평가가 강조되는 학업 환경에서 특히 매서운poignant 것이다. 

Individuals with IS tend to place themselves under a lot of pressure to avoid failure. In particular, when faced with a task that may have high visibility, the anxiety of potential failure combined with their unrealistic high standards causes them to react in maladaptive ways such as perfectionism and procrastination. Those who overwork, overprepare, and seek perfection (such that the input is out of proportion to the impact on the quality of their work) attribute their success to the amount of work put into the task. Those who procrastinate and do intense preparation at the last minute attribute their success to luck. Individuals with IS are unable to break these maladaptive work habits because of the fear that any deviation will increase the likelihood of failure. This can lead to physical and mental exhaustion, such that these individuals feel uncertain about their ability to maintain their high level of performance. As a result, they may avoid prominent opportunities with the consequence of failing to reach the full scale of their potential. Indeed, individuals with IS may develop a fear of success because of the additional responsibility and visibility that can come with it. This is particularly poignant in the academic setting where new challenges are continually encountered and there is an emphasis on frequent evaluations of performance. 

특히, 이러한 업무 관련 스트레스, 신체적, 정서적 피로, 그리고 IS와 겹치는 다른 심리적 동반성 또한 번아웃과 관련이 있다. 빌웍 등은 의대생들의 IS와 번아웃의 연관성을 조사한 결과 IS가 정서적 탈진, 이인화, 개인적 성취도 감소 등 번아웃 증후군의 여러 가지 요소와 유의미한 상관관계를 보였다. 레가시 등은 48명의 내과 레지던트들을 대상으로 이 관계를 연구했고 IS와 개인 성취도 사이의 부정적인 상관관계를 보고했다. IS를 가진 사람들이 그들의 성취를 받을 자격이 없다고 느낀다는 것을 고려하면 이것은 아마도 놀랍지 않을 것이다. 

Notably, these conditions of work-related stress, physical and emotional exhaustion, and other psychologic comorbidities that overlap with IS are also associated with burnout. Villwock et al examined the association between IS and burnout in medical students and found that IS was significantly correlated with multiple components of burnout syndrome, including emotional exhaustion, depersonalization, and reduced personal accomplishment. Legassie et al studied this relationship in 48 internal medicine residents and reported a negative correlation between IS and the personal accomplishment scale. This is probably not surprising given that individuals with IS feel undeserving of their accomplishments. 

IS를 가진 전문직 종사자들은 그들의 심리적인 행복에 상당한 대가를 치르고도 임상적, 학술적 업무를 효과적으로 수행하는, 전형적으로 높은 성취도가 높다. 하지만, 열심히 일해서 성취하는 것이 그들의 진정한 능력을 향상시키지 못한다고 믿는 고정된 마음가짐으로 인해 그들의 성장이 저해될 수도 있습니다. 그들은 자신의 성공이 자신의 기술이라기보다는 환경에 기인한다고 긍정적인 피드백을 무시합니다. 그 결과, 성공에 대한 객관적인 증거도, 우수한 성과에 대한 진실된 주관적 확신도 임포스터리즘의 감정을 제거하지 못한다. 프로그램 감독, 멘토, 감독 역할의 사람들은 성취도가 높고 성공한 개인들조차도 어려움을 겪을 수 있고 긍정적인 피드백이 그들을 돕는데 충분하지 않을 수 있다는 것에 주목하는 것이 중요하다. IS를 보유하고 있는 사람들에게 IS를 인식하고 관리하는 것이 필수적입니다.
Despite their self-perceived fraudulence, professionals with IS are typically high achievers who effectively fulfill their clinical and academic work, even at significant cost to their psychologic well-being. However, their growth may be impeded by having a fixed mindset with the belief that accomplishment through hard work does not improve their true ability. They disregard positive feedback by attributing their success to circumstance rather than their own skill. As a result, neither objective evidence of success nor sincere subjective assurances of superior performance remove the feelings of impostorism. It is important for program directors, mentors, and those in supervisory roles to note that even high-achieving, successful individuals may be struggling and that positive feedback may not be enough to help them. It is imperative to recognize and manage IS in those who have it. 


IS 자체 관리
Managing IS in Ourselves


임포스터리즘의 핵심이 '발각될까 봐' 하는 두려움이라는 점에서 임포스터리즘 감정을 가진 대부분의 사람들은 침묵 속에서 고통을 겪는다. IS를 상대하기 위한 필수적인 초기 단계는 IS를 인식하고, 그것이 어떤 존재인지에 대한 imposter-like feelings에 이름을 붙이는 것입니다. 이것은 적절한 맥락에서 불충분함과 사기성의 감정을 이해하는데 도움을 줄 수 있다. 문제를 명명하는 것은 또한 그것을 둘러싼 대화를 열어주기 때문에 고립되어 고통 받을 필요가 없다. 

Most people with impostor feelings suffer in silence given that the core of impostorism is a fear of being “found out.” The essential initial step in dealing with IS is recognizing it and naming the impostor-like feelings for what they are. This can help one understand the feelings of inadequacy and fraudulence in the right context. Naming the problem also opens up dialogue surrounding it, so one does not have to suffer in isolation. 

비록 약간의 자기 회의감을 갖는 것은 일반적인 일이고 바람직할 수 있지만, 이러한 감정들이 성공할 자격이 없다는 믿음으로 이어지면 안 된다. IS 개인들은 자신의 성공을 지나치게 강조하는데 겸손해 보일지 모르지만 겸손해 보이는 것은 어떻게든 자신을 속여 지금의 지위에 이르게 했다고 믿는 것과는 다르다. IS의 슈퍼스튜던트/여성/남성 아형은 그들의 단점에 집중하며 종종 그들의 많은 업적을 간과할 수 있습니다. 한 사람의 성공과 그것에 기여한 기술에 대한 객관적인 평가는 이러한 믿음과 싸우는 것을 도울 수 있다. 이를 위한 한 가지 방법은 자신의 업적과 성과를 내기 위해 사용된 핵심 기술을 나열하여 개인적인 경력 성공 목록을 작성하는 것이다. 게다가, 자신이 잘하는 것을 나열하는 것은 약점에서 강점으로 초점을 옮길 수 있습니다. 
Although some feelings of self-doubt are usual and expected, these should not lead to the belief that one does not deserve to succeed. Individuals with IS deemphasize their success, which may seem like humility, but being modest is different from believing one has somehow managed to fake one’s way to the current position. The superstudent/woman/man subtype of IS focuses on their shortcomings and can often overlook their many achievements. An objective evaluation of one’s successes and the skills that contributed to those can help combat these beliefs. One way of doing so is to conduct a personal career success inventory by listing one’s achievements and the core skills used to bring these to fruition. Additionally, listing things that one does well can shift the focus from weaknesses to strengths. 

다만 IS를 경험하는 사람에게 성공과 장점을 객관적이고 진실하게 나열하는 일은 스트레스가 될 가능성이 높다. 자신의 능력에 대한 현실적인 평가를 제공하는 또 다른 선택은 멘토와 동료들과의 강한 관계를 이용하는 것이다. 멘토들의 지지적이고 격려적인 지도는 한 사람이 사칭주의의 감정을 일반적이고 비합리적인 것으로 인식하도록 도울 수 있다. 임포스터 감정을 털어놓을 수 있는 동료들을 신뢰하면 스트레스와 긴장감이 줄어들고 고립감을 없앨 수 있다. 특히, 이 기술은 솔리스트 아형의 측면이 있는 사람들이 공동체의식을 성공의 일부로 받아들이도록 도울 수 있다. 동료들은 또한 객관적이고 현실적인 피드백을 제공할 수 있습니다. 그럼에도 IS를 이끌어낸 뿌리 깊은 신념을 바꾸는 데는 시간과 끈기가 필요하다. 
However, the task of listing successes and strengths in an objective and truthful manner for someone experiencing IS is likely to be stressful. Another option to provide a realistic assessment of one’s abilities is to use strong relationships with mentors and colleagues. The supportive and encouraging guidance of mentors can help one recognize feelings of impostorism as both common and irrational. Having trusted colleagues in whom to confide impostor feelings reduces stress and tension and can remove the sense of isolation. In particular, this technique can help those with aspects of the soloist subtype to embrace a sense of community as being part of success. Peers can also provide objective and realistic feedback. Nonetheless, changing the deep-rooted beliefs that led to IS in the first place takes time and persistence. 

IS를 극복하려면 imposter-like thinking의 고리를 끊는 것이 중요하다. Thought stopping and Shipping은 생각의 패턴을 바꾸기 위해 사용할 수 있는 두 가지 방법입니다.

  • 사고중단은 타고난 천재성과 전문가 아형의 측면을 가진 사람들에게서 흔히 볼 수 있는 문제적 사고를 방해하는 것을 목표로 하는 자기실천적인 인지 개입이다. 부정적인 생각을 염두에 두고mindful, 좀 더 긍정적인 생각으로 대체하는 것이 이 기술의 기본이다. 이러한 긍정적인 생각들을 자기 연민과 자신에 대한 친절로 뿌리내리는 것은 한 사람의 능력에 대해 더 건설적이고 비판적이지 않은 관점을 만들어 낼 수 있게 한다.
  • 배송비즈니스 문헌에서 사용되는 용어로서, 아이디어가 완벽해질 때까지 출시나 발표를 미루지 않는 개념을 나타냅니다. 배송은 누군가의 안전지대를 벗어나게 하는데, 이것은 특히 완벽주의자와 전문가 IS의 하위 유형에게 성장과 창의성에 강한 자극이 된다. 그것은 또한 자신의 실수를 용서하게 함으로써 자기 연민을 형성합니다. 전문적인 치료와 상담은 사기꾼과 같은 사고의 순환을 끊기 위해 사용되는 도구에 추가적인 깊이를 제공하는 데 도움을 줄 수 있다.

Breaking the cycle of impostor-like thinking is critical to overcoming IS. Thought stopping and shipping are two methods one can use to change patterns of thought.

  • Thought stopping is a self-practiced cognitive intervention aimed at interrupting problematic thoughts that are common in those with aspects of the natural genius and expert subtypes. The basis of the technique is to be mindful of negative thoughts and replace them with something more positive. Rooting these positive thoughts in self-compassion and kindness toward oneself allows one to generate a more constructive and uncritical view of one’s abilities.
  • Shipping, a term used in business literature, represents the concept of not waiting until an idea is perfect before launching or presenting it. Shipping pushes one outside one’s comfort zone, which is a strong stimulus for growth and creativity especially for the perfectionist and expert IS subtypes. It also builds self-compassion by allowing one to forgive one’s mistakes. Professional therapy and counseling can help provide additional depth to the tools used to break the cycle of impostor-like thinking. 

우리가 가르치는 분야에서의 주소 지정
Addressing IS in Those We Teach

우리가 가르치고 멘토링하는 이들에게 IS를 인식하고 대처하는 것은 우리 스스로 IS를 관리하는 것만큼 중요합니다. IS는 교육생들이 최고의 잠재력에 도달하는 것을 막을 수 있으며 의학 교육에 여러 가지 영향을 미칩니다. IS를 보유한 교육생이 많은 만큼 교육적 접근에 적응하고 후원을 받을 수 있는 학습환경을 조성하는 것이 중요하다. 실제로, 많은 기관들이 학생들의 IS를 관리하기 위해 구체적이고 구조적인 개입을 개발했습니다. 교육생들이 IS를 인지하고 관리할 수 있도록 힘을 실어주는 프로그램은 교육생들이 성과를 최적화하는 데 도움을 줄 수 있다. 

Recognizing and addressing IS in those we teach and mentor is just as important as managing IS in ourselves. IS can prevent trainees from reaching their highest potential and has several implications for medical education. Given the large number of trainees with IS, it is important to adapt pedagogic approaches and create a supportive learning environment. In fact, a number of institutions have developed specific structured interventions to manage IS in students. Programs that empower trainees to recognize and manage IS can help trainees optimize their performance. 

IS 자체를 완화하기 위해 언급된 몇 가지 기술은 교육생들의 IS를 해결하는 데에도 사용될 수 있습니다. 멘토는 멘티로 하여금 inadequacy와 fraudulence의 감정은 IS의 결과라는 것을 이해하도록 도울 수 있습니다. 이를 통해 IS 보유자들이 혼자가 아님을 알게 하는 것은 물론 멘토-멘티 관계에 대한 정직성과 신뢰도 강화할 수 있다. 이러한 신뢰는 훈련생의 능력에 대한 객관적인 평가를 그들과 공유하는 데 중요한 역할을 할 수 있습니다. 성취의 사실에 집중하고, 외적인 요인보다는 기술과 능력에 귀속시키는 것이 교육생들이 성공을 내면화하는 데 도움이 될 수 있다. 예를 들어, 만약 훈련생이 긍정적인 결과를 행운에 돌린다면, 멘토는 그들의 성공을 내적 요인으로 돌림으로써 생각을 재구성하는 것을 도울 수 있다. 
Several of the techniques mentioned, to mitigate IS in oneself, can also be used to address IS in trainees. A mentor can help a mentee understand that their feelings of inadequacy and fraudulence are in fact a result of IS. Not only does this let individuals with IS know that they are not alone, it can also strengthen honesty and trust in the mentor-mentee relationship. This trust can play a vital role in sharing an objective assessment of a trainee’s abilities with them. Focusing on the facts of accomplishments, and attributing them to skill and ability rather than external factors, can help trainees internalize their success. For example, if a trainee attributes a positive outcome to luck, a mentor can help reframe their thoughts by crediting their success to internal factors, such as being efficient or leading with authority. 

또한 멘토들은 종종 IS에 수반되는 고정된 사고방식을 성장 마인드로 전환하는 데 중요한 역할을 할 수 있습니다. 이는 IS 훈련생들이 좌절을 사칭꾼이라는 증거로 받아들이기보다는 학습과 성장의 본질적인 부분으로 바라볼 수 있도록 돕는다. 성장형 마음가짐 육성을 위한 몇 가지 팁에는 다면적인 피드백 제공, 투쟁을 기회로 보기, 지능만이 아닌 새로운 접근과 좋은 방향의 노력을 칭찬하기, 목표 설정으로 자기 성찰을 장려하기 등이 있다. 

Furthermore, mentors can play an important role in shifting a fixed mindset that often accompanies IS to a growth mindset. This helps trainees with IS to view setbacks as an inherent part of learning and growth rather than accepting them as proof that they are impostors. Some tips for nurturing a growth mindset include providing multifaceted feedback, viewing struggle as opportunity, praising an attempt at a new approach and well-directed effort instead of intelligence alone, and encouraging self-reflection with goal setting. 

자신과 다른 사람을 비교하는 것은 종종 IS 경험의 밑바탕이 되며, 특히 다른 사람들이 더 유능하다고 인식할 때 더 그렇다. 연구 결과에 따르면 교사가 만드는 환경은 학생이 공간을 배움의 기회로 보는지, 또래와 자신을 비교하고 대조하는 장으로 보는지에 상당한 영향을 미칠 수 있다. 전자는 동기 부여의 더 안정적인 형태이고, 후자는 훨씬 더 스트레스를 많이 받는다. 교육생의 부족함을 드러낼 수 있는 방식으로 가르치는 것은 당황스러움에 대한 두려움 때문에 창의력과 지적 호기심을 억누를 수 있다. IS를 가진 훈련생들은 성공을 확신하지 않는 한 대답을 주저하기 때문에 배우고 능력을 발휘할 기회를 놓친다. IS는 교육생들의 학습과 성장에 중요한 역할을 할 수 있습니다. 교육 스타일을 수정하고 사칭 감정을 관리할 수 있도록 지원과 지도를 하는 것이 교육생들의 진로와 웰빙 과정에 큰 영향을 미칠 수 있다. IS 격퇴 전략은 표 4에 요약되어 있습니다. 
Comparing oneself with others is oftentimes a cornerstone of the IS experience, especially when others are perceived as being more competent. Research suggests that the environment that teachers create can significantly affect whether a student views the space as an opportunity to learn, or as a venue to compare and contrast themselves with their peers. The former is a more stable form of motivation, and the latter is far more stressful. Teaching in a way that can expose a trainee’s inadequacies can suppress creativity and intellectual curiosity because of fear of embarrassment; these feelings are heightened in IS. Trainees with IS hesitate to answer unless certain of success, therefore missing opportunities to learn and showcase ability. IS may play a significant role in the learning and growth of trainees. Modifying teaching styles and providing support and guidance to manage feelings of impostorism can have a significant impact on the course of trainees’ careers and well-being. The strategies to combat IS are summarized in Table 4. 

결론들
Conclusions

IS는 의료계에 만연해 있으며 특히 훈련생들에게 심각한 심리적, 직업적 영향을 미칩니다. IS를 해결하기 위한 첫 번째 단계는 인식 제고입니다. 일단 확인되면, 영향을 받는 개인들과 멘토와 교육자들은 잘못된 자기 회의를 제거하고 부정적인 생각과 부적응적인 행동을 다루기 위한 조치를 취할 수 있습니다. IS를 보유한 개인은 업적과 진정한 능력을 인정함으로써 정신적, 육체적 건강을 유지하면서 가장 높은 직업 목표를 위해 노력할 수 있습니다.

IS is prevalent in the medical profession and has serious psychologic and professional implications, particularly for trainees. The first step to addressing IS is increased awareness. Once identified, affected individuals, and mentors and educators, can work to eliminate the misplaced self-doubt and take steps to address negative thoughts and maladaptive behaviors. By acknowledging achievements and true ability, individuals with IS can be empowered to strive for their highest career goals while maintaining mental and physical wellness.

 

 


Chest. 2019 Jul;156(1):26-32.

 doi: 10.1016/j.chest.2019.02.325. Epub 2019 Mar 11.

Impostor Syndrome: Could It Be Holding You or Your Mentees Back?

Affiliations collapse

Affiliations

1Division of Pulmonary, Allergy and Critical Care, Columbia University Vagelos College of Physicians and Surgeons, New York, NY.

2Division of Pulmonary, Critical Care, Sleep, and Allergy, University of Nebraska Medical Center, Omaha, NE.

3Division of Pulmonary and Critical Care, Indiana University School of Medicine, Indianapolis, IN.

4Division of Pulmonary, Critical Care, and Sleep, The Ohio State University, Columbus, OH. Electronic address: aneesa.das@osumc.edu.

PMID: 30872019

DOI: 10.1016/j.chest.2019.02.325

No abstract available

Keywords: burnout; impostor syndrome; program director; trainee.

 

무엇이 곁에 선 안내자가 되게 만들어주는가? 보건의료전문직 교육에서 멘토들의 동기 및 접근법에 대한 질적 연구(Med Teach, 2022)
What sparks a guide on the side? A qualitative study to explore motivations and approaches of mentors in health professions education
Subha Ramani, Rashmi A. Kusurkar, Evangelos Papageorgiou & Susan van Schalkwyk

 

 

소개
Introduction

멘토링은 다양한 직업에서 직업 개발, 직업 정체성 형성, 직업 만족에 대한 가치 있는 접근법으로 널리 받아들여진다. 2004; Berk 등. 2005; Sambunjak 등. 2006; Taylor 등. 2009; Driessen 등. 2011; Polololi 등. 2015; Choi 등. 2019). 보건 직업 교육(HPE)의 맥락에서 멘토쉽은 멘토 보유의 중요성, 학부 및 대학원 수준의 멘토쉽 특성, 성공적인 멘토-멘티 관계의 특성을 전경으로 하는 연구와 함께 잘 문서화되어 있다(Sambunjak 등. 2006; Driessen 등, 2011; Kashiwagi 등 20).13; Van Schalkwyk 등) 멘토링의 가치를 강조하고 교육자 포트폴리오에서 멘토링 역할의 중요성에 대한 인식을 높이는 연구(Simpson et al. 2007, 2013)에도 불구하고, 멘토가 이러한 역할을 맡는 이유에 대해서는 알려진 바가 거의 없다. 구체적으로, 왜 HPE의 리더들이 비공식적이고 국제적인 멘토링 역할을 자발적으로 받아들이는지 불분명하다. 이러한 지식은 가상 멘토링과 협업이 증가하는 이 시대에 가치가 있을 수 있습니다.
Mentoring is widely accepted as a valuable approach to professional development, professional identity formation, and career satisfaction in a variety of professions (Farrell et al. 2004; Berk et al. 2005; Sambunjak et al. 2006; Taylor et al. 2009; Driessen et al. 2011; Pololi et al. 2015; Choi et al. 2019). Mentorship in the context of health professions education (HPE) has been well-documented with studies foregrounding the importance of having a mentor, the nature of mentorship at both undergraduate and postgraduate level, and characteristics of successful mentor-mentee relationships (Sambunjak et al. 2006; Driessen et al. 2011; Kashiwagi et al. 2013; van Schalkwyk et al. 2017). Despite research emphasising the value of mentoring, and increasing recognition of the importance of mentoring roles in educators’ portfolios (Simpson et al. 2007, 2013), little is known about why mentors take on this role. Specifically, it is unclear why leaders in HPE voluntarily accept informal and international mentoring roles. This knowledge could be valuable in this era of increasing virtual mentoring and collaborations.

멘토링 역할을 맡은 이유는 멘토링 관계를 구축하는 방법에 영향을 미칠 수 있습니다. 그러나 HPE에 대한 연구는 멘토 관점에서 이러한 동기를 탐구한 연구는 거의 없다(Coates 2012). 앨런 외 연구진(1997)과 다른 이들은 멘토링의 동기가 외부 또는 타인-집중과 내부 또는 자기 집중으로 분류될 수 있다고 주장했다(Allen 외 1997; Beara 및 Hwangb 2015; Malota 2017). [타인-집중적인 동기]는 그 분야에 대한 지식을 다른 사람들에게 전달하고 돕고자 하는 열망을 특징으로 하는 반면, [자기 집중적인 동기]는 자신의 학습과 만족감을 증가시키고자 하는 열망을 나타낸다. 예를 들어, 중등학교 연구는 주니어 교사들이 멘티들 사이에서 더 나은 선생님들을 발전시키는 데 도움이 될 뿐만 아니라 멘토들을 위한 리더십의 디딤돌로 작용한다고 보고한다(Little 1990). 비즈니스 문헌에 따르면 좋은 멘토링의 수혜자였던 임원들은 다른 사람들을 멘토링할 의사가 더 많으며(Allen 등 1997), 멘토링 역할을 네트워킹, 승진 또는 유산을 남기는 기회로 보는 경우가 많다(Aryee 등 1996). 비록 모든 멘토링 관계가 자신과 다른 집중의 결합일 가능성이 있지만, 지배적인 초점은 멘토링 관계가 어떻게 구성되는지에 영향을 미칠 수 있다.
Mentors’ reasons for taking on mentoring roles could influence how they construct their mentoring relationships (Wang et al. 2009; van Ginkel et al. 2016), but few studies in HPE have explored these motivations from the mentors’ perspective (Coates 2012). Allen et al. (1997) and others have argued that motives for mentoring could be classified as outward or other-focussed and inward or self-focussed (Allen et al. 1997; Beara and Hwangb 2015; Malota 2017). Other-focussed motives feature a desire to help and pass on knowledge about the field to others, while self-focussed motives indicate a desire to increase own learning and sense of gratification. Drawing upon research from other fields, for example, secondary school studies report that mentoring junior teachers not only helps develop better teachers among mentees, but also serves as a stepping stone to leadership for the mentors (Little 1990). Business literature indicates that executives who have been the beneficiaries of good mentoring are more willing to mentor others (Allen et al. 1997), and many view mentoring roles as opportunities to network, advance in their career or leave a legacy (Aryee et al. 1996). Although all mentoring relationships are likely to be a combination of self and other focussed, the focus that is dominant could influence how mentoring relationships are constructed.

멘토-멘티 관계는 멘토링의 핵심이며, 할당받지 않은, 비공식적인, (자신의) 선택을 통해 만들어진 관계가, 기관에서 공식적으로 지정한 관계보다, 직업적 만족도를 높이는 데 더 성공적일 수 있다고 주장되어 왔다(Jackson 등 2003; Dobie 등 2010). 멘토-멘티 교육자 디아드의 경우, 이상적인 관계는 멘티의 변화하는 요구에 상호적이고, 상호 유익하며, 반응해야 한다(Dobie et al. 2010). Losveld 등은 최근 멘토 관계에서 멘토들이 가지고 있는 네 가지 주요 포지션을 설명했다: 촉진자, 코치, 모니터, 그리고 모범; 저자들은 이러한 포지션을 그들의 믿음을 연습에 적용하는 방법과 연결시켰다(Loosveld 등 2020). 
Mentor-mentee relationships are at the core of mentoring and it has been argued that those that are unassigned, develop informally and through choice may be more successful in enhancing professional satisfaction than those formally assigned by institutions (Jackson et al. 2003; Dobie et al. 2010). For mentor-mentee educator dyads, the ideal relationship should be reciprocal, mutually beneficial, and responsive to the mentee’s changing needs (Dobie et al. 2010). Loosveld et al. recently described four major positions held by mentors in their mentoring relationships: the facilitator, coach, monitor, and exemplar; the authors linked these positions to how they apply their beliefs to practice (Loosveld et al. 2020). 

기술의 발전은 지리적 경계에 구애받지 않는 관계를 촉진했다(그리피스 및 밀러 2005). E-멘토링은 "시간과 공간의 한계를 확장하고 평등한 역학을 만들어내"며, 멘티의 특정 요구에 맞춘 경우 혁신적인 전문적 개발을 제공할 수 있는 잠재력이 있다. 따라서 본 연구에서는 멘토들이 지리적 경계를 넘어 자발적으로 멘토링 역할을 수행하도록 동기 부여가 무엇인지, 그리고 이러한 동기가 멘토링의 선택에 어떤 영향을 미치는지 이해함으로써 이 분야의 작업을 진전시키는 것을 목표로 했다. 
Advances in technology have facilitated professional relationships unconstrained by geographical boundaries (Griffiths and Miller 2005). E-mentoring “extends the limitations of time and space and creates egalitarian dynamics” (Schichtel 2009, 2010) with the potential to provide transformative professional development if tailored to mentees’ specific needs (Dorner et al. 2021). In this study, therefore, we aimed to take the work in this area forward by seeking to understand what motivates mentors to volunteer to take on a mentoring role across geographical boundaries, and how this motivation influences the choice of strategies they bring to bear on it. 

  • 어떤 요소들이 보건 직업 교육의 고위 지도자들에게 그들의 기관 밖에서 더 많은 후배들과 교육자 지망생들을 멘토링하도록 동기를 부여합니까?
  • 참가자들이 효과적인 멘토 관계를 육성하기 위해 일반적으로 채택하는 접근법은 무엇입니까?
  • 글로벌 가상 멘토링에 대한 참가자들의 견해는 어떻습니까?
  1. What factors motivate senior leaders in health professions education to mentor more junior and aspiring educators outside their own institutions?
  2. What approaches do participants commonly adopt to nurture effective mentoring relationships?
  3. What are participants’ perspectives about global virtual mentoring?

방법들
Methods

비록 이 정성적인 연구는 내적, 외적으로 초점을 맞춘 멘토 동기와 접근법의 개념적 프레임워크에 의해 지도되었지만, 우리는 귀납적으로 작업했으며, 다양한 주제들의 발견에 개방적이었다. 우리의 이론적 입장은 [사회 구성주의의 상호 작용주의적 관점], 즉 멘토와 멘티 사이의 경우 사회적 상호 작용을 통해 의미와 정체성이 생성되는 방법이었다(Mead et al. 2015).

Though this qualitative study was guided by the conceptual framework of inward and outward-focussed mentor motivations and approaches, we worked inductively and remained open to discovery of a variety of themes. Our theoretical stance was an interactionist perspective of social constructionism, i.e. how meaning and identity are generated through social interactions, in this case between a mentor and mentee (Mead et al. 2015).

스터디 설정
Study setting

유럽 의료 교육 협회(AMEE)는 보건 직업 교육자들을 위한 가장 큰 국제 기구 중 하나이다. 멘토링을 명시적인 우선순위로 강조하기 위해, AMEE는 2019년 연례 회의에서 제도적, 지리적 경계를 넘어 멘토링 이니셔티브를 구현했다. 멘토나 멘티로 참여하는데 관심이 있는 사람들은 그들의 위치, 직업적 역할, 전문성, 관심사에 대한 간단한 설문조사를 완료하도록 요청받았다. 멘토는 AMEE 내 펠로우십 성과나 학력 및 현장 참여도 측면에서 공식적인 국제적 인정을 바탕으로 선발됐다. 36명의 멘토-멘티 쌍을 매칭하고, 서로의 이메일과 함께 제공하며, 그들 자신을 소개하고, 그들의 관계에 대한 목표에 대해 논의하고, 그들의 적합성을 확인하고, 온라인 및 직접 미팅 일정을 잡기 위해 더 많은 의사소통을 요청했습니다. 매칭은 글로벌 멘토 풀의 다양성을 활용했습니다. 모든 멘티가 다른 나라에 위치한 멘토와 짝을 이뤄 컨퍼런스에서 직접 만났더라도, 원거리 관계가 필요했다. 이 이니셔티브에 참여하는 것은 전적으로 자발적이었으며 참여하지 않는 것은 조직 내에서의 그들의 지위에 영향을 미치지 않았을 것이다.
The Association for Medical Education in Europe (AMEE) is one of the largest international organisations serving health professions educators (www.amee.org). To highlight mentoring as an explicit priority, AMEE implemented a mentoring initiative across institutional and geographical boundaries at the 2019 annual meeting. Those interested in participating as a mentor or mentee were asked to complete a short survey about their location, professional roles, expertise and interests. Mentors were selected based on achievement of fellowship within AMEE or formal international recognition in terms of scholarship and engagement in the field. Thirty-six mentor-mentee pairs were matched, provided with each other’s emails and asked to communicate further to introduce themselves, discuss goals for their relationship, ascertain their fit, and schedule online and in-person meetings. The matching capitalised on the diversity of the global mentor pool. All mentees were paired with mentors located in a different country, thus requiring a distance relationship even if they met in person at the conference. Participating in this initiative was completely voluntary and non-participation would not have affected their standing in the organisation.

샘플링 및 모집
Sampling and recruitment

36명의 멘토들이 AMEE 멘토링 이니셔티브에 참여했습니다. 이번 멘토링 이니셔티브를 위해 참가자들은 건강직업 교육에 대한 직업적 관심이 있는 멘티들의 멘토로 봉사활동을 펼쳤었다. 이 중 10명의 멘토들이 Zoom을 통해 일대일 인터뷰에 참여하도록 초청되었다. 최종 선정은 지리적 다양성과 충족가능성에 기초했다. 연구팀은 참가자들의 멘토링에 대한 동기와 접근방식을 탐구하기 위해 연구 목적과 위에서 설명한 문헌에 의해 알려진 개방형 질문을 개발했다. 동시 데이터 수집 및 분석을 통해 향후 인터뷰를 위한 트리거 질문의 수정 사항을 알 수 있습니다.
Thirty six mentors participated in the AMEE mentoring initiative. For this mentoring initiative, participants had volunteered to serve as mentors for mentees with a career interest in health professions education. Ten of these mentors were invited to participate in one-on-one interviews via Zoom. Final selection was based on geographical diversity and availability to meet. The research team developed open-ended questions, informed by the research aim and literature described above, to explore participants’ motivations and approaches to mentoring. Concurrent data collection and analysis informed revisions to the trigger questions for future interviews.

예시 트리거 질문은 보충 부록 1에 포함되어 있습니다. 참가자가 대화 중에 자발적으로 이러한 부분을 제기했는지에 대해 모든 질문이 제기되지는 않았다. "더 자세히 말해줘", "확장해줄 수 있어" 등과 같은 프롬프트와 프로브가 필요에 따라 사용되었습니다.
Sample trigger questions are included in Supplementary Appendix 1. Not all questions were posed if the participant spontaneously raised these areas during the conversation. Prompts and probes were used as needed such as “tell me more,” “can you expand on that” etc.

3명의 조사관(SR, RAK, EP)이 10명의 인터뷰를 모두 진행했다. 인터뷰는 50-60분 동안 진행되었고, 오디오 테이프로 녹음되었으며, 참가자들의 동의 하에 녹음되었다. 비록 우리가 10번의 인터뷰를 바탕으로 주제포화를 주장할 수는 없지만, 연구팀은 우리가 우리의 연구문제를 해결하기에 충분한 데이터를 생성했다고 믿는다.
Three investigators (SR, RAK, EP) conducted all ten interviews. Interviews lasted 50–60 min, were audiotaped, and transcribed with consent of participants. Though we cannot claim thematic saturation based on 10 interviews, the research team believed that we generated sufficient data to address our study questions.

 

데이터 분석
Data analysis

모든 데이터는 분석 전에 식별되지 않아 내러티브가 개인으로 거슬러 올라갈 수 없었다. 주제 분석을 사용하여 연구자가 데이터를 검토하여 주제, 관계 및 의미 패턴을 식별했다(Kiger 및 Varpio 2020). 주제 분석은 여러 단계로 구성된다:

  • 데이터의 톤과 내용에 익숙해지기;
  • 특정 개념에 관련된 데이터 세그먼트 코딩 또는 라벨링하기;
  • 코드, 코딩 범주, 코드 간의 관계를 포함한 해석으로 주제 생성;
  • 연구 팀 내 주제 토론;
  • 주제 마무리;
  • 자료 발표.

All data were de-identified prior to analysis so that narratives could not be traced back to individuals. We used thematic analysis, where the researcher examines the data to identify themes, relationships, and patterns of meaning (Kiger and Varpio 2020). Thematic analysis comprises several steps:

  • familiarisation with tone and content of the data;
  • coding or labelling data segments pertaining to a specific concept;
  • generation of themes involving interpretation of codes, coding categories and their relationship with each other;
  • discussion of themes within the research team;
  • finalising themes; and
  • presentation of data.

위에서 언급한 바와 같이, 분석에 대한 우리의 접근법은 귀납적, 즉 선험적 가설이 없는 테마의 데이터 유도 식별(Varpio 등 2020; Young 등 2020)이었다. 각 사본은 두 명의 조사자(SR, RAK)에 의해 독립적으로 코딩되었고 두 명의 추가 조사자가 코딩 체계coding scheme를 마무리하는 데 참여했다. 코딩 및 테마 생성에 대한 모호성이나 불일치는 연구팀 회의에서 합의를 통해 해결되었다.

As mentioned above, our approach to analysis was inductive, i.e. the data guided identification of themes without a priori hypotheses (Varpio et al. 2020; Young et al. 2020). Each transcript was independently coded by two investigators (SR, RAK) and two additional investigators were involved in finalising the coding scheme (SCVS, EP). Any ambiguities or disagreements in coding and generation of themes were resolved by consensus during research team meetings.

반사율
Reflexivity

연구 샘플링, 데이터 수집, 데이터 해석 및 보고의 모든 단계 동안 반사성을 보장하기 위해 참여자뿐만 아니라 저자와 주제 사이의 관계를 성찰하는 것이 중요하다(Ramani et al. 2018). 저자 3명(SR, RAK, SCVS)은 각 기관에서 리더십 역할을 하는 HPE 연구원으로 정성적 연구 방법론 경험과 멘토링에 관심이 있다. SR과 RAK은 의학적 배경에서, SCVS는 사회과학 배경에서 왔다. 따라서, 그들은 다양한 관점, 이론적 입장, 그리고 서로의 가정과 편견에 의문을 제기하는 능력을 가져온다. 네 번째 저자(EP)는 교육 장학금과 멘토링 주제에 관심이 있는 주니어 의사이다. 저자들은 인터뷰 대상자를 많이 알고 있었지만 멘토 중 어느 한 명과 같은 기관에서 일하지도 않았고, 어떤 참가자에게도 권력의 위치에 있지도 않았다. 연구팀은 면접 후 보고회를 열고 면접관들이 개인의 편견, 가정, 의견이 참가자들의 반응을 방해하지 않도록 유의하고 있는지 확인하기 위해 각 성적표를 검토했다.

It is important to reflect on the relationship between the authors and the topic as well as participants to ensure reflexivity during all phases of the research- sampling, data collection, data interpretation and reporting (Ramani et al. 2018). Three authors (SR, RAK, SCVS) are HPE researchers with leadership roles at their respective institutions, with experience in qualitative research methodology and interest in mentoring. SR and RAK come from a medical background and SCVS from a social science background. Thus, they bring diverse perspectives, theoretical stances and the ability to question each other’s assumptions and biases. The fourth author (EP) is a junior doctor interested in educational scholarship and the topic of mentoring. Although the authors knew many of the interviewees, they did not work at the same institution as any of the mentors and were not in a position of power over any participant. The study team held post interview debriefings and examined each transcript to ensure that interviewers were mindful of not allowing personal biases, assumptions and opinions to interrupt participants' responses.

 

결과.
Results

줌을 통해 멘토 10명, 여성 5명, 남성 5명을 대상으로 개별 인터뷰를 진행했습니다. 이들 중 3명은 중견 교육자, 7명은 상급 교육자라고 밝혔다. 3명은 북아메리카, 1명은 카리브해, 2명은 유럽, 3명은 오스트랄라시아 출신이었다. 확인된 주제는 다음과 같이 분류되었다. 

  • (1) 왜: 멘토링의 이유
  • (2) 어떻게: 멘토링 관계를 육성하는 방법
  • (3) 무엇: 국제 및 가상 멘토링

We conducted individual interviews with ten mentors via Zoom, five female and five male participants. Three identified themselves as mid-career educators and seven as senior educators. Three were from North America, one from the Caribbean, two from Europe and three from Australasia. Themes identified were categorised as

  • (1) Why- Motivations to mentor,
  • (2) How- Approaches to foster mentoring relationships, and
  • (3) What- Global and virtual mentoring.

We describe key themes under each category, along with representative quotes. The numbers P1, P2, etc. refer to the number assigned to each participant.

멘토에 대한 동기- 왜?
Motivations to mentor- Why?

멘티의 성장에 초점을 맞춘 육성 관계
Nurturing relationships focussed on mentees’ growth

참가자들은 멘토가 되기 위한 강한 의무imperative는 다른 사람들의 성공에 기여하고자 하는 열망이며 그들의 성공에 역할을 하는 것은 특권이라고 말했다. 멘티가 자신의 열정을 찾고 목표를 수립하며 목표를 이룰 계획을 수립하고 도전에 직면했을 때 포기하지 않도록 지도하고 지원하는 것이 이들의 근본적인 역할이었다. 이러한 맥락에서 [자신의 관심사와 경력 포부를 제쳐두고 다른 사람의 성공에 즐거움을 느끼는 것]으로 정의한 이타주의는 의미 있는 멘토링 관계에 매우 중요한 것으로 여겨졌다. 관계 형성은 타인을 돕고 이러한 경험에서 의미를 끌어내는 수단으로 여겨졌다. 모든 참가자들은 멘티가 이 관계의 중심에 있었고 그들의 목표가 우선이었다고 표현했는데, 예를 들어 "멘토는 그들이 누군가를 돕는다는 느낌(P1)으로부터 이익을 얻을지라도, 자신을 위한 것이 아니라 멘티를 위해 있다는 것을 명심해야 한다."고 했다. 마지막으로 멘티들이 잠재력을 발휘할 수 있도록 지원하고 그들이 수월성excellence에 도달하도록 도전시키는 것이 멘토링 관계의 만족스러운 측면이라고 언급되었다.
Participants stated that a strong imperative for being a mentor was the desire to contribute to the success of others and that playing a role in their success was a privilege. Their fundamental role was to guide and support mentees to find their passion, establish goals, formulate plans to achieve goals, and not give up when they encountered challenges. Altruism, a word used by one participant and defined in this context as setting aside their interests and career aspirations and taking pleasure in the success of others, was seen as critical to a meaningful mentoring relationship. Relationship building was viewed as the vehicle to helping others and deriving meaning from these experiences. All participants expressed that mentees were at the centre of this relationship and their goals were the priority, exemplified by this excerpt, “the mentor has to keep in mind that they are there for the mentee not for themselves, even though they will gain benefits from feeling that they're helping somebody (P1).” Finally, it was stated that supporting mentees in fulfilling their potential and challenging them to reach excellence were gratifying aspects of mentoring relationships.

저는 몇몇 멘티들의 성과에 뿌듯하고 감동받았습니다. 저는 그들의 관계에 감사를 느낍니다. 그들 중 일부를 지도할 수 있는 특권을요. 그것들은 나의 업적은 아니지만, 그들을 만나고 그들의 업적에서 어느 정도 작은 몫을 하게 되어 영광스럽게 생각합니다(P9).
I am proud and moved by some of my mentees’ accomplishments. I feel gratitude for their relationship, privileged to mentor some of them. They are not my accomplishments, but I feel honoured to have met them and to kind of share in some small way in their achievements (P9).

경험의 이익을 전하다.
Pass on the benefit of one’s experience

"뒤로 돌려주기Giving back"과 "앞으로 갚아나가기Paying forward"는 참가자들이 자주 사용하는 용어였다. 그들은 오랜 세월 동안, 그리고 어떤 경우에는 수십 년 동안 축적된 경험이 젊은 전문가들과 그들이 배운 것을 공유하는 데 도움이 되었다고 말했다. 멘토들은 그들의 직업적인 성공과 배운 교훈이 가치 있다고 느꼈습니다. 많은 멘토들이 자신의 직업적 한계와 오류로부터 상당히 많은 것을 배웠고, 이는 멘티들에게 풍부한 학습 경험이 될 것이라고 강조했다. 모두 자신이 좋은 멘토링의 수혜자임을 인식하고 멘토링의 전통을 이어가 멘티의 성공을 통해 그 분야가 지속적으로 성장할 수 있도록 열심이었다.
Giving back to the profession and paying forward were terms frequently used by participants. They stated that their accumulated experience across many years and in some cases over decades, helped them to share what they had learnt with the younger professionals. The mentors felt that their professional successes and lessons learned were valuable. Many emphasised that they had learned significantly from their own professional limitations and errors, and these would serve as a rich learning experience for mentees. All recognised that they had been recipients of good mentoring and were keen to carry on the tradition of mentoring so that the field could continue to grow through the successes of their mentees.

그것은 누군가의 커리어에 있어 구체적으로 도움이 될 수 있는 기회입니다. 저는 의학교육과 미래세대의 의학교육에 관심이 많습니다. 나는 훌륭한 멘토가 있었다. 그들은 멘토쉽에 대한 훌륭한 롤모델이었다. 그래서 저는 그들에게서 다른 사람들에게 전할 수 있는 많은 것을 배웠습니다.
It is an opportunity to be helpful to someone concretely in their career. I am very interested in medical education and nurturing future generations of medical educators… I had excellent mentors; they were excellent role models for mentorship. So I learned a lot from them that I could pass on to other people (P9).

자신의 지속적인 성장을 위해
For one’s own continued growth

모든 멘토들은 멘토링을 멘티로부터 많은 것을 배우는 양방향 관계로 묘사했습니다. 심지어 가장 나이가 많은 멘토들도, 멘티와의 참여로 많은 것을 배웠기 때문에, 모든 멘토 관계가 그들의 개인적 성장에 기여했다는 것을 인정했습니다. 또한, 그들은 특정 관계에서 발생하는 도전뿐만 아니라, 그 경험과 관계를 다루는 방식이 자기 성찰을 자극하고 직업적인 발전을 이루었다고 지적했다. 관계와 성장이 양방향이었다는 것을 모두가 인정했지만, 어떤 이들은 종종 이러한 경험의 결과로 그들이 얼마나 전문직으로서 계속 성장해 왔는지에 대해 놀라워했다.
All mentors described mentoring as a bidirectional relationship where they learned a lot from their mentees. Even the most senior mentors acknowledged that all mentoring relationships contributed to their personal growth, as they learned many things as a result of engagement with their mentees. Additionally, they indicated that the experience and how they handled the relationship, as well as the challenges that arose out of certain relationships, stimulated self-reflection and own professional development. While all acknowledged that the relationships and growth were bidirectional, some were often surprised at how much they continued to grow as professionals as a result of these experiences.

멘토와 멘티의 쌍방향 관계여야 합니다. 두 사람 모두 서로의 말을 경청하고 서로를 지도하고 배울 수 있어야 한다(P10).
It should be a two-way relationship between mentor and mentee. Both of them should be able to listen to each other and guide each other and learn from each other (P10).

나는 항상 많은 새로운 것을 배우는 것에 놀란다…멘토-멘티 관계… 너무 양방향인 것 같아요.
I’m always surprised to learn so many new things…mentor-mentee relationships… I think it's so bi-directional (P6).

 

멘토 관계를 조성하기 위한 접근 방식- 어떻게?
Approaches to foster mentoring relationships- How?

안전한 공간 제공
Provide a safe space

성공적인 멘토 관계를 위한 핵심 요소로서 안전과 신뢰가 강조되었다. '말하기 위해서는 안전하게 느껴야 한다. 이는 양측에 모두 정말 중요하다.' 멘티들이 토론을 주도하도록 독려하고, 멘토와 어떻게, 언제 연결할지, 결정하며 장점과 약점, 도전에 대한 자기반성을 편안하게 느끼는 전략 등이 제안됐다. 멘토들이 자신의 한계와 실수에 대한 이야기를 나눌 때 안전성도 강화됐다. 멘토-멘티 관계의 시작에서 어색함을 깨기 위해, 멘토들은 직업적으로 뿐만 아니라 개인적으로 서로를 알아가고, 원래 범위remit을 넘어 확장될 수 있는 종단적 관계를 형성할 것을 제안했다. 멘토와 멘티 사이의 신뢰는 심리적 안전의 풍토를 확립하는 데 필수적인 것으로 묘사되었다.

Safety and trust were emphasised as key elements for successful mentoring relationships “Feeling safe that one can talk. It's really important for both partners (P1).” Strategies proposed included encouraging mentees to take the lead in the discussions, deciding how and when to connect with mentors, feeling comfortable with self-reflection on strengths, weaknesses and challenges. Safety was also enhanced when mentors shared stories of their own limitations and mistakes. To break the ice at the start of a mentor-mentee relationship, mentors suggested getting to know each other in a personal as well as professional capacity and building trusting longitudinal relationships that may extend beyond their original remit. Trust between mentors and mentees was described as essential to establish a climate of psychological safety.

나는 멘토가 있었다…그는 나에게 직접적으로 조언을 해주지 않았다. 그는 항상 들으면서 말하곤 했어요, "당신은 무엇을 하고 싶나요?" 아니면 무엇이 옳다고 생각하나요?" 시간이 흐른 후 생각해보니, 기본적으로 내가 생각하는 바를 반영하기 위해 사람을 이용하고 있었다. 하지만 중요한 건 내가 믿었던 사람이어야만 했다는 것이다. 왜냐면 난 나 자신에 대한 잠재적인 약점들을 드러내고 있었거든. 저는 신뢰가 중요한 것이라고 생각합니다(P5).
I had a mentor…he never directly gave me advice. He would always listen and say, what do you want to do? Or what do you think is right? I worked out after a while that I was basically using a person to just reflect what I was thinking. But the important thing is it had to be somebody I trusted because I was revealing things that were potential weaknesses about myself. I think trust is an important thing (P5).

 

멘티와의 개인적 연결이 성공적인 멘토링 관계의 핵심 요소로 간주되었지만, 시간, 기대, 개인적 공간의 경계를 인식하는 것과 기밀 유지의 중요성도 강조되었다.
While a personal connection with mentees was viewed as a key element of successful mentoring relationships, awareness of boundaries of time, expectations, personal space, as well as the importance of maintaining confidentiality, were also emphasised.

관계에서 각자의 책임에 대한 명확한 기대와 책임에 대한 분명한 기대, 관계의 목표와 시간의 경계에 대한 명확한 기대(P9)를 갖는다고 생각합니다.
I think having clear expectations of the responsibilities of each person in the relationship and kind of a clear expectations of responsibilities and also of sort of the goals of the relationship and kind of the boundaries of time… the relationship (P9).

멘티가 자신의 전문적 개발에 대한 소유권을 가지도록 장려합니다.
Encourage mentees to take ownership of their professional development

 

모든 참가자들은 멘티들이 그 관계의 소유권ownership과 그들의 직업 목표를 가져야 한다고 강하게 강조했다. "우리는 어른들을 상대하고 있고, 그들은 새로운 아이디어를 가지고 갈 수 있다. 나는 항상 누군가의 손을 잡을 필요는 없다고 생각한다. 멘토가 도전을 성찰하고 지도하는 데 도움을 줄 수 있지만, (궁극적으로는) 멘티가 주도적으로 다음 단계를 수립하고, 그들의 계획을 따르고, 필요에 따라 멘토들과 다시 연결하도록 격려해야 한다고 느꼈습니다. 장점과 단점에 대한 자기 성찰을 촉진하는 것이 중요한 멘토 과제로 여겨졌다. 많은 멘토들이 교육 vs 초기 경력 vs 중간 경력에서 멘티들의 경력 단계에 맞춰 지도가 이루어져야 한다고 표현했다. 멘티가 대부분 초기 직업 교육자였던 이 특정 이니셔티브에 대해, 참여 멘토들은 멘티가 자신의 직업적 목표, 목표 달성을 위한 계획의 대략적인 아이디어를 가지고 준비해야 하며, 도전을 반성하고 미래 커뮤니케이션 일정을 계획할 준비가 되어 있어야 한다고 지적했다.

All participants strongly emphasised that mentees should assume ownership of the relationship and their career goals, “We are dealing with adults, …they can take some new ideas…and run with it. I don’t think there’s a need to hold somebody’s hand all the time (P1). While mentors could provide guidance and help reflect on challenges, it was felt that they should encourage the mentees to take the lead in formulating next steps, follow through with their plans and reconnect with mentors as needed. Facilitating self-reflection on strengths and weaknesses was considered an important mentor task. Many mentors expressed that guidance should be tailored to the mentees’ career stage, in training vs early career vs mid-career. For this particular initiative, where mentees were mostly early career educators, participating mentors indicated that the mentees should come prepared with a sense of their own professional goals, a rough idea of their plans to achieve goals, and be ready to reflect on challenges and take the initiative in scheduling future communications.

….멘티의 코트에 공을 넘겨야 합니다…여러분이 필요한 상황을 설정하고 프레임워크를 만들 수는 있지만, 실제로 멘토가 필요로 할 수 있다는 것을 인식하는 것은 멘티의 몫입니다. '이 관계에서 원하는 것이 무엇인지, 내가 당신을 어떻게 도울 수 있다고 느끼는지, 오늘 이곳에 무슨 일로 오시게 됐는지, 무엇을 의논하고 싶은지'(P8) 묻고 싶다.
….you’ve got to put the ball in the mentee’s court…initially we can set things up and create a framework, but it is up to the mentee to actually recognise that they might need you. I would ask “what do you want from this relationship, how do you feel I can help you, what brings you here today and what would you like to discuss” (P8).

 

글로벌 및 가상 멘토링 - 무엇?
Global and virtual mentoring- What?

지리적으로 국경을 넘나드는 멘토링은 여전히 관계에 관한 것이다.
Mentoring across geographical borders is still about relationships

 

멘토들은 그들이 다른 지역 출신의 젊은 교육자들을 만나는 것을 어떻게 즐겼는지 설명했고, 관계와 지리적 경계를 넘는 공동체 형성이 멘토와 멘티의 관점을 넓힐 수 있다고 제안했다. 그들은 그들 자신의 지식과 다른 문화에서 온 개인들과의 토론이 그들의 지식에 더해지고, 세계적인 관점을 보여주며 관계를 풍부하게 한다고 지적했다. 몇몇 참가자들은 국가 간 장거리 멘토링 관계를 경험했고, 다른 참가자들은 그렇지 않았다. 그들은 비록 관계가 그들이 어디에서 왔는지 보다는 관련된 사람들에게 달려있다고 느꼈지만, 멘토링 이니셔티브의 향후 반복은 계속해서 국가 전체에 걸쳐 dyads와 일치해야 한다고 제안했다.
The mentors described how they enjoyed meeting young educators from other geographical regions and suggested that relationships and community building across geographical boundaries could broaden perspectives of mentors and mentees. They indicated that discussions with individuals from cultures different than their own other added to their knowledge, showcased global viewpoints and enriched the relationships. Some participants had experience in long-distance mentoring relationships across countries, while others did not. They suggested that future iterations of the mentoring initiative should continue to match dyads across countries although they felt that relationships depended on the people involved rather than where they were from.

"국적에 따른 차이는 보이지 않지만, 어떤 사람들은 더 개방적이거나 쉽거나 다른 사람들은 더 어려울 수 있다는 차이점이 있을 수 있습니다. 어떤 관계들은 다른 관계들보다 쉽습니다. 자기 나라든, 서양 나라든, 아니 어느 나라의 멘토링이든, 기본적이거나 근본적인 차이를 잘 모르겠습니다."
“I don't see international differences, but there could be differences that some people are more open or easy and other people would be more difficult…. Some relationships are easier than others. I don't really see a basic or fundamental difference in mentoring people in your own country or Western countries or any country (P2).”

또한, 많은 참가자들은 높은 평가를 받는 보건 직업 교육자들을 위한 국제 기구를 통해 협력적인 학문뿐만 아니라 교수와 학습에 관한 대화를 풍부하게 하기 위해 교육자들의 국제 커뮤니티를 구축하는 것의 중요성에 대해 이야기했다.
Additionally, many participants talked about the importance of building an international community of educators to enrich conversations about teaching and learning as well as collaborative scholarship through a highly regarded international organisation for health professions educators.

그는 "AMEE 프로그램은 우리를 국제 의료 교육자 단체로, 지역사회로 모이게 했다"고 말했다.“ 공동체적인 것이 정말 중요하다고 생각한다.(P4)
I think the AMEE program has really brought together us as a group of international medical educators, we’ve been brought together as a community. I think that community thing is really important (P4).”

가상 멘토링은 관계 형성에 장벽이 아닙니다.
Virtual mentoring is not a barrier to relationship building


이 계획은 전염병 이전인 2019년에 시행되었지만, 참가자 중 누구도 거리나 온라인 멘토링을 효과적인 멘토링 관계의 장벽으로 인식하지 않았다. "대면이든 원격이든 중요하지 않아요. 모든 것은 관계에 관한 것입니다." 실제로 같은 기관이나 지역에 멘토와 멘티가 있는 사람이라도 전화나 영상통화, 이메일 등으로 소통하는 경우가 많았다. 화상회의에 대한 접근성이 높아지면서 가상 플랫폼이 관계를 맺는 데 장애물이 되지 않는다는 것을 느꼈다. 사실, 그것은 더 효율적이고 전 세계의 멘토들에 대한 접근을 넓힐 수 있다. 그들은 여전히 서로에 대한 기대와 관계 형성에 집중하는 것이 핵심이라고 강조했다.
Though this initiative was implemented in 2019, before the pandemic, none of the participants perceived distance or online mentoring as a barrier to effective mentoring relationships, “it doesn’t matter whether that’s personal face to face, or a distance. It’s about the relationship.” In fact, even those who had mentors and mentees at the same institution or region often communicated via phone or video calls or emails. With increasing access to video conferencing, it was felt that the virtual platform was not a barrier to establishing relationships. In fact, it could be more efficient and widened access to mentors across the world. They emphasised that setting expectations of and for each other and focussing on relationship building were still key.

"멀리서 멘팅을 하는 것은 이메일, 줌 등 우리가 하는 모든 일이 문제가 아닙니다. 직접 대면하든 그렇지 않든 문제는 관계를 구축하지 못할 경우입니다." 근본적인 질문으로 돌아가서 멘토링이 무엇인지, 무엇이 아닌지, 그리고 당신이 올바른 멘토인지에 대한 양측의 기대치에 달려 있습니다.
“I think it’s back to relationship building….mentoring at a distance is not a problem, by e-mail, Zoom, all other things that we do…. a problem that would be face-to-face or not is if the relationship couldn’t be built. It’s down to the expectations of both parties about what mentoring is, what it isn’t and are you the right mentor…back to those fundamental questions (P4).”

논의
Discussion

본 연구의 결과는 국제 멘토링 이니셔티브에 자발적으로 참여한 [HPE 리더들의 주요 동기]를 강조한다. 이러한 동기 부여는 그림 1과 같이 세 개의 렌즈를 통해 볼 수 있습니다.

  • 먼저 멘티의 성장이다. 멘티가 학문적 과제를 해결하고 전문적으로 성장할 수 있도록 지도하고 싶다는 열망을 강조했는데, 이는 이타적인 동기로 볼 수 있다.
  • 다음으로 모두 멘티로부터 얼마나 많은 것을 배웠는지, 멘토링 과정이 어떻게 자신의 성장을 증진시켰는지 집중 조명했다.
  • 마지막으로, 전문직에 되갚겠다give back는 약속에 만장일치를 보았고, 멘토링을 이 목표를 달성하기 위한 중요한 수단으로 보았다.

The results of our study highlight key motivations for leaders in HPE, who voluntarily participated in an international mentoring initiative. These motivations can be viewed through three lenses as depicted in Figure 1.

  • First, they emphasised a desire to guide mentees in addressing academic challenges and helping them grow professionally, which could be seen as an altruistic motive.
  • Next, all of them highlighted how much they learnt from mentees and how the process of mentoring enhanced their own growth.
  • Finally, they were unanimous in their commitment to give back to the profession and viewed mentoring as an important vehicle to accomplish this goal.

이러한 모든 발견에 함축적인 것은 멘토가 그러한 의도를 채택하는 것이 실현 가능하고 현실적일 수 있는 그들 자신의 경력에 있을 필요가 있다는 것이다. 아래에서는 참여 멘토(자신에 대한 집중 vs 타인에 대한 집중)의 동기 부여와 함께 멘토 관계의 중심으로서 심리적 안전에 대한 인식을 강조한다.

Implicit in all these findings is that the mentor needs to be at a point in their own careers where adopting such intent was both feasible and realistic. Below, we highlight what motivated participating mentors (a focus on self vs focus on others) as well as their perception of psychological safety as central to mentoring relationships.

 
 

이 연구의 참가자는 HPE의 국제적인 리더들로, 그들의 기관과 지리적 지역 밖에서 초보 교육자들을 멘토링하기 위해 자원했다. [그들 자신이 좋은 멘토링을 받았다는 사실]은 젊은 교육자들에게 그들의 경험의 혜택을 전하도록 영감을 주었다(Aryee et al. 1996; Malota 2017). 다른 연구에서는 멘토링을 [자신의 발전을 위한 디딤돌]로 보는 경우가 있다고 보고했지만(Little 1990; Allen 등), 우리의 멘토들은 주요 동기부여요인으로 (자신의) 학문적 발전을 강조하지 않았다. 우리 연구에서 자주 언급되는 동기로는 멘티들의 직업적 발달에 도움을 주고자 하는 [이타주의] 있었고, 이것이 멘토링 역할을 수용하는 주요 동인이 될 수 있음을 제안한다(배트슨과 파월 2003).

The participants in this study were international leaders in HPE who volunteered to mentor novice educators outside their institutions and geographical region. The fact that they themselves had been recipients of good mentoring inspired them to pass on the benefit of their experience to young educators, similar to reports from the business literature (Aryee et al. 1996; Malota 2017). While other studies have reported that mentors may view mentoring as a stepping stone to their advancement (Little 1990; Allen et al. 1997), our mentors did not emphasise academic advancement as a key motivator. We propose that altruism could be a major driver for acceptance of this international virtual mentoring role based on their frequently stated desire to help mentees in their professional development (Batson and Powell 2003).

[공감-이타주의 가설]은 도움이 필요한 타인을 보며 생기는 감정이입이 이타적 동기를 불러일으킨다는 것이다(배트슨 2019). 비록 이타주의가 더 큰 이기주의 서클 안에 존재하는 것으로 묘사되고, 타인을 돕고자 하는 욕망조차도 종종 자신에게 이익을 주기 위한 동기에 의해 움직인다는 것을 암시하지만, 이타주의의 작지만 유의미한 부분은 분명 이기주의 서클 바깥에 있고, 자기 이익에 대한 욕망에 의해서만 움직이지 않는다(Batson 2019).

The empathy-altruism hypothesis states that empathic emotion, caused by seeing others in need, evokes altruistic motivation (Batson 2019). Although altruism is depicted as existing within a larger egoism circle, suggesting that even the desire to help others is often driven by motives to benefit the self, a small but significant part of altruism is outside the egoism circle and not driven by desire for self-benefit (Batson 2019). 

[이타주의-자기중심성 개념]타인-초점적이고 자기-초점적인 멘토 동기와도 잘 맞아떨어진다(Beara and Hwangb 2015; Malota 2017). 이러한 국제적 멘토링 맥락에서 멘토링 역할은 전적으로 자발적이었고, 자신에게 직접적인 전문적인 혜택은 없었으며 멘토와 멘티는 사전 관계가 없었으며 상호 작용은 주로 가상적이었다. 따라서, 모든 참여 멘토들이 멘토 관계를 자신의 성장에 기여하는 양방향으로 보고했지만(자기-초점), 그들의 주된 동기는 멘티의 성장을 촉진하고 분야를 발전시키는 것으로 나타났다(타인-초점).

The altruism-egoism concept also aligns well with other-focussed and self-focussed mentor motivations (Beara and Hwangb 2015; Malota 2017). In this international mentoring context, the mentoring role was entirely voluntary, there was no direct professional benefit to themselves, mentors and mentees did not have a prior relationship and the interactions were mainly virtual. Thus, though all participating mentors reported mentoring relationships as bidirectional which contributed to their own growth (self-focus), their primary motivation appeared to be facilitating the growth of mentees and advancing the field (other focus).


멘토링 관계에 대한 접근방법에서는 참가자 전원이 [심리적 안전]이 중요하다고 강조했다. 이를 위해서는 리더가 솔선수범하여 모든 직원과 팀원의 의견을 수렴하고, 모든 수준의 개인이 의견과 우려를 편안하게 표명하며, 다방향 피드백을 장려하는 환경이 필요하다(에드몬슨 2019). 멘토링 관계에서 안전을 확립하기 위한 제안된 전략들은 다음을 포함한다: 

  • 전문가 뒤에 숨은 '사람'을 알아봄으로써 어색함을 해소한다.
  • 멘티가 자신의 안건을 작성하고 계획을 수립하고 그 실행을 전략화하도록 권장한다.
  • 멘티가 미래 커뮤니케이션을 계획할 수 있도록 허용한다.
  • 비판적 자기성찰을 촉진한다.
  • 그들의 열망에 대한 오너십을 갖도록 격려한다.


In terms of approach to mentoring relationships, all participants emphasised that psychological safety is critical. This requires an environment where leaders lead by example and invite input from all staff and team members, individuals at all levels feel comfortable voicing their opinions and concerns, and multidirectional feedback is encouraged (Edmondson 2019). Suggested strategies to establish safety in a mentoring relationship included:

  • breaking the ice by getting to know the person behind the professional;
  • encouraging mentees to script their own agenda, formulate plans and strategize implementation thereof;
  • allowing mentees to plan future communications;
  • promoting critical self-reflection; and
  • encouraging them to take ownership of their aspirations.

그들 모두는 그들의 관계를 협력적인 것으로 보는 것처럼 보였고, 그것을 'guide on the side'로 접근했다. 따라서 참여 멘토들은 모니터나 모범적인 역할보다는 자발적으로 Losveld 등이 설명한 촉진자 및 코치 역할을 맡는 것으로 나타났다(Loosveld 등 2020). 이러한 접근법은 HPE에서 가끔만 강조되는 [Daloz 멘토링 모델](Daloz 1986)과도 일치한다. 효과적인 멘토 관계는 [지지, 도전, 멘티의 미래 목표에 대한 비전]이라는 세 가지 핵심 요소의 균형을 맞춰야 합니다.

  • 너무 많은 지지와 아주 적은 도전은 의미 있는 성장을 촉진할 것 같지 않다;
  • 마찬가지로 지원 없이 너무 많은 도전은 개인들을 퇴보하게 할 것이다.
  • 효과적인 멘토는 기회를 제공하고 기대치를 설정함으로써 지원과 도전의 균형을 맞춘다(Bower 1998

All of them appeared to view their relationship as collaborative and approached it as a ‘guide on the side.’ Thus, participating mentors spontaneously appeared to take on facilitator and coach roles described by Loosveld et al, rather than the monitor or exemplar roles (Loosveld et al. 2020). These approaches are also consistent with the Daloz model of mentoring (Daloz 1986), the principles of which are infrequently emphasised in HPE. Effective mentoring relationships should balance three key elements – support, challenge and a vision of the mentee’s future goals.

  • Too much support and very little challenge are unlikely to foster meaningful growth;
  • equally too much challenge without support is likely to cause individuals to regress (Daloz 1986).
  • Effective mentors balance support with challenge by providing opportunities and setting expectations (Bower 1998).

멘티와의 관계에 대한 투자가 필수적인 것으로 보고되었지만, 일부 멘토들은 이러한 관계에서 경계를 유지하는 것의 중요성을 강조했다. [경계]는 모든 전문적 관계에서 개인 간의 적절한 행동과 상호작용을 가이드하는 '기초적인 그라운드 룰'으로 설명되었다. 잭슨 등은 이전에 교차 성별 멘토링 관계에서 경계 유지의 중요성을 제기해 왔다(Jackson et al. 우리의 멘토들은 젠더 문제를 우려로 제기하지는 않았지만, 개인의 공간을 침해하지 않고 비밀을 유지하는 등 시간 약속에 대한 명확한 기대감에 대해 구체적으로 논의했다. 균형에 대한 필요성은 그림 2에 설명되어 있습니다.
While investment in relationships with mentees was reported as essential, some mentors emphasised the importance of preserving boundaries in these relationships. Boundaries have been described as ‘basic ground rules’ for any professional relationship, that guide appropriate actions and interactions between individuals (Barnett 2008). Jackson et al. have previously raised the importance of maintaining boundaries in cross-gender mentoring relationships (Jackson et al. 2003). Our mentors did not raise gender issues as a concern, but specifically discussed clear expectations of time commitments, not intruding on one’s personal space and maintaining confidentiality. The need for balance is depicted in Figure 2.

 

미래 연구는 서로 다른 맥락과 환경 내에서 공통적이고 독특한 촉진제와 장벽을 발견하기 위해 광범위한 지리적 위치의 멘토를 포함해야 한다. 멘토와 멘티의 공유되고 상충되는 인식, 관계의 지속 또는 종말에 영향을 미치는 요소가 무엇인지, 단기 및 장기 관계의 영향을 비교하기 위해, 그리고 마지막으로 멘티, 그리고 마지막으로 멘티, 멘토 및 직업의 성장에 대한 실제 영향을 비교하기 위해서도 필요하다.
Future research should include mentors from a wider range of geographical locations to discover common and unique facilitators and barriers within different contexts and settings. Follow up studies are also needed to examine the shared and conflicting perceptions of mentors and mentees; what factors influence continuation or termination of relationships; compare the impact of short term and long-term relationships; and finally, the actual impact on the growth of the mentee, mentor and the profession.

결론들
Conclusions


우리의 참가자들은 멘토링 이니셔티브에 참여하게 된 세 가지 핵심 요소로 [멘티의 성장, 건강 직업 교육 분야의 성장, 그리고 자신의 성장]을 강조했지만, 처음 두 가지가 이타적이고 더 주된 동기라고 강조했다. 멘토 훈련은 일반적인 'how-to mentor' 기술보다는 육성, 촉진, 코칭 기술에 초점을 맞추고, 심리적 안전 확립에 대한 접근법을 강조하며, 전문직업적 발달에 대한 오너십을 멘티가 갖도록 격려하는 멘토를 양성할 수 있다. 제도적이고 조직적인 멘토링 이니셔티브는 이타적인 동기를 통해, 예를 들어 성찰적인 서술과 비판적인 대화를 통해 분야를 강화하는 데 열정적인 멘토를 식별하는 방법을 찾아냄으로써 더 강력하고 영향력 있는 멘토 관계를 촉진할 수 있다. 기관들은 또한 공감 이타주의 원칙을 만족시키는 안전하고 정의로운 학습과 조직 문화를 보장해야 한다. 예를 들어 상명하달식(top-down)과 타인의 안녕에 대한 진정한 우려와 기쁨을 공개적으로 표현하는 것이 그것이다.

Our participants emphasised three key factors that motivated their participation in mentoring initiatives: growth of the mentee; growth of the field of health professions education, and growth of oneself, but emphasised the first two as altruistic and more dominant motivations. Mentor training could focus on nurturing, facilitating and coaching skills rather than general ‘how-to mentor’ skills, emphasise approaches to establishing psychological safety, and train mentors in encouraging mentees to take ownership of their professional development. Institutional and organisational mentoring initiatives can promote stronger and more impactful mentoring relationships by finding ways in which to identify mentors who are passionate about strengthening the field through altruistic motivations – for example through reflective narratives and critical conversations. Institutions should also ensure a safe and just learning and organisational culture that satisfy empathy altruism principles, such as normalising strengths and weaknesses top-down and overt expression of genuine concern for and joy at the well-being of others.


Med Teach. 2022 Jan 5;1-7.

 doi: 10.1080/0142159X.2021.2020739. Online ahead of print.

What sparks a guide on the side? A qualitative study to explore motivations and approaches of mentors in health professions education

Affiliations

1Brigham and Women's Hospital and Harvard Medical School, Boston, MA, USA.

2Amsterdam UMC, Research in Education, Faculty of Medicine, Vrije Universiteit, Amsterdam, The Netherlands.

3European Junior Doctors Association and York Teaching Hospital NHS Foundation Trust, UK.

4Centre for Health Professions Education, Faculty of Medicine and Health Sciences, Stellenbosch University, South Africa.

PMID: 34985380

DOI: 10.1080/0142159X.2021.2020739

Abstract

Introduction: Despite abundant research emphasising the value of mentoring for healthcare professionals, little is known about what motivates mentors. This study aimed to explore what motivated a group of internationally renowned health professions educators to accept informal, international and mostly online mentoring roles, and their approaches to that mentoring.

Methods: Using a qualitative approach, we interviewed ten global educational leaders, who volunteered to serve as mentors in an initiative implemented by the Association for Medical Education in Europe in 2019, via Zoom. The hour-long interviews, conducted between May and October 2019, were audiotaped and transcribed on Zoom. De-identified transcripts were analysed for key themes.

Results: The key themes identified could be mapped to three categories, Motivations - Why; Approaches - How, and Global and virtual mentoring - What. Themes under motivations included: (1) Nurturing relationships focussed on mentees' growth; (2) Pass on the benefit of one's experience; (3) For one's own continued growth. Themes under approaches included: (1) Provide a safe space; (2) Encourage mentees to take ownership of their professional development. Themes under global and virtual mentoring included: (1) Mentoring across geographical borders is still about relationships; (2) Virtual mentoring is not a barrier to relationship building.

Discussion: Though mentors also saw own growth and ongoing professional development as an important benefit of mentoring, altruism or the desire to benefit others, appeared to be a key motivating factor for them. Finding ways in which to identify mentors who are passionate about strengthening the field in this way - for example through reflective narratives and critical conversations - could be key when implementing mentoring initiatives.

Keywords: E-mentoring; Mentoring; mentor motivations; professional development.

 

미국 3년제 의과대학의 종합적 역사: 한 학기의 리뷰(Med Educ Online, 2018)
Comprehensive history of 3-year and accelerated US medical school programs: a century in review
Christine C. Schwartz, Aparna S. Ajjarapu, Chris D. Stamy and Debra A. Schwinn

 

소개 및 목적
Introduction and purpose

지난 10년간 미국의 의대 교육 지도자들이 혁신적인 교육과정 개혁에 나섰다. 4년 연속 임상 및 생물의학 교육을 통합하고 능동적 학습을 추가하는 것 외에도, 일부 의과대학은 보다 포괄적인 기간, 특히 3년 내에 의학 교육을 제공하는 실험을 시작했다. 이 운동은 특히 미국 역사상 다양한 맥락에서 두 번 시도되고 포기된 적이 있기 때문에 약간의 논란을 불러일으켰다. 그러나 미국의 가속화된 의학 교육에 대한 배경 정보를 연구할 때, 기사는 일반적으로 특정 학교 및/또는 특정 기간에 초점을 맞추고 있기 때문에 3년제 MD 학교에 대한 포괄적인 역사적 검토는 없는 것으로 보인다. 과거로부터 배울 수 있다는 점을 감안하여, 우리 연구단은 지난 세기 동안 미국의 가속화된 allopathic MD 교육 프로그램에 대해 출판된 원고에 대한 철저한 역사적 검토에 착수했다. 우리의 목적은 의과대학이 시간이 지남에 따라 3년제 의학교육을 선택한 후 이를 포기한 이유를 조사하는 것이다. 

Over the last decade, US medical school education leaders have embarked on innovative curriculum reform. In addition to integrating clinical and biomedical science teaching over a 4-year continuum and adding active learning, some medical schools have begun experimenting with delivering medical education in a more comprehensive period, specifically 3 years. This movement has created some controversy, particularly since it has been tried and abandoned twice before in US history in various contexts. Yet in researching background information on accelerated medical education in the United States, there appears to be no comprehensive historical review of 3-year MD schools, since articles generally focus on specific schools and/or specific time periods. Given that we can learn from the past, our research group embarked on an exhaustive historical review of manuscripts published about accelerated allopathic MD education programs in the United States over the last century. Our purpose is to examine reasons medical schools had for choosing, and then abandoning, accelerated 3-year medical education over time. 

상세 내역
Detailed history

초기 의료 커리큘럼 표준화: 1800년대-1930년대
Initial medical curriculum standardization: 1800s–1930s

1800년대에 미국의 의과대학 대부분은 소규모의 영리for-profit 비-대학 소속이었으며, 고아범위하며 표준화되지 않은 교육과정과 교육목표를 가지고 있었다. 1847년에 미국 의학 협회(AMA)가 설립되었고 후에 AMA 의학 교육 위원회(CME)가 시작되어 1904년에 [표준화된 의과 대학 교육과정]을 제공하였다. 이 새로운 교육과정의 창시자는 1890년대에 [의대생들을 위한 엄격한rigorous 임상 실습]을 도입한 캐나다의 의사인 윌리엄 오슬러 경이었다. 1900년대 초에 아브라함 플렉스너는 카네기 재단으로부터 미국의 의학 교육을 검토하라는 의뢰를 받았다[2]. 오스러가 이끄는 존 홉킨스에서의 교육에 감명받은 플렉스너는 오슬러가 이야기한 집중 임상훈련에 앞서 2년의 과학 교육이 선행돼야 한다고 강조했고, 이는 총 4년의  교육과정으로 이어졌다. During the 1800s the majority of medical schools in the United States were small, for-profit, non-university affiliated, and had wide-ranging non-standardized curricula and educational goals. In 1847, the American Medical Association (AMA) was established and later the AMA Council of Medical Education (CME) was initiated, ultimately providing a standardized medical school curriculum in 1904 [1]. A founding father of this new curriculum was the Canadian physician, Sir William Osler, who introduced rigorous clinical clerkships for medical students in the 1890s. In the early 1900s, Abraham Flexner was commissioned by the Carnegie Foundation to review medical education in the United States [2]. Impressed by the education at John Hopkins, headed by Osler, Flexner emphasized that 2 years of science education should precede Osler’s intensive clinical training, comprising a total of 4 years of medical school .

1910년의 플렉스너 보고서(PDF 원본 문서는 카네기 재단 기록 보관소를 통해 온라인으로 제공됨)는 의학 교육에 대한 결정적 프레임워크를 제공했다는 점에서 혁명적이었으며, 본질적으로는 [통합된consolidated 대학 부속 의과대학]의 물결 속에 [표준화된 모델]을 낳았다. 1934년까지 38개의 의학전문대학원 중 8개를 제외한 모든 대학원이 대학 의과대학과 관련이 있었다. 제1차 세계 대전(1918년) 이후 의료 기술과 역량의 급속한 확장이 일어나 의과대학에 이어 곧바로 의사-교육자에 의해서 감독받는 진료(인턴십)로 이어졌다. 1930년, 의예과 요구사항도 명확해졌는데, 일반 화학, 물리학, 생물학이 각각 2학기씩, 유기 화학이 1학기씩이었다.

The Flexner report of 1910 (pdf of the original document is available online through the Carnegie Foundation archives) was revolutionary in providing a critical framework for medical education, essentially resulting in a model that became standardized in a wave of consolidated university affiliated medical schools. ‘By 1934 all but eight of the 38 approved graduate schools of medicine were related to university medical schools’ [3]. Post WWI (1918), rapid expansion of medical techniques and capabilities occurred, leading to physician-teacher supervised patient care immediately following medical school (internship) [2]. By 1930, premedical science requirements had also become clearly established, including two semesters each of general chemistry, physics, and biology, and one semester of organic chemistry.

3년제 가속 의료 커리큘럼 도입: 1930년대-1940년대
Introduction of the 3-year accelerated medical curriculum: 1930s–1940s

제2차 세계 대전(1939-1945) 동안, 미국은 국내외에서 의사 부족에 직면했고, 그래서 3년제 가속 의과대학 프로그램은 의사들을 더 빨리 교육하기 위한 제안 해결책으로 도입되었다[4]. 버지니아 의과대학은 제2차 세계 대전 동안 3년제 가속 의학 프로그램을 가진 최초의 학교들 중 하나였다. 의사 부족 문제를 해결하라는 압박을 받은 미국 연방정부는 대학과 의과대학에 3년제 가속 의료 프로그램을 더 폭넓게 도입할 것을 촉구했다.

  • 실제로 FSMB은 3년 뒤 졸업하는 학생들이 합법적으로 의료행위를 할 수 있도록 면허를 관리하는 법령을 개정했다.
  • 이러한 새로운 3년 커리큘럼을 적절히 개발하는 데 시간이 거의 주어지지 않았기 때문에, AMA 이사회는 어려움을 극복하는 데 도움을 주기 위해 연락 위원회liaison committee를 구성했다.
  • 또한, AMA의 의료 교육 및 병원 위원회는 가속화된 의료 프로그램의 품질 저하 우려로 인해 높은 의료 교육 수준을 유지하기 위한 검사를 감독할 책임이 있다[6].


During World War II (1939–1945), the nation faced physician shortages at home and abroad, so 3-year accelerated medical school programs were introduced as a proposed solution to educate physicians faster [4]. The Medical College of Virginia was one of the first schools to have a 3-year accelerated MD program during World War II [5]. Pressured with solving physician shortages, the US federal government urged universities and medical colleges to adopt 3-year accelerated medical programs more broadly.

  • Indeed, the Federation of State Medical Boards revised laws and regulations governing licensure so students graduating in 3 years could legally practice medicine.
  • Because very little (if any) time was given to appropriately develop these new 3-year curricula, the AMA Board of Trustees organized a liaison committee to aid in overcoming difficulties encountered.
  • In addition, the AMA’s Council on Medical Education and Hospitals took responsibility to oversee inspections to maintain high standards of medical education due to concerns of deterioration of quality with accelerated medical programs [6].

흥미롭게도, 군의관들이 민간인 신분으로 제대하자, 많은 사람들이 그들의 제한된 지식을 인정하여 '리프레셔' 강좌가 인기를 얻었다. 군에 있는 많은 수의 의사들에게 보낸 설문조사에서 거의 60%(12,534/21,029명)가 긴 재교육 과정(6개월 이상)을 수강하기를 원했고, 이는 졸업후 의학교육(GME) 프로그램을 더 개발하라는 압력으로 이어졌다. 1955-1956년까지 85개의 인가 또는 개발 중인 의과대학 중 63개가 어느 정도 PGME 프로그램에 참여하고 있었다. 1940년대 말에 이르러서는 GME는 더 공식적으로 구체화되었고 병원 기반 전공의 수련는 전문화의 경로가 되었다[7]. 국립보건원(NIH)의 영향력은 정부 지원 연구비를 통해 의사 과학자들의 초기 발전에 도움을 주었다.

Interestingly, once military physicians were discharged into civilian status, many recognized their limited knowledge so ‘refresher’ courses gained attraction. In a survey sent to a large sample of physicians in the military, nearly 60% (12,534/21,029) wanted to take long refresher courses (6-months or more) and this led to pressure to develop more post graduate medical education (GME) programs. ‘By the academic year 1955–1956, 63 of the 85 approved or developing medical schools were engaged to some degree in post-graduate medical education programs’ [3]. By the end of the 1940s, GME materialized more formally and hospital based residencies became the path to specialization [7]. The influence of the National Institutes of Health (NIH), with its government-funded research grants, aided early development of physician scientists.

연방 법률 변경 및 대체 가속 경로 도입: 1950-1971
Federal legislation changes and introduction of alternative accelerated pathways: 1950–1971

1950년에서 1960년 사이에는 이전 10년에 비해 새로운 3년제 프로그램의 확대나 개발이 거의 없었다. 의사 부족에 대한 우려는 1960년대에 계속되었고, 이러한 우려에 대응하여 보건 전문 학교의 확장을 지원하기 위한 연방 법안이 통과되었다. 1963년에는 [보건전문직 교육 지원 프로그램HPEAP]이 시행되어 보건전문직의 지원을 제공하였다. 이 지원에는 보건 전문학교(알로패스 및 골병리 의학, 치의학, 수의학, 검안법, 약학, 족부학, 공중보건 및 간호학)의 신설construction 지원뿐만 아니라 치과, 알로패스 MD 및 골병리 DO 의학과 학생들에게 대출을 제공했다[8].
Between 1950 and 1960, there was little expansion or development of new 3-year programs compared to the previous decade. Mounting concern regarding physician shortages plagued the 1960s and, in response to these concerns, federal legislation was passed to support expansion of health profession schools. In 1963, the Health Professions Education Assistance Program was implemented to provide support for the health professions. This support included construction aid for health profession schools (allopathic and osteopathic medicine, dentistry, veterinary, optometry, pharmacy, podiatry, public health, and nursing) as well as providing loans to students of dentistry, allopathic MD and osteopathic DO medicine [8].

1965년, 이 법률에 대한 새로운 개정이 이루어졌다. 여기에는 다음이 포함되었다.
New amendments to this legislation were made in 1965, which included

  • 기본 및 특별 개선 보조금
  • 건설 자금에 대한 새로운 요건(예: 기존의 요구사항보다 더 오랜 기간을 교육용으로 건물을 사용해야 함)
  • 학생 장학금 프로그램에 대한 자금 지원 확대 및 최대 대출액 증가(학생당 연간 최대 장학금 2,500달러 및 학생당 연간 최대 2,500달러),
  • 대출 탕감 프로그램을 만드는 것.
  • basic and special improvement grants,
  • new requirements for construction funding (e.g., requiring buildings be used for education for a longer period of time than previously required),
  • increasing funding for student scholarship programs and increased maximum loan amount ($2,500 maximum scholarship per student/year and $2,500 maximum annual loan per student), and
  • creating loan forgiveness programs.

[기본 보조금]은 학생 1인당 추가 비용 외에 승인된 각 학교에 일시금을 제공하여 보건전문직 학교의 등록enrollment을 확대하는 것을 목표로 했다[9]. [특별 보조금]은 인가를 촉진하고 특별 프로그램을 수립하였다[8,9].

Basic grants aimed to expand enrollment in health professions schools by providing a lump sum to each approved school in addition to extra money per student [9]. Special grants stimulated accreditation and established special programs [8,9].

보건 전문직 교육 지원 프로그램HPEAP은 [국가 보건 서비스단NHSC]과 같은 프로그램에 대한 자금 지원의 인가를 증가시켰는데, 이는 각 학교에게 자금 지원을 받으려면 부속 병원의 1년차 전공의 중 일차의료 수련을 받는 비율을 높일 것을 요구하였다. 1976년 개정된 보건 전문직 교육 지원법은 소외 지역의 보건 전문가를 위한 임상 훈련 프로그램을 제공한 기존 [지역 보건 교육 센터AHEC]의 capacity을 증가시키기 위한 자금 지원을 승인했다[10]. 이러한 보조금은 성공적으로 학생 등록과 졸업을 증가시켰다[8].

The Health Professions Education Assistance Program increased authorization of funding to programs such as the National Health Service Corps, which required schools to ensure that an increasing percentage of first-year residencies in affiliated hospitals were reserved for primary care training in order to receive capitation support. The 1976 version of the Health Professions Education Assistance Act authorized funding to increase the capacity of existing Area Health Education Centers, which provided clinical training programs for health professionals in underserved areas [10]. These grants successfully increased student enrollment and graduation [8].

[의료 종사자 부족에 대한 우려]로 인해, 1966년과 1971년 사이에 연합 건강 직업 인력 훈련법, 1970년 건강 훈련 개선법, 1971년 간호사 훈련법, 1971년 종합 보건 인력 훈련법 등 많은 다른 연방 법률이 통과되었다[8]. 포괄적 의료 인력 훈련법CHMTA은 의료 종사자 교육에 대한 연방 정부의 헌신을 높이고, 가정의학 의사 수련에 긴급성을 더했으며, 의료 전문직 중 소수자 수를 늘리고, 소외 지역의 부족을 완화한 것으로 유명하다. 이 법률은 1970년대에 3년제 의료 프로그램을 확장하는 데 중요한 역할을 했다[8].
Due to the concern about healthcare worker shortages, a flurry of other additional federal legislations were passed between 1965 and 1971, including the Allied Health Professions Personnel Training Act in 1966, Health Training Improvement Act in 1970, Nurse Training Act in 1971, and Comprehensive Health Manpower Training Act in 1971 [8]. The Comprehensive Health Manpower Training Act was notable for elevating federal commitment to training healthcare workers, giving new urgency to training family practitioners, increasing numbers of minorities in health professions, and alleviating shortages in underserved areas. This piece of legislation was crucial to the expansion of 3-year medical programs in the 1970s [8].

특히 1950년대와 1960년대에 MD 학위를 위한 다른 혁신적인 대안 경로가 도입되었다. 이들 프로그램은 의사 양성에 필요한 전체 시간을 단축하기 위해 마련됐으며, 학부 과정 3년과 의대 3년(BA-MD 프로그램)을 결합한 3+3 프로그램이 포함됐다. 1960년대에는 전국적으로 60명의 학생들이 BA-MD 프로그램에 입학했다. 이 숫자는 1976년까지 매년 약 400명으로 증가했다. 1950년대와 1960년대에 개발된 개선된 고등학교 및 학부 과정 덕분에 의대생들은 과거보다 더 높은 수준의 의과대학 과정을 시작할 수 있었고, 이는 2차 세계대전 당시보다 3년제 의과대학 프로그램의 성취가능성achieable을 더 높여주었다. 실제로 1967년까지 의대 지원자의 40% 이상이 생화학을 일부라도 배우고 왔다. 
Of note, during the 1950s and 1960s, other innovative alternative pathways to an MD degree were introduced. These programs were designed to shorten the overall time needed to train a physician and included 3 + 3 programs that combined 3 years of undergraduate courses with 3 years of medical school (BA-MD programs). In the 1960s, 60 students were admitted into BA-MD programs nationally. That number grew to around 400 students per year by 1976 [11]. Due to improved high school and undergraduate collegiate programs developed during the 1950s and 1960s, medical students were able to start at a more advanced level than had been possible in the past, which enabled 3-year medical school programs to be more achievable than they had been during the WWII era. Indeed, by 1967 over 40% of medical school applicants had some exposure to biochemistry [12].

BA-MD 프로그램의 학생들은 일반적으로 학업적으로 성공했다. 예를 들어, 보스턴 대학교의 BA-MD 프로그램에 입학한 학생 중 50%는 우등으로 학사 학위를 받았고, 10%는 우등으로 MD 학위를 받았다[13]. 1966년부터 1996년까지 통합 BA-MD 프로그램에서 학생들의 성과 결과 데이터를 검토한 결과, 표준화된 의료 위원회 시험 점수와 임상 성과에 따라 결정되는 역량이 기존의 의대 학생들과 차이가 없었다. 이러한 결과는 학생들이 성공적인 의사가 될 학생을 고등학교에서 바로 선발할 수 있음을 보여주었다[14]. 1960년대는 또한 의과대학 학급 규모가 커지는 추세를 보였다. 예를 들어, 1960년과 1970년 사이에 미네소타 의과대학은 신입생 반을 164명에서 227명으로 늘렸다[15명].

Students in BA-MD programs generally succeeded academically. For example, 50% of students who entered Boston University’s BA-MD program received their BA degree with honors and ≥10% received their MD degree with honors [13]. A review of performance outcome data of students in combined BA-MD programs from 1966 to 1996 showed no difference in competency from traditional medical school students as determined by scores on standardized medical board exams and clinical performance. These results demonstrated that students could be selected from high school to become successful physicians [14]. The 1960s also saw a trend toward larger medical school class sizes. For example, between 1960 and 1970, the University of Minnesota Medical School increased its freshman class from 164 to 227 students [15].

3년제 가속 의과대학 프로그램의 급증: 1970년대와 1980년대
A spike in the number of 3-year accelerated medical school programs: 1970s–1980s

베트남 전쟁 (1955~1975) 기간 동안 의사 부족 문제를 해결하는 것 외에도, 1970년대는 3년 과정의 급속한 개발로 이어진 추가적인 요소가 있었다: 바로 학생 부채를 줄이는 것이다. 이러한 목적은 성공하였으며, 1970년대에 돈을 벌기 위해 일하는 의대생들이 줄어든 것에서 드러난다. 1963년에는 의대 4학년의 45%가 주당 평균 16시간을 일했고, 1971년에는 더 적은 수의 4학년(34%)이 주당 평균 14시간을 일했으며, 1974년에는 4학년 중 26%만이 주당 평균 10시간을 일했다. [16] [학생 부채 감소, 의사 부족 문제 해결, 정부 재정적 인센티브에 관한 국가적 논의]는 1970년부터 1973년까지 3년제 프로그램에 등록하는 학생 수 증가에 주된 기여요인으로 보고되었다. 실제로, 이 기간 동안 3년제 가속 의학 프로그램에 등록하는 학생은 1970-1971학년의 671명에서 1973-1974년 2,597명으로 387% 증가했다. 3년제 의료진 등록이 가장 크게 증가한 것은 1971년 종합보건인력양성법CHMTA의 시행 이후였으며, 1972-1973년에 1080명이던 의과대학 입학이 다음 해에는 2,273명으로 증가했다. 1971년 포괄적 보건 인력 훈련법에 따라 연방 역량 기금은 3년 내에 졸업하는 학생 1인당 2,000달러의 보너스를 제공했다[19]. 이러한 상황 속에, 1973년에 이르자 모든 미국 의과대학의 약 1/3(n = 33)이 졸업에 3년짜리 MD 경로를 제공했다[9,20].
In addition to addressing physician shortages during the Vietnam War era (1955–1975), much like during WWII, the 1970s had an additional factor that led to the rapid development of 3-year programs: the desire to reduce student debt. A successful push to reduce student debt may be revealed in decreased numbers of medical students working for pay in the 1970s. ‘In 1963, 45% of medical school seniors worked an average of 16 hours a week; in 1971, fewer (34%) of seniors worked an average of 14 hours a week; and, by 1974, only 26% of seniors worked an average of 10 hours per week’ [16]. National discussion regarding reducing student debt, the need to address physician shortages, and government financial incentives were reported as major contributors to increased enrollment in 3-year programs from 1970 to 1973 [17]. Indeed, during this time, enrollment in 3-year accelerated MD programs increased 387%, from 671 students in the 1970–1971 academic year to 2,597 in 1973–1974 [8] (out of a total of 15,000 medical graduates per year [18]). The greatest increase in 3-year MD enrollment was seen after implementation of the 1971 Comprehensive Health Manpower Training Act, with first year medical school enrollment increasing from 1,080 in 1972–1973 to 2,273 during the subsequent academic year [8]. Under the Comprehensive Health Manpower Training Act of 1971, federal capitation funding provided a bonus of $2000 per student graduating in 3 years [19]. Given this context, by 1973 approximately one-third (n = 33) of all US medical schools offered a 3-year MD path to graduation [9,20].

1970년대 가속 의료 프로그램 개발에 대한 긍정적인 태도와 관심은 3년 프로그램을 포함한 전반적인 의과 대학 등록의 증가로 이어졌고, 다른 가속 경로를 제공하는 다수의 학교가 확장되었다. 가속화된 프로그램의 확장을 촉진하는 학생들에게도 장점이 있었다. 이에 유의해야 할 점은 1970년부터 1975년까지 의과대학 입학 경쟁률이 높아졌다는 사실이다,

  • 1970년에는 11,350명 모집에 25,000명이 지원했다
  • 1975년에는 15,000명 모집에 43,000명이 지원했으며, 이로 인해 대학 입학률은 45%에서 35%로 떨어졌다[11].

Positive attitudes and interest in developing accelerated medical programs during the 1970s resulted in increased overall medical school enrollment, including 3-year programs, and expansion in a number of schools offering other accelerated pathways. There were advantages for students that facilitated expansion of accelerated programs as well. In this regard, it should be noted that rising competition for admission into medical school occurred from 1970 to 1975;

  • in 1970, there were 25,000 applications for 11,350 openings.
  • By 1975, there were 43,000 applications for 15,000 places, which caused the percent of matriculates to fall from 45% to 35% (1970 to 1975, respectively) [11].

학생들은 가속화된 MD 프로그램에 대한 조기 입학이 광범위한 일반 입학 풀 내에서 경쟁을 피하기 위한 방법일 수 있다고 판단했을 수 있다[11]. 우수한 지원자들이 새로운 3년제 MD 프로그램에 지원하였고, 이러한 학생들은 전체 기관의 명성에 중요한 요소인, [peers와 비교한 입학 지표와 성과를 향상]시켰기 때문에 의과대학에도 도움이 되었다[11]. 흥미롭게도 3년제 MD 프로그램에 대한 교수진의 태도는 전문 분야에 따라 다양했습니다. 오하이오 주립 의과대학이 1970년에 4년제 프로그램에서 3년제 MD 프로그램으로 전환했을 때, 교수 태도에 대한 연구는 가정의학과 예방의학과 교수진이 3년제 MD 프로그램에 대해 가장 긍정적인 것으로 결정했다[20].

Students may have reasoned that early admission to accelerated MD programs might be a way of avoiding increasing competition within the broader general admission pool [11]. This was also beneficial for medical schools since outstanding candidates were attracted into new 3-year MD programs, and these students in turn boosted admission metrics and performance of their peers, an important component of overall institutional prestige [11]. Faculty attitudes toward 3-year MD programs varied, interestingly, by specialty. When Ohio State University School of Medicine transitioned from a 4-year program to a 3-year MD program in 1970, a study of faculty attitudes determined that family medicine and preventive medicine faculty were most positive toward 3-year MD programs [20].

3년 가속 MD 프로그램 중단: 1970년대 후반-80년대
Discontinuation of 3-year accelerated MD programs: late 1970s–1980s

1970년대에 도입되어 개발된 3년제 가속 의과대학 프로그램 중 다수는 그렇게 오래 유지되지 못했다. 학업 스트레스가 높았고 가속 MD 프로그램을 수강하는 학생의 약 25%가 자발적으로 교육을 1~2년 연장했다[9]. 또한, 학생과 교직원은 자료의 압축에 대한 압박을 언급했다. 프로그램을 마친 학생들은 '지쳤다'고 말했으며, 교직원들은 끊임없이 확장되는 의학 지식을 더 짧은 기간 안에 가르쳐야 한다는 것에 불만을 느꼈다[9]. 그 밖에 3년제 교육과정에선 가정의학과 농촌의학과 노인학 순환학 등의 과소대표underrepresentation, 심화윤리 및 약물남용 교육 부족 등이 지적됐다. 또한 최종적으로 레지던트 추천서를 준비할 교수진에게 제한적으로 노출되었고, 학생들이 레지던트 프로그램을 인터뷰할 시간이 거의 없었으며, 방학 시간도 최소화되었다[17]. 아마도 가장 중요한 것은 가속화된 MD 프로그램이 순 의사 양성net physician output을 증가시키지 않았다는 것이다. 이는 3년제 프로그램을 시작하는 주요 목표 중 하나였다[9]. 학급 규모의 증가 없이, 3년제 의료 프로그램은 3년제 첫 번째 학급이 4년제 학생들과 함께 졸업할 때 의사들의 무리를 만들었다. 그 후, 졸업하는 학생들의 순수는 더 이상 증가하지 않고 평형 상태로 유지되었다. 

Many of the 3-year accelerated medical school programs introduced and developed in the 1970s did not stay open long-term. Academic stress was high and about 25% of students in accelerated MD programs voluntarily extended their education by 1 or 2 years [9]. Additionally, students and faculty cited feeling pressured by compression of the material; students completing programs stated that they felt ‘exhausted,’ and faculty felt dissatisfied with trying to teach ever-expanding medical knowledge into a shortened timeframe [9]. Other issues cited with 3-year curricula included under-representation of family medicine, rural medicine, and gerontology rotations, as well as lack of in-depth ethics and substance abuse training. In addition, there was limited exposure to faculty members who would ultimately prepare residency recommendation letters, little time for students to interview with residency programs, and minimal vacation time [17]. Perhaps most importantly, accelerated MD programs did not increase net physician output, which was one of the main goals of starting such programs [9]. Without an increase in class size, 3-year medical programs created a bolus of physicians when the first class of 3-year students graduated along with fourth year students. Thereafter, the net number of students graduating remained stable (reached steady state), without further increase.

주의할 점은 3년제 MD 교육과정의 페다고지는 distinct하며, 따라서 단순한 4년제 교육과정의 압축을 넘어서야 한다는 것이다. 이것은 때때로 1970년대에 어렵게 배워졌다. 예를 들어, 애리조나 대학교는 1972년에 4년제에서 3년제 MD 프로그램으로 전환되었다가 1977년에 다시 4년제 프로그램으로 전환되었다. 애리조나는 처음에는 72주의 기초과학(임상 전) 자료를 56주로 압축한 뒤 2교시 및 3년 MD 커리큘럼에서 64주로 늘렸다. 애리조나 의대생들은 필요하다면 4년 또는 그 이상으로 그들의 교육을 연장할 수 있는 선택권이 있었다. 애리조나에서 처음 3개 반의 학생 중 1/3은 재학기간을 3년 이상으로 연장했으며, 이 옵션을 선택한 학생은 [의학 전공분야를 탐구]하는 데 더 많은 시간을 선택하는 대신, 대부분의 추가 시간을 [기초 과학 학습 속도를 늦추는 데] 사용했다[17]. 안타깝게도 원래 예정된 3년 기간에 끝마치지 못한 학생들은 종종 '약하거나 부족하다'는 오명을 쓰게 되었고, 그렇게 교수들에게 인식되었다[9,18].

It is important to note that pedagogy for a 3-year MD curriculum is distinct and therefore should go beyond compression of a school’s 4-year curriculum. This was sometimes learned the hard way in the 1970s. As an example, the University of Arizona went from a 4-year to a 3-year MD program in 1972, and then converted back to a 4-year program in 1977. Arizona had compressed 72 weeks of basic science (pre-clinical) material into 56 weeks initially, and then increased it to 64 weeks in the second class and subsequent classes in their 3-year MD curricula. Medical students at Arizona had the option to extend their schooling to four or more years if needed. One-third of students in the first three classes at Arizona extended their time beyond 3 years, and students who took this option used the majority of additional time to slow down the pace of basic science learning rather than choosing more time to explore medical specialties [17]. Unfortunately, students who extended their time beyond the originally committed 3 years were often stigmatized and perceived by faculty as ‘weak or deficient’ [9,18].

다른 학교들도 MD 커리큘럼이 압축된 것에 부담을 느꼈다. 오하이오 주립 대학교에서는 3년제 교육과정에 참여하는 교수진의 평균 만족도 점수가 100점 만점에 60.5점(34~93점)이었으며, 교수진의 50%가 4년제 MD 프로그램으로 복귀하는 것을 선호했다[20점]. USMLE 점수와 레지던트 일치 결과에 따르면 3년제와 4년제 학생들 간의 성과에 큰 차이가 없다는 연구 결과가 나왔지만, 1970년대 말까지 대부분의 3년제 MD 프로그램은 4년제 커리큘럼을 선호하여 중단되었다. 실제로 1973-1974 학년 이후, 이러한 프로그램에 대한 등록이 지속적으로 감소하였고, 1974-1975년에는 2,434명이던 3년제 MD 학생이 1978-1979년에는 1,455명으로 감소했다[23]. 3년 MD 프로그램을 종료하게 된 전반적인 이유에는 [재정적 인센티브를 제거한 연방 기금 중단, 의사 부족의 감소, 가속화된 기간에 대한 전반적인 불만족] 등이 포함되었다[22].
Other schools felt pressure from their compressed MD curriculum as well. At Ohio State, the mean satisfaction score of faculty participating in the 3-year curriculum was 60.5 out of 100 (range of 34–93), with 50% of faculty favored returning to a 4-year MD program [20]. Although studies showed no major difference in performance between 3-year and 4-year students, as measured by USMLE scores and residency match results, by the end of the 1970s most 3-year MD programs were discontinued in favor of 4-year curricula [13,17,21,22]. Indeed, after the 1973–1974 academic year, a persistent decline in enrollment in these programs occurred, with 2,434 3-year MD students in 1974–1975 declining to 1,455 in 1978–1979 [23]. Overall reasons given for ending 3-year MD programs included discontinuation of federal funding that eliminated financial incentives, declining physician shortages, and overall dissatisfaction with the accelerated time frame [22].

 

3 + 3 MD 잔류 프로그램의 성장과 함께 의사 훈련 기간 해결: 1980년대-2000년대
Addressing the length of physician training with growth of 3 + 3 MD-residency programs: 1980s–2000s

1970년대 말까지 대부분의 3년 MD 프로그램이 해체되었지만, 이후 수십 년 동안 MD-전공의 통합 프로그램은 의사의 전반적인 훈련 기간을 줄이기 위한 시도로 이루어졌다. 1975년부터 2000년까지 미국 전공의의 수는 37,140명에서 98,806명으로 두 배 이상 증가했다. 4년제 커리큘럼이 있는 일부 의과대학은 학생들이 로테이션 인턴십을 이수하면 4학년을 대체한 것으로 갈음하는 것waive the fourth year을 허용하기 시작했다[17]. 1980년대와 1990년대에 25개의 미국 의과대학은 내과 3 + 3에 있는 여러 프로그램 외에도 가정의학과 3 + 3 (MD 잔류) 프로그램을 가지고 있었다[21]. 흥미로운 점은 가정의학과 3+3 졸업생이 기존(4+3) 졸업자보다 치프 레지던트로 선택될 확률이 높았다. 그러나 이러한 3+3 프로그램 대부분은 주로 GME 인증 문제로 인해 종료되었다[22].
Although there was dissolution of most 3-year MD programs by the end of the 1970s, over the next few decades, growth occurred in combined MD-residency programs in an attempt to reduce the overall length of training of a physician. From 1975 to 2000, the number of residents in the United States had more than doubled, from 37,140 to 98,806 [18]. Some medical schools with 4-year curricula began allowing students to waive the fourth year if they completed a rotating internship [17]. In the 1980s and 1990s, 25 US medical schools had family medicine 3 + 3 (MD-residency) programs in addition to several in internal medicine 3 + 3 [21]. Interestingly, family medicine 3 + 3 graduates were more likely to be chosen as chief residents than traditional (4 + 3) graduates. Most of these 3 + 3 programs ended, however, primarily due to GME accreditation issues [22].

3년제 가속 의대 프로그램 현황: 2010-2017
Current state of 3-year accelerated medical school programs: 2010–2017

세기의 전환과 함께 의과대학 교과과정에서는 거대한 개혁이 일어났다. 2005년 이후 미국 의과대학의 75%가 능동적 학습과 임상 및 생물의학 과학의 통합 강화를 포함한 혁신적인 교육학을 시작했다[2]. 이는 21세기에 의사가 성공하기 위해서는 성인 학습을 최적화하고 업데이트된 의료 지식을 통합하는 개정된 커리큘럼이 필요하다는 일반적인 인식을 보여준다. 교육 개혁의 일환으로 2010년 이후, 3년제 MD 프로그램이 9개의 allopathic 의과대학에서 다시 등장했으며, 이들 학교의 80%는 3년제 학생들의 1차 진료에 초점을 맞추고 있다[21]. 레지던트 면접을 위해 여행하는 데 사용할 수 있는 3년 MD 커리큘럼의 제한된 시간을 고려할 때, 거의 모든 프로그램은 학생들에게 보장된 지역 레지던트 자리를 제공한다[21,24,25].
With the turn of the century, vast reforms have occurred in medical school curricula. Since 2005, 75% of US medical schools have initiated innovative pedagogy, including active learning and enhanced integration of clinical and biomedical sciences [2]. This shows general recognition that revised curricula that optimize adult learning and incorporate updated medical knowledge are needed for physicians to succeed in the twenty-first century. As part of curricular reform, since 2010, 3-year MD programs have re-emerged in nine allopathic medical schools, with 80% of these schools focusing on primary care for their 3-year students [21]. Given the limited time available in 3-year MD curricula to travel for residency interviews, almost all of these programs offer their students guaranteed local residency positions [21,24,25].

과거 추세에 대한 요약
Summary of historical trends

그림 1은 지난 세기 동안 미국에서 3년 MD 프로그램의 생성 및 해체에 영향을 미친 역사적 사건을 요약한 것입니다. 그림 2는 1930년부터 2017년까지의 총 의대생의 증가를 3년 커리큘럼으로 인가된 알로패스 의대 비율과 병치하여 보여준다[9,12,20,22–38]. 그림 2에서 볼 수 있듯이, 3년제 의과대학 중 가장 많은 비율이 2차 세계대전(90%)에 발생했고, 그 다음이 1970년대(40%)였다. 가장 최근에 3년제 교육과정을 갖춘 의과대학이 부활한 것은 1940년대와 1970년대에 급증했던 것에 비하면 훨씬 덜 두드러진다.

Figure 1 summarizes historical events impacting creation and dissolution of 3-year MD programs in the United States over the last century. Figure 2 documents the rise in total medical students from 1930 to 2017 juxtaposed against percentages of accredited allopathic medical schools with 3-year curriculum over the same period [9,12,20,2238]. As can be seen in Figure 2, the greatest percentage of medical schools with a 3-year program occurred in the WWII era (≈90%) followed by the 1970s (≈40%). The most recent resurgence of medical schools with 3-year curricula is far less pronounced compared to spikes in the 1940s and 1970s.

 

 

 

시간에 따른 새로운 테마
Emerging themes across time

가속 3년 의료 교육을 검토할 때 지난 세기에 걸쳐 두 가지 주요 주제(학습 교훈)가 나타난다.

  • 첫 번째 주제는 3년제 의료 교육의 재정적 이익(예: 학생 부채 감소 및 의료 교육비 절감)이 현실에서 원래 생각했던 것만큼 간단하지 않고 기관의 더 넓은 맥락에 의존한다는 것이다.
  • 두 번째(교육학적) 주제는 4년제 의료 교육에 대한 접근법과 구별되는 3년제 의료 교육을 위한 새롭고, 통합적이며, 능률적인 커리큘럼 개발의 중요성이다.

Two major themes (learning lessons) emerge across the last century when examining accelerated 3-year medical education.

  • The first theme is that financial benefit of 3-year medical education (e.g., decreased student debt and lower medical education costs) is an ideal that is not as straightforward in reality as originally conceived and depends on broader context of institutions.
  • A second (pedagogical) theme is the importance of developing new, integrated, and streamlined curricula for 3-year medical education, distinct from the approach to 4-year medical education. 

 

가속/3년제 의과대학의 재정적 이점 및 비용
Financial advantages and costs of accelerated/3-year medical schools

의대생 부채(학부와 의전원을 합친 것)는 여전히 미국에서 중요한 문제로 남아 있다. 1990년부터 2003년까지 의과대학 학비와 등록금은 83%에서 167%까지 인상되었다[35]. 다만 상황이 복잡하기 때문에 3년제 MD프로그램이 단순히 1년치 등록금만 없앤다고 해서 의대 부채를 줄인다고 보는 것은 잘못됐다는 점에 유의해야 한다. 실제로 일부 3년제 의과대학은 4년제 학교와 동일한 등록금을 부과하고 있다[28,36]. 이는 현재 미국 LCME가 MD 학위를 취득하기 위해서는 130주가 필요하기 때문인데, 이는 여름 동안 수업을 추가하고 방학 및 레지던트 면접 시간을 모두 줄임으로써 3년 프로그램에서 달성된다[22,37]. 제도적 관점에서, 그러한 구조조정은 종종 새로운 교사와 다른 비용을 필요로 한다. 그러나 현재 많은 3년제 프로그램이 레지던트 자리를 보장하기 때문에 일부 혜택이 생깁니다. 이를 통해 학생들은 4학년 때 들어가는 면접 비용을 $1000–$5,000 절감할 수 있습니다[39].
Medical student debt (combined undergraduate and medical school) remains an important problem in the United States. From 1990 to 2003, medical school tuition and fees grew between 83% and 167% [35]. It should be noted, however, that it is erroneous to assume that 3-year MD programs decrease medical school debt by simply eliminating 1 year of tuition since the situation is more complex. In fact, some 3-year medical schools charge the same tuition as 4-year schools [28,36]. This is because currently the US LCME requires 130 weeks for a MD degree, which is achieved in 3-year programs by adding classes during summers and by decreasing both vacation time and residency interview time [22,37]. From an institutional perspective, such restructuring often requires a new set of teachers and other expenses. Some benefits do accrue, however, since many current 3-year programs today guarantee residency positions; this can lead to immediate $1000–$5000 savings to students in eliminating senior year interview expense [39].

3년제 MD 프로그램 수료자는 기존 의대생에 비해 1년 일찍 취업해 경제적 혜택을 받는다. 이 추가 연도는 추가적인 1년의 실습과 그에 따른 임상 수입을 허용하여 학자금 대출 상환을 용이하게 할 수 있다. 오늘날 노동력에서 얻은 1년의 재정적 혜택은 일반 내과 전문의의 경우 16만 달러, 내과 하위 전문의의 경우 23만 달러인 것으로 보고되었다[35]. 이런 현실은 의학교육의 큰 경제적 부담을 줄이는 가장 효과적인 재정수단이 의학교육비 자체를 줄이는 데 있지 않고, 인력진입을 앞당겨 대출금을 더 빨리 갚을 수 있도록 하는 데 있을 수 있다는 지적이다. 가속도가 학부, 의과대학, 레지던트 단계에서 일어나든 마찬가지일 것이다.
Graduates of 3-year MD programs do acquire financial benefit by entering the workforce 1 year early compared to traditional medical students. This extra year allows an additional year of practice and resultant clinical income that could facilitate repayment of student loans. Financial benefit of 1 year gained in the workforce today has been reported to be $160,000 for general internists and $230,000 for internal medicine subspecialists [35]. This reality points out that the most effective financial means for decreasing the large financial burden of medical education may not lie in reducing the price of medical education per se, but rather by allowing earlier entry into the workforce so loans can be paid back sooner. This would be true whether acceleration occurs at the undergraduate, medical school, or residency level.

독특한 교육학으로서의 3년제 의과대학
3-year medical school as a distinct pedagogy

이렇게 많은 세부 자료를 강의/학습하기가 어렵기 때문에, 표준 4년제 교육과정을 3년으로 압축하면서 교직원과 학생 불만이 크게 발생하는 것도 시간이 흐르면서 나타나는 주제다. 이는 가속화된 의학교육 프로그램의 성공을 달성하기 위해 새롭고 능률적이며 통합된 커리큘럼을 만드는 것이 중요함을 시사한다. 현재 미국의 의학 교육 커리큘럼 개혁 노력과 성인 학습에 대한 효과적인 접근법에 대한 새로운 이해를 고려할 때, 이와 관련하여 선제적 개입이 처음으로 가능하다. 이것은 3년 MD 프로그램으로의 전환을 고려하는 리더들에게 중요한 교육학 수업이자 (필요한 투자로 인한) 현실 점검이다.
Another theme present over time is that strong faculty and student dissatisfaction occurs with compression of a standard 4-year curriculum into 3 years since it is difficult to teach/learn such a large body of detailed material. This suggests that creating new, streamlined, and integrated curricula will be important for achieving success in accelerated medical education programs. Given current medical education curriculum reform efforts in the United States, and new understanding of effective approaches to adult learning, for the first time proactive intervention is possible in this regard. This is an important pedagogy lesson, and reality check (due to investments required), for leaders considering moving toward 3-year MD programs.

하나의 미래관
One view of the future

앞으로 가속화된 3년 MD 프로그램의 주요(실현되지 않은) 이점은 학생마다 개별화된 훈련을 제공할 기회를 제공함으로써 현재 4년 커리큘럼 내에서 유연성을 제공하는 데 있을 수 있다. 모든 형태의 교육을 뒷받침하는 기술의 폭발로 인해, 동기식 및 비동기식 학습이 가능해졌으며, 이것은 이러한 프로그램에서 학생과 교수진 모두에게 향상된 만족과 유연성을 가져올 수 있다. 실제로, 3년에 걸쳐 기초 과학 및 임상 훈련을 이수하면 학생들은 더 오래된 (2 + 2) 4년 커리큘럼 내에서 불가능했던 연구, 이중 학위, 리더십 훈련 및 팀 기반 종적 경험과 같은 학술 의료 센터에서 이용할 수 있는 다른 풍부한 기회를 활용할 수 있다. 임상의학에만 집중하는 것을 선호하는 학생들에게는 1년 일찍 취업할 수 있다는 것이 대출 상환에 도움이 되고 따라서 중요한 경제적 이익을 얻을 수 있기 때문에 잠재적인 장점이다.
Moving forward, a major (unrealized) advantage of accelerated 3-year MD programs may be in providing flexibility within current 4-year curricula by offering an opportunity to individualize training for a given student. With an explosion of technology undergirding all forms of education, synchronous and non-synchronous learning is now possible and this may result in enhanced satisfaction and flexibility for both students and faculty in these programs. Indeed, completing basic science and clinical training over 3 years may enable students to take advantage of other rich opportunities available in academic medical centers such as research, dual degrees, leadership training, and longitudinal team-based experiences otherwise not possible within older, more traditional (2 + 2) 4-year curricula. For students who prefer to focus solely on clinical medicine, ability to enter the work force 1 year early is a potential advantage since it helps with loan repayment and therefore can have important financial benefit.

의료 교육을 개별화할 때의 단점(예: 주어진 의과대학 내에서 두 개의 병렬 3년 및 4년 MD 커리큘럼이 나란히 있는 경우)은 주로 추가 비용에 따라 발생한다. 이는 특히 소규모 그룹 학습에 이미 훨씬 더 많은 교수진의 참여가 필요한 시대에 순추가 등록금 없이 필요한 교수 자원이 증가했기 때문이다. 과거에 이러한 경로를 시행했을 때처럼 정부 보조금이 없다면, 이러한 미래관은 오늘날 재정적으로 점점 더 제한된 환경에서 지속되기 어려울 수 있다. 하지만, 교육학적인 관점에서, 진정으로 개인화된 교육을 상상하는 것은 매력적입니다.

Disadvantages in individualizing medical education (e.g., having two parallel 3-year and 4-year MD curricula in tandem within a given medical school), revolves predominantly around added cost. This is due to increased faculty resources needed without net added tuition, particularly in an era where modern innovations in medical school curricula already require significantly more faculty involvement for small group learning. In the absence of government subsidies, as occurred in the past when this pathway was implemented, such a view of the future may be difficult to sustain in today’s increasingly fiscally limited environment. However, from a pedagogical perspective, it is enticing to envision truly individualized education.

 

결론
Conclusion

미국의 의학 교육 역사를 통틀어 3년제 MD 프로그램(제2차 세계 대전, 1970년대, 현재)의 시행과 관심의 물결이 세 차례 있었다. 성장기마다 나타나는 공통적인 요인에는 [의사 부족 문제를 해결]에 대한 우려가 포함된다. 역사적으로, 의사 부족을 진정으로 해결하기 위해서는, 3년제 또는 4년제 의과대학의 [학년 당 학급 규모를 늘려야 한다]는 사실이 재발하고 있다. 가속화된 MD 커리큘럼의 성장에 박차를 가하는 다른 영향으로는 정부 자금과 1970년대 이후 의료 교육 비용 절감에 대한 관심이 있다. 위에서 언급한 바와 같이, 가속화된 의료 프로그램의 재정적 인센티브는 주로 학생들이 1년 일찍 직장에 들어갈 수 있는 능력에 있으며, 이는 여러 다른 교육 시점을 단축함으로써 효과적으로 달성될 수 있다. 3년 MD 프로그램 중단의 이유는 [의사 부족에 대한 우려가 감소하게 되면] 외부(정부/주) 자금 지원이 줄어드는 것과 가속화된 프로그램에 참여하는 [의대생과 교수진이 표출한 불만]이었다. 이러한 우려에도 불구하고 3년제 MD교육 수료생은 4년제 졸업생과 동등한 국가고시 성적을 거두고 있다.

Throughout the history of medical education in the United States, there have been three waves of interest and implementation of 3-year MD programs (WWII era, 1970s, and current). Common factors driving every period of growth include concern over addressing physician shortages. Historically, a reoccurring finding is that to truly address physician shortages, increasing class size of 3-year or 4-year medical school is needed. Other influences spurring growth of accelerated MD curricula have been governmental funding and, since the 1970s, an interest in reducing the cost of medical education. As stated above, financial incentive from accelerated medical programs lies predominantly in the ability of students to enter the workforce 1 year early, which can be effectively achieved by shortening several different educational time points. Reasons given for discontinuation of 3-year MD programs were elimination of external (government/state) funding, which waned in periods of declining concern over physician shortages, and dissatisfaction expressed by medical students and faculty participating in accelerated programs. In spite of these concerns, 3-year MD education graduates perform comparably with 4-year graduates on national examination scores.

강의에 사용되는 기술의 확장과 의과대학 수준의 수업들이 점차적으로 대학 학부 과정으로 이전되는 것을 고려하면, 과거에 비해 짧은 기간의 의사 양성이 오늘날 더 실현 가능할지도 모른다. 연구 등 대안적인 과정을 이수하고 싶은 학생들에게는 3년제 MD 프로그램이 기존 4년제 커리큘럼에서는 접할 수 없는 개별화를 위한 틀도 제공할 수 있다. 하지만, 지난 날을 살펴보면 이 또한 주의를 필요로 한다. 3년제 교육과정의 표준화가 어렵고 장기적인 지속 가능한 모델을 추구한다면 이러한 교육학을 조직하는 데 집중된 시간과 노력이 할당되어야 한다. 과거 3년 MD 프로그램에서 접한 맥락과 이슈를 검토함으로써 앞으로 새로운 프로그램이 가장 사려 깊고 성공적으로 설계될 수 있기를 바라는 것이 저자의 바람이다.

Given expansion of technology used in teaching, and gradual transfer of medical school level classes to university undergraduate coursework, training physicians in a shortened duration may be more feasible nowadays compared to the past. For students who would like to complete alternative coursework such as research, 3-year MD programs can also provide a framework for individualization not accessible in traditional 4-year curricula. However, history also suggests caution. Standardizing 3-year curriculum is difficult and focused time and effort must be allotted to organizing such pedagogy if a long-term sustainable model is sought. By reviewing the context and issues encountered with 3-year MD programs in the past, it is the author’s hope that new programs can be designed in the most thoughtful and successful manner possible going forward.


Med Educ Online. 2018 Dec;23(1):1530557.

 doi: 10.1080/10872981.2018.1530557.

Comprehensive history of 3-year and accelerated US medical school programs: a century in review

Affiliations collapse

Affiliation

1a Departments of Anesthesia (DAS), Biochemistry (DAS), Pharmacology (DAS) , University of Iowa , Iowa City , IA , USA.

PMID: 30376794

PMCID: PMC6211283

DOI: 10.1080/10872981.2018.1530557

Abstract

Within the context of major medical education curricular reform ongoing in the United States, a subset of schools has re-initiated accelerated (3-year) medical education. It would be helpful for education leaders to pause and consider historical reasons such accelerated medical schools were started, and then abandoned, over the last century to proactively address important issues. As no comprehensive historical review of 3-year medical education exists, we examined all articles published on this topic since 1900. In general, US medical educational curricula began standardizing into 4-year programs in the early 1900s through contributions from William Osler, Abraham Flexner, and establishment of the American Medical Association (AMA) Council of Medical Education (CME). During WWII (1939-1945), accelerated 3-year medical school programs were initiated as a novel approach to address physician shortages; government incentives were used to boost the number of 3-year medical schools along with changed laws aiding licensure for graduates. However, this quick solution generated questions regarding physician competency, resulting in rallying cries for oversight of 3-year programs. Expansion of 3-year MD programs slowed from 1950s to 1960s until federal legislation was passed between the 1960s and the 1970s to support training healthcare workers. With renewed government financial incentives and stated desire to increase physician numbers and reduce student debt, a second rapid expansion of 3-year medical programs occurred in the 1970s. Later that decade, a second decline occurred in these programs, reportedly due to discontinuation of government funding, declining physician shortage, and dissatisfaction expressed by students and faculty. The current wave of 3-year MD programs, beginning in 2010, represents a 'third wave' for these programs. In this article, we identify common societal and pedagogical themes from historical experiences with accelerated medical education. These findings should provide today's medical education leaders a historical context from which to design and optimize accelerated medical education curricula.

Keywords: 3-year medical school; Review; US; accelerated; curriculum.

 

전략기획이 중요한가? (Acad Med, 2019)
Does Strategic Planning Matter?
William T. Mallon, EdD

 

 

당신을 전략기획팀에 투입할 겁니다. 그것은 성취할 수 있는 만족감이 아무것도 없는 일과 같다.
I’m putting you on the strategic planning team. It’s like work but without the satisfaction of accomplishing anything.

—딜버트의 보스; 스콧 애덤스, 딜버트1
—The Boss to Dilbert; Scott Adams, Dilbert1

전문 문헌, 학술지, 그리고 재미있는 페이지에 그런 냉소를 불러일으킨 전략기획strategic planning에 관한 것은 무엇일까? 전략적 계획이 조직 결과를 개선하는지 여부에 대한 동료 검토 문헌에서 논쟁이 지속되고 있다.

  • 해설자들은 "나쁜 전략의 위험"2에 대해 경고하고,
  • 실무자들은 "전략 계획이 더 이상 관련이 있는지" 묻는다3.
  • 교수진은 전략 계획이 "전략도 계획도 없고, 그저 시간 낭비다."4 

What is it about strategic planning that has inspired such cynicism in the professional literature, the academic quad, and the funny pages? A debate persists in the peer-reviewed literature about whether strategic planning leads to improved organizational outcomes.

  • Commentators issue warnings about “the perils of bad strategy”2;
  • practitioners ask if “strategic planning [is] relevant anymore”3; and
  • faculty flat-out assert that the strategic plan is “neither strategy nor plan, but a waste of time.”4 

25년 이상 저는 고등교육, 학술 의학 및 비영리 단체의 전략 개발 및 전략 계획 노력의 참여자, 촉진자, 컨설턴트, 학자 및 리더였습니다. 이러한 역할을 하면서 저는 교수, 직원 및 기타 이해 관계자들 사이에서 전략 계획이 중요한지 여부에 대해 의문을 제기하는 상당한 냉소주의에 직면했습니다. 저는 조직 행동과 변화에 대한 실천가이자 연구자로서 냉소주의를 공유하지는 않지만, 전략 계획이 무엇을 성취하는가에 대한 건전한 회의론과 그것이 의미하는 것에 대한 깊은 이해를 얻게 되었다.
For more than 25 years, I have been a participant, facilitator, consultant, scholar, and leader of strategy development and strategic planning efforts in higher education, academic medicine, and nonprofit organizations. In these roles, I have encountered a fair amount of cynicism about strategic planning among faculty, staff, and other stakeholders, with many people questioning whether strategic planning matters. While I do not share that cynicism, as both a practitioner and researcher of organizational behavior and change, I have developed a healthy skepticism for what strategic planning achieves and a deep appreciation for what it means.

"전략적 계획" 대 "계획"
“Strategic Planning” Versus “Planning”

전략 계획이 중요한지 검토하기 전에 용어를 정의해야 합니다. 너무 자주, "전략적 계획"은 일반적인 정의 없이 catchall 문구로 사용됩니다. 조직의 '미래 계획'은 언제 '전략적 계획'이 됩니까?

Before we can examine whether strategic planning matters, we need to define the term. Too often, “strategic planning” is used as a catchall phrase without a common definition. When does an organization’s plan for the future become a strategic plan?

역사는 고대 군국주의 기원에서 20세기 사업 적용에 이르기까지 전략이 경쟁에 기반을 두고 있음을 보여준다. 즉, [직접적인 경쟁은 존재하지만 분명하지는 않은] 비영리 환경에서도 경쟁사보다 [우위를 점하는 데] 전략이 집중됩니다. 따라서 "전략적 계획"은 조직이 자신의 임무를 달성하기 위하여, [경쟁업체와 어떻게 차별화할지]를 파악하는 프로세스입니다. 즉, 경쟁이 병원 시스템, 학생 또는 교직원의 국가 경쟁업체, 또는 미래의 경쟁 위협업체 등입니다.
History shows that strategy, from its ancient militaristic origins to its 20th-century business application (from which higher education’s version of strategic planning developed), is predicated on competition. That is, strategy is focused on gaining advantage over one’s competitors—even in nonprofit settings, where direct competition still exists but may not be as apparent. “Strategic planning,” therefore, is the process whereby an organization identifies how it will differentiate itself from its competition to achieve its mission—whether that competition is a nearby hospital system, a national competitor for student or faculty talent, or a nascent competitive threat on the horizon.

그러나 많은 조직은 "전략적 계획"에 대한 덜 구체적이고 암묵적인 정의를 가지고 있습니다. "전략적 계획"은 한 조직이 개선을 위한 단기 및 장기 목표를 설정하고 이러한 개선을 달성하기 위한 진행 상황을 측정하는 프로세스입니다. 의학교육연락위원회[LCME]5가 승인한 의과대학에 대해서는 칭찬할 만하지만, 그러한 운영 계획은 반드시 "전략적"이라는 별명을 얻지는 않는다. [조직 계획]은

  • 전략 계획("외부 위협에 대응하기 위해, 경쟁사와 비교하여, 조직이 어떻게 달라져야 하는가?")과
  • 운영 계획("조직이 어떻게 끊임없이 더 잘 결과를 개선해나갈 수 있을까?")의 조합일 수 있습니다.

Many organizations, however, hold a less specific, implicit definition of “strategic planning” that is akin to “ongoing planning”—a process whereby an organization establishes short- and long-term goals for improvement and measures progress toward achieving those improvements. While laudable (and mandatory for medical schools accredited by the Liaison Committee on Medical Education [LCME]5), such operational planning does not necessarily earn the “strategic” moniker. Organizational plans may be a combination of

  • strategic planning (“How will the organization be different in response to external threats and compared with our competition?”) and
  • operational planning (“How will the organization continuously be better to improve outcomes?”).

운영 계획은 중요합니다. 그러나 그것은 전략적인 계획과 같지 않다.
Operational planning is important. But it is not the same as strategic planning.

전략 계획은 크게 중요하지 않음
Strategic Planning Has Not Mattered Much

고등교육에서의 전략계획의 기원은 1959년 매사추세츠공과대학에서 열린 대학시설계획가 회의에서 비롯되었다. 그것은 공공 부문과 고등교육의 전략 계획에 대한 획기적인 책으로 1980년대에 실제로 시작되었다.7-9 그 초기부터 대학, 의과대학 및 학술 보건 센터는 여러가지 전략적인 계획 기법을 사용해 왔다. 환경 스캐닝, SWOT(강점, 약점, 기회 및 위협)분석, 프로그램 및 제품 로드맵, 시나리오 계획, 예측 및 균형 스코어카드, 기타 연구 생성, 컨설턴트 판매 또는 자체 개발 도구 및 기법 등이 그것이다. 대부분의 전략적 계획 수립 노력은 Academic Medicine 이번 호에서 Byrne과 동료들이 기사에서 설명한 것과 같은 익숙한 프로세스를 따르는 경향이 있습니다.10
The genesis of strategic planning in higher education stems from a meeting of university facility planners held at the Massachusetts Institute of Technology in 1959.6 It really took off in the 1980s, with groundbreaking books about strategic planning in the public sector and in higher education.7–9 Since those early days, universities, medical schools, and academic health centers have employed strategic planning techniques such as environmental scanning, SWOT (strengths, weaknesses, opportunities, and threats) analyses, program and product road maps, scenario planning, forecasting, and balanced scorecards, among other research-generated, consultant-sold, or home-grown tools and techniques. Most strategic planning efforts tend to follow a familiar process—such as the one that Byrne and colleagues describe in their article in this issue of Academic Medicine.10

전략 계획은 양적, 질적 및 혼합적 방법을 사용하여 인류학, 행정학, 경영학, 의사결정 과학 및 교육과 같은 다양한 분야의 연구자들에 의해 광범위하게 연구되어 왔다. 메타 분석에서는 전략적 계획과 조직 성과 사이에 긍정적인 관계를 발견했지만, 전략 계획에 대한 연구는 인과 관계를 연관짓는 것에 대해 비판을 받아왔다.14 즉, 전략적 계획이 조직 성과에 영향을 미치지 않을 수 있다; 오히려 다른 요인이 좋은 성과의 원인일 수 있다. 예를 들어 우호적인 외부 요인들, 효과적으로 조직을 관리하는 방법을 아는 유능한 리더들, 그리고 심지어 운까지. 그러나 우리는 전략적인 계획 자체가 강한 성과를 유발한다고 말할 수 없다. 자, 전략계획이 정말 중요합니까?
Strategic planning has been studied extensively by researchers in diverse disciplines such as anthropology, public administration, management, decision sciences, and education, using quantitative, qualitative, and mixed methods. Meta-analyses have found positive relationships between strategic planning and organizational performance11–13; however, studies on strategic planning have been criticized for conflating correlation with causation.14 That is, strategic planning may not make a difference to organizational performance; rather, positive outcomes may be attributable to other factors, such as favorable external factors, competent leaders who know how to effectively manage organizations, and even luck. But we cannot say that strategic planning in and of itself causes strong performance. Ergo, does strategic planning matter—really?

경험적 증거 너머에는 미국의 의대와 교육병원의 역사적 맥락이 있다. 긴 안목에서, 전략 계획은 산업으로서 학문의학에 큰 영향을 미치지 않았다: 1960년대 이래로, 엄청난 성장은 학문의료센터가 사실상, 한 가지 전략과 다른 전략에 대해 선택이나 절충을 할 필요가 없는 시스템에 [충분한 해이함enough slack]을 만들어냈다. 그들은 모든 임무 분야에서 성장 포트폴리오의 균형을 맞출 수 있었다. 일부 의과대학이 규율되고 다른 의과대학들은 심각한 전략적 선택을 필요로 하는 중대한 위기에 직면하는 등 지역사회 전반에 걸쳐 다양성이 존재해왔지만, 산업으로서의 학문적 의학academic medicine은 많은 사람들에게, 많은 것에서, 엄청난 성공을 거두었다.
Beyond the empirical evidence is the historical context of medical schools and teaching hospitals in the United States. In the long view, strategic planning has not mattered much for academic medicine as an industry: Since the 1960s, tremendous growth has created enough slack in the system that academic health centers have, in effect, not needed to make choices or trade-offs regarding one strategy versus another. They have been able to balance growth portfolios in all their mission areas. While there is and has been variation across the community, with some medical schools being disciplined and others facing significant crises that required dire strategic choices, academic medicine as an industry has been enormously successful being many things to many people.

[억제되지 않는 성장]은, 적어도 사라지지는 않더라도, 최소한 더 [휘발성이 강해진다]고만 말해두자. 그리고 Tripartite mission을 위한 전통적인 자금원에 대한 압박이 이어지고 있다. 대부분의 AHC들은 더 이상 진정한 전략의 필요성을 무시할 수 없다. 즉, 기관의 존재 이유를 충족시키기 위해 무엇을 하고 무엇을 하지 말아야 하는지에 대한 선택을 하는 것이다.15 이 전략의 개념은 어떤 것은 선택하지만 다른 것은 선택하지 않는 것을 강조하기 때문에 간단하지만, 어려운 단어를 포함한다. 바로 "아니오No"이다.
Suffice it to say that unbridled growth has, if not disappeared, at least become more volatile. And the traditional funding sources for the tripartite missions have been under duress. Most academic health centers can no longer ignore the need for a true strategy—that is, making choices about what to do and what not to do to fulfill the institution’s reason for existence.15 This concept of strategy emphasizes choosing some things but not others and, therefore, involves a simple yet difficult word: “No.”

전략 니즈 리더십 노하우
Strategy Needs Leadership No-How

리더는 "아니오"라고 말할 수 있는 사람들이기 때문에 비판적이다.
Leaders are critical because they are the ones who can say “no.”

이러한 노하우(nohow)는 어려운 재정 상황에서 확실히 필요하지만, 그 때만이 아니다. 조직의 대차대조표가 양호하더라도, 혁신과 투자의 기회가 많을 때, 어떤 조직도 모든 기회를 추구할 수는 없습니다.
This no-how surely is needed under difficult financial circumstances, but not only then. Even if an organization’s balance sheet is healthy, even when there are many opportunities for innovation and investment, no organization can pursue every opportunity.

리더는 조직의 트레이드오프를 정의합니다. 즉, "하나가 더 많이 하려면, 다른 것을 덜 해야 함."16 그렇다고 해서 제로섬 게임을 제안하는 것은 아닙니다. 오히려, 예를 들어, 임상 또는 연구 전문 분야의 한 분야에 투자하되 다른 분야에 투자하지 않기로 선택함으로써, 리더는 조직의 우선 순위를 분명히 합니다. 모든 사람에게 모든 것이 되려고 노력하는 조직은 노력, 예산 및 인적 자원, 심지어 전달된 메시지의 산만함diffusion을 초래할 수 있습니다. 트레이드오프는 "[조직]이 제공하는 것을 의도적으로 제한"하는 것이다16

Leaders define the trade-offs for the organization—meaning that “more of one thing necessitates less of another.”16 This is not to suggest a zero-sum game. Rather, by choosing to invest in, say, one area of clinical or research expertise but not another, leaders make organizational priorities clear. Organizations that try to be all things to everyone (patients, students, residents, faculty, staff, the public) risk diffusion of effort, budgetary and human resources, and even messaging. Trade-offs “purposefully limit what the [organization] offers.”16

말하기는 쉬우나 행하기는 어렵다. 조직 생활의 현실은 무엇을 할지, 무엇을 하지 않을지에 대한 선택을 하는 것(즉, 전략을 갖는 것)에 저항한다. Porter가 말했듯이, 트레이드오프는 두려울 수 있다.16 누가 잘못된 선택을 하길 원하겠는가? 우리는 교수진, 직원, 지도자들을 실망시키고 싶지 않다. 우리는 갈등을 최소화하기를 원한다. 우리는 영향력 있는 부서나 교수진과의 소동이 언론 악재로까지 번지는 것을 피하고 싶다.
That’s easier said than done. The reality of organizational life works against making choices about what to do and not do (i.e., having a strategy). As Porter states, trade-offs can be frightening.16 Who wants to make the wrong choice? We do not want to disappoint faculty, staff, and leaders. We want to minimize conflict. We want to avoid a dustup with an influential department or faculty member that escalates into bad press—or a pink slip.

이러한 경향에 직면하여, 조직과 부서 지도자들이 전략의 성공적인 개발과 실행에서 주장할 수 있는 가장 중요한 단어는 "아니오"일 것이다.
In the face of these inclinations, perhaps the most important word that organizational and departmental leaders can assert in the successful development and implementation of strategy is “no.”

리더들은 그들이 조직이나 부서를 위한 "전략적 계획"이라고 부르는 것이 [자신의 사명을 달성하기 위해 취할 수 있는 다양한 경로들 사이의 트레이드오프]에 고유하게 초점을 맞추고 있는지, 아니면 [아무 고성능 조직에게나 모두 중요하고 칭송받을 목표]에 초점을 맞추고 있는지 자문해 볼 필요가 있다. 목표를 다른 업계의 조직의 전략 계획에 쉽게 적용할 수 있다면 전략 계획이 아닌 운영 계획을 수립하는 것일 수 있습니다.

Leaders need to ask themselves whether the thing that they call the “strategic plan” for their organization or department is uniquely focused on trade-offs between various pathways they could take to achieve their mission or focused on goals that are important and laudable for any high-performing organization. If you could take a goal and easily drop it into the strategic plan of an organization in another industry, you are probably working on an operational plan, not a strategic plan.

계획된 전략인가 아니면 비상 전략인가?
Planned or Emergent Strategy?

전략 및 전략 계획에 대한 대부분의 접근법은 [조직의 합리성organizational rationality]에 대한 암묵적인 관점을 가지고 있습니다. 즉, 위계적 구조, 합리적인 의사 결정, 비용 편익 분석 및 계획된 개입을 강조합니다. 1987년에 민츠버그가 지적한 것은 오늘날에도 여전히 사실이다: "사실상 전략 수립에 관해 쓰여진 모든 것들은 그것을 [신중한deliberate 과정]으로 묘사하고 있다. 먼저 생각하고, 그 다음에 행동합니다. 공식화한 다음 구현합니다."17
Most approaches to strategy and strategic planning have an implicit point of view of organizational rationality—one that emphasizes hierarchy, rational decision making, cost–benefit analyses, and planned interventions. What Mintzberg pointed out in 1987 is still true today: “Virtually everything that has been written about strategy making depicts it as a deliberate process. First we think, then we act. We formulate, then we implement.”17

민츠버그는 전략이 공식화될 수 있을 뿐만 아니라 형성될formulated 수도 있다고 주장했다. 그것은 진화하는 상황에 대응하여 나타날emerge 수 있고 나타나야 한다. 똑똑한 리더들은 "모든 것을 미리 생각할 수 있을 정도로 항상 똑똑할 수는 없다는 것을 인정한다."

Mintzberg argued that strategy can form as well as be formulated. It can and should emerge in response to evolving situations. Smart leaders “appreciate that they cannot always be smart enough to think through everything in advance.”17

전략이 계획되어야 하는가, 아니면 (상황에 맞춰) 나타나야emerge 하는가? 나는 실용주의자이지 순수주의자가 아니다. 저는 혼합된 접근법을 좋아합니다. 하멜에 의해 요약된 전략 개발의 유형입니다. "전략은 완벽한 질서와 완전한 혼돈, 절대적인 효율성과 맹목적인 실험, 독재 정치와 완전한 애드호크라시 사이의 경계에 놓여 있습니다." 
Should strategy be planned or should it emerge? I’m a pragmatist, not a purist. I like a hybrid approach, the type of strategy development summarized by Hamel: “Strategy is poised on the border

  • between perfect order and total chaos,
  • between absolute efficiency and blind experimentation,
  • between autocracy and complete adhocracy.”18 

의과대학과 교육병원은 특히 전략 개발이 완전히 계획되지도 않고 완전히 긴급하지도 않은 하이브리드 접근법에 매우 적합하다. 전략 계획은 하향식이며 분산형이며 합리적이고 상징적이며 계획적이고 긴급하다.
Medical schools and teaching hospitals are particularly well suited to this hybrid approach, in which strategy development is neither fully planned nor fully emergent. Strategic planning is both top-down and decentralized; rational and symbolic; and deliberate and emergent.

털은 어때요?
What About Fluff?

전략 계획들은 그들의 "허풍" 즉, "전문지식으로 가장한, 많은 유행어를 뿌리는, 뻔한 것의 재기술"로 비판을 받아왔다."2 어느 산업이나 조직은 허풍을 떨기 쉽다. 한 유명한 대학은 그것의 전략적 목표가 "학자이자 교사인 이상화," "타의 추종을 불허하는 교육과 경험을 제공하는 것," "대학원과 전문학 분야의 차별성을 보여주는 것," 그리고 "우리 시대의 위대한 아이디어와 이슈에 참여하는 것"이었다고 말했다. 
Strategic plans have been criticized for their “fluff,” or “restatement of the obvious, combined with a generous sprinkling of buzzwords that masquerade as expertise.”2 Organizations across industries are prone to fluff, academe included. One well-known university stated that its strategic goals were to “epitomize the scholar–teacher ideal,” “provide an unsurpassed education and experience,” “demonstrate distinction in graduate and professional studies,” and “engage in the great ideas and issues of our time.”19 In other words, this university’s transformational goals were to be a university.

전통적인 전략 계획에 대한 이와 관련된 비판은 그들의 목표가 [어려운 절충difficult trade-off을 촉진하는 것]이 아니라 "달성해야 할 일의 뒤죽박죽"으로 구성된다는 것이다. 종종 전략이나 목표로 잘못 분류되는, 해야 할 일의 긴 목록은 전략이 아니다. 그저 해야 할 일의 목록일 뿐이라고 말했다.2

A related criticism of traditional strategic plans is that their goals do not facilitate difficult trade-offs but, rather, constitute “a scrambled mess of things to accomplish. . . . A long list of things to do, often mislabeled as strategies or objectives, is not a strategy. It is just a list of things to do.”2

따라서, [해야 할 일의 목록들]이, 소위 전략 계획이라 불리며, 선반 위에 먼지만 쌓여 간다는 비판을 받아왔다.20 역동적이고 민첩하며 짧은 범위의 계획 방식을 사용하는 조직들조차 때때로 전략을 수립하는 데 너무 많은 시간을 투자하고 전략을 실행하는 데 충분한 시간을 투자하지 않는다. 민츠버그는 이렇게 말했다.
Thus, the list of things to do, aka the strategic plan, has been criticized for gathering dust on a shelf.20 Even organizations that employ dynamic, nimble, and shorter-span planning approaches sometimes spend too much time coming up with a strategy and not enough time implementing one. Mintzberg proffered:

  • 대부분의 경우, [리더]는 전략을 짜서는 안 된다; 그들은 그들이 이미 가지고 있는 전략을 추구하는데 있어서 가능한 한 효과적으로 그들의 조직을 만들어 나가야 한다. ... . 조직을 특별하게 만드는 것은 세부 사항을 마스터했기 때문이다.

    Most of the time, [leaders] should not be formulating strategy at all; they should be getting on with making their organizations as effective as possible in pursuing the strategies they already have. . . . Organizations become distinguished because they master the details.17

민츠버그는 효과가 없는 전략을 고수하는 것에 대해 논쟁하지 않았다. 오히려, 조직은 [환경적 상황이 전략의 유효함을 보여주는 시기에 이미 가지고 있는 전략을 완전히 구현하는 것]이 중요하다.

Mintzberg was not arguing for sticking with a strategy that is not working. Rather, an organization should fully implement the strategy it already has when the environmental circumstances indicate it remains valid.

문화로서의 전략
Strategy as Culture

하지만 여러분의 선반에 저장되어 있는 전략적인 계획에 대해 잠시 생각해 보겠습니다. 전략 계획은 단지 "폭풍과 분노로 가득 차 있고, 아무것도 의미하지 않는 의례화된 과정"에 그치고 있지는 않은가? "일처럼 하지만 아무것도 달성하지 못하는 것"?1

But let us dwell for a moment on those strategic plans stored on your shelf. Is strategic planning nothing more than a ritualized process, “full of storm and fury, signifying nothing”?21 Just “like work but without the satisfaction of accomplishing anything”?1

냉소가 퍼지기 전에, 전략과 조직 문화의 관계를 고려할 가치가 있다. 이러한 관계에 대한 한 가지 지배적인 견해는 "문화는 아침으로 전략을 먹는다"는 적대적이다. 이러한 관점이 매력적일 수 있지만(아마도 그것은 리더들이 전략을 조직의 성공과 연계할 필요를 면제하기 때문일 것이다) 정확하지 않다. 문화 테마 이론22와 문화 스키마 이론,23과 같은 인류학에서 나온 이론들은 [(조직의) 문서에서 반복되는 단어와 구절과 주제들]이 "미래 행동을 형상화, 안내 및 패턴화"한다고 제안한다.
Before cynicism washes over, it is worth considering the relationship between strategy and organizational culture. One predominant view of this relationship is adversarial—that “culture eats strategy for breakfast.” While this viewpoint may be appealing (perhaps because it absolves leaders from needing to link strategy to organizational success), it is not accurate. Theories from anthropology, such as cultural theme theory22 and cultural schema theory,23 suggest that the recurrent words and phrases and themes in written documents “stimulate, guide, and pattern future behaviors.”24

이러한 이론들은 전략적인 계획과 여러분의 선반에 있는 먼지투성이의 문서들이 [문서가 만들어내는produce 것]이 아니라 [문서가 표현하는express 것] 때문에 중요할 수도 있다는 것을 암시한다.25 Wiedman과 Martinez에 따르면, "사명, 목표 및 목적을 가진 서면 계획은 다시 업데이트 작업을 할 때에야 읽게 될지 모르겠지만, 위원회 회의, 비공식 대화, 직무 설명 등에서 구두로 재기술된 문화적 주제는 문화적으로 수용되는 행동의 역동적인 힘이 된다."24

These theories suggest that strategic planning, and those dusty documents on your shelf, may be important not for what they produce but for what they express.25 According to Wiedman and Martinez, “even though written plans with mission, goals, and objectives may not be read until they are updated again, the cultural themes, orally restated in committee meetings, informal conversations, job descriptions, etc., become a dynamic force of culturally accepted behavior.”24

조직의 공식 및 비공식 담화에서 어떤 주제가 반복된다면, 시간이 지남에 따라 행동을 변화시키고 문화에 영향을 미칠 수 있다. 비드먼과 마르티네스의 새로운 의과대학 전략계획 연구는 "전략적 계획이 조직문화 변화를 지시하는 데 중요한 역할을 할 수 있다."24 (p272) [전략의 언어]는 문화에 결정적인 영향을 미칠 수 있다.10 이러한 상징적인, [문화로서의 전략 효과]는 주요 이해관계자(예: 이사회, 교수, 학생, 주 의회, 기부자)에게 매우 중요하며, 이들 중 다수는 쉽게 이끌림당하지 않을 수 있다.

Repetition of themes in the formal and informal discourse of an organization can, over time, change behavior and influence the culture. Wiedman and Martinez’s study of strategic planning at a new medical school found that “strategic planning can play an important role in directing organizational culture change.”24(p272) The language of strategy may have a decisive effect on culture, as Byrne and colleagues’ case study demonstrates.10 This symbolic, strategy-as-culture effect can be critical for leading stakeholders (e.g., governing boards, faculty, students, state legislatures, donors), many of whom may not intend to be led easily.

그래서 어쩌면 우리가 모든 것을 잘못 알고 있었는지도 모른다. 어쩌면 문화는 조직의 전략 수립을 위한 시도를 파괴하는 반대 세력이 아닐 수도 있다. 아마도 전략과 문화는 같은 힘의 다른 표현일 것이다. 아마도 [전략적 계획의 힘]은 [기관의 문화를 형성하기 위해 전략에 대해 이야기하는 방식]에 있을 것입니다. 전략적 계획은 그것이 전달하는 가치, 그것이 구현하는 의식, 그리고 그것이 여러분의 조직을 새로운 방향으로 이끄는 방식에 있어 중요하다.

So maybe we have had it all wrong: Maybe culture is not an oppositional force that wreaks havoc with attempts at strategy setting in organizations. Maybe strategy and culture are different manifestations of the same force. Maybe the power of strategic planning is the way you talk about it to shape the culture of your institution. Maybe strategic planning matters for the values it conveys, the rituals it embodies, and the way it nudges your organization in new directions.

 


Acad Med. 2019 Oct;94(10):1408-1411.

 doi: 10.1097/ACM.0000000000002848.

Does Strategic Planning Matter?

Affiliations collapse

Affiliation

1W.T. Mallon is senior director, Strategy and Innovation Development, Association of American Medical Colleges, Washington, DC.

PMID: 31219813

DOI: 10.1097/ACM.0000000000002848

Abstract

In this Invited Commentary, the author examines the history, use, and effectiveness of strategic planning in higher education, academic medicine, and nonprofit settings. Strategic planning is a process by which an organization differentiates itself from its direct or emergent competition to achieve its mission. This form of planning is distinct from operational planning, in which an organization identifies the ways in which it will continuously improve. Many organizations employ a combination of strategic planning and operational planning but use the former term to describe their planning process without a clear definition or conceptual framework.The empirical literature across disciplines has not demonstrated that strategic planning leads to positive organizational outcomes. Over the modern history of academic medicine in the United States, strategic planning may have had limited impact on organizational outcomes because of favorable environmental circumstances that catalyzed growth and innovation regardless of planning efforts. In the current environment, organizational and departmental leaders need to define trade-offs between the various opportunities that they confront; allow for both planned and emergent strategy formulation; avoid platitudes and fluff; and focus on operational excellence.Theories from anthropology suggest that strategic plans may be more important for what they express than what they produce. Repetition of the themes and language of strategy in formal and informal discourse can have a decisive effect on the culture of the organization. Strategic planning, therefore, matters for its effect on organizational values, rituals, and ability to move the organization in new directions.

평가에서 독소 빼내기: 발달평가의 역할이 있는가? (Med Educ, 2016)
Taking the sting out of assessment: is there a role for progress testing?
Debra Pugh1 & Glenn Regehr2

 

 

평가의 의도하지 않은 결과
The unintended consequences of assessment

의대 교육에서 지식과 임상 기술에 대한 평가는 역량에 대한 판단에 자주 사용된다. 이러한 평가의 목표는 능력의 정확한 추정치를 얻는 것이지만, 평가의 의도하지 않은 잠재적 결과가 있다. 예를 들어, 학습(AOL)의 평가 모델에서는 성적을 배정하거나, 학습자를 능력 있는 학습자 또는 능력 없는 학습자(합격 또는 불합격자)로 분류하는 데 중점을 둔다. 이와 같이, 학습자의 관점에서 평가와 관련된 사회적 판단 또는 'sting'으로 인지되는 요소가 있다. 
In medical education, assessments of knowledge and clinical skills are frequently used to make judgements about competence. Although the goal of these assessments is to obtain an accurate estimate of ability, there are potential unintended consequences of assessment. For example, in an assessment of learning (AOL) model, the focus is on assigning grades or categorising learners into competent or not (i.e. pass or fail).1 As such, there is a perceived component of social judgement or ‘sting’ associated with assessment from the learner's perspective.

결과적으로, AOL에 초점을 둠으로써 학습자들이 반드시 배움을 촉진하지는 않으면서, 더 높은 시험 점수만을 얻는 노력 쪽으로 방향을 잡을 수 있다는 점에서 학습자들에게 긴장감을 조성한다. 따라서 시험 환경에 의해 야기되는 내재적 압력은 원치 않는 행동을 초래할 수 있으며, 이는 깊은 이해(예: 주입식 또는 암기)를 방해하는 공부 습관을 채택하는 것에서부터 노골적인 부정행위에 이르기까지 다양하다. 비록 그 차이가 미묘해 보일지 모르지만, 어떤 사람이 그 내용을 이해하는 목표보다는 시험에 합격하는 것을 목표로 공부할 때, 학습에 상당한 영향을 미칠 수 있다. 예를 들어, 연구는 [벼락치기 학습]이 [간격 학습]과 비교할 때 자료를 장기간 보존하는 데 덜 효과적이라는 것을 입증했다. 평가 형식은 또한 학습에 영향을 미칠 수 있는데, 학생들이 [저차원의 기술lower-order skills]을 평가하도록 설계된 시험에 대해 보다 피상적인 접근 방식을 사용하여 (평가 형식을 기반으로) 공부 전략을 변경하는 것으로 나타났기 때문이다.  
As a result, the focus on AOL creates a tension for learners in that they may be oriented more toward efforts that result in higher test scores without necessarily promoting learning. The inherent pressures created by a testing environment can therefore lead to unwanted behaviours, which may range from adopting study habits that hinder deep understanding (e.g. cramming or memorising by rote) to outright cheating. Although the difference may seem subtle, when one approaches studying with the goal of passing a test rather than the goal of understanding the material, there can be a significant influence on learning. For example, studies have demonstrated that cramming is less effective at leading to long-term retention of material when compared with spaced learning.2 The format of an assessment can also have an influence on learning, as students have been shown to alter their strategy for studying based on the format of an assessment, using more superficial approaches for tests thought to be designed to assess lower-order skills.3, 4

AOL 모델에서, 학습자에게 [평가]는 극복해야 하는 장애물로 취급될 가능성이 더 높다. 따라서 일정 기준(benchmark)에만 도달하면, 학습자가 취약 영역을 다시 검토하도록 하는 인센티브가 거의 없는 경우가 많습니다. 한 사람이 매우 높은 점수를 받든, 아주 약간만 받아들일 수 있는 점수를 받든 상관없이 미리 정의된 커트 점수를 성공적으로 충족시키는 한, 학습자에게 주는 메시지는 그러한 결함들이 상대적으로 미미하며 앞으로 나아갈 준비가 되어 있다는 것이다. 설령 학습자가 개선하고자 하는 동기가 있더라도, 시험 후에 제공되는 피드백은 종종 학습을 안내할 만큼 충분히 구체적이지 않다. 
In an AOL model, assessment is more likely to be treated by the learner as an obstacle that one must overcome. Thus, there is often little incentive for learners to revisit areas of weakness once the benchmark has been reached. As long as one is successful in meeting a predefined cut-score, regardless of whether one receives a very high score or only a marginally acceptable score, the message to learners is that those deficiencies are relatively insignificant and that they are ready to move on. Even if learners were motivated to improve, the feedback provided after a test is often not specific enough to guide learning.

아마도 더 우려되는 사실은 시험 중 다른 학생의 답안을 직접 복사하고 허가되지 않은 자료에 접근하는 행동을 포함하여 의대생들 사이에 [부정행위]가 널리 퍼져있다는 것이 여러 연구에서 입증되었다는 사실이다. 심지어 교육자들도 평가 과정을 회피하기 위해 부정직한 행동을 하고 싶은 유혹을 받을 수 있는데, 이는 표준화 시험의 조직적 부정행위와 관련된 혐의로 최근 미국에서 11명의 교사를 유죄판결을 받은 것에서 입증된다.10
Perhaps more concerning is the fact that several studies have demonstrated that cheating amongst medical students, including such behaviours as directly copying answers from another student and accessing unauthorised materials during a test, is widespread.5-9 Even educators may be tempted to engage in dishonest behaviour to circumvent assessment processes, as evidenced by the recent conviction of 11 teachers in the USA on charges related to systematic cheating on standardised tests.10

평가가 학습자의 역량을 보장하는 데 중요한 역할을 하는 것은 분명하지만, 이러한 [파괴적 행동]은 현재의 평가 문화가 실제로 학습이 촉진하려고 하는 바로 그 학습을 저해하고 있는지 여부를 의심하게 할 수 있다. AOL 모델과 대조적으로, 학습을 위한 평가 모델(AFL)은 [개선을 촉진하기 위해 학습자에게 피드백을 제공하는 기회로 평가를 사용]하는 것에 초점을 맞추고 있습니다. 동의어는 아니지만, AOL은 일반적으로 '총괄' 평가를 지칭하는 반면, AFL은 일반적으로 '형성' 평가를 지칭한다. 본 논문의 목적상

  • '총괄'이라는 용어는 성과를 강조하는 고부담 평가(예: 등급)를 지칭하는 반면,
  • '형성'이라는 용어는 피드백 제공을 우선시하는 저부담 평가의 맥락에서 사용될 것이다.

Although assessment clearly plays an important role in ensuring the competence of learners, these subversive behaviours may lead one to question whether or not the current assessment culture is actually undermining the very learning that it is purportedly trying to promote. By contrast with the AOL model, an assessment for learning model (AFL) focuses on using assessment as an opportunity to provide feedback to learners to promote improvement.11 Although not synonymous, AOL generally refers to ‘summative’ assessment, whereas AFL generally refers to ‘formative’ assessment. For the purposes of this paper,

  • the term summative will refer to high-stakes assessments that emphasise achievement (e.g. grades), whereas
  • the term formative will be used in the context of lower-stakes assessments that prioritise the provision of feedback.

그러나 이러한 평가 형태 사이에 상당한 중복이 있으며 둘 다 AOL 또는 AFL 모델에서 사용될 수 있다는 점에 유의해야 한다.
However, it is important to note that there is considerable overlap between these forms of assessment and both can be used in either AOL or AFL models.

AFL 모델에서는 판단보다는 성장의 기회 창출에 초점을 두는 것(즉, 최소 역량보다는 우수성을 강조하는 것)으로 이동하기 때문에, AOL 모델에서 주로 보이는 의도하지 않은 결과의 일부를 완화할 수 있는 잠재력을 가지고 있다. AFL 모델에서 평가 프로그램은 모든 개인(고성능이든 저성능이든)이 지속적인 개선을 위해 노력하는 것을 목표로 설계될 수 있다. 이런 의미에서 시험은 학습 도구가 되므로 흔히 사용되는 용어인 시험 강화 학습이 된다.
An AFL model has the potential to mitigate some of the unintended consequences associated with an AOL model because of the shift from a focus on making judgements to a focus on creating opportunities for growth (i.e. emphasising excellence rather than minimal competence). In an AFL model, a programme of assessment can be designed with the goal of challenging every individual (whether high or low performing) to strive for continuous improvement. In this sense, tests become learning tools, hence the often-used term test-enhanced learning.12

 

발달시험의 역할
The role of progress testing

평가의 초점을 AOL에서 AFL로 바꾸려면, 형성적 또는 총괄적 이유로 학습자의 강점과 약점을 완전히 파악하기 위해 많은 도구를 통합하는 [평가 프로그램]이 필요하다. AFL 모델에서 사용하기 위해 상당한 관심을 끌고 있는 것으로 보이는 한 가지 도구는 [발달시험]이다. 설계상, 발달시험의 청사진은 광범위한 컨텐츠 도메인(즉, 프로그램에 필요한 지식의 전체 영역)에 기초한다. 시험은 진행 상황을 감시하기 위해 훈련의 다른 단계에 있는 학습자에게 반복적으로 시행된다.13

  • 예를 들어, 일부 의료 프로그램은 전체 학부 커리큘럼에 기초한 필기 진도 시험을 전체 학생 단체에 정기적으로 시행한다(예: 1년에 4회).
  • 유사하게, 최소한 한 곳의 전공의 프로그램은 졸업에 필요한 훈련의 목표에 기초한 연간 임상 기술 진도 시험을 프로그램의 모든 전공의에게 제공한다.
  • 많은 연구들이 지식 및 임상 기술의 성장을 도표화하고 피드백 제공을 허용하기 위해 발달시험이 사용될 수 있다는 것을 입증했다. 

Changing the focus of assessment from AOL to AFL will require a programme of assessment that incorporates many tools in order to get a complete picture of learners’ strengths and weaknesses for both formative and summative reasons.1 One tool that appears to be garnering significant interest for use in an AFL model is the progress test. By design, the blueprints of progress tests are based on a broad content domain (i.e. the complete domain of knowledge required for a programme). The tests are administered repeatedly to learners at different stages in their training in order to monitor their progress.13 

  • For example, some medical programmes administer a written progress test based on the entire undergraduate curriculum to the entire student body at regular intervals (e.g. four times per year).14, 15
  • Similarly, at least one residency programme offers, to all residents in the programme, an annual clinical skills progress test based on the objectives of training required for graduation.16
  • A number of studies have demonstrated that progress tests can be used to chart growth of knowledge and clinical skills,14-18 and allow for the provision of feedback.19

 

발달시험은 단순히 진행률을 측정하는 것 이상의 [실질적인 이점]을 가지고 있는 것으로 보입니다. 서면 진도 시험의 사용은 국가 면허 시험의 성과 향상과 관련이 있는 반면, 발달시험으로 사용되는 객관적인 구조화된 임상 시험(OSCE)은 나중에 임상 기술의 국가단위 시험에 fail할 위험에 있는 전공의를 식별하는 데 유용한 것으로 나타났다. 
Progress tests appear to have tangible benefits beyond those of simply measuring progress. The use of written progress tests has been linked to improved performance in a national licensure examination,20 whereas objective structured clinical examinations (OSCEs) used as progress tests have been shown to be useful in identifying residents at risk of subsequently failing a high-stakes national examination of clinical skills.21

그러나 무엇보다도 [진행률 시험의 포괄성]과 [상대적으로 저부담 시험적인 특성]이 결합되어 AOL이 학습에 미치는 파괴적 영향을 완화시키는 데 도움이 될 수 있다는 점이 중요하다. 예를 들어, 평가되는 내용에 제한이 없기 때문에, 표적 학습, 암기, 벼락치기, 그리고 시험에 가르치는 것과 같은 전략은 특별히 유용하지 않을 것 같다. 이것은 더 깊은 학습 전략을 촉진하는 것으로 보인다. 또한 AOL 모델에서는 시험 보안 문제로 인해 종종 [의미 있는 피드백]이 배제되는데, 문제은행이 충분히 크다면 피드백도 제공될 수 있다. 따라서, 발달시험은 극복해야 할 장애물이 아니라 중요한 학습 기회가 될 가능성이 있다. 학습자가 이러한 방식으로 발달시험을 보도록 설득할 수 있다면, 발달시험을 사용하여 평가에서 일부 '독소'를 제거하는 데 도움이 될 수 있습니다.
Perhaps more importantly, however, the comprehensiveness of progress tests, coupled with the relatively low-stakes nature of the format, may serve to mitigate some of the subversive effects of AOL on learning. For example, because there is no functional limit on the content being assessed, strategies such as targeted studying, memorisation, cramming and teaching to the test are unlikely to be particularly useful. This appears to promote deeper learning strategies.14, 22 Additionally, meaningful feedback, which is often precluded in an AOL model due to test security issues, can be provided with limited risk as long as the item bank is sufficiently large. Thus progress tests have the potential to be important learning opportunities rather than hurdles to overcome. If learners can be persuaded to view progress tests in this way, then perhaps progress tests can be used to help take some of the ‘sting’ out of assessment.

평가가 학습을 촉진하는 방법
How assessment drives learning

'평가가 배움을 이끈다'는 격언은 아마도 많은 진실을 담고 있을 것이다. 그러나 평가를 학습 도구로 전략적으로 사용하려면 평가를 촉진하는 방법을 고려해야 한다. 학습에 대한 평가 효과는 다음의 세 단계로 나눌 수 있다. 

  • 시험 전(즉, 시험 인센티브 학습),
  • 시험 그 자체(즉, 시험이 학습으로 직접 연결됨) 및
  • 시험 후(즉, 시험이 학습으로 이어지는 후 제공되는 피드백)

The aphorism ‘assessment drives learning’ probably holds much truth. However, if one is to use assessment as a learning tool strategically, then one must consider how it promotes learning. The effects of assessment on learning can be divided into three phases:

  • pre-test (i.e. tests incentivise learning),
  • pure-test (i.e. tests directly lead to learning) and
  • post-test (i.e. the feedback provided after a test leads to learning).23 

시험 전 학습
Pre-test learning

학습에 대한 [시험 전 효과]는 시험의 [간접 효과]라고도 하며, 시험 예상에 의해 제공되는 외적 동기를 의미한다. 즉, 임박한 시험으로 인한 압박감은 학습자에게 학습 동기를 부여하고 시험할 자료를 통합된 방식으로 학습하려는 시도를 할 수 있다. 이런 점에서는, 총괄시험조차도 명백한 검색 목적을 위해 자료를 학습하려는 의도적인 노력을 장려함으로써 학습에 긍정적인 영향을 미칠 수 있다. 그러나 학생들이 학습에 접근하는 방법은 피상적인 접근(예: 깊은 이해보다는 암기)을 촉진하는 경우 시험에 의해 부정적으로 영향을 받을 수 있다. 예를 들어, 발달시험의 자주 언급되는 이점 중 하나는 주입식 공부보다 지속적인 공부를 장려한다는 것이다. 간격 학습과 대량 실습을 비교한 180편 이상의 논문에 대한 검토가 간격 학습이 대량 실전보다 우수하다는 견해를 뒷받침했기 때문에 이 방법이 유용할 수 있다.24

The pre-test effects on learning, also termed the indirect effects of testing, refer to the extrinsic motivation provided by the anticipation of being tested. In other words, the imminent pressure caused by an impending test may provide learners with an incentive to study and attempt to learn the material to be tested in a consolidated way. In this sense, even summative testing may have a positive influence on learning by encouraging intentional efforts to learn material for the explicit purposes of retrieval. However, the way in which students approach learning may be negatively affected by a test if it promotes a superficial approach (e.g. memorising by rote rather than deeper understanding). For example, one of the often-cited benefits of progress testing is that it encourages continuous studying over cramming. This may be valuable because a review of over 180 papers comparing spaced versus massed practice supported the view that spaced learning is superior to massed practice.24

종합 평가의 사전 시험 효과를 위한 유용한 이론적 모델이 Cilliers 등에 의해 개발되었다. 이 모델은 [평가 전 학습 활동]에 영향을 미치는 [영향의 두 가지 잠재적 원천]이 있다고 가정한다.

  • 과제 요구(예: 강의의 과제 유형 및 단서)와
  • 시스템 설계(예: 평가의 임박성 및 일반적인 작업 부하)

이는 뒤이어 다음에 영향을 미친다.

  • 인지 처리
  • 메타인지 조절 활동(예: 인지된 대리인 및 대인관계 요인)

A useful theoretical model for the pre-test effects of summative assessment was developed by Cilliers et al.25 This model postulates that there are two potential sources of impact that influence pre-assessment learning activities:

  • task demands (e.g. task type and cues from lecturers) and
  • system design (e.g. imminence of assessment and prevailing workload).

These in turn influence

  • cognitive processing and
  • metacognitive regulation activities (e.g. perceived agency and interpersonal factors).

예를 들어, 시험이 임박했고 학생들이 시험이 매우 위험한 사건으로 인식한다면, 그들의 목표는 그들이 평소에 선호했던 학습 접근법이 아니더라도, 공부할 때 벼락치기나 암기와 같은 낮은 수준의 인지 전략을 채택할 수 있다. 시험 형식이 연구 행동에 어떤 영향을 미치는지에 대한 연구가 이를 뒷받침하는 것으로 보인다. 예를 들어, 학생들은 선택-응답 대 구성-응답 형식 및 파트-과제 대 전체-과제 OSCE를 사용하여 평가될 것을 알 때 학습에 대해 더 피상적인 접근법을 사용하는 것으로 나타났다.

For example, if an examination is imminent and students perceive it to be a high-stakes event, they may adopt lower-order cognitive strategies when studying, such as cramming or memorising by rote, even if that is not their usual preferred approach to learning, because their goal is to maximise their chances of success. Studies about how the test format influences study behaviour would seem to support this. For example, students have been shown to use more superficial approaches to learning when they know they will be assessed using selected-response versus constructed-response formats3 and part-task versus whole-task OSCEs.4

이 프레임워크는 종합 평가를 위해 개발되었지만, 이론적으로 발달시험의 경우에도 유사한 종류의 영향 원인(예: 과제 유형, 평가 기준 등)이 학습 접근법에 영향을 미칠 것이라고 추측할 수 있다.

  • 이러한 추측을 뒷받침하기 위해, McMaster의 학생들의 학습 스타일을 학습 스타일(암기 대 개념 학습)을 평가하려는 [Mitchell의 인지 행동 검사]를 사용하여 연구한 결과, 발달시험이 도입되었을 때 암기보다는 더 깊은 학습 전략을 계속 사용한 것으로 밝혀졌다.
  • 마찬가지로, 림버그 대학의 진행률 시험 성과 연구는 의미 중심의 연구 접근법의 사용이 진행률 시험 점수와 긍정적인 상관관계가 있는 반면, 암기력이나 얕은 처리를 사용하는 것은 점수와 부정적인 상관관계가 있다는 것을 보여주었다.

Although this framework was developed for summative assessment, one could speculate that, for progress testing, similar sources of impact (e.g. task type, assessment criteria, etc.) would theoretically influence approaches to learning.

  • In support of this speculation, when McMaster's students’ learning styles were studied using Mitchell's cognitive Behavior Survey, which attempts to assess learning style (memorisation versus concept learning), it was found that they continued to use deeper learning strategies rather than memorisation when progress tests were introduced.1426 
  • Similarly, a study of performance on progress tests at Limburg University demonstrated that the use of a meaning-oriented study approach was positively correlated with progress test scores, whereas the use of memorisation or shallow processing was negatively correlated with scores.22

물론, 발달시험은 [시험 전 학습의 'consolidation' 효과]를 훼손할 위험이 있는 것도 사실이다. Van Berkel 등이 다른 시험 형식과 관련된 연구 행동을 비교했을 때, 학생들은 블록 시험을  공부의 동기로 보았다. 하지만 발달시험은 (기출문제를 보는 것을 빼면 학습의 유인이) 아니었다. 

  • 어쩌면 어떻게 전체 교과과정의 시험을 위해 공부하는 것에 접근할지 아는 것이 너무 어렵기 때문일지도 모른다.
  • 또는 어쩌면 진행 테스트가 학습자들에 의해 중요하게 인식되지 않기 때문일 지도 모른다.

Of course, there is a risk that progress testing could actually undermine the value of the ‘consolidating’ effects of pre-assessment learning. When van Berkel et al.22 compared study behaviours in relation to different test formats, students viewed block tests, but not progress tests, as an incentive to study (other than reviewing old tests),

  • perhaps because it is so difficult to know how one would approach studying for a test of the entire curriculum, 
  • or perhaps because progress tests are not perceived to be important by learners.

또한 시간 경과에 따라 [간격을 둔 시험spaced testing]이 지속적인 학습을 장려할 수 있다는 일부 증거가 있지만, 학습에 대한 이러한 접근법이 항상 시험 점수를 향상시키지는 않을 수 있다. 학생들을 [정기적으로 평가된 그룹(10주 과정 중 세 번)] 또는 [수업이 끝날 때만 평가된 그룹]에 무작위로 배정한 연구에서, [더 자주 평가를 받은 학생들]은 학습 간격을 두고 전체 학습 시간에 69시간을 더 할애했지만, 최종 평가에서 대조군 학생들보다 더 잘하지는 못했다. 사실, 과정 종료 평가 그룹의 학생들은 마지막 주에 훨씬 더 많은 시간을 공부하는 데 쓴다고 보고했는데, 이것은 주입식 학습보다 간격 배움이 더 낫다는 오랜 믿음에 도전할 수 있다. 그러나 간격 학습 접근법의 입증된 이점은 없었지만, 연구는 단기 효과만 조사했기 때문에 간격 학습 그룹에서 장기 보존이 더 나을지는 명확하지 않다.

Moreover, although there is some evidence to suggest that spacing tests over time may encourage continuous study, this approach to learning may not always result in better test scores. In a study in which students were randomised to either a group that was assessed regularly (three times during a 10-week course) or a group that was assessed only at the end of the course, students who underwent more frequent assessments spaced their learning and devoted 69 hours more to overall study time than their peers, but they did no better on a final assessment.27 In fact, students in the end-of-course assessment group reported spending significantly more time studying in the final week, which may challenge the long-held belief that spaced learning is preferable to cramming. However, although there was no demonstrated benefit of a spaced-learning approach, the study only examined the short-term effects, so it is not clear if long-term retention would have been better in the spaced-learning group.

순수 시험 학습
Pure-test learning

다가오는 시험을 예상하고 준비하는 효과 외에도, [시험 행위 자체]가 학습으로 이어질 수 있는데, 이를 [시험 효과]라고 한다. 몇몇 연구들은 시험이 학습의 간접적인 효과 이상으로 직접적으로 학습에 영향을 미치는데 사용될 수 있다는 것을 증명했다. 이것은 부분적으로, [정보를 검색하는 행위]가 [반복적인 공부만 하는 것]과 비교했을 때 학습의 개선을 이끈다는 것을 암시하는 [인출 가설retrieval hypothesis]에 의해 설명될 수 있다. [인출 행위]는 정보를 [향후 인출을 위해 정보를 더 쉽게 접근할 수 있도록 인코딩]하는 데 도움이 되는 듯 하다. 이 현상을 이해하는 데 도움이 되는 유용한 비유는 도서관에 있는 책을 고려하는 것이다. 도서관은 나중에 회수하는 것을 돕기 위해 책을 보관하는 분류 시스템을 채택한다. 만약, 이 시스템을 사용하는 대신에, 책들이 나중에 어떻게 회수될지에 대한 고려 없이 단순히 책꽂이에 놓여진다면, 필요할 때 그것들을 찾는 것이 훨씬 더 어려울 것이다. 마찬가지로, [정보 인출]을 연습할 때, 그것은 뇌가 나중에 액세스하기 위해 [태깅]이나 [인코딩]을 위한 시스템을 만드는 데 도움이 된다.
In addition to the effects of anticipating an upcoming test, the act of testing itself can lead to learning, something known as the testing effect. Several studies have demonstrated that tests can be used directly to influence learning above and beyond the indirect effects of studying.28-31 This may be explained, in part, by the retrieval hypothesis, which suggests that the act of retrieving information leads to improved learning when compared with repeated study alone. It would seem that the act of retrieval helps to encode the information in a way that makes it more accessible for future retrieval.32 A useful analogy to help understand this phenomenon is to consider books in a library. Libraries employ a classification system for shelving books in order to aid later retrieval. If, instead of using this system, books were simply placed on the shelves without consideration of how they would later be retrieved, it would be far more difficult to find them when needed. Similarly, when one practices retrieving information, it helps the brain to create a system for tagging or encoding it for future access.

[시험 효과]는 즉각적인 검색뿐만 아니라 학습된 자료를 최소 몇 달 동안 보존하는 것을 향상시키는 것으로 보입니다. 특히 흥미로운 것은, 시험 효과가 [사실의 보존을 향상]시킬 뿐만 아니라, [지식의 응용을 향상]시킨다는 것인데, 이는 [반복적인 인출]이 더 나은 이해로 이어질 수 있다는 증거를 제공하는 것으로 보인다는 것이다. 
The testing effect appears to not only enhance immediate retrieval, but also the retention of learned material for at least several months.33, 34 What is particularly interesting is that the testing effect seems to lead not only to better retention of facts, but also to improved application of knowledge, providing evidence that repeated retrieval may also lead to better understanding.31, 35, 36

[시험 효과]를 변조modulate하는 것처럼 보이는 중요한 요인들이 있다. 예를 들어 동일한 자료의 반복 시험을 위한 더 많은 기회를 제공하는 것은 학습을 더욱 강화하는 것으로 나타났다. 또한 지식의 인출이 어려울 때 시험 효과가 향상되는 것으로 보인다.  예를 들어, [단순한 정보의 인식]보다는 회상을 필요로하는 [응답 구성constructed-response 형식]을 사용하는 것이다. 이는 부분적으로 [바람직한 어려움 이론]에 의해 설명될 수 있는데, 이는 도전적인 과제가 단순화된 과제보다 더 큰 학습으로 귀결된다는 것을 암시한다.
There are important factors that seem to modulate the testing effect. For example, providing more opportunities for repeated testing of the same material has been shown to further enhance learning.37 The testing effect also seems to be enhanced when the retrieval of knowledge is effortful; for example, by using constructed-response formats that require recall rather than simple recognition of information.38, 39 This may be explained, in part, by the theory of desirable difficulties,32 which suggests that challenging tasks result in greater learning than simplistic tasks.

발달시험은 시험 효과를 촉진하는 데 이상적으로 적합해 보인다.

  • 발달 시험 청사진은 전체 교육과정에 기초하고 반복적으로 관리되기 때문에 학습자를 더 자주 콘텐츠에 노출시켜 [인출을 더 자주 유도함]으로써 시험 효과를 높일 수 있다.
  • 발달 시험은 전형적으로 [선택-응답selected response 형식(즉, 객관식 질문)]을 채택하지만, OSCE와 같이 보다 [어려운 인출을 요구하는 다른 형식도 실현 가능한 것]으로 나타났다. 강화된 인코딩을 통해 테스트 효과를 강화하기 위해 구성된 응답 형식 또는 OSCE 형식의 사용을 증가시키는 사례가 있을 수 있다.
  • [구성-응답constructed-response 형식]은 채점에 더 많은 노력을 필요로 하는 경향이 있지만, 학습의 이점은 할당된 자원의 증가를 정당화할 수 있다.

Progress tests would seem ideally suited for promoting the testing effect.

  • Because progress test blueprints are based on an entire curriculum and are administered repeatedly, they expose learners to more content more often, which should enhance the testing effect by prompting retrieval more frequently.
  • Although progress tests typically employ a selected-response format (i.e. multiple-choice questions), other formats that require more effortful retrieval, including OSCEs, have been shown to be feasible.40 There may be a case for increasing the use of constructed-response or OSCE formats to potentiate the testing effect through enhanced encoding.
  • Although constructed-response formats tend to require more effort to mark, the benefits to learning may justify an increase in allotted resources.

 

테스트 후 학습
Post-test learning

평가가 학습에 영향을 미칠 수 있는 마지막 단계는 피드백이 제공되는 [시험 후]이다. 유의미한 피드백은 메타인지에 영향을 미칠 수 있는 잠재력 때문에 AFL 모델에서 매우 중요하다. 피드백은 강점과 약점이 있는 영역을 강조하는데 도움이 될 수 있으며, 이는 학습자가 학습을 지시하는 데 사용될 수 있습니다. 물론, 의미가 있으려면 피드백이 바른sound 데이터에 기초해야 합니다. 그러한 데이터가 시험 점수의 형태인 경우 시험 자체는 수용가능한 심리측정적 특성(예: 신뢰할 수 있는 점수)을 가져야 한다. 또한 피드백이 상대적인 강점과 약점 영역을 식별하는 형태인 경우, 특정 영역에 초점을 맞추기 위한 권고사항이 의미 있는 '신호'에 기초할 수 있도록 각 영역은 신뢰성을 보장할 수 있는 충분한 표본을 확보해야 한다.

The final phase in which assessment can influence learning is after the test, when feedback is provided. Meaningful feedback is crucial in an AFL model because of its potential to influence metacognition. Feedback can help to highlight areas of strength and weakness, which may, in turn, be used by learners to direct their learning. Of course, in order to be meaningful the feedback must be based on sound data. If those data are in the form of test scores, then the test itself should have acceptable psychometric properties (e.g. scores that are reliable). Further, if the feedback is in the form of identifying areas of relative strength and weakness, then each area should have sufficient sampling to ensure reliability so that recommendations to focus on specific areas are based on a meaningful ‘signal’.

이와 관련하여 발달시험은 신뢰할 수 있는 자료와 학습자에게 풍부한 피드백을 제공하는 자료로 활용될 수 있는 좋은 위치에 있다. 발달시험 후에 학생들에게 제공되는 결과는 종종 [개인의 발달상황에 대한 정보], [강점과 약점의 영역에 대한 요약], 그리고 [다른 학생과의 상대적 비교]를 포함한다. 발달시험은 상대적으로 저부담시험이기 때문에, 학습자들은 학습을 더 안내하기 위해 [발달시험의 사본]을 제공받을 수도 있다. 또한 진도 시험은 학습을 촉진하는 중요한 피드백의 원천으로 사용될 수 있는 국가단위 고부담시험의 저조한 성과를 예측하는 데 유용한 것으로 보인다.
Again, in this regard, progress tests are well positioned to be used as a source of both reliable data and rich feedback for learners. The results provided to students following progress tests are often accompanied by information about individual progress, summaries of areas of strengths and weaknesses,19 and normative comparisons.41 Because of their relatively low-stakes nature, learners can even be provided with copies of their progress tests to further guide their learning.15 Of interest, progress tests also appear to be useful in predicting poor performance in national high-stakes examinations,21, 26 which can be used as an important source of feedback to promote learning.

그러나 피드백을 주는 것은 간단하지 않습니다. 예를 들어, 제공된 피드백의 유형이 중요합니다. 점수나 데이터 제공에 초점을 맞춘 피드백만으로는 학습을 촉진하기에 충분하지 않은 것으로 나타났다. 사실, 성적grade를 제공하는 것은, 그것이 내러티브 코멘트를 동반하더라도, 실제로 학습을 저해할 수 있습니다. 초등학생들에게만 성적, 서술적 논평만 제공하거나 또는 둘 다 제공했던 연구에서, 서술적 평가를 받은 학생들만 유사한 과제에 대해 재시험했을 때 후속적으로 개선되는 것을 보여주었다. 게다가, 피드백이 더 상세할수록, 학생들이 더 많이 배우는 것으로 보인다. 의과대학 예비학생들이 생물의학 지식을 평가하는 자가-온라인 객관식 테스트에 참여했을 때, 정답과 부정확한 옵션에 대한 자세한 설명을 받은 학생들이 정답에 대한 정보만 받은 학생들보다 더 우수한 것으로 나타났다. 어떤 경우에는 시험 보안 문제로 인해서 상세한 피드백을 주기 어려울 수 있지만, 종합 OSCE를 포함하여 학습자에게 더 많은 피드백을 제공하기 위한 최근 혁신적인 노력이 있었다. 

Giving feedback, however, is not a straightforwardly simple process. For example, the type of feedback provided is important. Feedback focused on providing scores or data alone has not been shown to be sufficient to promote learning. In fact, providing grades, even when accompanied by narrative comments, may actually undermine learning. In a study in which grade-school children were provided with either grades alone, narrative comments alone, or both combined, only students who had received narrative comments alone showed a subsequent improvement when retested on similar tasks.42 Further, it appears that the more detailed the feedback, the more likely students are to learn. When pre-medical students participated in a self-administered online multiple-choice test assessing biomedical knowledge, those who received detailed explanations about the correct and incorrect options outperformed those who only received information about the correct answer.43 Although test security issues may preclude detailed feedback in some cases, there have been recent innovative efforts to provide increased feedback to learners, including in summative OSCEs.44

발달시험을 피드백을 제공하는 용도로 쓰는 것이 더 어려운 이유 중 하나는, 학습자들은 [피드백에 현저하게 면역]이 될 수 있기 때문이다. 피드백을 수용하는 중요한 요소는 피드백을 제공하는 소스의 인식된 신뢰도인 것으로 보인다. Telio 등은 이 결과를 설명하기 위한 [교육적 동맹 프레임워크]를 제안했는데, 이 프레임워크에서는 피드백 제공자-수신자 관계와 심리치료사-환자의 관계 사이에 유사점을 도출했다. 이 모델에서, 학습자가 피드백을 받아들이고 내면화하기 위해서는 [피드백을 제공하는 사람과의 인식된 동맹관계]가 있어야 합니다. 이 동맹은 학습자들이 그들의 잠재력을 성취하는 데 필요한 지도와 비판을 받아들이기에 충분히 취약하도록 그들 자신을 도울 수 있다. 하지만, 피드백은 학습에 해로운 영향을 미칠 수 있는 감정적인 영향을 미칠 수 있습니다. 직무에 초점을 맞춘 피드백은 학습에 가장 강력한 영향을 미치는 것으로 보이는 반면, (즉, 칭찬과 처벌의 형태로) 자아를 자극하는invokes the self 피드백은 덜 성공적인 것으로 보인다.49 아마도 자아를 자극하는invokes the self 피드백은 교육적 연대를 위협할 수 있는 사회적 판단을 수반하기 때문일 것이다. 학습자 및 교사, 평가의 형성적 의도를 훼손할 수 있습니다.
As an additional complication of the use of progress tests to provide feedback, it has been suggested that learners can be remarkably immune to feedback.45, 46 An important factor in accepting feedback appears to be the perceived credibility of the source providing feedback.47 Telio et al.48 proposed an educational alliance framework to explain this finding, in which they draw parallels between the feedback provider‒receiver relationship and that of a psychotherapist and patient. In this model, in order for feedback to be accepted and internalised by the learner, there needs to be a perceived alliance with the person providing the feedback. This alliance can help learners to allow themselves to be vulnerable enough to accept the guidance and criticism that is needed to help them achieve their potential. However, feedback can have an emotional impact, which can have detrimental effects on learning. Feedback that is focused on the task appears to have the most powerful influence on learning, whereas feedback that invokes the self (i.e. in the form of praise and punishment) appears to be less successful.49 Perhaps this is because feedback that invokes the self carries with it social judgements that may threaten the educational alliance between learner and teacher, and may undermine the formative intentions of the assessment.

요약
Summary

발달시험의 많은 특징은 바람직한 학습을 강화하는 특성과 잘 일치하는 것으로 보인다.

  • 시험범위는 광범위하기에 주입식 학습을 덜 실현 가능하며, 단순히 좋은 점수를 얻는 것을 목표로 시험에 접근할 때 발생하는 것과 비교한다면, 발달시험이 간접적으로 더 지속적이고 위치적인 학습을 장려할 수 있다.
  • 학습자에게 동일한 자료를 반복적으로 테스트하면 정보 인출을 연습할 수 있습니다.
  • 마지막으로, 발달시험을 통해 수행능력에 대한 자세한 피드백을 제공할 수 있습니다.

Many of the features of progress tests appear to align well with the properties that enhance desirable learning.

  • Broad coverage of material makes cramming less feasible and may indirectly encourage more continuous and situated learning when compared with what occurs when one approaches a test with the goal of simply getting a good grade.
  • Repeatedly testing learners on the same material provides them with opportunities to practise retrieving information.
  • Finally, progress tests allow for the provision of detailed feedback on performance.

그러나 발달시험의 의도하지 않은 잠재적 결과도 고려해야 한다. 만약 학습자들이 그것을 하찮거나 준비하기에 너무 벅찬 것으로 인식한다면, 발달시험은 공부에 dis-incentive적인 것으로 판명될 수 있다. 피드백 제공은 가능하지만, 그러한 피드백이 추가 학습에 의미 있게 통합되도록 보장하는 데는 잘 알려진 복잡성이 있으므로 그러한 피드백의 전달이 정의에 의해 평가되고 통합되는 것을 당연하게 여겨서는 안 된다.

However, one must also consider the potential unintended consequences of introducing progress testing. It is possible that a progress test may prove to be a dis-incentive to studying if learners perceive it as unimportant or too overwhelming to prepare for. Although provision of feedback is possible, there are well-known complexities in ensuring that such feedback is incorporated meaningfully into further learning, so it shouldn't be taken for granted that the delivery of such feedback is by definition valued and incorporated.

문제를 해결하기 위한 유일한 가능한 접근법이 진도 테스트라는 것은 아니다. 우리의 요점은, 오히려, 신중하게 구현될 경우, 발달시험이 AFL 모델에 특히 적합하다는 것이다.
This is not to say that progress tests are the only possible approach to addressing these issues. Our point, rather, is that progress testing, if implemented carefully, is particularly well suited to a model of AFL.

평가를 사용하여 학습을 최적화하는 방법
How to use assessment to optimise learning

비록 문헌들이 AOL과 AFL 사이에 분명한 차이를 이끌어냈지만, 정의가 암시하는 것보다, 사실 두 가지 사이에는 기능적인 중복이 더 많을 수 있다. 즉, 모든 평가는 학생의 현재 학습 상태를 어느 정도 평가하는 데 사용되며, 모든 평가는 추가 학습을 알리고 지원할 수 있는 잠재력을 가지고 있다. 중요한 것은 [교육자의 관점에서 본 시험의 목적]과 [학습자가 시험 목적을 해석하는 방법] 사이에 불일치가 있을 수 있으므로, 학습자 행동에 미치는 영향의 관점에서 AOL과 AFL의 구별은 보는 사람의 눈에 달려 있을 수 있다. 이런 점에서 AOL이 될 것인지, AFL이 될 것인지를 결정하는 것은 [시험 자체의 속성]이 아니라, [교육자와 학습자가 시험의 목적에 대해 추론하는 것]이다. 따라서 이분법은 다소 인위적이며, 주어진 평가 상황에서 AOL과 AFL을 학습자의 마음에 상대적으로 더 배경이나 배경에서 고려하는 것이 더 유용할 수 있다.
Although the literature has drawn clear distinctions between AOL and AFL, it may be that there is more functional overlap between them than implied by the definitions. That is, it is likely that all assessment is used to assess a student's current state of learning to some degree, and all assessment has the potential to inform and support further learning. Importantly, there may also be discordance between the purported purpose of the test from the educator's perspective and how the learners interpret the test's purpose, so from the perspective of its influence on learner behaviour, the distinction between AOL and AFL may be in the eye of the beholder. In this sense, it is not a property of the test itself that determines whether it will be AOL or AFL, but rather the inferences that educators and learners make about the purpose of the test. The dichotomy, therefore, is somewhat artificial and for any given assessment situation it may be more useful to consider AOL and AFL as being relatively more in the foreground or background in the mind of the learner.

따라서 평가에 대한 서로 다른 접근법이 다른 방법보다 더 많은 학습 기회를 촉진할 수 있으며, 따라서 학습에 대한 긍정적인 영향을 극대화하도록 발달시험이 설계될 수 있다는 것에는 의심의 여지가 없다. 위에서 논의한 바와 같이, 진도 시험 설계 시 학습 촉진에 효과적일 수 있는 전략에는 다음이 있다.

  • 구성된 응답 형식 사용,
  • 빈번한 저부담 시험 기회 제공,
  • 간격을 둔 시험
  • 상세한 피드백 제공 

Thus, there is no question that different approaches to assessment may promote opportunities for learning more than others and, as such, progress tests can be designed to maximise their positive influence on learning. As discussed above, strategies that are likely to be effective in promoting learning when designing progress tests include:

  • using constructed-response formats,
  • offering frequent low-stakes testing opportunities,
  • spacing tests and
  • providing detailed feedback.

그러나 AFL을 이용하는 것에는 [자신이 평가되고 있다는 것을 아는 것]의 심리적 결과와 같은 [개념적인 장벽]이 있다는 것을 인식하는 것이 중요하다. 평가가 학습용(예: 형성평가)으로 분류되는 경우에도 학습자는 평가를 학습 기회라기 보다는 성공하기 위해 극복해야 하는 장애물로 볼 수 있다. 50 [모든 평가]는 학습자에게 [자신이 평가의 대상이 되는 고부담 사건]으로 인식될 수 있다. 따라서,

  • AOL을 전경foreground에 두는 것은, AFL 모델의 의도를 훼손할 수 있습니다.
  • AOL을 배경background으로 옮기기 위해서는, 평가의 사회적 의미가 바뀌어야 한다.

However, it is important to recognise that there are conceptual barriers to the use of AFL, such as the psychological consequences of knowing that one is being assessed. Even when assessments are labelled as being for learning (e.g. formative assessment), learners may view them as hurdles that they must overcome in order to succeed, rather than as learning opportunities.50 To the learner, any assessment may be perceived as a high-stakes event where they are being judged. As such,

  • the foreground of AOL may undermine the intentions of an AFL model.
  • In order to move AOL to the background, the social meaning of assessment must be changed.

다시 말해서, 학습자들은 발달시험을 [잠재적으로 징벌적인 결과를 초래할 수 있는 중대한 사건]보다는 [개선의 기회]로 보도록 배울 필요가 있다. 우리는 학생들의 마음속에 [AFL을 전경화하려는 우리의 노력]을 저해하지 않도록 하기 위한 평가 과정의 조건을 만들어야 한다.

In other words, learners need to be taught to view progress tests as opportunities to improve rather than as high-stakes events with potentially punitive consequences. We must create conditions of the assessment process that will ensure that we do not undermine our own efforts to foreground AFL in the minds of our students.

이를 위한 한 가지 방법은, 학습자로 하여금 [수행에 대한 정기적인 피드백을 기대하도록 기대치를 관리하는 것]입니다. 그러나 다시 한 번, 우리가 제공하는 피드백은 학습 기회로서 인식된 가치에 중요한 영향을 미칠 것이다. 따라서 서술적 피드백을 제공하기 위해 (적어도 일정 기간 동안) 발달시험에 대한 등급을 보류하는 것을 고려할 수 있다. 이 접근방식은 특히 잘한 직무에 대해 좋은 등급으로 보상받는 것에 익숙해진 의료 훈련생에게 암묵적으로 종합적인 평가의 성격을 최소화하는 데 도움이 될 수 있다. 대신에 학습자는 진도 테스트의 결과를 [강점과 약점의 잠재적 영역을 탐색]하고, [학습 목표를 달성할 수 있는 기회]로 보도록 권장받을 수 있습니다. 물론, 학습자는 평가 전략에 다르게 반응할 수 있다. [성과 지향적인 학습자]는 총괄평가나 벤치마크를 선호할 수 있는 반면, [숙달 지향적인 학습자]는 학습과 피드백 및 자기 반성을 연계하기 때문에 형성 평가에 더 관심이 있을 수 있다. 그러나, 교육자들이 그들 자신을 증명하기 보다는 학습자의 오리엔테이션을 개선하도록 촉진하는 조건을 설정할 수 있다면, 학습자들은 발달시험에 의해 제공되는 학습 기회를 더 잘 받아들일 수 있을 것이다.

One way to accomplish this is to manage learners’ expectations so that they come to expect regular feedback on their performance. However, again, the feedback that we provide will have an important influence on its perceived value as a learning opportunity. Thus we may consider withholding grades for progress tests (at least for a period of time) in favour of providing narrative feedback. This approach could help to minimise the implicitly summative nature of assessment, especially for medical trainees who have grown accustomed to being rewarded with good grades for a job well done. Learners could instead be encouraged to view their results from the progress tests as opportunities to explore potential areas of strengths and weaknesses and generate learning goals. Of course, learners may respond differently to assessment strategies – those who are performance-oriented may prefer summative assessments or benchmarks whereas those who are mastery-oriented may be more interested in formative assessments because they link learning with feedback and self-reflection.51 However, if educators can set conditions that promote learners’ orientation toward improving rather than proving themselves, then learners may be more likely to embrace the learning opportunities provided by progress tests.

또한 실질적인 문제가 AFL 모델 통합에 장벽으로 작용할 수 있다. 즉, 교육자가 [상당한 시간 제약]에 직면할 경우 (확인된 학습 기회를 다루기 위한) 의미 있는 교정조치 또는 추가 학습 기회를 제공하기 어려울 수 있다.

  • AOL 모델에서 자원은 심각한 어려움에 처한 것으로 확인된 학습자(예: 상대적으로 고부담 시험을 통과하지 못한 학습자)를 위해 예비되는 경향이 있는 반면,
  • AFL 모델에서 [모든 학습자가 개선 방법에 대한 지침을 받을 것]으로 예상된다.

Practical issues may also act as barriers to the incorporation of an AFL model. Namely, educators facing significant time restraints may find it difficult to offer meaningful remediation or additional learning opportunities to address identified opportunities for learning.

  • In an AOL model, resources tend to be reserved for learners who are identified as being in grave difficulty (e.g. those who have failed relatively high-stakes examinations), whereas
  • in an AFL model, all learners are expected to receive guidance on how to improve.

이러한 추가적인 노력은 이미 과로한 의사와 교육자에게 스트레스를 줄 수 있습니다. 학습자가 자신의 학습을 가이드하는 데 필요한 도구를 제공하는 데 집중하는 것은 이러한 압박의 일부를 상쇄하는 데 도움이 될 수 있지만, (발달시험이 제공하는 피드백에 대한 긍정적인 학습 반응을 가장 잘 얻으려면) 교육자로서 이 과정을 가이드할 책임을 무시할 수 없다.
This added effort may stress over-worked physicians and educators. Focusing efforts on providing learners with the tools necessary to direct their own learning may help to offset some of this pressure, but we cannot ignore our responsibility as educators to guide this process if we are to most effectively support a positive learning response to the feedback that the progress test offers.

마지막으로, [학습자에 대한 (최종적) 결정]을 내리기 위해 [발달시험]을 [다른 형성적 평가와 함께 사용할지 여부와 그 방법에 대한 문제]는 매우 현실적인 문제이다. 이러한 평가의 주된 목적이 형성적일 수 있지만, 학습자에 대해 얻을 수 있는 풍부한 정보가 있을 수 있습니다. 모든 평가가 학습만을 '위한' 것일 수는 없다. 학습자의 진행 상황이나 프로그램 진행 상황에 대해 간단히 판단할 필요가 있는 경우도 있습니다. 그러나 이러한 방식으로 평가 데이터를 사용하면 학습자가 학습에서 장애물을 극복하려는 시도로 초점을 전환할 수 있기 때문에 AFL 모델을 구현하려는 시도가 저해될 수 있습니다. 교육자들의 좋은 의도에도 불구하고, AFL은 학습자의 관점을 실제로 고려하지 않을 수 있다. 모든 유형의 평가에는 묵시적 판단 또는 '독소'가 내재되어 있기에, 학습자가 어떤 평가를 저부담의 형성적 평가로 볼 것이라고 가정하는 것은 주제넘을presumptuous 수 있다. 대신, 학습자가 평가를 사용하여 학습을 안내하고 이러한 통찰력을 사용하여 평가 프로그램을 적절하게 수정하는 방법을 조사하는 것이 유용할 수 있습니다. 
Finally, the issue of if and how to use progress tests and other formative assessments to make decisions about learners is a very practical concern. Although the primary purpose of these assessments may be formative, there is likely to be rich information that can be gained about learners.52 Not all assessment can be exclusively for learning, as it is sometimes necessary to make summary judgements regarding learners’ progress or continuation in a programme. However, using assessment data in this way may undermine attempts to implement an AFL model, as learners may shift their focus from learning to simply trying to overcome a hurdle. Despite educators’ good intentions, it is possible that AFL does not really consider the perspective of the learner. It may be presumptuous to assume that learners will ever be willing to view assessment as a low-stakes, formative experience because of the implied judgements, or ‘sting’, inherent in all types of assessment. Instead, it may be useful to probe learners about how they use assessment to guide their learning and use these insights to modify programmes of assessment accordingly.50

결론 Conclusions

점점 더 많은 교육자들이 역량 기반 의학 교육(CBME)을 수용함에 따라, AFL 모델은 계속해서 탄력을 받을 것 같다.53 이것은 또한 AOL가 차지할 장소가 없다는 것을 암시하는 것은 아니다. 단, AOL을 전경(예: 고위험 평가)에 두더라도, [지속적인 학습을 촉진할 기회]를 활용할 수 있고 이용해야 한다. 이러한 일이 일어나기 위해서는 평가 경험의 고통을 덜어줄 방법을 찾아야 한다. 발달시험은 이 독소를 제거(또는 최소한 감소)하는 문제에 대한 하나의 해결책으로 제공됩니다. 발달시험은 학습자에게 주입하려는 심층적이고 의미 있으며 지속적인 학습 유형을 지원할 가능성을 높이는 많은 기능을 가지고 있습니다. 
As more and more educators embrace competency-based medical education (CBME), the AFL model is likely to continue to gain momentum.53 This is not to suggest that there is not also a place for AOL. However, even when AOL is foregrounded (e.g. for high-stakes assessment), the opportunity to promote continuous learning can and should be harnessed. For this to occur, it is necessary to find ways to take the sting out of the assessment experience; progress tests are offered as just one solution to the problem of removing (or at least lessening) this sting. Progress tests have many features that increase the likelihood that they will support the types of deep, meaningful and continuous learning that we are trying to instill in our learners.

그러나 우리는 발달시험이 자동으로 이 기능을 수행한다고 가정하여 이러한 노력을 저해하지 않도록 주의해야 한다.

  • 사전 테스트, 순수 테스트 및 사후 테스트 영향을 통해 학습 관행을 형성하도록 [의도적으로 테스트를 구성]해야 합니다.
  • 우리는 시험이 평가의 AFL 측면을 뒷받침하는 [사회적 구성에 의해 뒷받침]되는지 확인해야 하며,
  • 우리는 학생들이 그러한 시험의 결과가 제공하는 성찰과 학습 기회를 최대한 활용할 수 있도록 하기 위한 [자원을 마련]해야 한다.

우리가 이런 노력을 하지 않는 한, 우리는 학생들의 마음속에서 진행 테스트가 우리의 커리큘럼에서 살아남기 위해 뛰어넘어야 할 또 다른 후프로 옮겨갈 위험을 무릅쓰고 있다.

However, we must be careful that we do not undermine these efforts by assuming that progress testing will automatically fulfill this function.

  • We must structure the tests intentionally to ensure that they shape learning practices through their pre-test, pure-test and post-test influences.
  • We must ensure that the tests are supported by social constructions that foreground the AFL aspect of the assessments, and
  • we must put in place the resources to ensure that students can take full advantage of the reflection and learning opportunities that the results of such tests offer.

Unless we engage in these efforts, we run the risk that progress tests will devolve, in the minds of our students, to just another hoop they must jump through to survive our curricula.

 

 


Med Educ. 2016 Jul;50(7):721-9.

 doi: 10.1111/medu.12985.

Taking the sting out of assessment: is there a role for progress testing?

Debra Pugh 1Glenn Regehr 2

Affiliations collapse

Affiliations

1Department of Medicine, University of Ottawa, Ottawa, Ontario, Canada.

2Faculty of Medicine, Centre for Health Education Scholarship, University of British Columbia, Vancouver, British Columbia, Canada.

PMID: 27295476

DOI: 10.1111/medu.12985Abstract

Context: It has long been understood that assessment is an important driver for learning. However, recently, there has been growing recognition that this powerful driving force of assessment has the potential to undermine curricular efforts. When the focus of assessment is to categorise learners into competent or not (i.e. assessment of learning), rather than being a tool to promote continuous learning (i.e. assessment for learning), there may be unintended consequences that ultimately hinder learning. In response, there has been a movement toward constructing assessment not only as a measurement problem, but also as an instructional design problem, and exploring more programmatic models of assessment across the curriculum. Progress testing is one form of assessment that has been introduced, in part, to attempt to address these concerns. However, in order for any assessment tool to be successful in promoting learning, careful consideration must be given to its implementation.Methods: We will examine the literature on how assessment drives learning and how this might apply to progress testing. We will also explore the distinction between assessment of learning and assessment for learning, including ways in which they overlap and differ. We end by discussing how the properties of an assessment tool can be harnessed to optimise learning.

Conclusions: Progress tests are one potential solution to the problem of removing (or at least lessening) the sting associated with assessment. If implemented with careful thought and consideration, progress tests can be used to support the type of deep, meaningful and continuous learning that we are trying to instill in our learners.

Objective: The purpose of this paper is to consider the implications of implementing progress testing within practice, and how this might promote or impede learning in the three phases of assessment (pre-test, pure-test and post-test).

© 2016 John Wiley & Sons Ltd.

개인, 팀, 프로그램의 교육성과 평가를 위한 기여와 귀인의 힘(Acad Med, 2020)
The Power of Contribution and Attribution in Assessing Educational Outcomes for Individuals, Teams, and Programs
Daniel J. Schumacher, MD, MEd, Eric Dornoff, Carol Carraccio, MD, MA, Jamiu Busari, MD, PhD, MHPE, Cees van der Vleuten, PhD, Benjamin Kinnear, MD, MEd, Matthew Kelleher, MD, MEd, Dana R. Sall, MD, MEd, Eric Warm, MD, Abigail Martini, and Eric Holmboe, MD

우리는 너무 반사적으로 역설들을 분리시킴으로써, 우리가 이 습관 때문에 지불하는 대가를 놓치고 있다. 역설의 극poles은 배터리의 극과 같습니다: 그들을 서로를 잡아주고, 생명의 에너지를 생성한다. 그들을 떼어 놓으면, 전류가 흐르지 않게 됩니다.
We split paradoxes so reflexively that we do not understand the price we pay for our habit. The poles of a paradox are like the poles of a battery: hold them together, and they generate the energy of life; pull them apart, and the current stops flowing.

—파커 파머1
—Parker Palmer1

CBME의 인기에도 불구하고, 우리가 서비스하는 모집단의 요구를 충족시키는 결과에 초점을 맞춘 이 접근방식으로의 의미 있는 전환은 어려운 일이었다. 간단히 말해서, 의료연수생에 대한 평가는 일반적으로 방어 가능한 타당성과 신뢰성이 부족하고 교육 및 환자 치료 결과에 대한 정보는 기껏해야 제한적이기 때문에 졸업생들이 교육 후 임상 실무에 대비할 준비가 되어 있는지 신뢰할 수 없다. 이 문제는 교육, 훈련 및 실천 연속체에 만연해 있으며, 의학연구소(현재의 국립 의학 아카데미)와 메디케어 지급 자문 위원회는 환자의 요구를 충족시키는 데 있어 레지던트 교육의 단점을 한탄하고 있다. 
However, despite the popularity of CBME, meaningful transition to this approach, which focuses on the outcome of meeting the needs of populations that we serve, has been challenging. Stated simply, we do not reliably know if graduates are prepared for clinical practice after training because assessment of medical trainees typically lacks defensible validity and reliability, and information on education and patient care outcomes is limited at best. This problem is pervasive across the education, training, and practice continuum, and the Institute of Medicine (now the National Academy of Medicine) and the Medicare Payment Advisory Commission have bemoaned the shortcomings of residency training in meeting the needs of patients.10,11 

의료 교육 프로그램 결과 및 실습 결과에 대한 이해와 개선을 확대하려면

  • 진료 및 프로세스의 일부 측면이 개인에게 귀속될attributed to 수 있는 방법을 결정해야 하는 반면,
  • 진료 및 프로세스의 다른 측면은 결과에 기여하는 여러 개인의 결과이다. 

Greater understanding and improvement in the area of medical education program outcomes as well as practice outcomes will require 

  • determining how some aspects of care and processes can be attributed to individuals,
  • whereas other aspects of care and processes are the result of several individuals contributing to the outcome.

그러나, 오직 후자만이 최근 문헌의 개념적 논의에서 초점을 받았다.
However, only the latter has received focus in recent conceptual discussions in the literature.

학자들은 최근 의료 교육 프로그램의 효과와 결과를 의미 있게 평가하기 위한 접근법으로서 [기여 분석contribution analysis]을 지지해왔다. 특히 CBME에서처럼, [결과를 생산하기 위해 여러 요소들이 어떻게 결합되어야 하는지를 결정하는 것이 중요한] 복잡한 이니셔티브에서의 기여 분석에 초점을 맞추고 있다. '기여contribution'은 서로 다른 실체가 결과에 기여하는 정도가 얼만큼인지에 주목한다. 그러나 어떻게 결과가 생성되는지에 대한 [전체 기여 스토리]에는 [개인에 기인하는 요소]가 포함되어 있는데, 개개인마다 결과에 미치는 영향의 정도가 다르다. 예를 들어 치료를 받기 위해 응급부서로 계획되지 않은 상태로 최근에 퇴원한 환자는 간호사가 제공한 퇴원 지침을 이해하지 못했거나, 주치의로부터 퇴원 지침을 받지 못했을 수 있다. 이 예에서 [개인(예: 간호사, 전공의)에 귀속attribute되는 활동]이 [환자 결과에 기여contribute]하기 위해 결합된다.
Scholars have recently advocated for contribution analysis as an approach to meaningfully evaluate the effectiveness and outcomes of medical education programs,12,13 especially for complex initiatives for which it is important to determine how several components must come together to produce an outcome, such as those of CBME.14 Contribution focuses on the extent to which different entities contribute to an outcome. However, the full contribution story for how an outcome is produced contains components that can be attributed to individuals that have varying degrees of influence on producing that outcome. For example, a recently discharged patient with an unplanned return to the emergency department to seek care may not have understood the discharge instructions given by the nurse or may not have received any discharge guidance from the resident physician. In this example, activities that are attributable to individuals (e.g., nurse, resident) combine to contribute to the outcome for the patient.

이 예에서 알 수 있듯이, 보건의료는 팀워크의 결과이며, 이것이 기여 분석contribution analysis이 제대로 주목을 받은 이유일 가능성이 높습니다. 그러나 [개인에게 귀속attribute되는 의료의 측면]에 초점을 맞추고, 개인에게 [팀 성과와 관련된 데이터]를 제공하는 것 또한 가치가 있다.

  • 본 논문의 일부 저자의 최근 연구는 전공의-민감적 품질 측정을 작업하였다. 이러한 품질 측정은 [특정 질병에 대한 중요성]과 [팀 또는 팀의 다른 구성원이 아닌 전공의에 의해 측정되는 행동]의 가능성에 기초한다. 따라서 [전공의-민감적resident-sensitive 품질 측정]은 개인에게 귀속되는 치료 결과를 다룰 수 있는 노력의 한 예이다.

As this example illustrates, health care is the result of teamwork, which is likely why contribution analysis has rightly received attention. However, focusing on aspects of care attributed to individuals and providing these individuals with data related to their performance on the team also have value.

  • Recent work by some authors of this paper has resulted in the creation of resident-sensitive quality measures. These quality measures are based on their importance to a specific illness as well as the likelihood of the action that is measured being performed by a resident and not by another member of the team or the team collectively. Thus, resident-sensitive quality measures are an example of an effort that can address outcomes of care attributable to individuals.15,16 

이러한 조치들은 아직 연구 중이지만, 개인이 제공하는 의료의 입증된 품질에 기초하여 부분적으로 제공되는 진료를 보상하려는 (성과 기반 인센티브 지급 시스템(메디케어 및 메디케이드 서비스 센터(CMS) 프로그램)과 같은) 관리 의료 지급 모델의 현재 추세를 감안할 때 잠재적 효용성을 가지고 있다. 게다가, 개인에게 집중하는 것이 개인의 발전을 이끄는 가장 효과적인 방법일 수도 있다. 또한, [개인 수준의 피드백]이 없다면, 부정적 결과에 대한 자신의 책임은 간과하고, 긍정적 결과에 대해서만 기여를 했다고 생각하는 편견인 [근본적인 귀인 오류]의 희생양이 되기 쉽다.

While these measures are still being studied, they have potential utility given current trends in managed care payment models, such as the Merit-based Incentive Payment System, a program of the Centers for Medicare and Medicaid Services (CMS), that seek to reimburse for care provided partly on the basis of the demonstrated quality of that care provided by individuals. Furthermore, focusing on individuals may be the most effective way to drive their personal improvement.17,18 Additionally, without individual-level feedback, it is easy to fall prey to fundamental attribution error, a bias to view oneself as responsible for positive outcomes but not for undesirable ones.19 

[프로그램 및 시스템 수준의 결과]는 미래의 [프로그램 평가와 프로그램 수준 개선]에 정보를 준다는 점에서 중요하지만, 우리는 [개개인]에 대해 졸업, 인증, 자격 증명 등을 판단해야 하(거나 할 수 있으)며, 개인에 의해 제공되는 입증된 의료 품질에 기초한 관리 의료 지급 모델(예: CMS 성과 기반 인센티브 지급 시스템)을 사용해야 할 수도 있다. 이 경우에 팀 차원의 인증이나 인증과 같은 프로세스를 수행하는 것은 실용적이지 않습니다. 이러한 노력은 팀 구성원이 바뀔 때마다 하루에 여러 번 새로운 결정을 내려야 합니다. 따라서 개인의 성과를 결정determine할 수 있는 능력이 중요하다. 요약하자면, 기여Contribution에 초점을 맞추는 것도 중요하지만, 의료의 어떤 측면이 개인에게 크게 귀속되는지에Attributed to 대해서도 초점을 맞출 필요가 있습니다.
While program- and system-level outcomes are important for informing program evaluation and program-level improvements for the future, we can and should graduate, certify, and credential individuals, and we may be required to use managed care payment models—such as the CMS Merit-based Incentive Payment System—that are based on demonstrated quality of care provided by individuals. It is not practical to carry out processes such as certifying or credentialing at the team level; such efforts would require new decisions several times a day, each time a team member changed. Thus, it is important to be able to determine an individual’s performance. In summary, while a focus on contribution is important, we also need to focus on what aspects of care can be largely attributed to individuals.

만약 우리가 비문에 인용된 파커 파머의 비유를 가까운 주제에 적용한다면, 우리는 귀인attribution과 기여contribution를 전지의 두 극으로 볼 수 있다. 두 가지 모두를 고려해야만, 우리는 [개인뿐만 아니라 팀과 프로그램에 대한 의료 교육의 결과에 대한 이해]에 요구되는 충분한 전압을 생성할 수 있다. 그러나, 우리가 [기여 분석]에만 초점을 맞추는 방식으로, "기여 분석contribution analysis을 위한 귀인 분석attribution analysis에서 벗어나기"와 같은 최근의 담론만 쫓는다면, "전류의 흐름이 중단될current stops flowing" 위험이 있다. 즉, 의학교육에서 [개인 수준]과 [프로그램 수준]의 결과를 모두 고려하지 못하게 되는 것이다.

If we apply Parker Palmer’s analogy,1 quoted in the epigraph, to the topic at hand, we can see attribution and contribution as the 2 opposite poles of a battery. By considering both, we can generate sufficient voltage to power the understanding of outcomes in medical education for individuals as well as for teams and programs. However, if we follow the recent conversation in the medical education literature, which has focused solely on contribution analysis and advocated “moving away from attribution analysis in favor of contribution analysis,”12 there’s a risk that the “current stops flowing” to consideration of both individual- and program-level outcomes in medical education. 

인용한 파머의 말은 "'그리고and'의 힘"에 있다. 즉, 기여와 귀인이 분석에 가져오는 이익을 모두 인정하고, 전체를 부분의 합보다 더 크게 만든다. 기여 분석에 대해 저술한 사람들은 다른 목적을 위한 귀속에 초점을 두는 것이 가능할 수도 있다. 그러나 귀속attribution이 [귀속-기여 연속체]에서 갖는 역할뿐만 아니라, [개인에 대한 귀속의 역할]을 명확하게 정의하는 것은 두 가지 이유로 중요하다: [귀인의 잠재력을 최대한 실현]하고, [귀인을 투명하게 만들기 때문]이다.
Heeding the words of Palmer relies on the “power of ‘and,’” that is, seeing the benefit that both contribution and attribution bring to analysis, making the whole greater than the sum of its parts. It is possible, perhaps even likely, that those who have written about contribution analysis also value a focus on attribution for different purposes. However, we believe that explicitly defining the role of attribution for individuals, as well as its role in the attribution-to-contribution continuum, is important for 2 reasons: realizing the full potential of attribution and making attribution transparent. 

프로그램 및 팀에 집중: 기여도 분석
Focusing on Programs and Teams: Contribution Analysis

[기여 분석]은 2001년에 시민 프로그램과 그들이 달성하고자 하는 결과를 질적으로 평가하는 수단으로 등장했다. 기여도 분석을 개발한 존 메인은 그 당시 변화하는 공공 행정 문화가 시민 프로그램의 결과에 대한 더 큰 책임을 요구한다고 느꼈다. 그는 [기여 분석]이 "관리자, 연구원 및 정책 입안자들로 하여금, [특정 결과에 대한 그들의 프로그램에 대한 기여도에 대한 결론]을 도출하는 데 도움을 줄 수 있다"고 생각했다. 최근 몇 년 동안, 그리고 CBME의 지속적인 추진력은 의료 교육 프로그램의 결과에서 책임에 대한 유사한 요구를 보아왔다. 이러한 상황은 의학교육학자들이 주장해온 바와 같이 [기여분석]을 이러한 목적에 매우 적합하게 만든다.
Contribution analysis emerged in 2001 as a means of qualitatively evaluating civic programs and the outcomes they are seeking to achieve. John Mayne, who developed contribution analysis, felt that the changing culture of public administration at the time required greater accountability for the outcomes of civic programs.20 He thought that contribution analysis could help “managers, researchers, and policymakers to arrive at conclusions about the contribution their program has made to particular outcomes.”20 Recent years, and the continued momentum of CBME, have seen similar calls for accountability in the outcomes of medical education programs.2–4,21 These circumstances make contribution analysis an excellent fit for this purpose, as medical education scholars have advocated.12

현실 세계는 [복잡한 특성]을 갖고 있으며, 이는 결과에 많은 영향을 미치는 요인이 다양함을 의미한다. 기여 분석의 목적은 [개별 실체가 전체 결과에 영향을 미치는 정도]를 결정하는 것이다.22 이 분석에서, 관심 결과의 동인 결정에 일정한 수준의 불확실성이 존재할 것으로 가정한다. 표 1과 같이, 메인은 [기여 분석의 6단계]를 설명한다.

  • (1) 해결해야 할 원인 문제를 설명한다. 
  • (2) 가정된 기여 이론을 개발하고 그 이론에 대한 위험을 확인한다. 
  • (3) 기여이론을 뒷받침하기 위해 기존의 증거를 수집한다. 
  • (4) 기여 스토리contribution story 및 쟁점을 평가한다. 
  • (5) 추가 증거를 찾는다. 
  • (6) 기여 스토리contribution story을 개정, 강화한다. 

The complex nature of the real world means there are many influences on an outcome. The goal of contribution analysis is to determine the extent to which individual entities affect an overall outcome.22 In this analysis, it is assumed there will be a given level of uncertainty present in the determination of the drivers of the outcomes of interest. As shown in Table 1, Mayne describes 6 steps in contribution analysis12,20:

  • (1) set out the causal problem to be addressed,
  • (2) develop the postulated theory of contribution and identify risks to the theory,
  • (3) gather the existing evidence to support the theory of contribution,
  • (4) assess the contribution story and the contestations to it,
  • (5) seek out additional evidence, and
  • (6) revise and strengthen the contribution story.

다음 절에서 자세히 설명한 바와 같이, 표 1은 이러한 단계를 프로그램 결과의 기여, 개별 결과의 귀속 및 CBME의 기여와 귀속 사이의 상호작용 결정에 적용할 수 있는 방법을 추가로 설명한다.
As detailed in the next section, Table 1 further delineates how these steps can be applied to determining the contribution of program outcomes, the attribution of individual outcomes, and the interactions between contribution and attribution in CBME.

 

 

개인에 초점을 맞춥니다. 속성 분석
Focusing on Individuals: Attribution Analysis

[기여 분석 프로세스]는 [귀속 분석]을 정의하는 데도 사용될 수 있다. 귀속 분석은 [상당부분이, 전적으로 개인에게 귀속되는 활동에 대한 증거적 주장을 구축]하기 위한 분석이다. 실제로, 메인은 기여 분석을 개념화하는 과정에서 [기여contribution는 개별 실체에 귀속될attributed 수 있는 것으로부터 시작된다]는 주장을 펼쳤다. 분명히, [귀속은 기여 이야기의 일부]인 것처럼 보인다. (결과가 어떻게 생산되었는지에 대한) [전체 기여 스토리]는 [그 결과를 만들어내는 과정에서 다양한 수준의 영향을 미친 개인, 활동 및 실체]를 포함한다. 

We believe that the contribution analysis process can be used to define attribution analysis as well, seeking to build an evidentiary argument for what activities can be largely or entirely attributed to individuals. Indeed, in his conceptualizations of contribution analysis, Mayne made the case that contribution begins with what can be attributed to individual entities; clearly, attribution is seen to be a part of the contribution story.20,23 The full contribution story of how an outcome is produced includes individuals, activities, and entities to whom varying degrees of influence in producing that outcome are attributed.

그러나 의대 교육에서 기여도 분석을 적용하는 논의는 attribution보다는 contribution를 중시하는 이분법에 가까웠다. 이러한 경향은 [CBME 프로그램의 결과에 초점]을 맞추는 경향 때문일 수 있다. 앞에서 논의한 바와 같이, 우리는 귀속과 기여에 대한 대화를 의학교육을 위한 "둘 중 하나either, or"가 아닌 "둘 다both, and"로 본다. 두 렌즈 모두 원하는 초점에 따라 매우 유용할 수 있다. 실제로, 메인은 귀속과 기여 사이의 연속체를 개념화했습니다.

However, discussions of applying contribution analysis in medical education have approached contribution and attribution as more of a dichotomy, advocating contribution over attribution.12,24 This tendency may be because of the focus on outcomes of CBME programs. As discussed previously, we view this conversation of attribution and contribution as a “both, and” rather than an “either, or” for medical education; both lenses can be very useful, depending on the desired focus. Indeed, Mayne conceptualized a continuum between attribution and contribution.

마인의 귀속-공헌 연속체
Mayne’s attribution–contribution continuum

그의 초기 연구에서, 메인은 "활동activity"이 점차적으로 더 원거리적인 세 가지 유형의 결과를 생성하는 결과 사슬을 설명했다.

  • "출력/리치output/reach": 그림 1의 왼쪽에 표시된 이 체인은 의약품의 프로세스 조치와 유사한 "출력/리치output/reach"로 시작한다(예: 환자는 1차 진료 제공자와 문서화된 천식 조치 계획을 가지고 있다).
  • "중간 결과": 조금 더 나아가서, 같은 이름의 의학의 품질 측정(예: 매년 스테로이드 과정 및 폐 기능 검사)과 유사한 "중간 결과"가 있다.
  • "종료 결과": 대부분의 원거리 결과는 의학의 실제 결과 측정(예: 매년 응급 부서 방문 또는 천식 입원 횟수)과 유사한 "종료 결과"이다.


In his early work, Mayne described a results chain where an “activity” produces 3 types of progressively more distal outcomes.20 

  • This chain, shown on the left side of Figure 1, begins with the “output/reach,” akin to process measures in medicine (e.g., patient has an asthma action plan documented with primary care provider).
  • A little further out are “intermediate outcomes,” akin to medicine’s quality measures of the same name (e.g., steroid courses each year and pulmonary function testing).
  • Most distal are “end outcomes,” akin to true outcome measures in medicine (e.g., number of emergency department visits or hospitalizations for asthma each year).

의학이 그렇듯, 메인의 모델에서는 하류downstream에 가까울수록 [결과에 영향을 미치는 (개인을 넘어서는) 추가적인 요소들]를 고려한다. 예를 들어 중간 및 최종 결과는 환자 흡입기 기술, 약물 접근, 가정 내 먼지 및 곰팡이의 존재에 의해 영향을 받을 수 있다.

As in medicine, Mayne’s model considers the additional factors beyond the individual that affect results further downstream. For example, intermediate and end outcomes can be affected by patient inhaler technique, access to medications, and the presence of dusts and molds in the home.

그림 1의 두 번째 열은 당뇨병 환자의 혈당 조절에 대한 결과 체인의 예를 보여주는데, 이는 전공의(이 예제의 초점)가 학습할 수 있는 활동이다. 

  • 당뇨병 환자를 돌보는 [전공의만 고려]할 경우, 전공의의 성과를 결정하는 데 다음 사항을 사용할 수 있다. 적절한 약물 처방(예: 메트포르민) 및 적절한 선별(예: 시력검사, 소변 마이크로알부민)을 지시하는 것과 같은 프로세스 조치이다. 그림 1에서 알 수 있듯이, 이러한 활동은 대부분 개인 전공의(즉, 전공의가 소변을 주문했거나 주문하지 않은 경우)에게 귀속attributed to할 수 있다. 
  • 결과 사슬을 따라 내려가면, 중간 결과 척도에는 실제 환자 식단과 운동, 약물 준수, 헤모글로빈 A1c 수치가 포함됩니다; 최종 결과 척도에는 당뇨병 신경병증, 망막병증, 뇌졸중 및 심근경색이 포함됩니다. 이러한 중간 및 최종 결과에는 척도의 달성 여부에는 기여하지만, 개별 전공의(예: 의약품 접근, 환자 약물 준수, 실제 환자 다이어트)가 제어할 수 없는 요인이 포함된다. 따라서, 이러한 측정들은 [(귀속보다는) 기여의 관점]에서 고려하기에 가장 좋은 위치에 있다.

The second column of Figure 1 shows an example of the results chain for blood sugar control in a patient with diabetes, an activity that residents (the focus of this example) can learn. When only the resident caring for a patient with diabetes is considered, the following can be used to determine that resident’s performance: process measures such as ordering the proper medication regimen (e.g., metformin) and appropriate screening (e.g., eye exams, urine microalbumin). As Figure 1 shows, these activities can be mostly attributed to the individual resident (i.e., the resident either ordered or did not order a urine microalbumin). Moving down the results chain, intermediate outcome measures include actual patient diet and exercise, medication adherence, and hemoglobin A1c levels; end outcome measures include diabetic neuropathy, retinopathy, stroke, and myocardial infarction. These intermediate and end outcomes include factors that cannot be controlled by an individual resident (e.g., access to medications, patient medication adherence, actual patient diet) contributing to whether or not the measures are achieved. Thus, these measures are best positioned to be considered through the lens of contribution rather than attribution.13

[프로세스 척도에 대한 퍼포먼스]는 개별 제공자의 모습을 반영하며, [여러 제공자에 걸친 집단적인 퍼포먼스]는 프로그램 또는 클리닉의 성과의 지표이다. 중간 및 최종 결과 측정에 대한 성과는 환자, 교육 프로그램 또는 클리닉 및 기관의 성과를 반영한다.
Performance on the process measures reflects the individual provider; performance collectively, across multiple providers, indicates the outcomes of the program or clinic. Performance on the intermediate and end outcome measures reflects the performance of the patient, training program or clinic, and institution combined.

 

귀속분석 정의
Defining attribution analysis

귀속과 기여의 연속성을 고려할 때, [기여 분석]은 개인에게 적용될 수 있다고 믿습니다. 구체적으로, [기여 분석]에 사용되는 동일한 단계가 개인에게 적용된다면, [귀인 분석]을 정의하고 개인 수행의 특정 구성요소를 결정할 수 있다고 믿는다. 이 접근법은 교육학자들이 여러 개의 변수를 집어넣어보고 "무엇이 들어맞는지what sticks"을 보기보다는, 귀인 연구를 시도할 때 증거를 수집할 수 있는 방법을 제공한다. 전공의를 사례로, 제안된 속성 분석을 위한 단계를 자세히 설명하고, 기여 분석 단계와 이러한 단계를 비교하면 표1과 같다.
Given the continuum between attribution and contribution, we believe contribution analysis can be applied to individuals. Specifically, we believe the same steps used in contribution analysis can be applied to individuals to define attribution analysis and to determine specific components of individuals’ performances that can be attributed to them. This approach provides education scholars with a method for collecting evidence when they are attempting attribution studies rather than plugging in multiple variables and seeing “what sticks.” We detail the steps for our proposed attribution analysis using residents as an example; we also compare these steps with the parallel steps of contribution analysis in Table 1:

  • 1단계: 개개인의 수행performance에서 해결이 필요한 인과관계 문제causal problem를 제시합니다.
    • 전공의의 경우 의료팀의 다른 구성원이 아닌 전공의가 정기적으로 완료해야 하는 실질적인 과제를 포함한다. 이 초기 단계에서, 제안된 귀속 업무attributable task가 [평가하려는 개인의 작업 범위 내에 있어야 하는지 여부]를 고려하는 것이 중요하다. 개인은 과제를 수행해야 하는 사람(또는 사람)이 그렇게 하지 않는 기능 장애 마이크로 시스템 또는 전문가 간 팀을 보상하기 위해서만 이 과제를 수행할 수 있다. 이러한 [잠재적 귀속 요인]은 배제해야 하며, 마이크로시스템 또는 팀 성과 개선에 초점을 맞추어야 한다.
  1. Set out the causal problem to address in individual performance. 
    1. For residents, this includes tangible tasks that residents—rather than other members of the health care team—regularly complete. At this early step, it is important to consider whether the proposed attributable task should be within the scope of work of the individual of interest. The individual may only perform this task to compensate for a dysfunctional microsystem or interprofessional team in which the person (or people) who should be performing the task is not doing so. Such potential attributable factors should be excluded and focus placed on improving the microsystem or team performance.
  • 2단계: 가정된 귀인 이론theory of attribution을 개발하고 그 이론에 대한 위험을 확인한다.
    • 그 task를 완수할 수 있어야 하는 다른 사람이 누구인지 고려하면서, 이러한 작업이 해당 전공의에게 귀속되는 이유를 설명하고 정당화한다.
  1. Develop the postulated theory of attribution and identify risks to the theory. 
    1. Explain and justify why these tasks are attributable to residents, taking into account who else could be completing the tasks.
  • 3단계: 귀속 이론을 뒷받침하기 위해 기존의 증거를 수집한다. 
    • 증거는 선택된 과제가 실제로 전공의의 행동resident action를 반영한다는 것을 입증해야 한다.
  1. Gather the existing evidence to support the theory of attribution. 
    1. Evidence should demonstrate that selected tasks actually reflect resident actions.
  • 4단계: 귀속 사례와 그와 관련된 쟁점을 평가합니다.
    • 이 시점에서 생성된 큰 그림 컨텍스트를 보고 그 속성이 임상 학습 환경의 맥락에서 타당한지 여부를 평가하십시오. 이 평가에는 평가대상이 되는 프로세스 조치가 [팀의 다른 구성원 또는 팀 집단으로서가 아니라] 진정으로 [평가되는 특정 전공의에게 상당정도 귀속되는지]를 이해하려는 시도가 포함되어야 한다.
  1. Assess the attribution story and the contestations to it. 
    1. Look at the big picture context created to this point and evaluate whether the attribution is valid in the context of the clinical learning environment. This evaluation should include attempting to understand whether the process measure under consideration is truly highly attributable to the resident rather than to another member of the team or to the team as a collective.
  • 5단계: 추가 증거를 찾습니다.
    • 예를 들어, 가족 및 의료팀의 다른 구성원들과 함께 차트 검토 및/또는 직접 관찰을 실시함으로써 프로세스 조치가 전공의에게 귀속된다는 주장을 뒷받침할 수 있는 더 많은 정보를 계속 모색한다.
  • Seek out additional evidence. 
    • Continue to seek out more information to support the claim that the process measure is attributable to the resident, for example, by conducting chart reviews and/or direct observation combined with discussions with a variety of stakeholders such as families and other members of the health care team.
  • 6단계: 귀속 스토리를 수정하고 강화합니다.
    • 5단계에서 수집한 새로운 정보를 통합하여 전공의와 측정된 업무 간의 관계를 보다 명확하게 정렬한다.
  1. Revise and strengthen the attribution story.
    1. Integrate the new information gathered in step 5 to create a clearer alignment of the relationship between the resident and the task measured.


메인의 귀인 개념화에서 더 나아가, 이러한 단계를 완료하면 [개인의 행동]과 [측정measure] 사이의 "확률적 인과관계"를 추론하는 데 도움이 될 것이다. 메인은 이 [확률론적 인과관계]를 확립하기 위해 5가지 기준을 충족해야 한다고 주장한다. 

  • 개연성plausibility, 
  • 계획에 따른 실행, 
  • 핵심 요소의 증거 확인, 
  • 다른 영향 요인을 고려  
  • 대안적 설명이 (틀렸음)을 반증disproving

Further building from Mayne’s conceptualization of attribution, completing these steps will help to infer “probabilistic causation” between an individual’s actions and the measure.25 Mayne asserts that 5 criteria must be met to establish this probabilistic causation:

  • plausibility,
  • implementation according to plan,
  • evidentiary confirmation of key elements,
  • taking other influencing factors into account, and
  • disproving alternate explanations.

 

기여와 귀속 모두 활용의 힘
The Power of Harnessing Both Contribution and Attribution

[기여 분석과 귀인 분석]을 모두 사용하여 프로그램을 집단으로 평가하는 동시에 규제당국이 인증해야 하는 개인의 진행 상황을 측정할 수 있다. 이러한 조치를 만들고 사용하면 추가 전공의 교육에 도움이 되지만 환자와 팀 구성원(예: 간호사)의 피드백을 고려하여 커뮤니케이션 및 환자 관계와 같은 더 무형의 기술에 대한 조치measures를 만들 수 있다. 이러한 접근 방식은 [가시적인 목표를 바탕으로 개인의 개선을 위한 귀중한 피드백]을 생성하는 동시에, [직원 교육을 촉진하기 위해 프로그램에 필요한 실행 가능한 피드백]을 제공합니다. "둘 중 하나"가 아니라 "둘 다"와 "그리고"라는 생각이 epigraph에 나타나 있다.
Using both contribution and attribution analyses, we can evaluate a program as a collective while also measuring the progress of the individuals that regulators must certify. Creating and using these measures will help to further resident education but can also be built upon by considering feedback from patients and team members (e.g., nurses) to create measures for more intangible skills, such as communication and patient rapport. This approach creates valuable feedback for individual improvement with tangible goals while also providing actionable feedback to programs to better facilitate the education of their staff. This “both, and” rather than “either, or” thinking is evoked in the epigraph.

결론 Conclusion

교육 결과를 환자 치료 결과와 연계하는 과제(교육의 지평선에 대한 우리의 가장 큰 과제)는 서로 얽힌 성과 가닥을 분리하고 검토하기 위한 첫 번째 단계로 기여 및 기여 분석을 사용하면 충분히 해결할 수 있을 것이다. 이러한 접근 방식을 통해 다음을 확인할 수 있다.

  • 각 가닥(개개이느이 퍼포먼스에 대한 귀속attribution)이 팀 성과에 어떻게 얽혀 있는지,
  • 전체 스레드(기여contribution 분석)가 팀 성과와 환자에 대한 치료 결과를 어떻게 연결하는지 

The challenge of linking educational outcomes to patient care outcomes—our greatest challenge on the education horizon—may well be served by using contribution and attribution analyses as the first step toward pulling apart and examining the intertwined performance strands. Such an approach allows us to see

  • how each strand (attribution of individual performance) is intertwined in team performance and
  • how the whole thread (contribution analysis) links team performance to care outcomes for patients.

이러한 노력에서 의료 교육은 [결과에 대한 개인의 책임]에 초점을 맞추는 것으로 시작되었지만, 개인과 팀 간에 책임을 공유하는 [팀 책임에 초점을 맞추는 것]으로 진화해나갈 것이며, quality improvement의 궤적을 따라가며 이익을 얻을 수 있을 것이다.

In these efforts, medical education may benefit from following the trajectory of quality improvement, which began as a focus on individual responsibility for outcomes but evolved to focus on team responsibility with shared accountability among individuals and teams.26

 


Acad Med. 2020 Jul;95(7):1014-1019.

 doi: 10.1097/ACM.0000000000003121.

The Power of Contribution and Attribution in Assessing Educational Outcomes for Individuals, Teams, and Programs

Daniel J Schumacher 1Eric DornoffCarol CarraccioJamiu BusariCees van der VleutenBenjamin KinnearMatthew KelleherDana R SallEric WarmAbigail MartiniEric Holmboe

Affiliations collapse

Affiliation

1D.J. Schumacher is associate professor of pediatrics, Cincinnati Children's Hospital Medical Center and University of Cincinnati College of Medicine, Cincinnati, Ohio. E. Dornoff is a medical student, University of Cincinnati College of Medicine, Cincinnati, Ohio. C. Carraccio is vice president of competency-based assessment, American Board of Pediatrics, Chapel Hill, North Carolina. J. Busari is consultant pediatrician and associate professor of medical education, Maastricht University, Maastricht, the Netherlands. C. van der Vleuten is professor of education, Department of Educational Development and Research, Faculty of Health, Medicine, and Life Sciences, and scientific director, School of Health Professions Education, Maastricht University, Maastricht, the Netherlands. B. Kinnear is assistant professor of pediatrics and internal medicine, Cincinnati Children's Hospital Medical Center and University of Cincinnati College of Medicine, Cincinnati, Ohio. M. Kelleher is assistant professor of pediatrics and internal medicine, Cincinnati Children's Hospital Medical Center and University of Cincinnati College of Medicine, Cincinnati, Ohio. D.R. Sall is assistant professor of internal medicine, University of Cincinnati College of Medicine, Cincinnati, Ohio. E. Warm is professor of medicine and internal medicine program director, University of Cincinnati College of Medicine, Cincinnati, Ohio. A. Martini is a clinical research coordinator, Division of Emergency Medicine, Cincinnati Children's Hospital Medical Center, Cincinnati, Ohio. E. Holmboe is senior vice president for milestones development and evaluation, Accreditation Council for Graduate Medical Education, Chicago, Illinois.

PMID: 31833856

DOI: 10.1097/ACM.0000000000003121Abstract

Recent discussions have brought attention to the utility of contribution analysis for evaluating the effectiveness and outcomes of medical education programs, especially for complex initiatives such as competency-based medical education. Contribution analysis focuses on the extent to which different entities contribute to an outcome. Given that health care is provided by teams, contribution analysis is well suited to evaluating the outcomes of care delivery. Furthermore, contribution analysis plays an important role in analyzing program- and system-level outcomes that inform program evaluation and program-level improvements for the future. Equally important in health care, however, is the role of the individual. In the overall contribution of a team to an outcome, some aspects of this outcome can be attributed to individual team members. For example, a recently discharged patient with an unplanned return to the emergency department to seek care may not have understood the discharge instructions given by the nurse or may not have received any discharge guidance from the resident physician. In this example, if it is the nurse's responsibility to provide discharge instructions, that activity is attributed to him or her. This and other activities attributed to different individuals (e.g., nurse, resident) combine to contribute to the outcome for the patient. Determining how to tease out such attributions is important for several reasons. First, it is physicians, not teams, that graduate and are granted certification and credentials for medical practice. Second, incentive-based payment models focus on the quality of care provided by an individual. Third, an individual can use data about his or her performance on the team to help drive personal improvement. In this article, the authors explored how attribution and contribution analyses can be used in a complimentary fashion to discern which outcomes can and should be attributed to individuals, which to teams, and which to programs.

의학역량에 대한 질문: COVID-19 사태가 의학교욱의 목표를 바꾸어야 하는가? (Med Tech, 2021)
Questioning medical competence: Should the Covid-19 crisis affect the goals of medical education?
Olle ten Catea , Karen Schultzb , Jason R. Frankc , Marije P. Hennusd , Shelley Rosse , Daniel J. Schumacherf , Linda S. Snellg, Alison J. Whelanh and John Q. Youngi ; on behalf of the ICBME Collaborators

 

도입 Introduction

2020년 사스-CoV-2 (COVID-19) 대유행은 건강과 교육을 포함한 사회의 많은 부문에 심각한 영향을 끼쳤다. 보건 및 교육에서 학생, 교사, 프로그램 및 기관의 업무 과정과 보건 직업 교육에서의 이들의 교차점에서 일어난 적응은 지속적인 영향을 미칠 수 있고, 우리는 제안할 것이다(루시와 존스턴 2020; 로즈 2020; 하우어 외 2021). 강의실과 임상 교육 모두에서 의학 교육의 많은 적응adaptations이 문서화되었다(Goldhamer 등 2020; Hall 등 2020). 본 논문에서 우리는 이러한 적응에 초점을 맞추지 않고, 전염병이 의료 역량에 대한 우리의 견해에 어떻게 더 근본적으로 영향을 미쳤는지에 초점을 맞추고 있다.
The 2020 SARS-CoV-2 (COVID-19) pandemic has profoundly affected many sectors of society, including health and education. The adaptations that have taken place in the work processes of students, teachers, programs, and institutions in health care and education and their intersection in health professions education could and, we would propose, should have lasting effects (Lucey and Johnston 2020; Rose 2020; Hauer et al. 2021). Many of the adaptations in medical education – in both classroom and clinical education – have been documented (Goldhamer et al. 2020; Hall et al. 2020). In this paper we do not focus on these adaptations, but rather on how the pandemic has more fundamentally affected our views on medical competence.

[역량]에 대한 다양한 정의 중 하나는 '활동을 수행하거나 주어진 과제를 완수하기 위해 개인 또는 사회적 요구에 대응할 수 있는 능력'(IGI Global 2021)이다. 이는 의료 전문가의 경우 [임상 실무에서 직면하는 도전에 대응할 수 있는 능력]이다. 이러한 과제는 환자 안전에 대한 다소간의 위험이 수반될 있으며, 긴급한 대응이 필요할 수도 있고, 준비와 훈련이 필요할 수 있다. 
Among the various definitions of competence, one is ‘the capacity to respond to individual or societal demands in order to perform an activity or complete a given task’ (IGI Global 2021), which, for a medical professional, would be the capacity to respond to challenges faced in clinical practice. These challenges may come with more or less risk for patient safety, may need a more or less urgent response, and may require more or less preparedness and training.

  • 의료 종사자의 재배치,
  • 이러한 근로자가 새로운 업무를 위해 적절히 훈련할 기회,
  • 전염병 동안 새로운 업무에 참여할 의사의 의지

...에 대한 필요성은 이러한 필요성에 대한 [개별 임상의가 이러한 필요, 위험, 개인의 능력을 어떻게 인식하는지]뿐만 아니라, [조치의 필요성] 및 [환자와 의사 모두에 대한 작업의 위험성]에 달려 있었다. 단순화하면 [긴급성]과 [위험 수준]이라는 두 가지 외부 조건이 네 가지 상황을 초래합니다(그림 1).

  • The need for redeployment of health care workers,
  • the opportunity for these workers to properly train for new tasks, and
  • the willingness of physicians to engage in novel tasks during the pandemic

...have depended on the need for action and the risk of the work to both patient and physician, as well as individual clinicians’ perceptions of these needs, the risks, and their personal capabilities. Simplified, the two external conditions – urgency and risk level – lead to four situations (Figure 1).

그림 1 다양한 능력을 갖춘 보건 전문가의 적합성의 결정 요소로서 직무 필요성과 위험.
Figure 1. Task need and risk as determinants of the suitability of health professionals with varying capabilities to be employed.

 

COVID-19 대유행 기간 동안의 치료는 종종 그림 1의 오른쪽 상단 모서리에 있다. 대유행이 극에 달했을 때 응급 의사, 가족 의사, 전염병 전문의, 집중치료사, 내과 의사 및 호흡기내과 전문의들이 당연히 COVID-19 환자를 돌볼 것을 요청받았다. 하지만, 많은 병원에서는, 이러한 환자들을 돌볼 수 있는 전담 전문가가 너무 적어서, 입원 의학과에 익숙하지 않은 사람들을 포함하여, [다른 전문의들]의 의사들이 자원봉사를 했거나 도움을 요청 받았기 때문에 도움을 주었다. 예를 들어 소아 진료량이 급격히 감소한다는 것은 소아과 의사가 소아 ICU에서 위독한 성인 환자를 돌보도록 요청했다는 것을 의미한다(Kneyber et al. 2020).
Care during the COVID-19 pandemic has often sat in the top right corner of Figure 1. At the peaks of the pandemic, emergency physicians, family physicians, infectious disease specialists, intensivists, internists, and pulmonologists were, not surprisingly, called on to attend to patients with COVID-19. However, in many hospitals, too few dedicated specialists were available to cover the care for these patients, so physicians from other specialties assisted, including ones less familiar with inpatient medicine, either because they volunteered or because they were asked to help. Drastic drops in pediatric care volumes, for instance, meant that pediatricians requested to care for critically ill adult patients in pediatric ICUs (Kneyber et al. 2020).

전문가, 의대, 대학원 프로그램, 면허 기관 및 대중은 모두 [유능한 의사]가 무엇인지에 대한 이미지를 가지고 있지만, 이 용어를 정의하거나 이러한 정의를 조작화하는 것은 항상 어려웠다(Kate 2017). 매우 인용된 정의일지라도, 엡스타인과 헌더트(2002)가 제공한 권위 있는 정의('제공되는 개인과 공동체의 이익을 위해 일상적 실무에서 의사소통, 지식, 기술 기술 기술, 임상적 추론, 감정, 가치 및 성찰의 습관적이고 현명한 사용')는 해석의 여지를 남긴다. 어떤 지식과 기술이 기대될 수 있는지 명시하지 않고, 사람들은 같은 방식으로 표준을 해석하거나 적용할 수 없다. 이는 부분적으로 역량이 상황에 따라 다르다는 사실 때문일 수 있다. (10 케이트 외 2010; 10 케이트 및 빌렛 2014; Teunissen 외 2021).

Professionals, medical schools, postgraduate programs, licensing organizations, and the public all have an image of what a competent physician is, but defining this term, or operationalizing those definitions, has always been difficult (ten Cate 2017). Even highly cited, authoritative definitions, such as the one provided by Epstein and Hundert (2002) (‘the habitual and judicious use of communication, knowledge, technical skills, clinical reasoning, emotions, values, and reflection in daily practice for the benefit of the individual and community being served’), leave room for interpretation to some extent as they do not specify which knowledge and skills may be expected, and people may not interpret or apply the standards in the same way. This may be due to the fact that competence is, in part, context dependent (ten Cate et al. 2010; ten Cate and Billett 2014; Teunissen et al. 2021). 

Billett (2017)은 직업 역량의 세 가지 요소 또는 영역을 구분한다: 

  • 모든 유사한 전문가에 의해 공유되는 표준 도메인
  • 맥락에 의해 결정되는 상황 도메인, 그리고 
  • 유능한 전문가들 사이에서도 개인의 차이를 설명하는 개인 도메인

Billett (2017) distinguishes three components or domains of occupational competence:

  • a canonical domain, shared by all similar professionals,
  • a situational domain determined by the context, and
  • a personal domain that explains individual differences, even among competent professionals.

[규칙적인 상황]에서, 대부분의 의사들은 그들의 규범적이고 전문적인 자격과 동료들, 동료들, 그리고 전문 사회의 상황적 지원이 모든 표준과 기대치를 충족하기에 충분한 지침을 제공하는 안정적이고 친숙한 맥락에서 일한다. 그러나 공식적으로 요구되는 능력으로 규정될 수 있는 것에는 한계가 있다. 예를 들어, 어떤 지식은 암묵적이고 성문화하기가 어렵다. COVID-19와 같은 대유행에서 상황 변화는 초기 불확실성과 관련된 능력의 적응을 필요로 한다. 경력 내내 모든 의사는 [불확실한 순간]에 직면한다. 즉, 직업 변화, 새로운 치료와 시술의 치료의 발전, 익숙하지 않은 문제, 희귀 질환 및 표준 임상 지침에 반영되지 않은 비정형 프레젠테이션의 환자(Collianni et al. 2021). 이러한 익숙하지 않은 상황에는 전문가의 판단, 임상적 추론, 행동 및 관리가 새롭게 필요합니다. 프로들은 '미안하지만, 나는 그것을 학교에서 배우지 못했다' 뒤에 숨을 수 없다. 일반적인 사회 및 전문적 기대는 지속적인 자기주도 학습을 통해 의료 질문 및 익숙하지 않은 문제를 가진 환자를 어느 정도까지 보호할 수 있다는 것이다. 다시 말해서 의사는 적응할 수 있을 것이라는 기대를 받는다(10 Kate 등).

In regular circumstances, most physicians work in stable and familiar contexts for which their canonical, professional qualifications, plus contextual support from colleagues, coworkers, and professional societies, provide sufficient guidance to meet all standards and expectations. There is a limit, however, to what can be formally stipulated as required competence. For example, some knowledge is tacit and hard to codify. In a pandemic such as COVID-19, contextual changes require an adaptation of competence, associated with initial uncertainty. Throughout their careers, all physicians face moments of uncertainty: job changes, advances in care with new therapies and procedures, unfamiliar problems, rare diseases, and patients with atypical presentations that are not reflected in canonical clinical guidelines (Colaianni et al. 2021). These unfamiliar situations require renewed professional judgment, clinical reasoning, actions, and care. Professionals cannot hide behind ‘I apologize, but I did not learn that in school’ (Duijn et al. 2020). The general societal and professional expectation is that all physicians can be trusted, to some extent, to care for patients with health care questions and problems with which they are not familiar, through ongoing self-directed learning. Physicians are expected, in other words, to be adaptable (ten Cate et al. 2021).

문제는: 어느 정도의 적응성을 기대하는 것이 합리적인가? COVID-19 대유행은 이 질문을 집중 조명했다. 의사들은 항상 적응할 수 있어야 했지만, 그렇게 빠르고 광범위한 방식으로는 드물었고, 의료 제공자들 스스로가 개인적인 위험에 처하게 된 상황에서, 그렇게 많은 중증 환자들과 함께 있는 경우는 드물었다.
The question is: what adaptability limits define reasonable expectations? The COVID-19 pandemic has spotlighted this question. Physicians have always needed to be adaptable, but rarely in such a rapid and expansive way and rarely with so many profoundly sick patients, in a situation in which the health care providers themselves were put at personal risk.

우리는 마이크로, 메소, 매크로 수준에서 답을 제공하기 보다는 교육적이고 조직적인 질문을 제기한다이는 미래 업무의 피할 수 없는 다양성에 대한 건강 전문가의 준비와 적응력에 대한 인식을 높이기 위해서이며, COVID-19 대유행, 다음 대유행 또는 기타 국가 및 글로벌 보건 위기의 세 번째 및 그 이후의 파동을 위한 것이다(그림 2).

We pose educational and organizational questions, rather than providing answers, at the micro, meso, and macro levels, to raise awareness about health professionals’ preparedness and adaptability for the inevitable diversity of future work, be it for third and subsequent waves of the COVID-19 pandemic, the next pandemic, or other national and global health crises (Figure 2).

그림 2 개인, 프로그램 및 제도, 규제 및 사회 시스템의 세 가지 관점에서 의료 위기 동안 의료 역량을 평가합니다.
Figure 2. Valuing medical competence during a health crisis from three perspectives: individual, program and institution, and regulatory and societal systems.

 

마이크로 레벨: 개별 연수생 및 개업 의사의 관점에서 의료역량 재고
The micro level: Reconsidering medical competence from the perspective of individual trainees and practising physicians

물론 역량은 특정한 일을 수행하는 능력이다. 그렇다면 전문직 역량professional competencce은 전문가에 의해 수행될 것으로 예상되는 직무와 관련이 있는데, 전문가가 권위자로 간주되거나 자문받는 이유는 전문적인 기술, 훈련 또는 지식을 갖추었기 때문이다. 전문가들은 (이미 여러 번 완료했기 때문에) 매우 익숙한 과제뿐만 아니라, (해당 과제가 예상 실무 범위에 포함된다면) 이전에 거의 또는 전혀 수행되지 않은 과제까지도 수행할 것으로 기대된다(Ward et al. 2018). 모든 의학 졸업자는 어느 정도 신뢰받으며, 낯선 업무에 대처할 것으로 예상해야 하지만 문제는 예상되는 실무 범위 내외에서 [어느 정도까지 대처하느냐]이다. 이로 인해 의과대학 선택에서부터 확립된 실무에 이르기까지 의료 경력 주기에 걸쳐 다음과 같은 몇 가지 질문이 제기된다.
Competence, of course, is the ability to perform specific tasks. Professional competence then pertains to professional tasks, those expected to be performed by professionals, often called experts because they are regarded or consulted as an authority on account of special skill, training, or knowledge (Oxford English Dictionary [date unknown]). Experts are expected to perform not only tasks with which they are highly familiar because they have completed them many times, but also tasks they have rarely or never previously performed if those tasks fall within their expected scope of practice (Ward et al. 2018). All medical graduates should be trusted and expected to cope with unfamiliar tasks to a certain extent (ten Cate et al. 2021), but the question is to what extent, both within and outside of an expected scope of practice. This leads to several questions across the medical career cycle, from selection for medical school through established practice:

i. 익숙하지 않은 문제와 불확실성에 대처하기 위해서는 [적응력과 창의적인 문제 해결(능력)]이 필요하며, 이는 다시 에너지와 진취성을 필요로 한다. 불확실한 상황에서 일할 수 있는 적응성 및 의지와 관련된 지원자의 속성을 의대 선택 과정에서 평가해야 하는가? 그리고/또는 학교는 학생들의 이러한 속성을 개발하기 위해 노력해야 하는가? 진취성과 창의성이 (합당한) 기대치expectation가 될 수 있는가? 그리고 그것은 의대를 시작할 때 학생들에게 전달되어야 하는가?
i. Coping with unfamiliar issues and uncertainty requires adaptability and creative problem-solving, which in turn require energy and initiative. Should applicants’ attributes associated with adaptability and willingness to work in uncertain circumstances be assessed in medical school selection processes, and/or should schools work to develop these attributes in their students? Can initiative and creativity become an expectation, and should that be communicated to students when they start medical school?

ii. 이타주의와 용기: [모르는 것은 많지만, 니즈는 높은 환경에서 의료를 제공하는 것]은 기술뿐만 아니라 (도덕적인) 태도도 제공하는 것인가? 그림 1과 같이, 필요량이 가용 리소스를 압도하는 상황에서 재배치에 대한 요구가 발생할 수 있습니다. 필요성이 높고 위험이 낮은 상황(왼쪽 상단 박스 그림 1)은 이타주의를 요구할 수 있다.

  • 예: 제공자는 장기간 가족으로부터 떨어져 있어야 할 수 있다.
  • 저위험 제공자는 해당 질병을 가지고 있지 않은 환자의 치료를 넘겨받아 고위험 제공자의 시간을 확보할 필요가 있을 수 있다. 
  • 제공자는 필요 또는 요구를 충족시키기 위해 급여를 받거나 받지 않고 추가 임상 작업을 수행해야 할 수 있습니다.

ii. Altruism and courage: Is providing care in a setting of high need with many unknowns not only a skill set but a (moral) attitude as well? As per Figure 1, calls for redeployment will occur in high-need situations where need overwhelms the available resources. Situations of high need and low risk (top left box Figure 1) may call for altruism (e.g.

  • providers may need to be away from family for extended periods of time;
  • low-risk providers may need to free up time for high-risk providers by taking over the care of their patients who do not have the disease in question;
  • providers may need to do additional clinical work, with or without pay, to meet needs or demands).


환자, 의사 또는 둘 다에게 필요성과 위험이 높은 상황도 용기가 필요할 수 있다. 이는 그림 1의 오른쪽 상단 박스로 나타내며, 여기서는 의료 사업자가 편안한 영역 밖에서, 그러나 스트레스가 많고 불확실한 상황에서 지원 유무에 관계없이 합리적으로 능력 범위 내에서 일하고 있다. 의료 사업자는 [충분한 역량을 가지고 있음에도 참여를 꺼리는 것]에서부터 [환자 안전 또는 팀 또는 자신의 안전 측면에서 상당한 위험을 감수하는 것]까지 그러한 상황에서 다양한 방식으로 대응할 것이다.
Situations of high need and high risk, for patients, physicians, or both, may also require courage. These are represented by the top right box of Figure 1, where health care providers are working outside of their comfort zone, but reasonably within the scope of their abilities, with or without supports, in stressful, uncertain circumstances. Health care providers will respond in a spectrum of ways in such circumstances, from being unwilling to engage even though they have sufficient competence, to taking on substantial risk in terms of either patient safety or the safety of their team or themselves.

스펙트럼의 양쪽 끝은 문제가 있다. 중간 지점은 우리의 질문이 있는 곳이다. 의사로서의 역할에는 환자와 공중 보건에 대한 봉사에 대한 헌신이 수반됩니다. 하지만 이러한 헌신이 어디까지 확장될까요? 의무 요소를 더 직접적으로 설명하려면:
Both ends of the spectrum are problematic.The middle ground is where our questions lie. Being a physician involves a commitment to service – to patients and to public health – but how far does this extend? To state the obligatory element more directly:

  • 당신은 의사가 될 수 있지만 익숙하지 않거나 도전적이거나 위험이 높은 환경에서 일하는 것을 거부할 수 있는가? 
  • 그리고 만약 그렇다면, 가능한 [환자 성과 이득]에 대한 [개인적 위험 수준]이나, 임상적 필요 역량과 비교한 역량 격차와 같이, 그러한 결정에 고려해야 할 윤리적 경계는 무엇인가?
  • Can you be a physician but choose to refuse to work in an unfamiliar, challenging, or high-risk setting?
  • And if so, what are the ethical boundaries for such decisions, such as level of personal risk compared with possible patient outcome benefit, or the competence gap compared with what is clinically needed.

 

  • 참여하기 전에 지원, 감독, 적절한 보호 및 추가 훈련을 주장할 수 있는가?
  • 의무 여부를 결정에 고려할 공공 보건(예: 인구 위협의 정도), 임상의 안전(예: 적절한 보호 장비의 가용성), 임상의사의 역량(예: 사전 경험, 집중 훈련 및 지원의 적절한 조합)의 기본 임계값은 무엇인가? 
  • Can you, or indeed should you, insist on support, supervision, adequate protection, and further training before engaging?
  • What are the basic thresholds of public health (i.e. extent of population threats), clinician safety (e.g. availability of adequate protective equipment), and a clinician’s competence (e.g. adequate combination of prior experience, focused training, and support) that determine whether there is an obligation for any physician to serve?

 

  • 이런 종류의 이타주의나 용기가 기대될 수 있는가? 그리고 의대생들은 훈련을 시작할 때 그들의 경력 동안 그러한 상황에서 행동하도록 요구될 수 있다는 것을 들어야 하는가? 
  • 그리고 이러한 개인의 용기, 이타주의, 그리고 위험 감수는 [중앙 및 거시적 수준의 지도자들]이 그러한 상황에서 의료 제공자들을 [지원하고 교육하고 보호할 책임을 지는 경우]에만 정당화되어야 하는가?
  • Can this type of altruism or courage be expected, and should medical students be told at the start of their training that during their career they may be called on to act in such circumstances?
  • And should this individual courage, altruism, and risk-taking be justified only if leaders at the meso and macro levels take responsibility to support, educate, and safeguard health care providers in such circumstances?

 

iii. 학습자에게 적응력을 교육할 수 있는가(Cutrer et al. 2017). 올바른 호기심, 동기, 사고방식 및 복원력과 같은 마스터 [적응형 학습자]의 특징이 제안되었다(Cutrer et al. 2018). 이러한 개인 속성이 고정되어 있는가, 아니면 교육이 적응형 자기조절기술을 육성할 수 있는가? 학습자를 낯선 사례와 문제에 노출시키고, 이성 내에서 그들에게 도전하고 불확실성에 대처하기 위한 문제 해결 능력을 고의적으로 구축할 수 있도록 신중하게 선택한 것은 적응 능력을 개발하는 데 도움이 될 수 있다. 적응 능력을 포착, 강화 및 평가하기 위한 이러한 접근법은 어느 정도 성공으로 시도되었다(Wijnen-Meijer 외 2013; Kalet 외 2017).
iii. Can learners be trained for adaptability (Cutrer et al. 2017). Master adaptive learner features, such as having the right curiosity, motivation, mindset, and resilience, have been suggested (Cutrer et al. 2018). Are these fixed personal attributes or can education foster skills in adaptive self-regulation? Exposing learners to unfamiliar cases and problems, carefully chosen to challenge them within reason and to enable them to deliberately build problem-solving skills to deal with uncertainty, may serve to develop adaptive skills. Such approaches to capture, reinforce, and assess adaptive skills have been tried with some success (Wijnen-Meijer et al. 2013; Kalet et al. 2017).

 

iv. 의료 전문가가 현재의 업무 범위 밖에서 일하도록 요청받는다면 어떤 지원이 필요한가? 익숙한 관행에서 익숙하지 않은 관행으로 쉽게 전환하기 위해 '근위 발달 지역ZPD'을 식별할 수 있다. 이 용어를 만든 Vygotsky(1978, 페이지 86)는 이를 '[독립적 문제 해결이 가능한 실제 발달 수준]과 [성인의 지도 또는 능력있는 동료화의 협력을 통한 문제 해결능력으로 결정되는 잠재적 개발 수준] 사이의 거리'로 정의했다. 상급 전문가나 동료에 의한 지도 또는 감독은 격차를 해소하고 안전한 실천뿐만 아니라 개인이 감독 없이 연습하는 법을 배우도록 보장할 수 있다. 이 영역 내에서 학습자나 전문가는 '조건적 역량conditional competence'(즉, 지도와 감독이 사용가능한 경우에만 역량이 있다고 볼 수 있음)을 가지고 있다. 전문가를 지도 및 평가를 받는 학습자의 위치로 되돌리려면 겸손함과 팀 내에서 효과적으로 일할 수 있는 기술이 필요합니다. 이러한 속성은 의과대학 선택 과정에 포함되어야 하며, 훈련과 전문 실무 중에 강화 또는 구축되어야 하는가?

iv. What support is needed if a medical professional is asked to work outside their current scope of practice? To ease a transition from familiar to unfamiliar practice, a ‘zone of proximal development’ may be identified. Vygotsky (1978, p. 86), who coined this term, defined it as ‘the distance between the actual developmental level, as determined by independent problem solving and the level of potential development as determined through problem solving under adult guidance or in collaboration with more capable peers’. Guidance, or supervision, by more advanced experts or peers can bridge the gap and ensure not only safe practice but also that an individual learns to practise without supervision. Within this zone, learners or professionals have ‘conditional competence’, (i.e. competence only if there is guidance and supervision available). Putting professionals back in the position of learners being supervised and assessed will require humility and the skill to work effectively in a team. Should these attributes be included in medical school selection processes and reinforced or built during training and professional practice?

이전에 획득한 기술은 개인이 여러 해 동안 연습한 후 쇠퇴할 수 있다(Choudhry 등 2005; Norcini 등 2017).

  • 이전에 훈련했지만 더 이상 진료하지 않는 분야에 대해, 매우 경험이 풍부하지만 전문화된 의료 전문가들에게 기대할 수 있는 것은 무엇인가?
  • 전문가들은 한때 보유했지만 더 이상 숙달되지 않은 기술을 필요로 하는 업무에 대해, (기술을 재습득rebuild한 후) 도와달라는 요청을 받았을 때 거절할 수 있는가, 아니면 이러한 활동을 시작하기 전에 적절한 교육과 역량 평가를 받기를 고집할 수 있는가?

의료계와 사회 사이의 사회적 계약은 암묵적으로 이러한 의무를 포함할 수 있지만, 명백하게 원시적인 primum non nocere 원칙(첫째, 해를 끼치지 않음)은 질문될 수 있는 것에 한계를 설정한다.

Previously attained skills may decay after an individual has been in practice for many years (Choudhry et al. 2005; Norcini et al. 2017).

  • What can be expected of very experienced, but very specialized medical experts in areas where they previously trained but no longer practise?
  • Can these professionals refuse a request that they rebuild these skills and assist with tasks requiring skills they once possessed but no longer have mastery over, or can they insist on receiving proper education and assessment of competence before they take on these activities?

The social contract between the medical profession and society may implicitly include this obligation, but clearly the primum non nocere principle (first, do no harm) sets limits on what can be asked. 

다음과 같은 의문이 든다:

  • 의료 전문가들에게 짧은 시간 내에 다시 습득할 수 있는, 오랫동안 잊고 있던 기술을 사용하도록 요청할 수 있는가?
  • 전문가들에게 [과거에 실행범위에 있었던 적이 없지만], [새로 배운다면 의사나 환자에게 허용되는 수준의 위험 수준에서 적용될 수 있는 기술]을 습득하도록 요청받을 수 있는가?
  • 의사로서 [정상적인 진료 범위를 벗어나는 작업이나 훈련을 거부하는 것]이 [허용 가능한 시기]와 [권장되는 시기]는 언제인가?
  • Questions that arise include the following: Can medical experts be called on to use long-forgotten skills that can be relearned in a short time?
  • Can experts be asked to acquire skills that have never been in their scope of practice but that may be learned and applied with an acceptable level of risk to the practitioner or the patient?
  • When is that acceptable and when is it rather advisable for a physician to refuse to work or train outside their normal scope of practice?

 

메소 레벨: 지역 프로그램 및 기관의 관점에서 의료 역량 재고
The meso level: Reconsidering medical competence from the perspective of local programs and institutions

사실상 전 세계의 모든 의과대학들은 전염병이 시작된 이래로 교육 과정을 적응하도록 강요되어 왔다. 대면 교육은 중단되었고, 교실 교육은 온라인 교육으로 전환되었으며, 임상 로테이션은 일시적으로 연기되거나 대폭 축소되었다(골드해머 외 2020; 루시와 존스턴 2020; 웨인 외 2020). 그러나 동시에 일부 의과대학은 수요가 가장 높은 의료 종사자에 대한 수요를 충족시키기 위해 학생들이 조기 졸업할 수 있도록 했다(바르잔스키와 카타네즈 2020; 콜 2020; 플로트 외 2020). 이러한 제도적 조치는 의료 면허에 필요한 역량을 암시적으로 재정의하거나 역량 평가를 개선하여 이전에 설정한 졸업 시간 전에 훈련 목표를 달성한 학생이 면허를 받을 수 있음을 입증한다. 신중하게 구성된 커리큘럼, 프로그램 평가 프레임워크 요건 및 시험 규칙이 갑자기 유연해졌다. 고정 졸업 기준에 대한 시간의 변동성에 의해 정의될 경우(Frank 등 2010) 역량 기반 의학교육이 학부 교육에서 가능하지 않다는 주장은 반박된 것으로 보인다. COVID-19 사태로 인해 학부 의료 프로그램, 대학원 프로그램 및 기관이 커리큘럼과 평가의 적응을 고려해야 했고, 이로 인해 몇 가지 의문이 제기되었다.
Virtually all medical schools in the world have been forced to adapt their educational processes since the start of the pandemic. Face-to-face education has been suspended, classroom teaching has turned into online education, and clinical rotations have been temporarily postponed or significantly curtailed (Goldhamer et al. 2020; Lucey and Johnston 2020; Wayne et al. 2020). But at the same time, some medical schools enabled students to graduate early (Barzansky and Catanese 2020; Cole 2020; Flotte et al. 2020) to meet the demand for health care workers where the need was highest. These institutional measures implicitly redefined the competence needed for medical licensing or refined the assessment of competence to certify that students who had attained the goals of training before their previously set graduation time could be licensed. Carefully constructed curricula, programmatic assessment framework requirements, and examination rules suddenly became flexible. The argument that competency-based medical education, if defined by more variability in time against fixed graduation standards (Frank et al. 2010), is not possible in undergraduate education, seems to have been refuted. The COVID-19 crisis has required undergraduate medical programs, postgraduate programs, and institutions to think of adapting curricula and assessment, leading to several questions.

v. 미리 설정된 교육 기간의 완료만을 기준으로 하기 보다는, 역량에 따라 학습자의 자격을 더 갖추기 위해, 좀 더 개별화된 커리큘럼이 필요할 것인가? (샌튼 외 2020) 한 가지 접근법은 위탁 가능한 전문 활동(EPA)을 포함할 수 있다. EPA는 학습자가 필요한 역량을 입증하는 즉시 수행할 수 있도록 신뢰할 수 있는 전문 실무 단위이다 (10 Kate 2005, 10 Kate and Taylor 2020). 의사의 진료 범위는 개인화된 EPA 포트폴리오로 생각할 수 있으며, 이는 교육 중에 점진적으로 구축되며, 실무자가 근무 수명 내내 유지 또는 채택한다(10 Kate 및 Carraccio 2019). 
v. Will more individualized curricula be needed to qualify learners more on the basis of their competence rather than solely on the basis of their completion of a preset duration of training (Santen et al. 2020)? One approach may include entrustable professional activities (EPAs). EPAs are units of professional practice that learners can be trusted to perform as soon as they have demonstrated the required competence (ten Cate 2005; ten Cate and Taylor 2020). A physician’s scope of practice may be envisioned as an individualized portfolio of credentialed EPAs, which is gradually built during training, and which is maintained or adapted by practitioners throughout their working life (ten Cate and Carraccio 2019).

잠재적으로 졸업 시간을 개별화하는 것에 더하여, 이 접근방식은 COVID-19와 같은 위기 대처에도 유용할 수 있다. 위기 대처에 필요한 작업을 위한 EPA를 명확히 표현할 수 있고, 훈련을 제공할 수 있으며(개인과 기존 기술 세트에 따라 달라질 수 있음), 평가를 구성할 수 있다. 예를 들어 인공호흡기 관리는 EPA(Hester et al. 2020)로 형성될shaped 수 있다. 특정 영역의 역량을 공식적으로 외부적으로 회수할 수 있는 인식인 디지털 배징은 EPA(Mehta et al. 2013)의 사용에 완벽하게 적합한 개발인 보다 개별화된 역량 프로파일(Norcini 2020; Noyes et al. 2020)을 만들도록 최근 권고되었다.

In addition to potentially individualizing times of graduation, this approach may also prove useful in addressing crises such as COVID-19. EPAs for the work needed to deal with the crisis can be articulated, training can be provided (the nature and extent of which would vary depending on the individual and their existing skill sets), and assessment can be organized. Ventilator management, for example, could well be shaped as an EPA (Hester et al. 2020). Digital badging, a formalized and externally retrievable recognition of competence in an area, has recently been recommended to create a more individualized profile of competence (Norcini 2020; Noyes et al. 2020), a development that would perfectly fit with the use of EPAs (Mehta et al. 2013).

vi. 학교, 기관, 전문 기관 및 작업 그룹은 '급속 배치rapid deployment' 모듈 또는 부트캠프 활동을 만들고 필요할 때 제공해야 하는가(헤스터 외 2020)? 새로운 주제를 중심으로 국내 또는 국제적으로 이러한 커리큘럼을 공유할 수 있는 저장소가 있어야 하는가? 병원은 의과대학과 협력하여 신속한 배치 팀을 구성하여, 군 예비군과 유사한 비상 기술을 정기적으로 업데이트하여 위기에 직접 대응하고 더 많은 인력을 재배치 및/또는 훈련시켜야 한다. [위기 대비]와 [일상적인 치료를 위한 자원 요구] 사이에 최적의 지점은 어디인가?

vi. Should schools, institutions, professional organizations, and working groups create ‘rapid deployment’ modules or bootcamp activities and offer them when needed (Hester et al. 2020)? Should there be a repository where such curricula can be shared nationally or internationally around emerging topics? Should hospitals in collaboration with medical schools create rapid-deployment teams, regularly updating their emergency skills, in analogy with the military reserves, to respond to crises directly, while simultaneously redirecting and/or training a larger workforce? Where is the sweet spot between crisis preparedness and resource needs for routine care?

vii. 기관들은 위기 상황에서, 위기의 니즈와 전체적으로 일치하는 전담 맞춤형 팀들이 신속하게 조립될 수 있도록, 의료인력의 [기술 세트skill sets의 목록inventory]을 가지고 있어야 하는가? 위기의 시기에 모든 팀이 필요로 하는 간헐적으로 강화되어야 하는 기초적인 기술이 있는가?
vii. Should institutions maintain an inventory of the skill sets of their workforce such that in times of crisis, dedicated bespoke teams whose skill sets collectively match the needs of the crisis can be quickly assembled? Are there foundational skills that all teams would need during times of crisis that should be intermittently reinforced?

매크로 수준: 광범위한 규제, 시스템 및 사회적 관점에서 의료 역량 재고
The macro level: Reconsidering medical competence from a broader regulatory, systems, and societal perspective

많은 사회와 그 정부는 인구의 건강을 보호하고 육성할 의무를 가지고 있다. 이는 대개 환자의 치료를 허가하는 행위이며 환자의 역량을 인정하는 것을 반영하는 것으로 관할 지역의 의료 사업자의 면허를 책임지는 규제 기관을 통해 이루어진다. 또한 헌법이나 후속 개정 또는 법률을 통해 유능한 인력을 확보하고 시민을 위한 접근 권한을 제공하는 것을 포함한다. 전염병이 강조했듯이, 위험 완화를 위해 유능한 인력을 보호하고 지원하는 것도 조직의 책임이다. COVID-19 위기는 의료 및 과학 전문가와의 대화에서 전염병과 싸우고 치료를 확보하고 지원해야 할 정부의 책임을 다시 한번 전면에 부각시켰다. 그들의 결정은 인구 질병률과 사망률에 지대한 영향을 미친다.
Many societies and their governments hold obligations to protect and foster their population’s health. This is usually done through regulatory bodies responsible for the licensing of health care providers in their jurisdiction, which is an act of permission to treat patients and reflects a recognition of their competence. It also involves securing a competent workforce and providing access to care for citizens, either through a constitution or in subsequent amendments or laws. As the pandemic has highlighted, it is also the responsibility of organizations to protect and support that competent workforce to mitigate risk to a tenable level. The COVID-19 crisis has once again brought to the forefront the responsibility of governments to fight pandemics and to secure and support care, in a dialogue with medical and scientific experts. Their decisions have a profound impact on population morbidity and mortality.

급성 치료가 필요한 환자 급증과 같이 필요성이 높은 경우 의료 참여에 대한 조직 차원의 허가 자격은 필요에 따라 유연해질 수 있다. 면허 요건은 때때로 장애물이 될 수 있다

  • 외국 출신 의료 전문가의 경우, 대부분의 경우 의료 면허를 위한 국가시험이 있는데, 이것은 수십 년 전에 다른 나라에서 그들 자신의 면허 요건을 완료한 하위 전문가들에게는 충족되기 어려울 수도 있다. 
  • 동시에 그러한 하위 전문가들은 위기 관리에 도움이 될 관심 하위 영역(예: 집중 치료)에 대한 최근 경험을 가지고 있을 수 있다.

When the need is high, such as in situations in which a surge of patients require acute care, qualifications for organizational-level permission to participate in health care may become flexible out of necessity. Licensing requirements may sometimes be an obstacle.

  • Foreign medical specialists coming to most countries face the requirement of national examinations at the level of medical licensure, which may be difficult to meet for subspecialists who completed their own licensing requirements decades ago in another country.
  • At the same time, those same subspecialists may have recent experience in the subdomain of interest (e.g. intensive care) that would be helpful in the management of the crisis.

vii. 규제당국과 국회의원은 예를 들어 필요한 경우 더 작은 범위의 독립적 실무에 대해 제한된 면허를 가진 의사를 허가하기 위한 조건을 재고해야 하는가? 고급advanced 의학 학습자에게도 이런 일이 일어날 수 있을까요? COVID-19 대유행에서 볼 수 있듯이, 갑작스런 건강 재해로 인해 병원은 통상적인 훈련 없이 보건 전문가를 모집해야 할 수 있다. 이러한 필요를 충족시키기 위해 그림 1의 차원들을 고려해야 한다.

  • (a) (양적 및 질적으로) 추가 인력의 긴급 요구
  • (b) 작업의 위험(즉, 환자와 의료 종사자 모두의 치료 중 부작용의 위험) 및
  • (c) 재배치에 이용 가능한 자들의 경험 수준.

viii. Should regulators and lawmakers rethink the conditions for licensing physicians, for example, with restricted licences for a smaller scope of independent practice if needed? Could this happen with advanced medical learners? As seen in the COVID-19 pandemic, sudden health disasters can result in hospitals needing to recruit health professionals without the usual training. In meeting this need, the dimensions included in Figure 1 must be considered:

  • (a) the urgent need for extra hands (in quality and quantity),
  • (b) the danger of the work (i.e. the risks of adverse events during care for both patients and health care workers) and
  • (c) the level of experience of those available for redeployment.

세 가지 차원 모두 스케일 값을 가지며, 낮음 또는 높음일 수 있으며, 신중한 조합이 배포의 허용 가능성(또는 라이센스 정식 위탁)을 결정할 수 있습니다.

All three dimensions have scale values and may be low or high, and a thoughtful combination may determine the acceptability of deployment (or, if you will, formal entrustment with a license).

ix. 적절한 감염 관리 정책, 충분한 개인 보호 장비, 훈련 기회 및 보상 구조와 같은 의료 종사자의 재배치를 요청할 때 [지역, 주 및 연방 당국의 상호적인 의무]는 무엇인가? 이러한 부족한 인력을 법적 영향으로부터 보호하기 위해 재해가 의사들에게 현재 실무 범위를 초과하여 일할 것을 요구하는 경우(또는 규제자가 요구할 경우) 책임 규칙을 채택해야 하는가?
ix. What are the reciprocal obligations of local, state, and federal authorities when requesting redeployment of health care workers, such as adequate infection control policies, sufficient personal protective equipment, training opportunities, and reward structures (Antommaria 2020)? Should liability rules be adapted if a disaster demands (or a regulator requires) physicians to work beyond their current scope of practice, to protect these scarce workforces from legal repercussions?

x. 보건 위기가 지나가서, 의료 전문가의 필요성이 평상시 수준으로 돌아간 다음에는 어떻게 되어야 하는가? 위기의 대응으로 긴급 면허가 유지되어야 하는가? 아니면 유효기간이 있어야 할까? 위기 경험은 어떤 식으로든 믿을 수 있는가? 그리고 우리는 다음 위기에 더 잘 대비하기 위해 배운 교훈을 어떻게 이용할까?

x. What happens after the health crisis has passed, and the need for health care professionals returns to normal requirements? Does the emergency licensing done in response to the crisis persist? Or does it have an expiry date? Can crisis experiences be credentialed in any way? And how do we use the lessons learned to better prepare for the next crisis?

고찰 Discussion

산업화된 세계의 의사들과 교육자들은 예측 가능한 방향으로 의료 역량을 생각하기 위해 움직였을지도 모른다. COVID-19 위기는 새로운 질병이 어떻게 많은 문제를 야기하는지, 그리고 관리 권고안이 어떻게 수개월에 걸쳐 바뀔 수 있는지를 일반 대중에게 보여주었다. 이는 '유능한 의사'조차도 항상 무엇이 최선인지 알지 못하고 불확실성으로 압도될 수 있는 방법을 강조한다. 현재와 같은 위기상황에서, 어떻게 우리가 대응하도록 인력을 최적화할 수 있을까요?
Physicians and educators in the industrialized world may have moved to think of medical competence in a predictable direction. The COVID-19 crisis has revealed to the general public how a new disease creates many challenges and how recommendations for management can change over a period of months. This highlights how even ‘competent physicians’ do not always know what is best and can be overwhelmed with uncertainty. In a crisis like the current one, the question comes up: How can we optimize the workforce to respond?

우리의 관찰과 질문의 일반적인 결론은 [의료 기관]과 [규제 기관]뿐만 아니라 [의사]들도 사회의 건강 요구가 적응을 요구할 때 [개별적으로 그리고 집단적으로] 적응할 준비를 해야 한다는 것이다. 이것은 의료 능력 표준의 개념화에 영향을 미친다. COVID-19 위기는 이러한 표준이 이전에 생각했던 것보다 덜 정적인 것일 수 있다는 것을 알게 했다.

The general conclusion of our observations and questions is that physicians, as well as health institutions and regulatory bodies, should be prepared, individually and collectively, to adapt when the health needs of society call for adaptation. This has implications for the conceptualization of standards of medical competence. The COVID-19 crisis has made us aware that these standards may be less static than we previously believed.

 


Med Teach. 2021 Jul;43(7):817-823.

 doi: 10.1080/0142159X.2021.1928619. Epub 2021 May 27.

Questioning medical competence: Should the Covid-19 crisis affect the goals of medical education?

Olle Ten Cate 1Karen Schultz 2Jason R Frank 3Marije P Hennus 4Shelley Ross 5Daniel J Schumacher 6Linda S Snell 7Alison J Whelan 8John Q Young 9

Affiliations collapse

Affiliations

  • 1Center for Research Development of Education, University Medical Center Utrecht, Utrecht, The Netherlands.
  • 2Department of Family Medicine, Queen's University, Queen's University, Kingston, Canada.
  • 3Royal College of Physicians and Surgeons of Canada and Department of Emergency Medicine, University of Ottawa, Ottawa, Canada.
  • 4University Medical Center Utrecht, Utrecht, The Netherlands.
  • 5CBAS Program in the Department of Family Medicine, University of Alberta, Edmonton, Canada.
  • 6Division of Emergency Medicine, Cincinnati Children's Hospital Medical Center and the University of Cincinnati College of Medicine, Cincinnati, Ohio, USA.
  • 7Royal College of Physicians and Surgeons of Canada, McGill University, Montreal, Canada.
  • 8Association of American Medical Colleges, Washington DC, USA.
  • 9Department of Psychiatry, Donald and Barbara Zucker School of Medicine at Hofstra/Northwell and the Zucker Hillside Hospital at Northwell Health, Glen Oaks, NY, USA.
  • PMID: 34043931
  • DOI: 10.1080/0142159X.2021.1928619AbstractKeywords: Learning outcomes; curriculum; outcome-based.
  • The COVID-19 pandemic has disrupted many societal institutions, including health care and education. Although the pandemic's impact was initially assumed to be temporary, there is growing conviction that medical education might change more permanently. The International Competency-based Medical Education (ICBME) collaborators, scholars devoted to improving physician training, deliberated how the pandemic raises questions about medical competence. We formulated 12 broad-reaching issues for discussion, grouped into micro-, meso-, and macro-level questions. At the individual micro level, we ask questions about adaptability, coping with uncertainty, and the value and limitations of clinical courage. At the institutional meso level, we question whether curricula could include more than core entrustable professional activities (EPAs) and focus on individualized, dynamic, and adaptable portfolios of EPAs that, at any moment, reflect current competence and preparedness for disasters. At the regulatory and societal macro level, should conditions for licensing be reconsidered? Should rules of liability be adapted to match the need for rapid redeployment? We do not propose a blueprint for the future of medical training but rather aim to provoke discussions needed to build a workforce that is competent to cope with future health care crises.

When I say … 리커트 문항(Med Educ, 2021)
When I say … Likert item
Edward Krupat

 

 

정량 지향적인 연구자들은 설문지와 설문 조사 형태의 자기 보고 조치에 크게 의존한다. 특히 리커트 아이템을 이용해 태도와 신념을 평가하는 방식이 의대 교육자부터 여론 조사자까지 전 세계 연구진에 의해 채택됐다. 리커트 아이템이라는 용어는 1932년 유망한 젊은 사회과학자 렌시스 리커트가 자신의 논문에서 태도를 측정하는 새로운 방법의 사용을 소개한 것으로 거슬러 올라간다. 
Researchers who are quantitatively oriented rely greatly on self-report measures in the form of questionnaires and surveys. In particular, the use of Likert items to assess attitudes and beliefs has been adopted by researchers worldwide, from medical educators to public opinion pollsters. The term Likert item dates back to 1932 when a promising young social scientist, Rensis Likert, introduced the use of a new method to measure attitudes in his dissertation.

발명자의 이름을 딴 리커트 항목은 진술에 불과하며(예: 내 주치의에게 만족함), 강한 동의에서 강한 반대까지 다양한 옵션이 뒤따른다. 태도를 측정하는 다른 수단(아래 참조)이 존재하지만, 기술적으로 보자면, 리커트 문항은 독점적으로 이러한 형식만을 의미한다. 그럼에도 불구하고, 의학 교육 문헌에서 이 라벨은 종종 '라이커트 스타일'이라고 불리는 다양한 태도 항목 형식과 함께 매우 느슨하게 사용되어 왔다. 

Named after its inventor, a Likert item is nothing more than a statement (e.g., I am satisfied with my physician), followed by several options varying from Strongly Agree to Strongly Disagree.1 While other means of measuring attitudes exist (see below), technically, a Likert item refers exclusively to this format. Nonetheless, in the medical education literature, this label has been used very loosely, with a range of attitude item formats often referred to as ‘Likert style’. 

겉보기에는 간단해 보이지만, 리커트 항목과 리커트 척도의 사용(리커트 항목을 합치거나 조합한 결과)을 둘러싸고 많은 잘못된 정보와 논쟁이 존재한다. 첫째, 문자 그대로, 내가 "라이크-에르트"라고 말할 때, 나는 "라이크-에르트"가 아니라 "i"로 짧게 발음하는데, 이것은 전 세계의 많은 학식 있는 동료들이 저지른 실수이다. 이 발음의 이유는 간단합니다. 렌시스 리커트는 자기 이름을 '릭-에르트'라고 발음했다. 마치 'k' 앞에 'c'가 붙은 것과 같다. 우리도 그래야 한다.

Although seemingly straightforward, a good deal of misinformation and debate exists around the use of Likert items and Likert scales (which are the result of summing or combining Likert items). First, literally, when I say … Likert, I pronounce it Lick-ert, with a short ‘i’, not Like-ert (with a long ‘i’), a mistake made by so many of my learned colleagues around the world. The reason for this pronunciation is simple. Rensis Lickert pronounced his name ‘Lick-ert’, as if it had a ‘c’ before the ‘k’, and we should too. 

리커트 아이템은 찬성과 반대 의견의 다양한 이슈와 우려를 가지고 있습니다.2-4

  • 질문 중 하나는 얼마나 많은 선택지가 있어야 하는가 하는 것이다. 일반적인 관행은 4개보다 적지 않고, 7개를 넘지 않으며, 필자의 경험상 의학교육연구자는 4, 5개의 선택지를 사용하는 경향이 큰 반면, 더 넓은 사회과학계, 특히 심리학자와 사회학자들 사이에서는 6, 7개를 사용한다.
  • 선택한 숫자에 관계없이, 짝수 또는 홀수 수의 응답지 수를 선택할 경우 종종 동의 안 함으로 분류되는 중간점을 제공하는 것이 좋은 생각인지에 대한 의문이 제기된다. 설문 조사 실무자들 사이에 논쟁이 존재하며, 일부는 응답자들에게 자신의 태도가 진정으로 중립적이라는 것을 나타내는 방법을 제공하는 것이 더 낫다고 믿고, 다른 일부는 중간점이 단순한 중립성을 반영하지 않는 이유로 개인에 의해 종종 부적절하게 사용된다고 주장한다.5
  • 또한 리커트 항목 데이터를 분석하고 제시하는 방법에 대해서도 의견이 일치하지 않는다.6 일부에서는 빈도 및 백분율의 사용(카이-제곱과 같은 통계 사용)을 지지하지만, 다른 많은 사람들은 기술적으로는 선택사항이 구간 수준 데이터를 나타내지 않더라도 합계 및 평균이 계산되고 보고될 수 있다고 믿는다. 

Likert items come with a range of issues and concerns, pro's and con's.2-4 

  • One question is that of how many response alternatives there should be. The general practice is no less than four nor more than seven, and in my experience, medical education researchers greatly tend to use four or five options, whereas in the broader social science community, in particular among psychologists and sociologists, six or seven are used.
  • Regardless of the number chosen, the choice of whether to go with an even or odd number of alternatives raises the question of whether providing a midpoint, often labelled neither-agree-nor-disagree, is a good idea. Debates exist among survey practitioners, some believing that it is better to offer respondents a way of indicating that their attitude is truly neutral; others arguing that the midpoint is often used inappropriately by individuals for reasons that do not reflect simple neutrality.5 
  • Disagreement also exists as to how the Likert-item data should be analysed and presented.6 While some endorse the use of frequencies and percentages (using statistics such as chi-square), many others believe that sums and means can be calculated and reported (using statistics such as t-tests), even though technically, the choices do not represent interval-level data. 

또한 리커트 항목에서 파생된 가능한 편견에 대한 의문도 많다.

  • 한 가지 가능한 편견은, '묵인'으로서 사람들이 진술에 부동의하기보다는 동의하는 경향을 의미한다.
  • 또 다른 [사회적 만족도 편향]은 사람들이 자신의 '진정한' 반응보다는 다른 사람들이 듣고 싶어한다고 믿는 대답을 제공하는 경향이 있다는 것이다.
  • '자대고 긋기straightlining'를 생성하는 응답 집합은 여러 항목이 모두 같은 방향으로 단어화될 때 지나치게 일관된 방식으로 답하는 경향이다. 비록 일부에서는 '아니오'를 문장에 삽입하여 항목의 의미를 되돌리려고 시도했지만, 이것이 형편없는 해결책이라는 증거가 존재한다.7
    • 선호하는 관행은 일부와 동의하지만 다른 사람들과의 의견 불일치가 유사한 태도를 나타내는 항목을 작성하는 것이다. 예를 들어, '진료 중 환자와 의사는 동등해야 한다' 항목에 동의하는 것과  '의사가 진료면담에 책임이 있다'는 의견에 부동의하는 것은 둘 다 환자-중심적 지향성의 표현일 수 있습니다.

Questions also abound about possible biases deriving from Likert items.

  • One possible bias results from response acquiescence, the tendency of people to agree with statements rather than disagree.
  • Another, the social desirability bias, is the tendency for people to provide answers they believe others want to hear rather than their ‘true’ responses.
  • Response set, which generates ‘straightlining’, is a tendency to answer multiple items in an overly consistent manner when all are worded in the same direction. Although some have attempted to reverse an item's meaning by inserting ‘not’ into the statement, evidence exists that this is a poor solution.7
    • A preferred practice is to write items such that agreement with some, but disagreement with others, indicate a similar attitude (e.g., agreement with the item ‘Patients and their doctors should be seen as equals during a visit’ but disagreement with ‘The doctor should be in charge of the medical interview’ would both be expressions of a patient-centred orientation). 

최근 리커트 항목에 대한 회의적인 시각으로 인해 대안적 유형의 접근법, 특히 '항목-특이적item-specific'(IS) 형식의 사용에 대한 논란이 일고 있다. 이와 같은 항목은 질문 초점의 함수로 다양한 응답 대안과 함께 문제를 제기한다. 예를 들어, 의대생들을 대상으로 설문조사를 할 때, 찬성 또는 반대와 관련된 선택사항에 따라 '나는 환자에게 나쁜 소식을 효과적으로 전달할 수 있다'는 진술보다는, IS의 지지자들은 '당신은 얼마나 자주 나쁜 소식을 환자에게 효과적으로 전달합니까?'와 같은 진술과 그 다음 '항상 그러함'에서 '절대 안 함'까지 다양한 선택을 추천할 것이다. IS 항목에는 대응 옵션 사용의 통일성이 잠재적으로 결여되어 교차 연구 비교를 어렵게 하는 것과 같은 가능한 문제가 있다. 예를 들어 빈도를 측정할 때 '빈번히', '종종', '대부분의 시간' 사이의 동등성을 확인하기는 어렵다.

Recently, scepticism about Likert items has led to debate about the use of alternative types of approaches, in particular the use of ‘Item-Specific’ (IS) formats. Items such as these pose a question, with response alternatives that vary as a function of the question's focus. In surveying medical students, for example, rather than providing the statement, ‘I can deliver bad news to patients effectively’, followed by options involving agreement or disagreement, IS proponents would recommend something such as, ‘How often do you deliver bad news to patients effectively?’ followed by choices that might range from Always to Never. IS items have their own possible problems, such as potential lack of uniformity in the use of response options, which would make cross-study comparison challenging. In measuring frequency, for instance, the equivalence among ‘frequently’, ‘often’ and ‘much of the time’ is difficult to ascertain.

Artino 등과 같이 의학 교육의 일부 연구자들은, 설문 조사 연구 설계에서 이러한 형태의 항목을 사용하는 것은 '문제Pitfall'중 하나로 지적하며, 동의-부동의 항목의 지속적인 사용에 대해 강한 (반대적) 입장을 취해왔다. 8 이러한 저자들이 방법론적 전문지식과 지식을 갖춘 사회 과학자들에 의해 논문을 인용하는 만큼, 이에 대한 정보는 다른 질문 형식을 사용하여 비교 연구에 집중하는 [조사 방법론자]와 [미국 여론 조사 협회와 같은 조직]의 회의에 정기적으로 참석하는 전문가에 의해 생성된 증거에서 나온다. 
Some in medical education have taken a strong position on the continued use of agree–disagree items, such as Artino et al, who have listed the use of this form of item as a ‘pitfall’ in survey research design.8 As much as these authors are respected for their methodological expertise and cite papers by informed social scientists,9 the ultimate source of information about this comes from the evidence generated by those survey methodologists who focus on comparative research using different question formats, professionals who regularly attend meetings of organisations such as the American Association of Public Opinion Research.

현재 증거의 상태를 요약한 매우 최근 그리고 철저한 리뷰에서, Dykema 등은 우리에게 다음과 같이 말한다.

  • (1) 증거 기반은 여전히 작고 잠정적이며, 연구 설계의 문제점과 혼란으로 인해서 결론을 쉽게 내리기 어렵다.
  • (2) 여러 연구에 따르면, 어떤 리커트 형식이 사용되었는지를 비교했을 때, 차이 또는 비교상의 긍정적 효과는 없다.
  • (3) 상당한 증거는 분명히 IS 질문의 방향으로 진행되고 있다.

In a very recent and thorough review summarising the state of the current evidence, Dykema et al tell us that

  • (1) the evidence base in still small and tentative, and problems and confounds in research design limit easy conclusions;
  • (2) several studies show no differences or comparative positive effects resulting from the comparative use of the Likert format; however,
  • (3) the preponderance of evidence is definitely trending in the direction of IS questions.

 

수년 동안 데이터의 신뢰성과 타당성에 대한 큰 걱정 없이 동의-불합치 형식을 사용하여 설문조사를 설계해 온 필자는 데이터 중심적이어야 하며, 근거의 무게가 명확하고 일관될 때까지 오랜 접근 방식을 단순히 거부해서는 안 된다고 굳게 믿고 있다. 만약 당신이 '얼마나 자주 항목특이적IS 질문을 사용할 생각인가'라는 질문을 한다면, 제 개인적인 대답은 '자주Often'일 것입니다. 그러나 만약 '동의-불합치 항목이 공룡처럼 멸종되어야 한다'는 문장이 있다면, 내 대답은 '강력히 동의하지 않는다'일 것이다.

Having for many years designed surveys using the agree–disagree format without great concern for the reliability and validity of the data, I am a strong believer that we should be data driven, and not simply reject long-standing approaches until the weight of the evidence is clear and consistent. If you presented me with the question, ‘How often do you intend to employ Item-Specific questions’, my personal response would be ‘Often’. Yet, if presented with the statement: ‘Agree–disagree items should go the way of the dinosaurs’, my response would be ‘Strongly Disagree’. 


Med Educ. 2021 Sep 6.

 doi: 10.1111/medu.14660. Online ahead of print.

When I say … Likert item

Edward Krupat 1

Affiliations expand

다중 비교에 관한 팩트와 픽션(J Grad Med Educ, 2021)
Facts and Fictions About Handling Multiple Comparisons
Gail M. Sullivan, MD, MPH
Richard S. Feinn, PhD

 











한 가지 측면은 많은 비교를 이용한 분석과 관련이 있다. 다중 독립 비교를 고려하지 않는 교육자와 연구자는 다음과 같은 검토자의 의견을 받을 수 있다. 

  • 얼마나 많은 비교를 할 계획이었나요? 
  • 이러한 다중 비교를 위해 어떻게 조정했습니까? 또는 
  • 다중 비교가 통계적 추론에 어떤 영향을 미칩니까? 

One aspect concerns analyses using many comparisons. Educators and researchers who do not take into account multiple independent comparisons may receive reviewer comments such as:

  • Where did you prespecify how many comparisons you planned to make?
  • How did you adjust for these multiple comparisons? or
  • How do the multiple comparisons affect your statistical inferences?

다중 비교를 고려하지 않으면 내부 타당성에 대한 의문이 제기될 수 있습니다(즉, 이러한 결과가 실제로 사실입니까?). 또한 검토자와 저자의 관점에서 저자에 대한 신뢰도를 낮출 수 있다(이 작가들은 그들이 뭘 하는지 알고 있을까? )임상의와 교육자로서 우리는 이러한 문제와 투명하고 잘 다루지 않을 경우 연구나 논문을 파멸시킬 수 있는 방법에 대해 잘 알지 못할 수 있다.

Not considering multiple comparisons can raise questions of internal validity (ie, are these findings actually true?). It can also lower, in the minds of reviewers and authors, confidence in the authors: Do these authors know what the heck they're doing? As clinicians and educators we may be less aware of these issues and how they can doom a study or paper if not handled transparently and well.

정량적 논문을 고려할 때 다음과 같은 3가지 질문이 즉시 제기된다. 

  • (1) 본 논문은 내 환경 또는 교육생(외부 타당성, 일반화 가능성)에 적용되는가? 
  • (2) 연구 대상 전체 모집단에 대한 우연 또는 사실로 인한 발견인가(위양성 대 실제 양성 발견) 및 
  • (3) 소견의 크기 또는 의미(효과 크기)는 어느 정도인가?1  

이 사설은 많은 작가들에게 성배인 두 번째 이슈에 대해 간략하게 소개합니다: 상당한 P 레벨입니다.


When considering a quantitative paper, 3 questions immediately arise:

  • (1) Does this paper apply to my setting or trainees (external validity, generalizability);
  • (2) Are the findings likely due to chance or true for the overall population being studied (false vs true positive finding); and
  • (3) How large or meaningful are the findings (effect size).1  

This editorial provides a brief introduction to the second issue, the holy grail for many authors: a significant P level.

기본으로 돌아가기
Back to Basics

왜 우리는 P 레벨을 소중히 여기는가? 두 평균을 비교하는 단일 비교부터 시작합시다. 내과 레지던트 그룹이 고가의 이사회 검사 준비 과정을 수강했지만 유사한 레지던트 그룹이 수강하지 않았다고 가정하고, 그룹 간 이사회 점수 평균을 비교하여 이 과정을 계속 진행해야 하는지 여부를 결정하려고 합니다. 귀무 가설이 참이라고 가정하면(즉, 그룹 간에 차이가 없다), P 값은 선택된 거주자(모든 전공의의 무작위 표본)가 적어도 발견된 크기의 두 가지 이사회 점수 수단에서 차이를 생성할 확률이다.
Why do we cherish P levels? Let's start with a single comparison, comparing 2 means. Suppose a group of internal medicine residents took an expensive board examination prep course and a similar group of residents did not, and we want to compare board score means between groups to determine if the course should be continued. If we assume that the null hypothesis is true (ie, there is no difference between the groups), the P value is the probability that our selection of residents—a random sample of all residents—produced a difference in the 2 board score means of at least the size found.

제1종 오류(alpha)는 연구팀이 합당하다고 인정하는 오류의 수준으로, 통계시험을 실시하기 전에 이를 선택해야 한다. 즉, 실제로 차이가 없을 때 그룹 간에 차이가 존재한다고 결론을 내릴 확률이다. 통계 테스트의 P 수준이 선택한 오류 수준보다 작은 경우(보통 5%(0.05)), 테스트 차이는 보드 준비 과정이 아니라 전공의의 선택으로 인해 발견된 차이(전체 모집단을 연구할 수 없기 때문에)일 5%의 확률만 갖는 것으로 본다. (즉, 시험 점수 차이가 우리 연구를 위해 선택된 거주자 때문에 발생할 5% 확률, 즉 우연에 의해서만 발생).

Type I error (alpha) is the error level deemed reasonable by the research team, who must select it before conducting the statistical test. It is the probability of committing a false positive error: in other words, of concluding that a difference between groups exists when there is truly no difference. If the P level from the statistical test is less than the selected error level, usually 5% (.05), we view the test difference as having only a 5% chance that the difference found is due to the selection of residents (as we cannot study the entire population) rather than the board prep course (ie, a 5% chance that the test score difference is due to the residents selected for our study, ie, by chance alone).

하지만 이 값비싼 이사회 준비 과정의 대상이 누구인지를 이해하는 데 중요한 추가 요소를 살펴보려면 어떻게 해야 할까요? 예: 교육 중 시험 점수, 레지던트 나이 및 성별, 미국 의대 졸업자 대 국제 의대 졸업자, 레지던트 중 마일스톤 등급(Milestones leveling) 또는 선호되는 아침식사 음료? 우리가 환자를 위한 많은 실험실 검사를 주문할 때도 이러한 문제가 발생할 수 있습니다.

But what if we wish to look at additional factors that might be important to understanding who should be targeted for this expensive board prep course? For example: in-training examination scores, resident age and gender, US medical graduate vs international medical graduate, Milestones ratings during residency—or preferred breakfast drink? These issues can occur when we order many lab tests for a patient, too.

 알파 또는 I형 오류 수준이 비교 시마다 0.05로 유지되면 하나 이상의 "통계적으로 유의한" 결과가 나올 확률은 5% 이상 증가합니다(그림 참조). 예를 들어, 10개의 비교의 경우 검사 중인 요인이 아닌 랜덤하게 선택된 주민 모집단(즉, 우연히)으로 인해 적어도 하나의 "통계적으로 유의한"(P < .05) 비교를 찾을 확률이 40%로 증가합니다. 
13개의 독립적인 비교의 경우, 우연히 "유의한" P 수준을 찾을 확률은 50%로 증가합니다.2  이러한 값을 familywise error rate이라고 하며, 이는 family of comparison에 의해 발생한다. 

If the alpha or type I error level remains at .05 for each comparison, the probability of at least one finding being “statistically significant” increases above 5% (see Figure). For example, for just 10 comparisons, the probability rises to 40% that you will find at least one “statistically significant” (P < .05) comparison that is due to the population of residents randomly selected rather than the factor under examination—that is, by chance. For 13 independent comparisons, the probability of finding a “significant” P level by chance increases to 50%.2  These are called family-wise error rates, for a family of comparisons.

아침 식사로 차를 마시는 전공의가 이 보드 준비 과정을 수강하는 데 가장 적합한 대상이라고 잘못 결론을 내릴 수 있는 것이다.

You could erroneously conclude that residents who drink tea for breakfast are the best target for taking this board prep course—and create tortured explanations for this finding in your Discussion section.

 

 

통계적 유요성은 허용 오차 수준(알파 또는 유형 I 오류)에 의해 결정되며, 표본 모집단이 전체 모집단과 유사할 가능성(예: 여러 기관에서 2020-2021년 내과 레지던트들이 모든 내과 레지던트들과 유사)을 반영한다는 점을 기억하라. 이 다중 비교 문제는 95% 신뢰 구간과도 관련이 있습니다. 다중 비교를 수행하고 각 비교에 대해 평균 차이의 95% 신뢰 구간을 생성하면 모든 구간에 평균의 실제 차이가 포함될 확률은 95% 미만입니다.
Remember that statistical significance is determined by the level of error accepted (alpha or type I error) and reflects the likelihood that the sampled population resembles the entire population (eg, that internal medicine residents in 2020–2021 at several institutions resemble all internal medicine residents). Note that this issue of multiple comparisons also pertains to 95% confidence intervals. If multiple comparisons are performed and a 95% confidence interval of the difference in means is created for each comparison, the probability that all the intervals will contain the true difference in means will be less than 95%.

극단적인 예로, 게놈 전체 연관 연구(GWAS)를 수행하는 연구자들이 다중 테스트에 적응하지 않았다고 가정해 보자. GWAS는 질병과의 연관성에 대해 100,000개의 다른 위치를 검사할 수 있다. 각 위치에 0.05의 알파 수준을 사용한 경우 위양성 값이 많이 나올 수 있습니다.

As an extreme example, imagine if researchers conducting genome-wide association studies (GWAS) did not adjust for multiple testing. GWAS may test 100 000 different loci for an association with a disease. If an alpha level of .05 was used for each locus you can guarantee there would be numerous false positives.

낚시 원정대 및 P-해킹
Fishing Expeditions and P-Hacking

낚시 탐험대 또는 [P-해킹]이라는 용어는 연구자들이 독립변수와 종속변수의 관계에 대한 모든 가능한 비교에 대해 그들의 데이터를 검사할 때를 가리킨다. 

  • 독립 변수(예: 인구통계학적 요인, 대학원생 수준, 전문성, 학부 위치, 레지던트 순환) 
  • 종속 변수(예: 웰빙 지수, 번아웃 지수, 번아웃 서브그룹 요소, 워라밸 지수) 

더 많이 비교할수록 P 수준 < .05가 비교 대상으로 발견될 가능성이 높으며, 귀무 가설(즉, 차이 없음)은 부정확하게 기각될 수 있다. 이 용어들은 일반적으로 경멸적이며, 예를 들어 논문의 요약 또는 결과 섹션과 같이 중요한 결과만 보고되는 경우를 위해 남겨둔다.
The terms fishing expedition or P-hacking refer to when researchers examine their data for every possible comparison of independent variables (eg, numerous demographic factors, postgraduate year levels, specialties, undergraduate locations, residency rotations) and/or dependent variables (eg, well-being index, burnout index, burnout subgroup elements, work-life balance index). The more comparisons, the more likely a P level of < .05 will be found for a comparison, and the null hypothesis (ie, no difference) may be rejected inaccurately. These terms are generally pejorative and reserved for when only the significant findings are reported, for example in the Abstract or Results section of a paper.

이 문제는 [흥미로운 발견을 어디서 찾을 수 있을지에 대한 기대 없이 완전히 새로운 질문을 탐구할 때]에는 피할 수 없을지도 모른다. 그러나 의학 교육에서 이것은 거의 사실이 아니다; 우리는 보통 이전의 연구나 그럴듯한 이론에 근거한 가설을 가지고 있다. '낚시'가 나타나는 것을 피하려면 '방법' 섹션에서 자신의 접근 방식에 대한 문헌과 이론적 틀을 바탕으로 계획된 비교를 미리 규정하는 것이 최선이다. 이 fishing의 문제는 임상시험에서 충분히 자주 발견되어 이제 연구자들이 데이터를 수집하고 분석하기 전에 주요 결과물을 공공 사이트(clinicaltrials.gov)에 게시하는 것이 의무화 되었다. 데이터를 본 후에는 분석을 추가하고 싶은 유혹을 이겨내십시오!
This problem may be inevitable when exploring entirely new questions with no expectation of where the interesting findings may lie. However, in medical education this is rarely true; we usually have hypotheses based on prior work or plausible theory. To avoid the appearance of “fishing,” it is best to prespecify, based on the literature and theoretical framework for your approach, your planned comparisons in the Methods section. This fishing problem was found often enough in clinical trials that it is now mandatory for researchers to post the primary outcome(s) on a public site (clinicaltrials.gov) before the data are collected and analyzed. Resist the temptation to add additional analyses after you have seen the data!

그럴듯한 사전 가설이 없는 경우 많은 비교를 수행하고, 관련된 P 수준 및 신뢰 구간과 함께 모든 가설을 보고하고, 방법 절에 탐색 가설이며, 이러한 이유로 다중 비교를 조정하지 않았다고 기술할 수 있습니다. 검정 횟수가 증가함에 따라 모임별 오류율도 증가하므로 이러한 상황에서는 추론을 그리는 데 주의해야 합니다.
When there are no plausible prior hypotheses, it can be acceptable to make many comparisons, report all of them with the associated P levels and/or confidence intervals, and state in your Methods section that these were exploratory hypotheses and that no adjustment for multiple comparisons was made for this reason. Be cautious in drawing inferences in these situations: as the number of tests expands, so does the family-wise error rate.

비교 및 사전 계획 분석을 제한하는 이유
Why to Limit Comparisons and Pre-Plan Analyses

프로젝트를 준비하기 위한 첫 번째 단계는 문헌에 대한 심층적인 검토입니다.

  • 다른 연구자들은 어떤 방법을 사용했나요?
  • 어떤 이론이 다른 접근법을 뒷받침할 수 있는가?
  • 우리의 지식에는 어떤 gap이 있을까요?

In preparing for a project, the first step is a deep dive into the literature:

  • What methods did other researchers use?
  • What theories may support different approaches?
  • What gaps remain in our knowledge?

종종 이전 작업은 다음 단계로 구체적인 방향이나 질문을 제공합니다. 따라서 계획된 데이터 분석뿐만 아니라 데이터 수집도 제한할 수 있습니다. 데이터가 이미 수집되었다면(예: 의학대학원 교육 인증 위원회 및 국가 프로그램 관리자 그룹에는 방대한 데이터 수집이 있다), 질문에 답변하는 데 필요한 사항을 신중하게 선택하십시오.

Often prior work will provide you with specific directions or questions as next steps. This in turn will help you limit the collection of data as well as planned analyses of the data. If data were already collected (eg, Accreditation Council for Graduate Medical Education and national program director groups have enormous data collections to explore), choose carefully what you need to answer your question(s).

여기 문제가 있다: 다중 비교를 수정하지 않으면 복제 스터디에서 다른 연구자는 발견하지 못하는 위양성 결과를 찾을 위험이 있습니다. 다중 비교를 수정하면 실제로 존재하는 차이를 찾을 수 있는 통계적 검정력이 손실됩니다(위음성). 따라서, 당신의 질문에 가장 적합한 것으로 당신의 비교를 제한하세요.
Here's the conundrum: If you don't correct for multiple comparisons, you risk finding “significant” results that are false positives and that will not be found by others in replication studies. If you do correct for multiple comparisons, you lose statistical power to find differences that actually exist (false negatives). Ergo, limit your comparisons to what fits your questions best.

비교에 대한 수정이 필요하지 않은 경우도 있습니다. 예를 들어, [새로운 경험적 오리엔테이션 프로그램]이 현재 [미국 정신건강의학 인턴]에서 [6개월째에 집계된 전문직업성 마일스톤]에 미치는 영향을 보고 있다고 생각해 보십시오. 인턴들 중 절반은 새로운 일주일간의 체험 오리엔테이션을 받고, 나머지 절반은 대규모 그룹 오리엔테이션과 가상 오리엔테이션을 병행한다. 경험적 오리엔테이션 프로그램을 받은 사람들은 P < .05 수준에서 유의미하게 더 높은 점수를 받는다.
Correction for a comparison may not be needed in some instances. For example, consider that you are looking at the effects of a new experiential orientation week on intern performance on aggregated professionalism milestones at 6 months, in current US psychiatry interns. Half of the interns receive the new week-long experiential orientation, and the other half receive a combination of large group and virtual orientation sessions. Those with the experiential orientation score significantly (and meaningfully) higher at the P < .05 level.

아래의 하위그룹에 대해서 이차 분석을 계획합니다.

  • 국제 의학 졸업생 대 미국 의학 졸업생,
  • 남자 대 여자,
  • 나이가 많은(30세) 대 어린(31세),
  • USMLE 1단계 5분위수 및
  • 대학 기반 프로그램과 비대학 기반 프로그램의 사용자.

You plan secondary analyses to look at subgroups:

  • international medical graduates vs US medical graduates,
  • male vs female,
  • older (> 30) vs younger (< 31 years),
  • USMLE Step 1 quintile, and
  • those at university-based vs non-university-based programs.

이 예에서는 2차 분석에서는 다중 비교를 위해 조정이 필요할 수 있지만, 1차 분석에서는 correction이 필요하지 않다.
In this example, it is not necessary to correct for the primary analysis, although the secondary analyses may require adjustment for multiple comparisons.

다중 비교 처리 전략
Strategies for Handling Multiple Comparisons

계획 중인 가장 중요한 비교를 고려한 후 여러 개 이상의 비교를 수행할 경우 다중 비교를 반영하도록 분석을 조정하는 것을 고려해야 합니다. 비교할 항목을 결정하기 전에 데이터를 살펴본다면 이미 다중 비교를 수행한 것입니다. 우리는 당신이 진정으로 탐구적인 연구를 수행하는 것이 아니라면 이것을 하지 말 것을 제안합니다.
After considering the most important comparisons you plan to make, if you have more than a few, you should consider adjusting your analysis to reflect the multiple comparisons. (Remember that if you look at your data before deciding what comparisons to make, you have already made multiple comparisons. We suggest not to do this unless you are performing truly exploratory research.)

고려해야 할 많은 방법들이 있고, 전문은 물론 수많은 글들이 잘 묘사되어 있다. 이 가운데 본페로니 교정은 의학 교육에 많이 쓰인다. 본페로니 교정은 알파를 계획된 비교 횟수로 나누어 알파 수준(오류)을 하향 조정한다. 10개 비교의 경우 유형 I 오차가 0.05인 경우 수정된 알파 수준은 .05/10 또는 .005입니다. 이를 비교 오류율이라고도 합니다. 본페로니 교정은 기억하기 쉬워서 인기가 있지만, 특히 협회가 사실 서로 독립적이지 않을 경우 지나치게 보수적이다. 따라서 유형 II 오류(위음성)로 이어질 수 있다. 이 일반적인 접근법에는 많은 수정 사항이 있으며, 일부는 덜 보수적인 조정을 사용한다(예: 벤자미니-호흐버그 방법)은 일차 가설과 이차 가설의 알파 수준을 변화시키거나 모든 검정의 알파 수준을 더 낮은 알파 수준으로 변화시킨다(예: 0.05 대신 0.01).

There are many methods to consider, and full texts as well as numerous articles describe them well. Of these, the Bonferroni correction is often used in medical education. The Bonferroni correction adjusts the alpha level (error) downward by dividing alpha by the planned number of comparisons. For 10 comparisons, with a type I error of 0.05, the corrected alpha level is .05/10 or .005. This is sometimes termed the comparison-wise error rate. The Bonferroni correction is easy to remember and thus popular, but it is overly conservative, especially if the associations are not in fact independent of each other. Thus, it can lead to a type II error (falsely accepting the null hypothesis of no association). There are many modifications of this general approach; some include using a less conservative adjustment (eg, Benjamini–Hochberg method), varying the alpha level for primary and secondary hypotheses, or switching to a lower alpha level for all tests (eg, .01 instead of .05).

하지만 우리가 비교하고자 하는 다양한 비교가 서로 독립적이지 않다면 어떨까요? 아니면 우리가 25와 같이 많은 수의 비교를 한다면 어떨까요? 독립 변수 및 종속 변수가 상관관계가 있는 경우와 수많은 검정이 수행되는 상황에 대한 방법이 있습니다. 이 소개 기사의 범위를 벗어나, 독자들이 다중 비교와 방법을 지원할 수 있는 다양한 접근 방식에 대해 자세히 알아볼 수 있는 좋은 자료가 많이 있습니다(자료 참조).
But what if the various comparisons we want to make are not independent of each other? Or what if we are making a large number of comparisons, such as 25? There are methods for when independent and/or dependent variables are correlated and situations where numerous tests are performed. While beyond the scope of this introductory article, there are many good resources for readers to learn more about multiple comparisons and the various approaches that can support your methods (see Resources).

제한 사항에 대해 논의하는 방법
How to Discuss in Limitations

지금까지 살펴본 바와 같이, 데이터를 조사하기 전에(최적으로 데이터를 수집하기 전에) 결정을 내려야 하며, 이러한 결정이 결과의 "진실truth"에 영향을 미칠 수밖에 없습니다. 방법 섹션에서 비교 및 알파 오차 수준을 선택하여 추론을 명확하게 제시합니다. 그런 다음 토론 섹션에서 잘못된 긍정(우연히 관측된 차이) 또는 잘못된 부정(존재하나 찾지 못한 차이) 중 어느 방향으로든 결정이 결과에 영향을 미칠 수 있는 방법을 고려하십시오. 이 후자의 문제는 유형 II 오류(베타)의 결과로 더 자주 발생하며, 우리는 이를 다음 논의를 위해 저장해 둘 것이다. 방법의 결정으로 인한 잠재적 효과를 투명하게 나열하면 검토자, 편집자 및 독자의 관점에서 신뢰성이 향상되며, 장황할 필요도 없습니다. '지나친' 투명성은 '너무 적게'은 투명성보다 좋고, 과도한 단어는 개정 과정에서 싹쓸이할 수 있다.
As you have seen, decisions must be made before examining your data—optimally before even collecting your data—that will inevitably affect the “truth” of your findings. Clearly present your reasoning in choice of comparisons and alpha error levels in the Methods section. Then, in the Discussion section, consider how your decisions may have affected your findings in either direction: false positives (differences observed that are actually due to chance) or false negatives (no difference found when one does exist). This latter problem more often occurs as a result of a type II error (beta), which we will save for another discussion. Laying out the potential effects of your methods' decisions in a transparent way enhances credibility in the eyes of reviewers, editors, and readers, and does not have to be lengthy. It's better to have “too much” transparency vs “too little,” and any excess words can be trimmed away in the revision process.

결론들
Conclusions

이 기사는 의학교육연구에서 다중비교라는 주제를 거의 다루지 않는다. 교육자와 연구자들이 발표나 출판을 위해 기사를 읽고, 분석을 고려하고, 작품을 작성할 때 이 문제를 염두에 둘 수 있도록 인지도를 높였으면 한다. 가장 중요한 항목:
This article barely scratches the surface of the topic of multiple comparisons in medical education research. We hope to raise awareness so that educators and researchers keep this issue in mind when reading articles, considering analyses, and writing up their work for presentations or publications. Most important:

  • 시작할 때 비교를 미리 계획합니다. 아직 분석하지 않았지만 분석을 수행하기 전에 데이터를 검토한 경우에는 이러한 사후 분석을 가능한 모든 비교로 간주하십시오.
  • 비교가 서로 독립적일 가능성이 높은지 또는 일부 비교가 서로 관련이 있을 수 있는지 판단합니다.4 
  • 여러 가지 비교를 위해 알파 수준(오차)을 조정하는 것을 고려해 보십시오.
  • 방법 섹션에서 결정을 명확하게 제시합니다.
  • 자신의 방법이 토론에서 발견한 내용에 어떤 영향을 미쳤는지 토론합니다.
  • 의심스러울 때는 친절한 생물통계학자 한 명에게 물어보세요.
  1. Preplan your comparisons at the start. If you have not, but have examined the data before deciding which analyses to make, consider these post-hoc analyses as all possible comparisons.
  2. Decide if your comparisons are likely independent of each other or if some may be related to each other.4 
  3. Consider adjusting your alpha level (error) for more than a few comparisons.
  4. Present your decisions clearly in the Methods section.
  5. Discuss how your methods may have affected your findings in the Discussion.
  6. When in doubt, ask a friendly biostatistician.

 


A general introduction to adjustment for multiple comparisons

Shi-Yi Chen,1 Zhe Feng,2 and Xiaolian Yi3

Abstract

In experimental research a scientific conclusion is always drawn from the statistical testing of hypothesis, in which an acceptable cutoff of probability, such as 0.05 or 0.01, is used for decision-making. However, the probability of committing false statistical inferences would considerably increase when more than one hypothesis is simultaneously tested (namely the multiple comparisons), which therefore requires proper adjustment. Although the adjustment for multiple comparisons is proposed to be mandatory in some journals, it still remains difficult to select a proper method suitable for the various experimental properties and study purposes, especially for researchers without good background in statistics. In the present paper, we provide a brief review on mathematical framework, general concepts and common methods of adjustment for multiple comparisons, which is expected to facilitate the understanding and selection of adjustment methods.

Introduction

The statistical inference would be a critical step of experimental researches, such as in medicine, molecular biology, bioinformatics, agricultural science, etc. It is well acceptable that an appropriate significance level α, such as 0.05 or 0.01, is pre-specified to guarantee the probability of incorrectly rejecting a single test of null hypothesis (H0) no larger than α. However, there are many situations where more than one or even a large number of hypotheses are simultaneously tested, which is referred to as multiple comparisons (1). For example, it is common in clinical trials to simultaneously compare the therapeutic effects of more than one dose levels of a new drug in comparison with standard treatment. A similar problem is to evaluate whether there is difference between treatment and control groups according to multiple outcome measurements. Due to rapid advances of high-throughput sequencing technologies, it is also common to simultaneously determine differential expression among tens of thousands of genes.

The statistical probability of incorrectly rejecting a true H0 will significantly inflate along with the increased number of simultaneously tested hypotheses. In the most general case where all H0 are supposed to be true and also independent with each other, the statistical inference of committing at least one incorrect rejection will become inevitable even when 100 hypotheses are individually tested at significance level α=0.05 (Figure 1). In other words, if we simultaneously test 10,000 true and independent hypotheses, it will incorrectly reject 500 hypotheses and declare them significant at α=0.05. Of course, estimation of error rate would become more complex when hypotheses are correlated in fact and not all of them are true. Therefore, it is obvious that the proper adjustment of statistical inference is required for multiple comparisons (2). In the present paper, we provide a brief introduction to multiple comparisons about the mathematical framework, general concepts and the wildly used adjustment methods.

 

Mathematical framework

For a simultaneous testing of m hypotheses, the possible outcomes are listed in Table 1. Let’s suppose that the number of true H0 is m0, which is an unobservable random variable (0≤m0≤m). After performing statistical inferences we totally found R H0 being rejected and declared significant at the pre-specified significance level; and herein R is an observable random variable (0≤R≤m). Among the statistically rejected hypotheses of R, when R>0, we suppose that there are U H0 that have been incorrectly rejected. Similar to m0, U is also an unobservable random variable with equal to or larger than 0. Accordingly, counts of other possible outcomes could be deduced, including the correctly rejected H0 (R- U), correctly retained H0 (m0-U), and incorrectly retained H0 (m-R-m0+U).

Type I and II errors

For the statistical inference of multiple comparisons, it would commit two main types of errors that are denoted as Type I and Type II errors, respectively. The Type I error is that we incorrectly reject a true H0, whereas Type II error is referred to a false negative. Because the exact numbers of Type I and Type II errors are unobservable (as denoted in Table 1), we would intend to control the probability of committing these errors under acceptable levels. In general, the controlled probabilities of committing Type I and Type II errors are negatively correlated, for which therefore we must determine an appropriate trade-off according to various experimental properties and study purposes. If a significant conclusion has important practical consequence, such as to declare an effective new treatment, we would control Type I error more rigorously. On the other hand, we should avoid committing too many Type II errors when it intends to obtain primary candidates for further investigation, which is very common in studies of genomics. Here, we specially address the controlling of Type I error because it considerably increases for multiple comparisons.

 

Adjusted P value or significance level

In statistical inference, a probability value (namely P value) is directly or indirectly computed for each hypothesis and then compared with the pre-specified significance level α for determining this H0 should be rejected or not (3). Therefore, there are two ways for adjusting the statistical inference of multiple comparisons.

  • First, it could directly adjust the observed P value for each hypothesis and keep the pre-specified significance level α unchanging; and this is herein referred to as the adjusted P value.
  • Second, an adjusted cut-off corresponding to the initially pre-specified α could be also computationally determined and then compared with the observed P value for statistical inference.

In general, the adjusted P value is more convenient because in which the perceptible significance level is employed. However, it would be difficult or impossible to accurately compute the adjusted P value in some situations.

Measures accounting for Type I error

According to possible outcomes of multiple comparisons (Table 1), all efforts would be paid to the control of variable U, for which therefore various statistical measures have been proposed to account (4). Certainly, each of these measures has differential applications with respective strengths and weaknesses.

A simple and straightforward measurement is the expected proportion of variable U among all simultaneously tested hypotheses of m, which is referred to as the per-comparison error rate (PCER):

If each hypothesis is separately tested at significance level α, PCER will be equal to α when all H0 are true and independent with each other. Obviously, it becomes PCER=αm0/m≤α when not all H0 are true in fact. However, control of PCER would be less efficient because we would obtain at least one false positive at significance level α=0.05 when 20 true H0 are simultaneously tested.

In practical applications, it is more reasonable to jointly consider all hypotheses as a family for controlling Type I error; and therefore the most stringent criterion is to guarantee that not any H0 is incorrectly rejected. Accordingly, the measure of familywise error rate (FWER) is introduced and defined as the probability of incorrectly rejecting at least one H0:

The control of FWER has been widely used especially when only a few or at most several tens of hypotheses are simultaneously tested. However, FWER is believed to be too conservative in cases that the number of simultaneously tested hypotheses reaches several hundreds or thousands.

Another popular measure for controlling Type I error of multiple comparisons is the false discovery rate (FDR), which is defined as the expected proportion of incorrectly rejected H0 among all rejections:

Therefore, FDR allows the occurrence of Type I errors under a reasonable proportion by taking the total number of rejections into consideration. An obvious advantage of FDR controlling is the greatly improved power of statistical inference, which would be useful when a large number of hypotheses are simultaneously tested.

Common methods for adjustment

Suppose that there are m hypotheses of H1, …, Hm being simultaneously tested, which correspond to the initially computed P values of p1, …, pm. Accordingly, the adjusted P values of multiple comparisons are denoted as p′1, …, p′m. The pre-specified and adjusted significance levels are further denoted as α and α’, respectively. Furthermore, we assume that all hypotheses are ordered as H(1), …, H(m) according to their observed P values of p(1)...p(m); and the associated P values and significance level are denoted as p(i), p′(i) and α′(i) for the ith ordered hypothesis of H(i). We here provide an illustrative example for demonstrating differences among various adjustment methods. Let m=6 and α=0.05; and the initially computed P values corresponding to six hypotheses are p1=0.1025, p2=0.0085, p3=0.0045, p4=0.0658, p5=0.0201 and p6=0.0304, respectively.

Bonferroni adjustment

Bonferroni adjustment is one of the most commonly used approaches for multiple comparisons (5). This method tries to control FWER in a very stringent criterion and compute the adjusted P values by directly multiplying the number of simultaneously tested hypotheses (m):

Equivalently, we could let the observed P values unchanging and directly adjust the significance level as α′ = α/m = 0.05/6. For our illustrative example the adjusted P values are compared with the pre-specified significance level α=0.05, and the statistical conclusion is obviously altered before and after adjustment (Figure 2). Bonferroni adjustment has been well acknowledged to be much conservative especially when there are a large number of hypotheses being simultaneously tested and/or hypotheses are highly correlated.

Holm adjustment

On the basis of Bonferroni method, Holm adjustment was subsequently proposed with less conservative character (6). Holm method, in a stepwise way, computes the significance levels depending on the P value based rank of hypotheses. For the ith ordered hypothesis H(i), the specifically adjusted significance level is computed:

The observed P value p(i) of hypothesis H(i) is then compared with its corresponding α′(i) for statistical inference; and each hypothesis will be tested in order from the smallest to largest P values (H(1), …, H(m)). The comparison will immediately stop when the first p(i) ≥ α′(i) is observed (i=1...m) and hence all remaining hypotheses of H(j) (j=i,…,m) are directly declared non-significant without requiring individual comparison (Figure 3). Alternatively, it could directly compute the adjusted P value for each hypothesis and produce same conclusion (Figure 2).

Hochberg adjustment

Similar to Holm method, Hochberg adjustment employs same formula for computing the associated significance levels (7). Therefore, the specifically adjusted significance level for ith ordered hypothesis H(i) is also computed:

However, Hochberg method conducts statistical inference of hypothesis by starting with the largest P value (H(m), …, H(1)). When we first observe p(i) < α′(i) for hypothesis H(i) (i=m,…,1), the comparison stops and then concludes that the hypotheses of H(j) (j=i,…,1) will be rejected at significance level α. The adjusted P values of Hochberg method are shown in Figure 2. It is also known that Hochberg adjustment is more powerful than Holm method.

Hommel adjustment

Simes (1986) modified Bonferroni method and proposed a global test of m hypotheses (8). Let H={ H(1), …, H(m)} be the global intersection hypothesis, H will be rejected if p(i) ≤ iα/m for any i=1, …, m. However, Simes global test could not be used for assessing the individual hypothesis Hi. Therefore, Hommel (1988) extended Simes’ method for testing individual Hi (9). Let an index of j=max{i{1...m}:p(mi+k)>kα/i for k=1...i} be the size of the largest subset of m hypotheses for which Simes test is not significant. All Hi (i=1,…,m) are rejected if j does not exist, otherwise reject all Hi with pi≤α/j. Although straightforward explanation for computing the adjusted P values of Hommel method would be not easy, this task could be conveniently performed by computer tools, such as the p.adjust() function in R stats package (http://cran.r-project.org).

Benjamini-Hochberg (BH) adjustment

In contrast to the strong control of FWER, Benjamini and Hochberg [1995] introduced a method for controlling FDR, which is herein termed BH adjustment (10). Let be the pre-specified upper bound of FDR (e.g., q=0.05), the first step is to compute index:

If k does not exist, reject no hypothesis, otherwise reject hypothesis of Hi (i=1,…,k). BH method starts with comparing H(i) from the largest to smallest P value (i=m,…,1). The FDR-based control is less stringent with the increased gain in power (Figure 2) and has been widely used in cases where a large number of hypotheses are simultaneously tested.

Benjamini and Yekutieli (BY) adjustment

Similar to BH method, a more conservative adjustment was further proposed for controlling FDR by Benjamini and Yekutieli [2001], and this method is also termed BY adjustment (11). Let again q be the pre-specified upper bound of FDR, the index k is computed as:

If does not exist, reject no hypothesis, otherwise reject hypothesis of Hi (i=1,…,k). BY method could address the dependency of hypotheses with increased advantages.

Conclusions

Although substantial literature has been published for addressing the increased Type I errors of multiple comparisons during the past decades, many researchers are puzzling in selecting an appropriate adjustment method. Therefore, it would be helpful for providing a straightforward overview on the adjustment for multiple comparisons to researchers who don’t have good background in statistics. Of course, there are many theoretical topics and methodological issues having not been addressed yet in the present paper, such as resampling-based adjustment methods, choice of significance level α, and specific concerns for genomics data. It is also beyond the scope of this paper to discuss the sophisticated mathematical issues in this filed.

 

 


J Grad Med Educ. 2021 Aug;13(4):457-460.

 doi: 10.4300/JGME-D-21-00599.1. Epub 2021 Aug 13.

Facts and Fictions About Handling Multiple Comparisons

Gail M Sullivan 1Richard S Feinn 2

Affiliations collapse

Affiliations

  • 1is Editor-in-Chief, Journal of Graduate Medical Education (JGME), and Associate Director for Education, Center on Aging, and Professor of Medicine, University of Connecticut Health Center.
  • 2is Statistical Editor, JGME, and Associate Professor of Medical Sciences, Quinnipiac University.

의학교육에서 한때 있었던, 미래의 있을 미신(J Grad Med Educ, 2020 )
The Once and Future Myths of Medical Education
Geoff Norman, PhD, MA, BSc, FRSC

 


교육 분야는 [그럴듯하지만 검증되지 않은 아이디어와 유행]에 특히 민감해 보인다. 긴 세월에 걸쳐 등장했다가 사라진 여러가지 그럴듯한 이론이나 다소 허술한 연구에 근거해 흥미로운 사상사를 쓸 수도 있다. 그리고... 일단 아이디어가 자리를 잡으면 뿌리 뽑기가 어렵다. —Henry L. Roediger III, PhD1
The field of education seems particularly susceptible to the allure of plausible but untested ideas and fads (especially ones that are lucrative for their inventors). One could write an interesting history of ideas based on either plausible theory or somewhat flimsy research that have come and gone over the years. And . . . once an idea takes hold, it is hard to root out. —Henry L. Roediger III, PhD1

Roediger1이 지적한 바와 같이, 이러한 신화들 중 많은 것들은 놀랄 만한 수명을 가지고 있다. 어떤 신화들은 100년 이상 존재했을 뿐만 아니라 100년 전에 반증되었다.
As Roediger1 points out, many of these myths have remarkable longevity. Some myths have not only been around for more than 100 years, but also were disproved more than 100 years ago (see TABLE).

"좋은 과학"에 기초한 무수한 공격 앞에서조차 , 많은 신화가 견고하게 오래 유지된다는 것은 [신화 부수기myth-busting]가 [유의미한 과학적 사실에 대한 진술]보다 훨씬 더 많이 수반되어야 한다는 명백한 증거이다.
the robustness and longevity of many of these myths, in the face of multiple assaults based on ‘‘good science,’’ is prima facie evidence that myth-busting must involve far more than a statement of the relevant scientific facts.

교육신화의 특징
Characteristics of Educational Myths


교육 신화의 성격에 대한 일부 반영은 다른 신화들과 몇몇 독특한 측면들을 드러낸다. 의학 교육 신화는 다른 한편으로는 과학적인 증거의 영향에 영향을 받지 않는 것으로 보인다. 그런 점에서 그들은 (지구가 평평하고, 예방접종은 자폐증을 유발하고, 동종요법으로 질병을 치료한다는 것과 같은) 더 대중적인 신화들과 공통적인 특징을 공유한다.
Some reflection of the nature of education myths reveals properties common to other myths and some unique aspects. On the one hand, medical education myths endure and are apparently immune to the impact of scientific evidence. In that regard they share common characteristics with other more popular myths, like the earth is flat, vaccinations cause autism, and homeopathy cures illness.

반면에, 지구의 평탄도나 예방접종에 관한 것과 달리, 교육신화는 간단히 고쳐지지 않는다; 'trainee의 학습 스타일에 맞추는 것이 학습을 강화시킨다'는 것과 같이, 많은 교육 신화가 대학원 수준의 교사 양성 과정의 핵심 커리큘럼의 일부이다. 게다가, 이러한 신화를 공유하는 공동체는 고학력자이고, 그들 스스로 과학 문헌에 대한 문해력을 갖추었다고 생각할 가능성이 높다.
On the other hand, unlike those concerning the earth’s flatness or vaccinations, education myths are not proselytized by a small fringe; many, like adjusting for trainee learning styles enhances learning, are part of the core curriculum in postgraduate level teacher training courses. Moreover, the community that shares these myths is highly educated and would likely consider themselves scientifically literate.


왜 교육계가 신화 전파에 취약한가?
Why Is the Education Community Vulnerable to the Dissemination of Myths?


1. 인간
1. Human


교육자들은 인간이고, 인간들은 우리가 정보를 처리하는 방식에 내재된 다양한 편견에 취약하다는 것을 보여주었다. 사람들은 정보를 객관적으로 처리하지 않는다. 오히려 사람들은 선입견을 통해 정보를 걸러낸다. 
Educators are human, and humans have been shown to be vulnerable to various biases inherent in the way we process information. People do not process objectively. information Rather, people filter information through their preconceptions. 

확증편향 Confirmation Bias:

사람들은 자신의 선입견에 부합하는 정보를 적극적으로 찾고 우선 순위를 매기는 경향이 있으며, 이는 자신의 이전 관점을 반박하는 정보보다 높습니다.
People tend to actively seek out and prioritize information consistent with their preconception, higher than information that refutes their prior view.

Wason5는 [3개의 숫자로 구성된 시퀀스]를 사용하여 효과의 초기 데모를 발표했습니다. 참가자들은 순서를 만든 잠재적인 기본 규칙을 추론하거나 제안하도록 요청받았다. 그들은 세 개의 숫자로 이루어진 다음 문자열을 시퀀스에 제안함으로써 규칙을 테스트할 수 있습니다. 올바른 기본 규칙을 결정한 사람은 거의 없었지만, 대부분은 확인 사례를 일관되게 제시함으로써 확인 편견을 입증했다. 
The initial demonstration of the effect was published by Wason5 using sequences of 3 numbers. Participants were asked to infer or propose potential underlying rules that created the sequence. They could test a rule by suggesting the next string of 3 numbers in the sequence. Few determined the correct underlying rule, but most demonstrated confirmation bias by consistently suggesting confirmatory examples. 

수학적 게임에서 교육적 신화로 연결되는 다리를 만드는 것은 어렵다. 그러나 또 다른 검증 편향 연구는 훨씬 더 확실한 연관성을 드러냈습니다. 이 연구에서 로드 등은 사형 억제 가치에 대한 찬반 견해가 강한 참가자를 식별했다. 연구원들은 [명백히 과학적인 증거]를 주더라도, 토론의 불씨를 진정시키기보다는 빈번하게 부채질할 것이라고 결론지었다."6 
It is difficult to make a bridge from a mathematical game to educational myths. But another study of confirmation bias revealed a much more solid link. In this study, Lord et al6 identified participants who had strong views for and against the deterrent value of capital punishment. The researchers concluded that provision of ostensively scientific evidence ‘‘will frequently fuel rather than calm the fires of debate.’’6 

사회적, 행동적, 임상적 연구에 내재된 불확실성을 감안할 때, [논쟁의 양쪽 측면 모두에서 연구 결과를 찾기는 꽤 쉽다]. 확인 편향은 교육자들이 그들의 결론을 뒷받침하는 증거를 "체리 픽"할 것이라는 불행한 결론으로 이어지고, 그래서 추가적인 자료들은 그들의 신화에 대한 믿음을 증가시키는 역설적인 효과를 가져올 수 있다. 

Given the uncertainties inherent in social, behavioral, and clinical research, it is quite easy to find studies on both sides of a debate. Confirmation bias then leads to the unfortunate conclusion that educators will ‘‘cherry pick’’ the evidence that supports their conclusion, so that the additional data may have the paradoxical effect of increasing their belief in the myth. 



생생성/가용성 편중:
Vividness/Availability Bias:


인간의 기억은 들어오는 자극과 기억 속에 저장된 지식 사이의 연관성을 만든다. 반복 노출은 이러한 연관성을 향상시킵니다. 불행하게도, 다른 요인들, 예를 들어 특히 극적인 사건이나 생생한 사건 묘사도 마찬가지입니다.7 사건 발생 가능성에 대한 [통계 정보]를 처리하는 것보다 사건에 대한 [이야기를 기억]하는 것이 훨씬 쉽습니다. 이것은 실제로 교육적으로 유용한 전략이 될 수 있다; 일련의 연구에서, 우즈 외 연구진은 기초 과학을 질병의 징후와 증상을 상기시키는 데 도움을 주는 "이야기"로 볼 수 있다는 것을 보여주었다. 
Human memory makes associations between incoming stimuli and knowledge stored in memory. Repeated exposure enhances these associations. Unfortunately, so do other factors, such as particularly dramatic or vivid portrayals of events.7 It is much easier to recall a story about an event than to process statistical information about the likelihood of the event. This can actually be an educationally useful strategy; in a series of studies, Woods et al8,9 have shown that basic science can be viewed as a ‘‘story’’ to aid in recall of signs and symptoms of diseases. 


이러한 생생한 발견이 보여주는 것은 [사람들은 하나의 생생한 반례로 과학적 증거를 기각하는 것에 거리낌이 없다는 사실]이다. 한 가지 자주 반복되는 예는 공항으로 가는 도중에 교통사고로 사망할 확률이 비행기 사고로 사망할 가능성보다 높다는 것입니다. 그러나 소형 비행기나 사망자가 거의 없는 항공 추락사고도 대서특필되고 있지만 고속도로 사망자는 거의 없습니다. 
The consequence of this vividness heuristic is that people have no qualms about dismissing scientific evidence by using a single vivid counter example. One frequently repeated example is that your chance of being killed in a car accident on the way to the airport is higher than your chance of being killed in an air crash. But air crashes, even involving small airplanes and few deaths, make headlines—highway deaths rarely do. 

교육에서도 유사한 메커니즘이 발생할 수 있다. 예를 들어, 아무도 자신을 시각 학습자나 언어 학습자로 선언하는 데 어려움을 겪지 않기 때문에, 이 버전의 학습 스타일은 그 진실성을 뒷받침할 많은 직접적 증언을 찾을 수 있습니다. 불행하게도, [스스로 보고한 시각/언어 학습]은 [직접 측정한 공간 및 언어 능력]이나, [시각 또는 언어 지향적 교육 자료를 통한 학습]과는 관련이 없는 것으로 나타났다.10 
In education, similar mechanisms can arise. For example, no one has any difficulty declaring themselves as visual or verbal learners, so this version of learning style can find many firsthand testimonials to support its veracity. Unfortunately, self-reported visual/verbal learning has been shown to have no relation to either direct measures of spatial and verbal ability, or learning from visually or verbally oriented instructional materials.10 

2. 과학자
2. Scientists

과학적인 글쓰기는 "possible", "may", "likely"와 같은 조건부 단어들로 가득 찬 독특한 양식 형태를 가지고 있다. 과학적인 글쓰기는 회색 음영으로 나오며, 검은색과 흰색은 팔레트에 나타나지 않는다. 이 설명은 모든 과학에서 사실이지만 임상, 사회 및 행동 과학에서는 두 배로 그렇습니다. 기본적인 증거가 이론적 예측에 있는 자연과학에 비해, 우리의 이론은 일반적으로 H0-차이없음, H1-차이있음의 형태를 취한다. 
Scientific writing has a peculiar stylistic form, replete with conditional words like ‘‘possible,’’ ‘‘may,’’ and ‘‘likely.’’ Scientific writing comes in shades of gray; black and white do not appear in the palette. While this description is true of all sciences, it is doubly so in clinical, social, and behavioral sciences. Compared with natural sciences, where the fundamental proof lies in a theoretical prediction, our theories generally take the form of H0–no difference, H1–difference. 

더욱이, [전통적인 피셔 통계 추론]은 그 로직의 필수적인 구성요소로서 [불확실성]에 기반을 두고 있다. 통계적 추론은 항상 차이가 없을 때 차이를 선언할 확률 5%에 해당하는 임계값(허위 양수)으로 시작합니다. 이는 거짓 음의 비율에 영향을 미칩니다. 정확히 0.05 수준에서 가설을 기각할 경우 복제 가능성은 50%에 불과합니다. 11,12 따라서 임상 및 행동 분야에서 [연구 결과를 복제하지 못하는 것]에 대한 우려가 증가하는 것은 놀라운 일이 아닙니다.13,14 
Moreover, traditional Fisherian statistical inference builds in uncertainty as an essential component of the logic. Statistical inference always begins with a critical value corresponding to a 5% probability of declaring a difference when there is none: a false positive. This in turn has implications for the false negative rate: if the hypothesis is rejected at exactly the 0.05 level, the likelihood of replication is only 50%.11,12 Therefore, it is not surprising that failure to replicate findings is a growing concern in the clinical and behavioral disciplines.13,14 

임상 연구에서는 적어도 치료(300mg 용량)와 결과(치사율, 심박출량)에서 일관성을 가질 수 있다. 의료 교육에서, 현실적 환경(예: 교실)에서는 그러한 일관성이 사실상 불가능하다. 일부 랩 기반 실험 연구는 서면 또는 비디오 프리젠테이션과 객관식 테스트와 같은 결과를 사용하여 개입을 완전히 표준화할 수 있지만, 이러한 엄격한 제어는 예외입니다. 또한, 문제 기반 학습(PBL)과 같은 개념은 표준화를 거스를 정도로 많은 형태로 운영될 수 있습니다. 그러므로 비복제가 의학교육에서 중요한 문제라는 것은 이해할 수 있다. 널리 인용된 연구인 '''복제 프로젝트Replication Project'''에 의하면 심리학의 고전적 발견 중 39%만이 복제될 수 있다고 보고했다.
In clinical research, it is at least possible to have consistency in treatments (a 300mg dose) and outcomes (mortality, cardiac output). In medical education, in realistic environments (eg, classrooms), such consistencies are virtually impossible. While some lab-based experimental research may be able to completely standardize interventions using, for example, written or video presentations, and outcomes, such as multiple-choice tests, such tight control is the exception. Moreover, a concept like problem-based learning (PBL) can be operationalized in so many forms that it defies standardization. It is therefore understandable that non-replication is a significant issue in medical education. A widely cited study, the ‘‘Replication Project,’’14,15 reported that only 39%of classic findings in psychology were able to be replicated.

이 문제에 대한 한 가지 가능한 해결책은 BEME(Best Evidence Medical Education) 프로젝트에서 지원하는 메타 분석 기법의 사용이다.16 여기서도 교육 연구의 성격의 결과로 문제가 빠르게 발생한다. 첫 번째, 임상 연구에서 문헌 검색은 적절한 논문의 높은 비율을 산출할 수 있으며, 때로는 식별된 논문의 50%에 근접할 수 있습니다. 교육에서, "PBL"이나 "자체 평가" 또는 "직업 간 교육"과 같은 용어가 매우 많은 맥락에서 사용될 수 있기 때문에, 검색을 통한 경험적 연구의 산출량yield이 매우 낮다. 몇 년 전 20개의 BEME 리뷰를 자세히 검토해 본 결과, 최초 검색에서 약 10만 개의 기사를 확인했지만 실제 리뷰는 총 818개의 논문에 근거하여 0.8%의 산출량yield을 기록했습니다. 
One possible solution to this problem is the use of meta-analytical techniques, as supported by the Best Evidence Medical Education (BEME) project.16 Here, too, problems quickly arise as a consequence of the nature of educational research. The first is that in clinical research, a literature search can yield a high proportion of appropriate articles, sometimes approaching 50% of those identified. In education, because a term like ‘‘PBL’’ or ‘‘self-assessment’’ or ‘‘interprofessional education’’ can be used in so many contexts, the yield of empirical research fromsearches is very low. A fewyears ago, I reviewed 20 BEME reviews in detail and found that, while in the initial search they identified about 100000 articles, the actual reviews were based on a total of 818 papers, a yield of 0.8%. 


두 번째 문제는 [용어의 부정확성]에서 발생한다. "가상 현실"과 같은 용어가 컴퓨터 모니터의 사실적인 동적 프리젠테이션에서 매우 다른 결과를 가지고 눈으로 직접 이미지를 표시하는 헤드셋에 이르기까지 모든 것을 의미할 수 있다.17 따라서 개입과 결과가 다를 때, 그리고 연구의 결과 샘플이 작을 때, 좋은 정보를 제공하는 메타 분석이 불가능합니다. 
The second problem arises from the imprecision of the terms, where a term like ‘‘virtual reality’’ can mean anything from a realistic dynamic presentation on a computer monitor to a headset displaying images directly to the eyes, with very different consequences.17 Thus, when the interventions and outcomes differ, and the resulting sample of studies is small, an informative meta-analysis is not possible. 

그 결과, 정확히 반대 입장을 지지하는 연구 뿐만 특정 입장을 지지하는 연구도 비교적 쉽게 찾을 수 있다. 다시, 인간으로서 데이터를 확인하려는 경향을 감안할 때, 우리는 우리의 입장을 뒷받침하는 연구를 인용합니다. 
The consequence, is that it is relatively easy to locate studies that support a particular position as well as its exact opposite. In turn, given our propensity as humans to seek confirming data, we cite the study that supports our position. 

3. 교사들
3. Teachers

어떤 이성적인 사람도 물리학자만큼 양자역학을 잘 이해한다고 가정하거나 외과의사만큼 복강경 수술을 할 수 없다고 가정하지 않을 것이다. 그러나 모든 사람들이 자신의 의견이 소위 전문가와 동등하다고 생각하는 분야도 있다. 예술Art은 그러한 특징을 지니는 한 분야이다. 많은 사람들은 집 페인트 캔 몇 개와 오래된 붓 몇 개를 고려하면 잭슨 폴록과 동등할 수 있다고 믿는다. 유감스럽게도 교육도 (자신의 의견이 전문가와 동등하다고 생각하는) 또 다른 분야로 보인다. 모든 사람들은 사람들이 다른 것에 기초하지 않더라도, 단지 그것을 하기 위해 노력한 오랜 세월을 바탕으로 어떻게 배우는지에 대해 상당한 이해를 하고 있다고 상상합니다. 그 결과, 교육은 지속적 신화로 가득 차 있으며, 일부는 교육 전문성에 대한 특별한 주장이 없는 선의의 학자들에 의해 행해지고 있다. 
No rational person would presume that they understand quantum mechanics as well as a physicist, or could perform laparoscopic surgery as well as a surgeon. Yet there are areas where everyone presumes that their opinions are the equal of so-called experts. Art is one area: many believe that, given a few cans of house paint and some old brushes, they could be the equal of Jackson Pollock. Regrettably, education appears to be another area. Everyone imagines themselves to have considerable understanding of how people learn, based, if on nothing else, on the many years they spent trying to do just that. As a consequence, education is rife with enduring myths, perpetrated in part by well-meaning academics who have no particular claim to educational expertise. 

다음과 같은 인간의 상태에 대한 격언이 붙어있는 알버트 아인슈타인의 포스터가 얼마나 많은가? 
How many posters of Albert Einstein, accompanied by a maxim about the human condition, have been printed? Here are a few:

  • 지식보다 상상력이 더 중요합니다.
  • 지성의 진정한 표시는 지식이 아니라 상상력이다.
  • 진짜 가치 있는 건 직감뿐입니다.18
  • Imagination is more important than knowledge.
  • The true sign of intelligence is not knowledge but imagination.
  • The only real valuable thing is intuition.18

아인슈타인이 물리학에 대한 탁월함으로 어떻게 학습에 대한 그의 의견이 건전하다는 결론을 내리게 되었는지는 명확하지 않다. 우리는 한 분야의 전문가가 다른 모든 분야에서 경청되어야 한다고 생각하는 것 같다 (유감스럽게도, 할리우드 배우들도 같은 과대망상에 시달리고 있으며, 자격증은 훨씬 적다.) 
It is not clear to me how Einstein, with his brilliance in physics, came to the conclusion that his opinions about learning were sound. We appear to believe that an expert in one area should be heard in all other areas. (Regrettably, Hollywood actors suffer from the same delusion of grandeur, with far fewer credentials.) 

내가 보기에, 고작 이 짧은 몇 줄에 [교육에서 가장 오래 지속되고 잘못된 신화 중 하나]가 무엇인지 요약되어 있다. 지식은 불필요한 악으로 간주되고, 그 모든 고약한 시험에 합격하기 위해 습득되었다가 잊혀진다는 것이다.
In my view, these few succinct lines summarize what is one of the most enduring and misguided myths in education. Knowledge is viewed as an unnecessary evil, acquired to pass all those nasty exams—and then forgotten. 

실제 연구에 의해 반증된 100년의 이론 이후, 1990년까지 인지 심리학은 [하나의 영역에서 성공적인 문제 해결]은 상상력이 아닌 관련 [지식의 양]에 의해 결정된다는 것을 확인했습니다.19,20 퍼킨스와 살로몬 21은 다음과 같이 말했습니다. 
After a century of theories disproved by actual research, by 1990, cognitive psychology resolved that successful problem solving in one domain was determined by the amount of relevant knowledge— not imagination—the problem solver possessed.19,20 As Perkins and Salomon21 said: 

사고는 [특정한, 맥락 의존적 기술] 및 (다른 지식영역에 대한 적용도가 낮은) [지식 단위]에 의존한다. (한 맥락에서 훈련받은 다음 다른 영역으로 전이될 수 있는) [일반화되고 맥락-독립적 기술]이라는 것에 대한 굳건한 경험적인 증거는 부족하고, 이것이 그저 희망적 생각wishiful thinking임이 증명되었다.21 
Thinking depends on specific, context-bound skills and units of knowledge that have little application to other domains . . . The case for generalizable, context-independent skills that can be trained in one context and transferred to other domains has proven to be more a case of wishful thinking than hard, empirical evidence.21 



이 관점에 도전할 만한 것은 아무것도 나오지 않았다. 그러나 교육자들은 이제 보편화된 이 발견을 받아들이려 하지 않는 것 같다. 물론, 사고와 전문지식은 단순한 팩트facts 이상의 것을 필요로 한다. 학습에 있어 중요한 연구 영역 중 하나는 전이transfer이다. 즉, 관련 지식을 메모리에서 검색하여 유사하지만 새로운 문제를 해결하는 것입니다. 일반적으로 관련 지식을 습득한 참가자는 새로운 문제를 해결하기 위해 해당 지식을 회수할 수 있습니다. 
Nothing has emerged to challenge this perspective. However, educators appear reticent to accept this now universal finding. To be sure, thinking and expertise do require more than facts. One critical area of research in learning is transfer—retrieving relevant knowledge from memory to solve new, dissimilar, but related problems. Typically, participants who have learned the relevant knowledge may be able to retrieve it to solve a new problem more than 10% to 30%of the time. 

많은 의학 교육자들은 전이transfer의 역할에 대해 알지 못한다. 대신, 교육계는 임상적 추론이나 문제 해결과 같은 일반적이고 내용이 없는 기술을 기본으로 합니다. 그리고 아이의 장난감처럼, 한 개의 못을 다른 못에 박으면, [맥락-비의존적 기술]이라는 개념은 메타인지, 인지적 편견, 비판적 사고와 같은 이름만 바꿔가며 끊임없이 변신하고 있다.22 

Many medical educators are not aware of the role of transfer. Instead, the education community defaults to general, content-free skills like clinical reasoning or problem solving. And, like the child’s toy where, when you hammer one peg down another takes its place, the notion of these context-free skills is constantly mutating into different labels like metacognition, cognitive biases, and critical thinking.22 

신화의 지속성에 대해 우리가 할 수 있는 일은? 
What Can We Do About the Persistence of Myths? 


[단순 증거 제시]만으로 최초 판단과 관련된 관성을 극복할 것 같지는 않다. 실제로, Lord et al6가 보여주었듯이, 이러한 노출은 (태도가 더욱 극단적으로 되는) "태도 양극화attitude polarization"를 초래할 수 있다는 몇 가지 증거가 있다.
it is unlikely that simple presentations of evidence will overcome the inertia associated with the original judgment. Indeed, as Lord et al6 showed, there is some evidence that this exposure can result in ‘‘attitude polarization’’ where attitudes become more extreme.

마찬가지로, "가능한 한 객관적이고 편견이 없어야 한다"는 권고도 연구의 품질이나 데이터의 설득력 판단에 영향을 미치지 않았다. 속도를 늦추거나, 철저하거나, 체계적이어야 하는 지침이 정확도에 미치는 영향을 최소화한 진단 추론에 대해 수행한 여러 연구에서 유사한 비-효과non-effects가 ㅗ학인되었다
Similarly, admonitions to ‘‘be as objective and unbiased as possible’’23 had no effect on judgments of the quality of the study or persuasiveness of the data. Similar non-effects have been noted in a number of studies we have conducted on diagnostic reasoning, where instructions to slow down, be thorough, or be systematic had minimal effects on accuracy.24,25

그러나 한 가지 효과적인 전략은 참가자들에게 [연구가 정반대의 결론에 도달했을 때 어떻게 반응할지 고려하도록 하는 것]이었다.23 이 조건에서 편향 효과는 사라졌다.
However, one strategy that was effective was to get participants to consider how they would respond if the study came to the opposite conclusion.23 In this condition, biasing effects disappeared.

결론
Conclusions


교육 신화는 고등교육에서 많은 개인들을 끈질기게 쥐고 있는 것으로 보인다. 사활이 걸린 문제는 아니지만 이론에 매달리고 비효과적인 개입으로 알려진 것은 자원 낭비를 의미한다. 게다가, 그 판돈stakes이 항상 대수롭지 않은 것은 아니다. 동적 반응 전신 시뮬레이션과 같은 일부 교육 기술은 10만 달러 이상의 비용이 들 수 있지만, "고충실성"의 이점은 입증되지 않은 채로 남아 있다. 어떤 증거가 있는지는 효익이 미미할 것이라는 것을 시사한다. 마찬가지로, 해부학 교육을 위한 가상 현실 기술은 하드웨어에 대해 세트당 5,000달러의 비용이 들 수 있지만, 현재까지 입증된 이점은 없습니다. 
Educational myths appear to have a tenacious hold on many individuals in higher education. While hardly a life and death matter, clinging to theories and known to interventions that are be ineffective represents a squandering of resources. Moreover, the stakes are not always insignificant. Some educational technologies, such as dynamic responsive whole body simulations, may cost upward of $100,000, yet the benefit of ‘‘high fidelity’’ remains unproven. What evidence there is suggests that the benefits will be marginal. Similarly, virtual reality technologies for instruction in anatomy may cost $5,000 per set for the hardware, yet to date they have no proven benefit. 

금전적 비용이 전부는 아니다. 구글이 아무리 매력적이라도, 오늘날의 학생들은 과거의 학생들보다 (더 적은 것이 아니라) 더 많은 사실을 터득해야 한다. 학습자가 알려진 효과적인 전략을 최대한 사용하지 않고 알려진 비효율적인 전략을 피하는 것은 잘못된 행동입니다. 이를 이루기 위해서는 강경주의적jingoist '증거 기반'이 의료 교육 커뮤니티 문화의 중심 부분이 되어야 한다.

The dollar cost is not the whole story. Despite the allure of Google, today’s students must master more, not fewer, facts than their predecessors. It is a disservice to learners to not maximally use the known effective strategies and avoid the known ineffective strategies. For that to be achieved, the jingoist ‘‘evidence-based’’ must become a central part of the culture of the medical education community. 

 



12. Norman GR. Statistics 101. Adv Health Sci Educ Theory Pract. 2019;24(4):637–642. doi:10.1007/ s10459-019-09915-3.

2. De Bruyckere P, Kirshner P, Hulshof D. Urban Myths About Learning and Education. San Diego, CA: Academic Press; 2015.

4. Martimianakis MA, Tilburt J, Michaelic B, Hafferty F. Myths and social structure: the unbearable necessity of mythology in medical education. Med Educ. 2020;54(1):15–21. doi:10.1111/medu.13828.

26. de Bruin ABH. Debunking myths in medical education: the science of refutation. Med Educ. 2020;54(1):6–8. doi:10.1111/medu.14028.


J Grad Med Educ. 2020 Apr;12(2):125-130.

 doi: 10.4300/JGME-D-20-00185.1.

The Once and Future Myths of Medical Education

Geoff Norman

Free PMC article

No abstract available

문헌고찰: 양질의 의학교육연구를 위한 초석(J Grad Med Educ. 2016)
The Literature Review: A Foundation for High-Quality Medical Education Research
Lauren A. Maggio, PhD, MS (LIS) Justin L. Sewell, MD, MPH Anthony R. Artino Jr, PhD

 

의학 교육1의 발표된 학술연구가 급증하고 교육 연구를 출판하는 저널의 급속한 성장에도 불구하고 원고 acceptance rate은 계속 떨어지고 있다.2 [중요한 문제를 식별하고 연구를 맥락에 배치하는 철저하고 정확하며 최신의 문헌 검토를 실시하지 않는 것]은 일관되게 rejection의 가장 큰 이유 중 하나이다.
Despite a surge in published scholarship in medical education1 and rapid growth in journals that publish educational research, manuscript acceptance rates continue to fall.2 Failure to conduct a thorough, accurate, and up-to-date literature review identifying an important problem and placing the study in context is consistently identified as one of the top reasons for rejection.3,4

문헌 검토 정의
The Literature Review Defined


의학 교육에서, 어떤 조직도 연구 논문의 문헌 검토에 대한 공식적인 정의를 명확히 하지 않았습니다. 따라서, 문헌 검토는 여러 가지 형태를 취할 수 있습니다. 기사의 유형, 대상 저널 및 특정 주제에 따라 이러한 형태는 방법론, 엄격성 및 깊이에서 다양합니다. 
In medical education, no organization has articulated a formal definition of a literature review for a research paper; thus, a literature review can take a number of forms. Depending on the type of article, target journal, and specific topic, these forms will vary in methodology, rigor, and depth. 

우리는 그러한 문헌검토를 [기존의 지식 내에서 (현재 연구의 위치를 포함하여) 연구하려는 주제에 대해 알려진 것과 알려지지 않은 것의 종합적 검토와 요약]으로 정의한다. 이러한 유형의 문헌 검토는 체계적인 검토에 의해 요구되는 집중적인 검색 과정을 요구하지 않을 수도 있지만, 신중하고 엄격한 접근 방식을 사용할 가치가 있습니다.
We define such a literature review as a synthetic review and summary of what is known and unknown regarding the topic of a scholarly body of work, including the current work’s place within the existing knowledge. While this type of literature review may not require the intensive search processes mandated by systematic reviews, it merits a thoughtful and rigorous approach.

문헌검토의 목적과 중요성
Purpose and Importance of the Literature Review

현재 문헌에 대한 이해는 연구 연구의 모든 단계에서 매우 중요하다. 링가드9는 최근 자신의 연구가 더 큰 의학교육 대화에 어떻게 적합한지를 이해하기 위해 "대화로서의 저널" 은유를 사용했다. 그녀는 이렇게 묘사한다.

당신이 사교 행사에서 대화에 참여하는 것을 상상해 보세요. 무슨 말을 하는지 알기 위해 엿듣고 있다가(이것이 문헌 검토가 '대화conversational'에 해당하는 것이다), 당신이 주제에 대한 공통 관심사를 가지고 있으며, 이미 말한 내용에 대한 지식이 있고, 자신의 의도를 나타내며 대화에 참여한다.

  
An understanding of the current literature is critical for all phases of a research study. Lingard9 recently invoked the ‘‘journal-as-conversation’’ metaphor as away of understanding how one’s research fits into the larger medical education conversation. As she described it:

‘‘Imagine yourself joining a conversation ata social event. After you hang about eavesdropping toget the drift of what’s being said (the conversational equivalent of the literature review), you join the conversation with a contribution that signals your shared interest in the topic, your knowledge of what’s already been said, and your intention.’’9 


문헌 검토는 [맥락을 제공하고, 방법론을 알려주며, 혁신을 식별하고, 중복 연구를 최소화하며, 전문적 기준을 충족]하도록 함으로써 모든 연구자가 '대화에 참여'할 수 있도록 도와줍니다. 현재의 문헌에 대한 이해는 또한 Boyer가 제안한, 학문적 작업을 평가해야 하는 6가지 기준 중 5가지에 기여함으로써 장학금을 증진시킨다.11 구체적으로, 문헌 검토는 연구자에게 다음과 같은 도움을 준다.
The literature review helps any researcher ‘‘join the conversation’’ by providing context, informing methodology, identifying innovation, minimizing duplicative research, and ensuring that professional standards are met. Understanding the current literature also promotes scholarship, as proposed by Boyer,10 by contributing to 5 of the 6 standards by which scholarly work should be evaluated.11 Specifically, the review helps the researcher

  • (1) 명확한 목표를 명시한다.
  • (2) 적절한 준비의 증거를 보여준다.
  • (3) 적절한 방법을 선택한다.
  • (4) 관련 결과를 전달한다.
  • (5) 성찰적 비평에 참여한다.  

 

  • (1) articulate clear goals,
  • (2) show evidence of adequate preparation,
  • (3) select appropriate methods,
  • (4) communicate relevant results, and
  • (5) engage in reflective critique.  


수준 높은 문헌 검토를 수행하지 못한다면, [반복적이고, 이론에 기초하지 않으며, 방법론적으로 취약하고, 단일 설정 이상으로 지식을 확장하지 못하는 것] 등과 같이 의학 교육 문헌에서 확인된 여러 문제로 이어진다.12 실제로 많은 연구가 이미 출판된 연구의 반복 작업을 수행한 것이고 새로운 지식에는 거의 기여하지 않는다고 의료 교육 학자들은 불평한다. 명백한 원인은 적절한 문헌 검토를 수행하지 못했기 때문이다.3.4 
Failure to conduct a high-quality literature reviewis associated with several problems identified in the medical education literature, including studies that are repetitive, not grounded in theory, methodologically weak, and fail to expand knowledge beyond asingle setting.12 Indeed, medical education scholars complain that many studies repeat work already published and contribute little new knowledge—alikely cause of which is failure to conduct a proper literature review.3,4 

마찬가지로, 이론적인 기초나 개념적 프레임워크가 결여된 연구는 연구 설계와 해석을 어렵게 만든다.13 의학 교육 연구에 이론이 사용될 때, 종종 피상적인 수준에서 호출된다. Norman14가 지적한 바와 같이, 이론이 적절하게 사용될 때, 그것은 [함께 연결될 수 있는 변수]와 그 이유를 명확히 표현하는데 도움을 주고, 연구자가 [가설을 세우고 연구의 맥락과 범위를 정의]할 수 있게 해준다. 
Likewise, studies that lack theoretical grounding or a conceptual framework make study design and interpretation difficult.13 When theory is used in medical education studies, it is often invoked at asuperficial level. As Norman14 noted, when theory isused appropriately, it helps articulate variables that might be linked together and why, and it allows the researcher to make hypotheses and define a study’s context and scope. 

또 다른 문제는 많은 의학 교육 연구가 방법론적으로 취약하다는 것이다.12 좋은 연구를 위해서는 관련 교육을 받은 연구 조사자 질문이 필요한데, 이들은 관심 변수를 운영적으로 정의하고 특정 연구 질문에 대한 최선의 방법을 선택할 수 있다.
Another problem is that many medical education studies are methodologically weak.12 Good research requires relevant trained research investigators questions, who can articulate operationally define variables of interest, and choose the best method forspecific research questions.

마지막으로, 의대 교육에 관한 많은 연구들은 "일회성one-offs"이다. 즉, 기회가 현지에서 나타났기 때문에 수행되는 단일 연구이다. 이러한 연구는 종종 다른 환경에 대한 점진적인 구축과 일반화를 지향하지 않습니다. 문헌에 대한 확실한 이해는 연구에 대한 프로그램적 접근을 장려할 수 있다.  
Finally, many studies in medical education are‘‘one-offs,’’ that is, single studies undertaken because the opportunity presented itself locally. Such studies frequently knowledge are not oriented toward progressive building and generalization to other settings. A firm grasp of the literature can encouragea programmatic approach to research.  

문헌 검토 접근 중
Approaching the Literature Review

문헌 검토를 계획하려면 저널에 따라 크게 달라지는 저널 요건을 이해해야 합니다(표 1). 저자들은 문헌 검토의 결과 보고와 관련된 일반적인 문제점을 주목하는 것이 좋다. 표 2는 우리가 작가, 검토자, 편집자로서 직면했던 가장 일반적인 문제들을 열거합니다.  
Planning the literature review requires understanding of journal requirements, which vary greatly by journal (TABLE 1). Authors are advised to take note of common problems with reporting results of the literature review. TABLE 2 lists the most common problems that we have encountered as authors, reviewers, and editors.  

 


문헌 찾기 및 구성
Locating and Organizing the Literature


인적 자원
Human Resources


의학 사서는 연구 관심사를 효과적인 검색 전략으로 변환하고, 이용 가능한 정보 리소스를 연구자에게 익숙하게 하며, 정보를 정리하는 데 필요한 정보를 제공하고, 새롭게 부상하는 연구에 최신 정보를 제공하기 위한 전략을 도입할 수 있습니다. 종종, 사서들은 또한 그들의 기관 전반에 걸친 연구에 대해 알고 있고 비슷한 관심사를 가진 연구원들을 연결할 수 있을 것이다. 동료들에게 제안을 구하면 연구원들이 레이더에 없을 자원을 빠르게 찾는 데 도움이 될 수 있다.
A medical librarian can help translate researchinterests into an effective search strategy, familiarize researchers with available information resources, provide information on organizing information, and introduce strategies for keeping current with emerging research. Often, librarians are also aware of research across their institutions and may be able toconnect researchers with similar interests. Reaching out to colleagues for suggestions may help researchers quickly locate resources that would not otherwise be on their radar.  

이 과정에서 연구자들은 다른 연구자들이 자신들의 주제에 대해 쓰고 있는 것을 확인할 것으로 보인다.연구자들은 이러한 관련 연구자들의 출판물 검색을 고려해야 한다(검색 전략은 표 3 참조). 또한 기관 웹사이트에는 해당 교직원의 교육과정 이력서, 도서장, 논문, 기술보고서 등 어려운 자료를 포함하여 해당 교직원의 전체 위치 간행물, 기록물 등을 포함할 수 있다. 
During this process, researchers will likely identifyother researchers writing on aspects of their topic.Researchers should consider searching for the publications of these relevant researchers (see TABLE 3 for search strategies). Additionally, institutional websites may include curriculum vitae of such relevant faculty with access to their entire locate publication publications, record, including difficult to such asbook chapters, dissertations, and technical reports. 




검색 도구 및 관련 문서
Search Tools and Related Literature


의학교육 연구는 다양한 학문으로 이루어지기 때문에, 연구원들은 [의학을 넘어서는 범위](예: 심리학, 간호학, 교육학, 인류학)와 보고서, 기준집, 학술대회 초록, 단행본 서적과 같은 [여러 출판 유형]을 다루는 검색 도구를 포함해야 한다(여러 정보 자원은 BOX 참조). 많은 검색 도구에는 선택한 기사의 인용문을 보기 위한 옵션이 포함되어 있습니다. 인용된 참조를 검토하면 검토를 위한 추가 기사와 선택한 기사가 해당 필드에 미치는 영향에 대한 느낌을 얻을 수 있습니다. 
Because medical education research draws on avariety of disciplines, researchers should include search tools with coverage beyond medicine (eg, psychology, nursing, education, and anthropology) and that cover several publication types, such as reports, standards, conference abstracts, and book chapters (see the BOX for several information resources). Many search tools include options for viewing citations of selected articles. Examining cited references provides additional articles for review and a sense of the influence of the selected article on its field. 

참고문헌 정리하기
Getting Organized

앞서 언급한 리소스는 엄청난 양의 정보를 제공할 가능성이 높기 때문에 잘 정리하는 것이 매우 중요합니다. 연구자들은 어떤 세부사항이 그들의 연구에 가장 중요한지 결정하고(예: 참가자, 설정, 방법, 결과) 그러한 세부사항을 체계적이고 접근 가능하도록 유지하는 전략을 만들어야 한다. 연구자들이 Evernote와 같은 디지털 도구를 사용하여 이러한 정보를 캡처하고 있으며, 이를 통해 디지털 작업 공간 및 검색 기능에 액세스할 수 있습니다. Citation manager의 사용은 인용문을 저장하기 때문에 유용할 수 있으며, 경우에 따라 참고 문헌을 작성할 수 있다(표 4).
As the aforementioned resources will likely provide a tremendous amount of information, organization is crucial. Researchers should determine which details are most important to their study (eg, participants, setting, methods, and outcomes) and generate a strategy for keeping those details organized and accessible. Increasingly, researchers utilize digital tools, such as Evernote, to capture such information, which enables accessibility across digital workspaces and search capabilities. Use of citation managers can also be helpful as they store citations and, in some cases, can generate bibliographies (TABLE 4).

언제 말해야 하는지 알기
Knowing When to Say When


연구자들은 종종 citation이 충분하다는 것을 어떻게 알 수 있는지 묻는다. 안타깝게도 마법의 숫자나 이상적인 숫자는 없습니다. 문헌 취재를 점검하는 전략 중 하나는 관련 논문의 참고 문헌을 점검하는 것이다. 연구자들이 참고 문헌을 검토하면서 새로운 문헌이 거의 나타나지 않고, 동일한 문헌이 반복되는 것을 알아차리기 시작할 것이다. 이것은 연구자가 특정 주제에 관한 문헌을 (충분히) 다루었음을 나타낼 수 있다.
Researchers often ask how to know when they have located enough citations. Unfortunately, there is no magic or ideal number of citations to collect. One strategy for checking coverage of the literature is to inspect references of relevant articles. As researchers review references they will start noticing a repetition of the same articles with few new articles appearing. This can indicate that the researcher has covered the literature base on a particular topic.

모두 합치기
Putting It All Together


연구논문 작성을 준비할 때는 어떤 citation을 포함시킬지, 그리고 introduction과 discuttion에 어떻게 활용inform할지 고민하는 것이 중요하다. 대상 저널에 대한 'Instructions to Authors'은 종종 문헌 검토(또는 소개)와 각 기사 범주에 허용되는 총 인용 횟수에 대한 지침을 제공한다. 
In preparing to write a research paper, it is important to consider which citations to include and how they will inform the introduction and discussion sections. The ‘‘Instructions to Authors’’ for the targeted journal will often provide guidance on structuring the literature review (or introduction) and the number of total citations permitted for each article category. 

Introduction에 대한 참고문헌을 선택할 때에는, 핵심 배경 이론 및 방법론 개념뿐만 아니라 [최근에 발표된 관련 연구]를 설명하는 것을 고려한다. 서론에서 제시하는 참고문헌은 사용 가능한 문헌의 너저분한 목록이나 단순 서술이 아니라, 현재 연구에 대한 맥락을 제공하고, 연구가 채우려는 문헌의 격차를 파악하기 위한 [종합적 요약]이므로, 간략해야 한다. 논의를 위해 현재 연구의 조사 결과를 현재 문헌과 비교 및 대조하고 현재 연구가 어떻게 필드를 발전시키는지를 나타내기 위해 citation을 신중히 선택해야 한다. 
When selecting references for the introduction consider those that illustrate core background theoretical and methodological concepts, as well as recent relevant studies. The introduction should be brief and present references not as a laundry list or narrative of available literature, but rather as a synthesized summary to provide context for the current study and to identify the gap in the literature that the study intends to fill. For the discussion, citations should be thoughtfully selected to compare and contrast the present study’s findings with the current literature andto indicate how the present study moves the field forward. 

결론
Conclusion

 

 

 

 

 


J Grad Med Educ. 2016 Jul;8(3):297-303.

 doi: 10.4300/JGME-D-16-00175.1.

The Literature Review: A Foundation for High-Quality Medical Education Research

Lauren A MaggioJustin L SewellAnthony R Artino Jr

Free PMC article

No abstract available

 

글로벌 평정척도가 체크리스트보다 전문성의 상승단계 측정에 더 나은가? (Med Teach, 2019)
Are rating scales really better than checklists for measuring increasing levels of expertise?
Timothy J. Wooda and Debra Pughb

 

 

도입
Introduction


객관적 구조화 임상검사(OSCE)에서 성과를 평가할 때 평정 척도rating scale는 학습자의 전문성 증가에 민감하지만, 체크리스트는 그렇지 않다는 것이 원칙이 되었다. 이에 대한 일반적인 설명은, 초보자들이 익숙하지 않은 문제에 직면했을 때 상세한 접근법을 사용할 가능성이 높은 반면, 더 경험이 많은 임상의들은 진단에 도달하기 위해 지름길을 사용할 수 있기 때문에 체크리스트를 사용하여 평가할 때 실제로 낮은 점수를 받을 수 있다는 주장과 관련된다(Regehr et al. 1998; Hawkins and Bullet 2008). 이와 같이, 체크리스트(조치 수행 여부를 평가하는 것)는 [철저성과 데이터 수집 능력을 보상한다]는 비판을 자주 받는 반면, 평정 척도rating scale(평가자가 조치가 얼마나 잘 수행되었는지 판단할 수 있게 하는 것)는 임상적 추론과 같이 전문가에게 보이는 고차적 기술을 평가하는 데 더 낫다는 평을 받는다.
It has become a doctrine that, when assessing performance in an objective structured clinical examination (OSCE), rating scales are sensitive to the increasing expertise of learners, whereas checklists are not. A common explanation for this relates to the assertion that novices are likely to use a detailed approach when encountering an unfamiliar problem while more experienced clinicians are able to use shortcuts to arrive at a diagnosis and, thus, may actually get lower scores when assessed using a checklist (Regehr et al. 1998; Hawkins and Boulet 2008). As such, checklists (which assess whether or not an action was performed) are often criticized for rewarding thoroughness and data-gathering ability, while rating scales (which allow raters to judge how well an action was performed) are touted as being better for assessing the higher-order skills seen in experts, such as clinical reasoning (Hodges and McIlroy 2003; Yudkowsky 2009). 


이론적인 관점에서 볼 때, 증가하는 전문성을 포착하는 데 있어서 등급 척도가 체크리스트보다 낫다는 주장이 타당하다. 이중 프로세스 이론은 문제에 직면했을 때 자동, 비분석 프로세스(유형 1) 또는 노력이 드는, 분석적 프로세스(유형 2)를 사용할 수 있다고 제안합니다. 따라서 OSCE 환경에서,

  • 전문 임상의가 사례에 접근할 때 무의식적(유형 1) 프로세스를 더 강조하여 실제로 일부 체크리스트 항목을 누락할 것으로 예상할 수 있다.
  • 반대로, 같은 경우에 접근하는 초보자는 보다 체계적(유형 2) 접근법에 더 큰 중점을 둘 수 있으며, 결과적으로 체크리스트 과제를 더 많이 수행하기 때문에 더 높은 점수로 보상받을 수 있다.

From a theoretical perspective, the assertion that rating scales are better than checklists at capturing increasing levels of expertise makes sense. Dual-process theory suggests that when faced with a problem we may use automatic, non-analytic processes (i.e. Type 1) or effortful, analytic processes (i.e. Type 2) (Evans 2008, 2018; Kahneman 2011).

  • In an OSCE setting, therefore, one might expect an expert clinician to place greater emphasis on unconscious (i.e. Type 1) processes when approaching a case and therefore actually miss some checklist items.
  • In contrast, a novice approaching the same case may place greater emphasis on a more systematic (i.e. Type 2) approach and, consequently be rewarded with a higher score because they perform more of the checklist tasks. 



연구 결과를 설명할 수 있는 또 다른 접근방식은, 전문가가 될수록 전문가는 다른 개발 단계를 거쳐 발전한다는 것이다(Dreyfus and Dreyfus 1986). [초보 단계]는 대량의 데이터 수집을 강조하는 반면, [전문가]들은 집중된 데이터를 보다 효율적으로 수집할 수 있으며 주어진 문제를 해결하도록 이끈 모든 단계를 파악하기 위해 어려움을 겪을 수 있습니다. 마찬가지로, 전문가들은 임상 데이터를 신속하게 해석할 수 있는 질병 스크립트를 개발하여 초보자가 수행할 수 있는 모든 단계를 따르지 않고도 문제를 해결할 수 있도록 할 수 있다(Schmidt et al. 1990). 
Another approach that could account for the findings is that professionals progress through different developmental stages as they become experts (Dreyfus and Dreyfus 1986). The novice stage isc haracterized by an emphasis on the gathering of large amounts of data, while experts are able to gather focused data more efficiently and may struggle to identify all the steps that led them to solve a given problem. Similarly,experts may capitalize on their experience to develop illness scripts that allow them to quickly interpret clinical data, allowing them to solve problems without following all the steps that a novice might (Schmidt et al. 1990).  

이러한 세 가지 이론을 고려할 때, 전문성이 높은 수험생을 평가할 때 평가 척도가 체크리스트보다 더 나은 도구가 될 것으로 예상할 수 있다.
Given these three theories, one would expect rating scales to be a better tool than checklists when assessing examinees with increasing levels of expertise. 

그러나, 이러한 등급 척도 우위에 대한 주장은 정당한가? 가장 자주 인용되는 연구에서 가정의사는 글로벌 등급 점수(5점 만점 기준)에서 전공의나 임상실습생보다 높은 점수를 받았지만, 2개 스테이션 정신의학 OSCE(Hodges et al. 1999)에 대한 체크리스트로 평가했을 때 두 그룹보다 더 나쁜 점수를 받았다. 

But, is this claim of rating scale superiority warranted? In the most frequently cited study, family physicians scored higher than residents and clinical clerks on a global rating score (derived from five 5-point rating scales), but worse than both groups when assessed with a checklist on a two-station psychiatry OSCE (Hodges et al. 1999). 

호지스 외 연구진(1998)은 8개 스테이션의 정신의학 OSCE에서 전공의와 임상실습생을 비교했다. 전공의들은 임상실습생보다 Rating scale 등급이 높았지만 체크리스트 점수는 비슷했다. 더 많은 스테이션이 있음에도 불구하고, 이러한 결과 패턴이 서로 다른 도메인을 평가하는 OSCE로 일반화 될지는 완전히 명확하지 않다. 저자들이 지적하듯이, 정신의학은 중요한 면에서 다른 학문과 다를 수 있다. 
study by Hodges et al. (1998) compared residents and clerks on an 8-station psychiatry OSCE. Residents had higher global ratings than clerks but similar checklist scores. Despite having more stations, it is not entirely clear if this pattern of results would generalize to OSCEs assessing different domains. As the authors point out, psychiatry may differ fromother disciplines in important ways. 

체크리스트의 한계에도 불구하고, 성과 평가 시 많은 장점을 제공한다. 즉, 체크리스트는 비교적 사용하기 직관적이고, 균일한 등급 기준을 제공하고, 높은 신뢰성을 가질 수 있으며, 취약 영역에 대한 특정 피드백을 제공할 수 있다(Harden et al. 2016; Norcini 2016). 실제로 잘 구성된 체크리스트와 등급 척도가 종종 다른 교육 수준을 구별하는 유사한 결과를 낳는다는 것을 보여주는 문헌 기구가 증가하고 있다. 예를 들어, 최근의 체계적인 검토(Ilgen et al. 2015)는 시뮬레이션 기반 평가에서 체크리스트와 등급 척도의 사용에 대한 타당성 증거를 탐색했다. 그 중 7개는 등급 척도 사용을 선호했고, 2개는 체크리스트 사용을 선호했으며, 대다수는 도구에서 차이를 발견하지 못했다. 그러나 이 체계적인 검토는 시뮬레이션 기반simulation-based 평가에만 초점이 맞춰져 있다는 점에 유의해야 한다. 시뮬레이션과 직접 관련되지 않은 수행능력 기반performance-based 평가에 대한 점검 목록과 등급 척도의 비교에는 제한된 증거만 있을 뿐이다. 

Despite the purported limitations of checklists, they offer many advantages when assessing performance, namely: checklists are relatively intuitive to use; provide uniform rating criteria; can have high reliability; and allow for the provision of specific feedback on areas of weakness to residents (Harden et al. 2016; Norcini 2016). In fact, there is a growing body of literature demonstrating that wellconstructed checklists and rating scales often produce similar results in discriminating between different levels of training. For example, a recent systematic review (Ilgen et al. 2015) explored validity evidence for the use of checklists and rating scales in simulation-based assessment. Of those, seven favored the use of rating scales, two favored the use of checklists, and the vast majority (n¼25) found no difference in the tools. However, it is important to note that this systematic review focused only on simulation-based assessments. There is only limited evidence in the comparison of checklists and rating scales for performance-based assessments not directly related to simulation. 

방법
Methods


참여자 Participants

Internal Medicine 진행률 검사 OSCE(IM-OSCE)는 Ottawa University(PGY1–PGY4)의 모든 Internal Medicine 레지던트에게 필수적이지만 형식적인 연례 검사로 시행됩니다. 
The Internal Medicine progress test OSCE, or IM-OSCE, is administered as a mandatory, but formative, annual examination for all Internal Medicine residents at the University of Ottawa (PGY1–PGY4). 


설계 Design

IM-OSCE는 지식, 임상 의사 결정, 신체 검사 기술 및 커뮤니케이션 기술을 평가하도록 설계된 9개 스테이션으로 구성되었습니다. 시험의 각 행정의 청사진은 캐나다 왕립의과대학 외과의가 정한 내과 교육 목표(RCPSC 2011)에 기초했다. 각 행정부마다 다양한 신체 시스템과 분야를 대표하는 사례가 선정되었습니다. 각 IM-OSCE의 내용은 사례 반복 없이 매년 달랐다. 
The IM-OSCE consisted of nine stations that were designed to assess knowledge, clinical decision making, physical examination skills, and communication skills. The blueprint for each administration of the exam was based on the Objectives of Training for Internal Medicine set by the Surgeons of Royal College of Physicians and Canada (RCPSC 2011). For each administration, cases were selected to represent a variety of different body systems and disciplines. The content on each IM-OSCE was different every year, with no repetition of cases. 


내과 전문의들은 각 스테이션마다 고유한 평가자 한 명씩을 두고 각 역마다 전공의들의 성과를 평가했다. 그러나 IM-OSCE의 설계 때문에 평가자는 분석에 포함되지 않았다. 각 IM-OSCE는 하나의 관리에서 두 개의 좌석이 있었고 각 좌석에 여러 개의 트랙이 있었습니다. 이 설계는 평가자와 표준화된 환자가 교락 요인이 되고 트랙과 좌석에 내포된다는 것을 의미합니다. 전공의는 이러한 선로에 무작위로 할당되고 PGY 레벨에 의해 체계적으로 할당되지 않았기 때문에 설계가 더욱 복잡했으며, 따라서 정격자 또는 선로와 같은 요소를 포함하면 상당한 데이터 누락과 전력 상실로 이어질 수 있었다. 따라서 우리는 스테이션 수준에서 데이터를 분석하기로 결정했으며, 분석에 트랙이나 레이터를 포함하지 않았습니다. 
Internal Medicine specialists assessed the residents’ performance on each station with a single, unique examiner at each station. Raters were not included in the analysis, however, because of the design of the IM-OSCE. Each IM-OSCE had two sittings in one administration and multiple tracks within each sitting. This design would mean that raters and standardized patients would be confounded factors and would be nested within track and sitting. The design was further complicated because residents were randomly allocated to these tracks and not systematically assigned by PGY level, therefore including factors like rater or track would have led to considerable missing data and a loss of power. We decided therefore to analyze data at the station level and did not include track or rater in the analysis. 

Pugh 외 연구진(2014)에 기술된 바와 같이, 전공의들은 스테이션-특이적 체크리스트와 작업-특이적 평정 척도(MeanGR)를 조합하여 평가받았다. 또한 표준 설정에 사용되는 단일 글로벌 등급 척도(GRS)를 사용하여 평가했으며, 응시자의 성과를 의대생 수준 또는 PGY 1~4의 연수생 수준으로 평가하기 위해 개발된 교육 수준 평가 척도traning level rating scale도 사용했다. 이 시험의 경우, 스테이션 점수는 표준 설정의 수정된 경계선 방법(McKinley 및 Norcini 2014)을 적용하는 데 사용되는 GRS와 체크리스트와 MeanGR(위원회가 결정한 각 가중치)의 조합을 사용하여 도출되었다. PGY1-4 척도는 피드백용으로만 사용되었으며 스테이션 점수에 반영되지 않았습니다. 각 스테이션별 점수를 합산해 총점을 만들어 수험생에게 보고했다. 

As described in Pugh et al. (2014), residents were scored using a combination of station-specific checklists and task-specific rating scales (MeanGR). They were also assessed using a single global rating scale (GRS) used for standard setting, as well as a training level rating scale developed to rate candidate performance as being at the level of a medical students or at the level of a trainee in PGYs 1 to 4. For this examination, station scores were derived using a combination of the checklist and the MeanGR (weightings for each determined by a committee) with the GRS used to apply the modified borderline method of standard setting (McKinley and Norcini 2014). The PGY1–4 scale was used only for feedback and did not factor into the station score. A total score was created by summing the scores on each station and were reported to examinees. 

분석 Analysis

시험 연도 내의 각 스테이션에 대해 체크리스트와 MeanGR 점수를 먼저 z-점수로 변환하여 두 측정치의 점수와 등급이 동일한지 확인했습니다. 음수를 제거하기 위해 각 측도의 z-점수는 평균 100, 표준 편차는 10으로 표준화되었습니다. 
For each station within an exam year, the Checklist and MeanGR scores were first converted to z-scores to ensure scores and ratings on both measures were on the same scale. To remove the negative numbers, the z-scores for each measure were standardized to have a mean of 100 and a standard deviation of 10. 

시험 연도별 각 스테이션마다 주 요인subject factor으로 취급되는 전공의의 PGY 수준(PGY1–4)과 반복 측정 요인repeated measure factor으로 취급되는 측정(즉, 체크리스트 및 평균GR 점수)을 사용하여 혼합 분산 분석을 수행하였다. 주된 관심은 다음과 같다.

  • (1) PGY 수준의 주요 효과가 있었던 비교: 훈련 증가의 함수에 따라 점수가 변경되었음을 나타낼 수 있기 때문
  • (2) PGY 수준과 두 측정값 사이에 교호작용 비교: 이는 한 측정값에서 점수가 다른 측정값과 다르게 증가했음을 나타내기 때문

For each station by exam year, a mixed ANOVA was conducted with PGY level of the resident (PGY1–4) treated as a between subject factor and the measure (i.e. Checklist and MeanGR scores) treated as a repeated measures factor. Of most interest were:

  • (1) comparisons in which there was a main effect of PGY level, because this would indicate that scores changed as a function of increases in training; and
  • (2) comparisons producing an interaction between PGY level and the two measures, because this would indicate that scores increased differently for one measure compared to the other.

스테이션에서 교호작용이 발견되면 교호작용의 근원을 탐색하기 위해 후속 분석이 수행되었습니다. 해당 스테이션에 대한 각 측도에 대해 PGY 수준을 과목 간 인자로 처리한 상태에서 과목 간 분산 분석을 별도로 수행했습니다.
If an interaction was found on a station, a subsequent analysis was conducted to explore the source of the interaction. For each measure on that station, a separate between subjects ANOVA was conducted with PGY level treated as a between subject factor.

윤리 Ethics review


결과
Results

2014년 총 73명, 2015년 85명, 2016년 86명의 전공의가 시험에 응시했다. 그림 1-3은 주어진 관리 연도의 각 스테이션 별 체크리스트와 평균 GR 점수를 나타낸 막대 그래프를 보여준다.
There was a total of 73 residents attempting the examination in 2014, 85 in 2015 and 86 in 2016. Figures 1–3 display bar graphs depicting Checklist and Mean GR scores by PGY for each station in a given administration year.

즉, 27개 스테이션에 걸쳐 총 13개 스테이션에서 체크리스트 점수와 평균 GR 점수에 대해 동등하게 교육 수준 상승 함수로 점수가 증가했음을 입증했으며, 한 스테이션만 체크리스트 점수가 증가하지 않고 등급 척도가 증가했음을 입증했다. 
In other words, across 27 stations, a total of 13 stations demonstrated that scores increased as a function of increase in training level equally for both Checklist and Mean GR scores and only one station demonstrated that checklist scores did not increase but rating scale did. 


고찰
Discussion

본 연구의 목적은 OSCE 내에서 전문지식의 증가와 채점 도구 사이의 관계를 재검토하여 [평정 척도rating scales]가 [체크리스트]보다 전문지식의 증가에 실제로 더 민감한지를 판단하는 것이었다. 체크리스트는 그렇지 않지만, 평정 척도는 전문지식 수준에 민감하다는 일반적인 견해를 고려할 때, 평정 척도 점수는 PGY 수준의 함수로 증가해야 하는 반면, 점검표 점수는 증가해서는 안 된다고 예상할 수 있다. 우리의 결과는 전문성 증가를 측정할 때 체크리스트에 비해 종종 인용되는 등급 척도 우위에 대한 주장에 반대challenge한다. 우리가 조사한 27개 스테이션 중 rating scale에서만 PGY 수준별 차이가 나타난 것은 1개뿐이었다. 
The purpose of this study was to reexamine the relationship between increases in expertise and scoring instruments within an OSCE in order to determine if ratings scales are indeed more sensitive to increases in expertise than checklists. Given the prevailing view that rating scales are sensitive to levels of expertise whereas checklists are not, one would expect that rating scale scores should increase as a function of PGY levels whereas checklist scores should not. Our results challenge the oft-cited claim of rating scale superiority over checklists when measuring increases in expertise. Of the 27 stations we examined, there was only one in which rating scales but not checklists demonstrated a difference by PGY level. 

우리의 결과는 시뮬레이션과 관련된 여러 논문에서 보고된 결과를 복제하지만(Ilgen et al. 2015) 왜 우리의 연구 결과가 [등급 척도의 우월성]에 대한 일반적인 가정에 도전하는지 의문을 제기한다. 여러 가지 이유가 있을 수 있습니다. 첫째, 체크리스트 설계는 초기 Hodges 등 연구 이후 발전해 왔다. 즉, 체크리스트는 요청되거나 [수행될 수 있는 모든 단계의 전체 목록]을 나타내지 않으며, 사례의 주요 기능key feature에 초점을 맞출 가능성이 더 높아졌습니다(Daniels et al. 2014; Yudkowsky et al. 2014). 확실히, 이것은 본 연구에 포함된 OSCE가 주요 특징key features에 초점을 두고 개발된 사례이다. 
Our results replicate findings reported in several papers related to simulation (Ilgen et al. 2015) but raise the question as to why our findings challenge the common assumption of rating scale superiority. A number of reasons might exist. First, the design of checklists has evolved since the initial Hodges et al. study. That is, checklists are now less likely to represent an exhaustive list of all steps that could be asked or done, and more likely to focus on the key features of the case (Daniels et al. 2014; Yudkowsky et al. 2014). Certainly, this is the case with the OSCEs included in the present study which were developed with a focus on key features. 

세 번째 가능성은 스테이션들의 난이도와 관련이 있을 수 있다. Hodges 등의 연구에서 스테이션은 임상 실습생 수준으로 설계되었지만 전공의와 수련후 의사를 테스트했다. 본 연구의 관측소는 PGY-4 수준의 성능을 테스트하기 위해 만들어졌기 때문에 상당히 어려웠다. 
A third possibility could be related to the difficulty of the stations. The Hodges et al. stations were designed to be at the level of clinical clerks but tested residents and practicing physicians. The stations in this study were considerably more difficult, having been created to test ability at the level of a PGY-4. 

연구 대상 27개 스테이션 중 13개 스테이션만only이 사용하는 채점도구와 무관하게 PGY 수준별 차이를 보인 것은 다소 놀라운 일이었다. PGY-4 수준에서 설정된 난이도 시험이지만 모든 수련 연차의 전공의가 시도한 진도 시험임을 감안할 때, 모든 스테이션에 적어도 하나의 도구instrument에서 변화가 있을 것으로 예상할 수 있다. 그러나 이는 적어도 부분적으로는 스테이션 유형의 함수일 수 있습니다. 주목할 점은 의사소통 스테이션 (0/3) 중 단 한 곳도 없었고, 단지 신체검진 스테이션에서 3/12에서만 두 척도 중 하나 이상에서 PGY level에 따른 차이가 나타났다.
It was somewhat surprising that only 13 of the 27 studied stations demonstrated a difference by PGY level regardless of the scoring instrument used. Given that this is a progress test with a difficulty set at a PGY-4 level but attempted by residents of all training years, one would have expected changes with at least one of the instruments in all stations. However, this may be again, at least in part, a function of station type. It is noteworthy that none of the communication stations (0/3) and only 3/12 physical examination stations examined demonstrated a difference by PGY level for either of the measures. 

세 번째 신체 검사 스테이션은 상호작용이 있었고, 평정 척도만이 PGY 수준이 증가를 보였다. 신체 검사 스테이션과 관련된 이러한 발견은 많은 신체검사 기술(예: 관절 검사 또는 신경 검사 수행 능력)이 수련 초기에 획득되었을 것으로 예상되고 레지던트 기간 동안 크게 발전하지 않았을 수 있기 때문에 발생했을 수 있습니다. 의사소통 스테이션에 대한 PGY 수준의 차이가 없는 것과 관련하여, 이는 수련기간 증가에 따른 내과 레지던트 의사소통 능력 개발의 진전이 없음을 입증하는 이전에 발표된 연구와 일치한다(Pugh et al. 2016). 
A third physical examination station had an interaction with only the rating scale producing increases in PGY level. This finding related to physical examination stations may have occurred because many of the skills tested (e.g. ability to perform a joint or neurologic exam) might be expected to have been acquired early in training and may not have evolved much during residency. With regards to the lack of differences seen by PGY-level on the communication stations, this is in keeping with a previously published study which also demonstrated no progression in the development of Internal Medicine residents’ communication skills over time (Pugh et al. 2016). 

이론의 여지없이, (수험생이 효율적인 데이터 수집하고, 진단을 내리고, 관리 계획을 수립하는 과정에서 문제에 대한 접근 방식을 입증해야 하는) [구조화된 구술structured oral]은 더 복잡하며, 따라서 주니어 훈련생과 시니어 훈련생 사이의 차이를 입증할 가능성이 더 높을 수 있다. (10/12 structured oral station는 PGY-수준별 차이를 보였다.)
Arguably, structured orals, which require an examinee to demonstrate an approach to a problem that includes efficient data gathering, diagnosis and formulation of a management plan, are more complicated and therefore may be more likely to demonstrate a difference between junior and senior trainees (10/12 structured oral stations demonstrated a difference by PGY-level). 

본 연구의 가장 큰 한계는 동일한 평가자가 체크리스트와 평가 척도를 모두 완료했기 때문에 두 측정이 서로 영향을 미쳤을 가능성이 매우 크다는 것이다. 즉, 체크리스트가 역량 증가를 측정할 수 없다는 가정이 얼마나 일반적인지를 고려할 때, 두 측정이 서로 교란되어 있더라도 우리의 결과는 최소한 주의를 시사해야 합니다.
A major limitation to our study is that the same rater completed both the checklist and the rating scales and therefore it is quite possible that the two measures influenced each other. That said, considering how common the assumption is that checklists cannot measure increases in competency, our results should at the least suggest caution even with both measures being confounded with each other.

결론적으로, 우리는 체크리스트가 등급 척도보다 낫거나 나쁘다고 주장하는 것이 아니다 – 둘 다 특정한 상황에서 장점이 있다.

In conclusion, we are not arguing that checklists are better or worse than rating scales – both have merits under particular circumstances. 

 

 

 


Med Teach. 2020 Jan;42(1):46-51.

 doi: 10.1080/0142159X.2019.1652260. Epub 2019 Aug 20.

Are rating scales really better than checklists for measuring increasing levels of expertise?

Timothy J Wood 1Debra Pugh 2

Affiliations collapse

Affiliations

  • 1Department of Innovation in Medical Education, University of Ottawa, Ottawa, Canada.
  • 2Department of Medicine, University of Ottawa, Ottawa, Canada.
  • PMID: 31429366
  • DOI: 10.1080/0142159X.2019.1652260Abstract
  • Background: It is a doctrine that OSCE checklists are not sensitive to increasing levels of expertise whereas rating scales are. This claim is based primarily on a study that used two psychiatry stations and it is not clear to what degree the finding generalizes to other clinical contexts. The purpose of our study was to reexamine the relationship between increasing training and scoring instruments within an OSCE.Approach: A 9-station OSCE progress test was administered to Internal Medicine residents in post-graduate years (PGY) 1-4. Residents were scored using checklists and rating scales. Standard scores from three administrations (27 stations) were analyzed.Findings: Only one station produced a result in which checklist scores did not increase as a function of training level, but the rating scales did. For 13 stations, scores increased as a function of PGY equally for both checklists and rating scales.Conclusion: Checklist scores were as sensitive to the level of training as rating scales for most stations, suggesting that checklists can capture increasing levels of expertise. The choice of which measure is used should be based on the purpose of the examination and not on a belief that one measure can better capture increases in expertise.

형성적 OSCE가 어떻게 학습을 유도하는가? 전공의 인식 분석 (Med Teach, 2017)
How do formative objective structured clinical examinations drive learning? Analysis of residents’ perceptions
Debra Pugh, Isabelle Desjardins & Kevin Eva

 

 

배경
Background


평가가 학습을 촉진한다는 데는 의학 교육자들 사이에 이견이 거의 없습니다(Newble 2016). 그러나 평가의 역할에 대한 강조가 순전히 더 나은 학습의 평가(AOL)에서 교육자가 학습을 위한 평가(AFL)를 사용할 수 있는 방법에 대한 사고 방식으로 변화함에 따라, 다양한 형태의 평가가 교육적 가치를 갖는 방법과 시기를 결정하는 자극이 있다. 
There is little disagreement among medical educators that assessment drives learning (Newble 2016). However, as the emphasis for the role of assessment shifts purely from better assessment of learning (AOL) toward thinking in ways about how educators can use assessment for learning (AFL), there is an impetus to determine how and when assessments of various forms have educational value. 

평가가 학습자에게 직접적 및 간접적 영향을 미칠 수 있다는 것을 알게 되었습니다(Larsen et al. 2008). [직접적인 효과]는 평가 자체가 학습을 촉진할 때 발생합니다. 예를 들어, [테스트 효과]는 동일한 시간을 할애했을 때, 그냥 공부보다 테스트가 학습에 더 강력한 영향을 미칠 수 있다는 잘 확립된 현상을 말한다(Larsen et al. 2008, 2009; Kromann et al. 2009; Larsen 2013). 반면 [간접적인 효과]는 학습자에게 평가를 받을 것임을 알려 학습 동기를 제공하는 데서 발생합니다. 또한, 시험이 끝난 후 학습자에게 제공되는 피드백은 학습자가 평가가 끝난 후에도 주제를 계속 탐색하도록 동기를 부여할 수 있는 장점과 단점을 강조하여 학습 방향을 안내하는 데 도움이 될 수 있습니다(Agrawal et al. 2012). 
It has become understood that assessment can have both direct and indirect influences on learners (Larsen et al. 2008). Direct effects arise when the assessment itself prompts learning. For example, the testing effect refers to a well-established phenomenon that testing can have a more powerful influence on learning than when an equal amount of time is devoted to studying (Larsen et al. 2008, 2009; Kromann et al. 2009; Larsen 2013). Indirect effects, in contrast, arise from providing an incentive to study by informing learners that they will be assessed. In addition, the feedback provided to learners after a test can help to guide their learning by highlighting areas of strength and weakness that may, in turn, motivate learners to continue exploring the topic after the assessment is over (Agrawal et al. 2012). 

이러한 명확한 평가의 이점에도 불구하고, 시험이 학습에 해로울 수도 있습니다. 예를 들어, 시험 이벤트로 인한 스트레스는 학습자들이 장기적인 이득을 위해 자료를 보다 철저히 이해할 수 있도록 노력을 기울이기보다는, 단기적으로(즉, 시험에서) 성공할 가능성을 극대화하는 피상적인 학습 전략(예: 암기, 주입식, 공부)을 채택하도록 유도할 수 있습니다. (Pashler et al. 2007) 또한 학습자는 테스트의 단서cue를 사용하여 시도하지 않았을 질문에 올바르게 (찍어서) 답할 수 있으며, 이는 자신의 능력에 대한 인상을 부풀릴 수 있습니다(Desjardins et al. 2014). 마지막으로, 수험생들은 점수를 높이기 위해 담합과 부정행위에 의존해야 한다는 압박감을 느낄 수 있으며, 다시 실제 학습과 관련된 노력을 저하시킬 수 있습니다(Henning et al. 2013). 
Despite these clear benefits of assessment, testing can also be detrimental to learning. For example, the stress caused by a testing event may lead learners to adopt superficial learning strategies (e.g. rote memorization, cramming, studying to the test) that maximize their chances of success in the short term (i.e. on an examination) rather than devoting their efforts to truly understanding the material in a way more likely to yield long-term gain (Pashler et al. 2007). Learners may also use cues on the examination to correctly answer questions they would not otherwise have attempted, which may create an inflated impression of their own abilities (Desjardins et al. 2014). And, finally, examinees may feel pressure to resort to collusion and cheating in an attempt to improve their scores, again detracting from efforts related to actually learning the material (Henning et al. 2013). 

시험을 교육학적 개입으로 채택employ하려고 노력하는 사람들에게 이러한 어려움은 평가가 [학습자가 자신의 스킬을 보여주는 상황]을 지켜보는 관찰자가 있는 수행능력-기반performance-based 평가일 때 더욱 복잡해질 가능성이 있다. 
These challenges for those striving to employ tests as pedagogical interventions are likely to be compounded when the assessment in question is performance based with observers watching a learner demonstrate their skills. 

비록 지식은 기초로서 필요하지만, 학습자가 임상 문제에 직면했을 때 그 지식을 통합하고 적용하는 방법을 평가하기 위해 잘 설계된 OSCE를 사용한다(Harden et al. 1975). OSCE는 일반적으로 (임상 기술과 환자와의 관계를 확립하는 능력 등) 서면 테스트의 대상과 다른 구조를 평가하는 데 사용된다(Jefferies et al. 2007). 이 두 가지 요인 모두 OSCE에서 이루어지는 학습이 단순한 [선언적 지식]을 반영할 가능성이 낮으며, 다양한 방식으로 해석가능한 상호작용을 수반하는 [복잡한complex 행동]을 반영할 가능성이 높다는 것을 시사한다. 
Although they require a foundation of knowledge, well-designed OSCEs are used to assess how learners integrate and apply that knowledge when faced with a clinical problem (Harden et al. 1975). OSCEs are generally used to assess different constructs than those that are targeted by written tests, such as clinical skills and the ability to establish rapport with a patient (Jefferies et al. 2007). Both of these factors suggest that the learning that takes place in OSCEs is less likely to reflect simple declarative knowledge and more likely to reflect complex behaviors that will interact in variably interpreted ways. 

따라서 OSCE를 둘러싸고 이뤄지는 학습은 (서면 테스트와 비교했을 때) 의사가 공식 교육을 완료한 후 경험하게 될 평가 모멘트의 영향에 대한 더 나은 근사치better approximation를 제공할 수 있습니다. 그러나 수행능력-기반 평가에서 따라오는 관찰은 학습자가 자연스럽게 무엇을 할 것인지를 보여주기보다는 '연기play a role'을 해야 한다고 느끼게 만듦으로써 '연출적staging' 행동으로 이어진다는 점을 명심해야 한다(Gormley et al. 2016; Shea and Norcini 2017). 이는 학습자, 특히 상급advanced 교육 단계에 있는 학습자의 경우 [잘 설계된 OSCE조차 비현실적인 것으로 간주]한다면 교육적 가치에 대한 냉소를 유발할 수도 있다. 이 모든 내용을 종합하여 대학원(전공의) 교육 환경에서 형성적목적을 위해 표면적으로 운영되는 OSCE가 학습을 장려하기 위해 평가를 설계할 때 고려해야 하는 긴장을 더 잘 이해할 수 있는 특히 강력한 컨텍스트를 제공할 것임을 시사한다. 

As such, learning that takes place around an OSCE could provide a better approximation (relative to written tests) of the influence of assessment moments that physicians will experience after their formal training is completed. It is important to keep in mind, however, that the observation required for performance-based assessment leads to “staging” behaviors as learners can feel compelled to “play a role” rather than demonstrate what they would naturally do (Gormley et al. 2016; Shea and Norcini 2017). This creates the potential that learners, especially those operating at an advanced stage of training, will view even a well-designed OSCE as inauthentic, thus engendering cynicism regarding its educational value. All of this sums together to suggest that an OSCE that is ostensibly run for formative purposes in a postgraduate (residency) training context would provide a particularly powerful context within which to better understand the tensions that need to be taken into account when designing assessments to encourage learning. 

방법
Methods


형성적 OSCE는 오타와 대학에서 대학원 과정(PGY) 1~4학년 레지던트에게 Progress test(즉, 여러 단계의 교육에서 학습자에게 시행되는 종합 검사)로 시행되었습니다. 같은 날 저녁, [9개 스테이션]의 [5개 동시회로]가 2차례 운행돼 모든 전공의가 이용할 수 있었다. 

A formative OSCE was administered to Internal Medicine (IM) residents in postgraduate years (PGY) 1–4 at the University of Ottawa as a progress test (i.e. a comprehensive examination administered to learners at different stages of training). Five simultaneous circuits of nine stations were run twice in the same evening to accommodate all residents. 

OSCE 진행률 테스트 형식
OSCE progress test format



스테이션의 길이는 12분, 구두 피드백은 1분이었다. 1분이 긴 시간은 아닌 것으로 보일 수 있지만, 이 맥락에서 우리의 이전 연구는 심사관들이 1분 안에 평균 16명의 전공의 피드백 포인트를 제공하는 것으로 입증했다(Humphrey-Murto et al. 2016). 전공의는 스테이션 유형에 따라 선택된 스테이션별 체크리스트와 다수의 5점 평가 척도(예: 조직 기술, 환자와의 관계)를 사용하여 의사 검사자에 의해 채점되었다.
Stations were 12min in length, accompanied by 1min of verbal feedback. While a single minute may not seem like a long time, our previous research in this context has demonstrated that examiners provide an average of 16 residents feedback points to in 1 min (Humphrey-Murto et al. 2016). Residents were scored by physician examiners using a combination of station-specific checklists and a number of five-point rating scales (e.g. organizational skills, rapport with patient) that were selected based on station type.

참여자 Participants

설문 Surveys

참가자들은 검사 전(사전 검사), 검사 직후(사후 검사), 검사 후 결과(사후 결과)의 세 가지 설문조사를 완료해야 했습니다. 자세한 내용은 보충 부록을 참조하십시오. 
Participants were asked to complete three surveys: before the examination (pre-examination), immediately following the examination (postexamination), and after the examination, results were made available (postresults); see Supplementary Appendix. 

운영 Administration

온라인 설문조사 서비스(Fluid Survey VR)를 사용하여 설문조사를 배포했으며 선택된 응답(즉, 라이커트 등급 척도)과 구성된 응답(즉, 서술형 논평) 질문을 모두 포함했다.
Surveys were distributed using an online survey service (Fluid Surveys VR ) and included both selected-response (i.e., Likert-like rating scales) and constructed response (i.e. narrative comments) questions.

분석 Analyses

상위 성과자와 하위 성과자 간의 차이는 총 OSCE 점수의 [중위 분할median splits]을 사용하여 조사되었으며, 전공의는 특정 대학원 연도에 상위 성과자 또는 하위 성과자로 분류되었다. 우리는 성취도가 낮은 사람이 성취도가 높은 사람과 비교했을 때 다른 학습 전략을 채택할 것이라는 가설을 세웠습니다. 혼합 설계 분산 분석을 사용하여 검사 주기 동안 낮은 성과자와 높은 성과자의 등급의 차이뿐만 아니라 그러한 등급의 변화(즉, OSCE 이후 및/또는 결과를 받은 후 참가자의 인식이 변경되었는지 확인)를 조사했습니다. 구면성에 대한 가정을 위반한 경우, Greenhouse–Geisser corrections을 사용했다. 
Differences between high and low performers were explored using median splits on total OSCE score with residents classified as either high or low performers within their particular postgraduate year. We hypothesized that low achievers would adopt different learning strategies when compared to high achievers. A mixed design ANOVA was used to examine differences in low and high performers’ ratings as well as changes in those ratings over the examination cycle (i.e. to see if participants’ perceptions changed after the OSCE and/or after they received their results). Where assumptions of sphericity were violated, Greenhouse–Geisser corrections were used. 

결과
Results


참가자는 OSCE에 등록된 거주자의 분포에 근거하여 예상대로 모든 교육 수준에 걸쳐 비교적 고르게 분포되었다(표 1). 
Participants were relatively evenly distributed across all levels of training, as expected based on the distribution of residents enrolled in the OSCE; (Table 1). 



선택한 응답 질문에 대한 테마 생성
Theme generation for selected response questions


참가자들에게 OSCE의 목표에 대해 묻는 질문에서는 세 가지 주제를 파악했습니다. 

  • 성과 지향 목표(즉, 참가자가 점수를 잘 받기를 원했음을 나타내는 목표) 
  • 숙달 지향 목표(즉, 참가자가 임상 기술 향상을 원했음을 나타내는 목표) 및 
  • 피드백을 받는 것(즉, 참가자가 OSCE로부터 성과에 대한 지침을 구하고 있었다는 것을 나타내는 목표)

For the question asking participants about their goals for the OSCE, three themes were identified:

  • performance-oriented goals (i.e. goals indicating the participant wanted to score well),
  • mastery-oriented goals (i.e. goals indicating the participant wanted to improve their clinical skills) and
  • receiving feedback (i.e. goals indicating the participant was seeking guidance about their performance from the OSCE). 


OSCE의 가치에 대한 참가자의 인식과 관련된 항목은 [타당한 평가 수단]과 [교육적 가치]라는 주제로 코드화되었다. 
Items related to participants’ perceptions about thevalue of the OSCE were coded into the themes of:

  • valid means of assessment and
  • educational value. 



OSCE를 준비하는 데 사용된 학습 활동의 유형에 대한 질문과 OSCE에서 점수를 잘 받는 방법에 대한 참가자의 인식에 대한 질문은 [내용 중심 전략]과 [시험 전략]의 두 가지 주제로 나뉘었다. 
Items associated with both the question about the types of study activities used to prepare for the OSCE and the question about participant perceptions of how to score well on the OSCE were divided into two themes:

  • content-focused and
  • test-taking strategies. 




OSCE 목표
Goals for the OSCE

성능 지향 목표: 연습 OSCE는 처음이기 때문에, 로얄 칼리지 OSCE의 형식을 익히고 다음에 시험을 볼 때 나아지기를 바라는 것이 저의 주된 목표입니다. (C3Q; PGY-2) 
Performance-oriented goals: Since it will be my first time doing the practice OSCE, my main goal is to familiarize myself with the format of a Royal College OSCE and hopefully improve the next time I take the exam. (C3Q; PGY-2) 

숙달 지향 목표: OSCE는 로얄 칼리지에 대비하여 PGY4급으로 설계되어 있기 때문에, 저는 R1로서 이 경험을 통해 (이 시험에 합격할 것이라고 기대보다는) 배우는 것이 목표입니다. (A1P; PGY-1) 
Mastery-oriented goals: Since the OSCE is designed for the PGY4 level in preparation for the Royal College, my goal is to learn from this experience as an R1 and not expecting (sic) to pass the exam. (A1P; PGY-1) 

피드백 요청: 내용만 있는 것이 아니라, 그런 관점에서 저의 '시험정신exammanship'과 로얄 칼리지 준비에 대한 피드백을 원합니다. (A1E; PGY-3) 
Desire for feedback: I would like feedback on my ‘exammanship’ (sic) and Royal College preparation from that point of view, rather than just content alone. (A1E; PGY-3) 

표 2에서 볼 수 있듯이, 고성능 전공의와 저성능 전공의 모두 좋은 성과를 거두기를 원했다. 시간에 따라 변하기는 했지만 [성과 지향적 진술]과 관련된 평균 등급은 일반적으로 높았다(F→4.1 p→0.03). 사후 검사(평균 4.2, SE→0.15)와 사후 결과(평균 4.3, SE→0.10) 조사와 비교했을 때 사전 검사(평균 →4.6, SE→0.11)에서 평균 등급이 더 높았다. 높은 성과 대 낮은 성과자의 주효과는 관찰되지 않았으며(F→0.52, p→0.48), 상황(즉 사전 검사, 사후 검사, 사후 결과)은 성과 그룹과 상호작용하지 않았다(F→3.2, p→0.07).
As shown in Table 2, both high- and low-performing residents wanted to perform well. Mean ratings related to performance-oriented statements were generally high, although they changed over time (F¼4.1 p¼0.03). Post hoc tests indicated that mean ratings were higher in the pre-examination survey (mean¼4.6, SE¼0.11) when compared to the postexamination (mean¼4.2, SE¼0.15) and postresults (mean¼4.3, SE¼0.10) surveys. No main effect of high versus low performers was observed (F¼0.52, p¼0.48) and occasion (i.e. pre-examination, postexamination, postresults) did not interact with performance group (F¼3.2, p¼0.07).

OSCE를 사용하여 임상 기술을 개선하고자 하는 참가자의 욕구를 나타내는 [숙련 중심의 진술]에 대한 평점은 OSCE 직후 내려갔으나, 참가자가 결과를 받은 후 상승하였다(F§123, p<0.001). 수행능력 수준별 차이는 없었으며(F→0.01p→0.91) 경우에 따라 성능 수준(F→0.64, p→0.53)과 상호 작용하지 않았습니다. 
Ratings for mastery-oriented statements, indicating participants’ desire to use the OSCE to improve their clinical skills, went down immediately after the OSCE but then increased after participants received their results (F¼123, p<0.001). There was no difference by performance level (F¼0.01 p¼0.91) and, again, occasion did not interact with performance level (F¼0.64, p¼0.53). 

[피드백 수신]과 관련된 진술의 등급은 OSCE를 예상하여 피드백을 받는 것의 중요성과 관련된 진술에 대한 평점이 가장 높았습니다. 이러한 등급이 사전 조사와 후속 조사(F→8.7, p→0.001) 사이에 감소하였고, 성능 수준(F→1.3, p→0.26)과 상호작용(F→3.0, p→0.07)의 차이가 없었다.

Ratings for statements related to the importance of receiving feedback were greatest in anticipation of the OSCE as these ratings decreased between the pre-examination survey and subsequent surveys (F¼8.7, p¼0.001), with no difference between performance level (F¼1.3, p¼0.26) and no interaction (F¼3.0, p¼0.07).



OSCE에 대한 인식
Perceptions of the OSCE


시간에 따라 설정한 목표에 대한 참가자의 반응이 동적으로 변화했음에도 불구하고, OSCE의 타당성과 관련된 참가자의 평점은 표 3에 예시된 바와 같이 OSCE의 교육적 가치에 대한 평점(F of0.56, p570.57)과 마찬가지로 안정적이었다(F33.4, p)0.05) 다시 말하지만, 이러한 등급은 성능 수준에 따라 차이가 없었으며, 발생 및 성과 수준(두 주제 모두 F<2.0, p>0.15)은 상호 작용하지 않았다.
Despite the dynamic changes in participants’ responses regarding the goals they set over time, their ratings related to the validity of the OSCE were stable (F¼3.4, p¼0.05) as were their ratings of the educational value of the OSCE (F¼0.56, p¼0.57), as illustrated in Table 3. Again, these ratings did not differ by performance level (F<0.50, and p>0.45 for both themes) and occasion and performance level did not interact (F<2.0, p>0.15 for both themes).

OSCE 직후에 설문조사를 했을 때, 거의 모든 참가자(n=34, 97%)가 무언가를 배웠다고 보고했다. 사후 평가 설문 조사에 대한 대부분의 논평은 시험 전략 개선과 관련하여 무엇을 배웠는지에 초점을 맞췄다. 
When surveyed immediately following the OSCE, almost all participants (n¼34, 97%) reported that they had learned something. Most of the comments on the postexamination survey focused on what was learned in relation to improving test-taking strategies: 

반면, 결과가 발표된 후 OSCE로부터 무엇을 배웠는지에 대한 질문을 받았을 때, 참가자들의 서술적 논평은 OSCE가 지식의 상당한 gap를 식별하도록 했다는 사실을 강조하였다.
In contrast, when asked about what they had learned from the OSCE following the release of the results, participants’ narrative comments highlighted the fact that the OSCE had allowed them to identify significant gaps in their knowledge:

학습을 안내하는 데 유용한 요소를 물었을 때, 참가자의 평점은 시험자 피드백에 대해 상대적으로 중립적이었다(평균 §3.4, SD00.79). 서술적 논평은 일부 참가자가 심사자 피드백의 타당성의 가치를 떨어뜨리는 이분법dichotomy을 언급되었고, 다른 참가자는 더 많은 피드백을 요구하였다.  
When asked what factors were useful in guiding their learning, participants’ ratings were relatively neutral regarding examiner feedback (mean¼3.4, SD¼0.79). Narrative comments reflected a dichotomy in which some participants discounted the validity of examiner feedback, while others called for more feedback:  

스터디 활동에 소요된 시간
Time spent on study activities


비록 이것이 형성시험이었지만, 약 절반의 참가자(n¼18, 51%)는 OSCE를 위해 특별히 준비하는 데 시간을 보낸다고 보고했다. 
Although this was a formative examination, about half theparticipants (n¼18, 51%) reported spending time specific-ally preparing for the OSCE. 

표 4에 예시된 점수는 연구 활동에 소요된 시간과 관련하여 참가자의 의도와 경험 간에 차이가 존재했음을 시사한다. [시험 전 설문]에서 교육생들에게 연구 활동에 얼마나 많은 시간을 할애할 것으로 예상했는지를 물었을 때, 후보자들에게 다양한 학습 활동에 실제로 얼마나 많은 시간을 소비했는지를 보고하도록 요청했을 때(평균 2.2, SE→0.20) [시험 후 설문]보다 반응이 유의미하게 높았다(평균 1.1, SE→0.22) [시험 결과 후]에서는, 참가자들에게 미래 OSCE 연구에 얼마나 많은 시간을 할애할 계획이냐는 질문을 받았을 때, 그들의 추정치는 다시 사전 심사 수준(평균 § 2.3, SE se 0.25)으로 올라갔다. 이러한 등급은 성능 수준(두 주제 모두 F<0.6, p>0.4)에 따라 다르지 않았으며, 성능 수준과 경우가 상호 작용하지 않았다(두 주제 모두 F<0.6, p>0.5).
The scores illustrated in Table 4 suggest that, with regards to time spent on study activities, differences existed between participants’ intentions and their experience. Preexamination, when trainees were asked how much time they anticipated they would spend on study activities, responses were significantly higher (mean¼2.2, SE¼0.20) than they were postexamination, when candidates were asked to report how much time they had actually spent on various study activities (mean¼1.1, SE¼0.22). Postresults, when participants were asked how much time they would plan to devote to studying for future OSCEs, their estimates came up again to the pre-examination level (mean¼2.3, SE¼0.25). These ratings did not differ by performance level (F<0.6, p>0.4 for both themes) nor did performance level and occasion interact (F<0.6, p>0.5 for both themes).

 

OSCE에서 점수를 잘 받는 방법
How to score well on the OSCE


OSCE에서 점수를 잘 받으려면 더 많은 컨텐츠 지식이 필요하다는 참가자의 인식과 관련된 등급이 시간이 지남에 따라 변경되었습니다(F¼5.0, p00.01). [시험 후 설문]은 표 5에 예시된 바와 같이 [시험 전 설문](평균 3 3.6, SE 0 0.09)와 [결과 후 설문](평균 3 3.9, SE 0 0.10) 사이에 이러한 차이가 발생한 것으로 나타났다. 성능 수준의 주효과는 없었습니다(F→0.099, p→0.75). 그러나 성능과 상황 사이에는 교호작용이 있었습니다 (F→6.5, p→0.005). 사후 테스트 결과 사전 심사 후 콘텐츠 지식의 중요성에 대한 낮은 성과자의 인상이 높아진 반면, 높은 성과자의 평점은 OSCE 이전 낮은 성과자의 평점보다 높아 시간이 지날수록 높은 것으로 나타났다. 시간에 따른 시험 응시 전략의 중요성에 대한 참가자의 평가에는 차이가 없었다(F→0.17, p→0.81).
Ratings related to participants’ perceptions that more content knowledge is required to score well on the OSCE changed over time (F¼5.0, p¼0.01). Post hoc tests indicated that this difference arose between the pre-examination (mean¼3.6, SE¼0.09) and postresults (mean¼3.9, SE¼0.10) surveys, as illustrated in Table 5. There was no main effect of performance level (F¼0.099, p¼0.75). However, there was an interaction between performance and occasion (F¼6.5, p¼0.005). Post hoc tests indicated that low performers’ impressions of the importance of content knowledge increased after the pre-examination survey, whereas high performers’ ratings were higher than low performers’ ratings pre-OSCE and remained high over time. There was no difference in participants’ ratings of the importance of test-taking strategies over time (F¼0.17, p¼0.81).

OSCE를 어떻게 준비했는지를 물었을 때, 가장 일반적인 연구 전략에는 콘텐츠 지식 향상(n=18), 정기 임상 순환 시 환자 검사(n=13), 임상 검사 관련 비디오 시청(n=10)이 포함되었습니다. 테스트맨십과 관련된 전략은 덜 자주 표현되었다. 즉, 이전 OSCE 체크리스트(n→5)와 OSCE 준비 과정(n→1)의 검토였다. 
When asked how they had prepared for the OSCE, the most common study strategies involved improving content knowledge: reading around areas of content (n¼18), examining patients during regular clinical rotations (n¼13) and watching videos related to clinical examinations (n¼10). Strategies related to testmanship were less commonly expressed: review of old OSCE checklists (n¼5) and OSCE prep courses (n¼1). 

고찰
Discussion

시험전 효과
Pretest effects


비록 형성적 시험이었지만, OSCE는 시험 전 단계에서 공부 습관에 영향을 주었다. 참가자들은 OSCE가 [콘텐츠 지식 향상]과 [시험 점수 극대화]를 목적으로 하는 학습 행동에 참여하도록 이끌었다고 보고했습니다. 이는 필기 테스트에서 보이는 것과 유사하다(Cilliers et al. 2012). 흥미롭게도 학습자가 종종 성과 지향적 또는 숙달 지향적(Chen et al. 2016)으로 분류되지만, 참가자들은 OSCE를 극복해야 할 장애물이자 학습과 피드백을 받을 수 있는 기회로 보고 있음을 시사했다.
Although it was a formative examination, the OSCE influenced study habits in the pre-assessment phase. Participants reported that the OSCE led them to engage in study behaviors aimed at both improving content knowledge and maximizing their test scores, which parallels what is seen in written tests (Cilliers et al. 2012). Interestingly, although learners are often categorized as being either performance oriented or mastery oriented (Chen et al. 2016), participants’ responses suggested that they viewed the OSCE as both a hurdle to overcome and an opportunity to learn and receive feedback, as reflected by their goals and study strategies. 

의료계 전공의들이 성공하기 위해 학문과 높은 점수를 모두 추구하는 데 많은 시간을 보냈다는 점에서 이는 놀라운 일이 아닐 수 있다. 따라서 학습자의 마음속에서 [수행을 잘 하는 것]과 [자료를 숙달하는 것]은 [맥락에 따라서 중요도가 조금씩 달라지는 보완적 목표]로 개념화될 수 있습니다. 학습자가 OSCE를 [학습에 대한 평가]와 [학습을 위한 평가] 둘 다로 보는 것 역시, 이러한 구조 사이(AoL과 AfL)에 상당한 기능적 중복이 있으며, 평가 순간을 반드시 하나의 범주 또는 다른 범주로 분류하는 것으로 생각하는 것은 인위적일 수 있음을 시사한다. 확실히, 모든 평가가 어느 정도 극복해야 할 장애물로 간주될 수 있기 때문에 [학습자는 교육자의 방식대로 총괄적 평가와 형성적 평가를 구분하지 않는다]고 제안하는 문헌이 있다(Bok et al. 2013; Heeneman et al. 2015). 
This may not be surprising, given that medical residents have spent much of their academic career pursuing both knowledge and high marks in order to be successful. Therefore, performing well and mastering the material may more accurately be conceptualized as complementary goals that are more or less foregrounded in the minds of learners, depending on context. That learners appeared to view such a low stakes OSCE as both an assessment of their learning and an assessment for their learning suggests that there is considerable functional overlap between these constructs and that it may be artificial to think of assessment moments as necessarily falling into one category or the other. Certainly, there is literature to suggest that learners do not differentiate between formative and summative assessment the way educators do, as all assessment may be viewed as a hurdle to be overcome to some extent (Bok et al. 2013; Heeneman et al. 2015). 

순시험 효과
Pure test effects

시험 행위 자체가 필기 시험(시험 강화 학습)을 통한 학습으로 이어지는 것으로 나타났다. 필기 시험 사용에 대한 여러 연구에서는 혼자 공부하는 것에 비해 시험이 더 많은 학습과 더 나은 학습 이전으로 이어진다는 것을 발견했지만, 이것이 수행능력 기반performance-based 시험에서도 해당되는지transfer 여부는 명확하지 않다(Butler 2010; Larsen et al. 2013). [수행능력 기반 테스트를 보는 것 자체]로도 결과 유사한 효과가 발생한다는 징후가 있었지만, 그러한 현상은 잘 확립되지 않았다(Kromann et al. Kromann et al. 2009). 현재 연구에서 거의 모든 참가자는 이 Formative OSCE에 참여함으로써 무언가를 배웠다고 보고하였다. 
The act of testing itself has been shown to lead to learning with written tests (test-enhanced learning). Several studies on the use of written tests have found that testing leads to more learning and better transfer of learning when compared to studying alone, but it is not clear if this transfers to performance-based tests (Butler 2010; Larsen et al. 2013). While there have been indications that similar effects occur as a result of sitting performance-based tests, that phenomenon is less well established (Kromann et al. 2009). In the current study, almost all participants reported that they had learned something by participating in this formative OSCE. 

평가 결과가 모두 공개되고 나면, [임박한 시험으로 인한 스트레스]가 해소되었기 때문인지, 수행의 중요성에 대한 참가자들의 상대적 인식이 시간이 지날수록 줄어든 것으로 보인다. 반면 [내용 숙달]의 중요성에 대한 평가는 시험 직후 낮아졌다가 결과 발표 직후 다시 올라갔다. 
Based on their ratings, it appears that participants’ relative perceptions of the importance of performing well decreased over time, perhaps because the stress associated with the impending examination had been removed. In contrast, ratings of the importance of mastering the content decreased immediately following the examination and then bounced back up following the release of the results. 

주관식 응답에서는 [미래의 OSCE에서 성공할 수 있도록 하는 시험 전략testmanship에 대한 통찰력을 얻는 데 도움이 되었다]는 응답이 많았다. 이와는 대조적으로, 결과 발표 후 완료된 후속 조사에서 무엇을 배웠는지에 대한 질문을 받았을 때, 참가자들의 코멘트는 [내용 지식]에 초점을 맞추는 경향이 있었다. 이것은 평가의 즉각적인 위협을 제거함으로써, 참가자들이 [단순히 좋은 성과]를 내는 것을 목표로 하기보다는, [학습에 더 집중]할 수 있게 되었다는 사실을 반영할 수 있다. 또한 평가가 [성과 중심의 근시안적 태도]를 유도하는 경향은 [일시적]일 수 있음을 시사합니다.
many of the narrative comments that the reflected the perception OSCE helped them to gain insight into testmanship strategies to allow them to be successful on future OSCEs. In contrast, when asked about what they had learned in the follow-up survey completed after the release of the results, participants’ comments tended to focus on content knowledge. This may reflect the fact that removal of the immediate threat of being assessed allowed participants to better focus on their learning rather than simply aiming to perform well, while also suggesting that any tendencies assessments have toward inducing performance-focused shortsightedness may be transient.

시험 후 효과
Post-test effects


일부는 제공된 피드백의 가치를 평가절하하였고, 다른 일부는 더 많은 피드백을 추구하였다. 이는 Formatie OSCE에서 시험자 피드백이 어느정도나 학습의 중요한 modulator가 되는지에 대해 의문을 제기한다(Eva et al. 2010).
Some discounted the value of the feedback provided, while others sought more feedback. This raises questions about the extent to which examiner feedback is an important modulator of learning in a formative OSCE (Eva et al. 2010).

고성능 및 저성능
High versus low performers


놀랍게도 OSCE에 대한 목표, OSCE의 가치에 대한 인식, 연구 활동에 소요되는 시간 등에서 [낮은 성과자와 높은 성과자의 차이는 없었다]. 우리는 저성취자들이 학습에 더 성과 지향적인 접근법을 채택하거나 이러한 평가 형태에 대해 더 부정적인 견해를 가질 수 있다는 가설을 세웠으나, 이에 대한 어떠한 증거도 찾지 못했으며, assessment practice의 주된 영향이 적어도 형성적 맥락에서는 전반적 숙련도에 좌우되지 않을 수 있음을 시사했다.  
Surprisingly, there were no differences between low and high performers in terms of their goals for the OSCE, their perception of the value of the OSCE, or time spent on study activities. We had hypothesized that low performers might employ a more performance-oriented approach to learning or that they might have more negative views with regards to this form of assessment, but we did not find any evidence of this, suggesting that the leading influences of assessment practices may not be dependent on the overall proficiency of the examinee, at least in a formative context. 

다만 점수를 잘 받는 것에 대한 [콘텐츠 관련 지식]의 중요성에 대해서, 고득점자의 인식은 시험 전-후-결과후에 걸쳐 안정적인 반면, 저득점자의 인식은 OSCE 시험 이후 높아진 점이 눈에 띈다. 이는 저성취자들이 처음에는 콘텐츠 관련 지식의 가치를 충분히 인식하지 못했지만, OSCE 경험은 그들에게 그들의 약점에 대한 몇 가지 통찰력을 제공했을 수 있음을 시사할 수 있다.
However, it is notable that high performers’ recognition of the importance of content-related knowledge in order to score well was stable throughout the examination period, whereas low performers’ ratings increased after the OSCE. This may suggest that, although low performers did not fully appreciate the value of content-related knowledge initially, the OSCE experience may have provided them with some insights into their weaknesses.

한계 Limitations



결론 Conclusions

이 연구는 OSCE 관련 학습이 언제 어떻게 발생하는지 설명하는 예비 단계를 나타냅니다. 본 연구에서는 전공의들이 OSCE를 이수할 수 있는 기회를 학습경험(AFL)으로 평가한 것으로 보이지만, 이는 형성적이고 저부담 시험임에도 불구하고 성과를 잘 내고자 하는 욕구(AOL)에 의해 다소 억제되었다. 필기 시험(Cilliers et al. 2010)에서 볼 수 있듯이, OSCE는 학습 전(즉, 학습 습관의 변경) 순수(즉, 학습으로 직접 연결) 단계와 사후(즉, 학습 목표의 개발로 연결) 단계에서 양성과 음성으로 학습에 모두 영향을 미치는 것으로 보인다. 

This study represents a preliminary step in explaining when and how OSCE-related learning occurs. It would seem that the residents in this study valued the opportunity to complete an OSCE as a learning experience (AFL), but this was tempered somewhat by a desire to perform well (AOL) despite the fact that it was a formative, low stakes, examination. As has been shown with written tests (Cilliers et al. 2010), OSCEs seem to influence learning in both positive and negative ways in the pre(i.e. by changing study habits) pure(i.e. by directly leading to learning) and post-test (i.e. by leading to the development of learning goals) phases. 


형성 평가: 미래의 학습을 안내하고, 확신을 주며, 성찰을 촉진하고, 미래의 가치를 형성하는 평가의 토론 형식입니다.

Formative assessment: A discussive form of assessment that guides future learning, provides reassurance, promotes reflection, and shapes future values. 

Reference: Epstein R. (2007) Assessment in Medical Education. New England Journal of Medicine; 356:387–396. 

 

 

 

 


Med Teach. 2018 Jan;40(1):45-52.

 doi: 10.1080/0142159X.2017.1388502. Epub 2017 Oct 16.

How do formative objective structured clinical examinations drive learning? Analysis of residents' perceptions

Debra Pugh 1Isabelle Desjardins 1Kevin Eva 2

Affiliations collapse

Affiliations

  • 1a Department of Medicine , University of Ottawa , Ottawa , Canada.
  • 2b Department of Medicine , University of British Columbia and Senior Scientist at the Centre for Health Education Scholarship (CHES) , Vancouver , Canada.
  • PMID: 29037098
  • DOI: 10.1080/0142159X.2017.1388502Abstract
  • Introduction: Although several studies have explored the relationship between learning and written tests, little is understood about how performance-based examinations influence learning. The purpose of this study was to explore how a formative objective structured clinical examination (OSCE) drives learning.Results: Participants' goals for the OSCE related to performance, mastery and feedback. Almost all participants reported that they had learned something from the OSCE (94%) and most participants generated learning goals after the OSCE (71%). High performers appeared to recognize the importance of content-related knowledge for scoring well before and after the OSCE, whereas low performers may have under-estimated its importance until after the examination.
  • Discussion: Participants viewed a formative OSCE as both a hurdle to overcome (assessment of learning) and an opportunity to learn (assessment for learning). Understanding how OSCEs influence study behavior can help guide the development of assessments that promote learning.
  • Methods: We administered surveys to residents (n = 35) at three time points to determine if and how an OSCE influenced their learning: before and immediately following the OSCE, and after the distribution of their results. Differences in quantitative responses between high- and low-performing residents and across time were compared using repeated-measures ANOVA. Thematic analysis was used to analyze narrative comments.

근무지기반평가: 평가자의 수행능력이론과 구인(Adv in Health Sci Educ, 2013)
Workplace-based assessment: raters’ performance theories and constructs
M. J. B. Govaerts • M. W. J. Van de Wiel • L. W. T. Schuwirth • C. P. M. Van der Vleuten • A. M. M. Muijtjens

 

도입
Introduction


'실제' 직업 환경에서 수련자의 성과를 관찰하고 평가하는 것은 수세기 동안 보건 직업 교육의 초석이 되어 왔습니다. 이는 잠재적으로 데이터를 수집하고 일상적인 실습에서 교육생이 실제로 수행하는 작업에 대한 피드백을 제공하는 가장 좋은 방법입니다. 실제로, 현재의 평가 관행은 작업장 기반 평가(WBA)에 점점 더 중점을 두는 것이 특징입니다. 역량-기반 커리큘럼의 광범위한 구현에 의한 자극, 의사의 책무성에 대한 요구와 의료 품질에 대한 우려의 증가, 의료 훈련생에 대한 감독 및 평가의 개선 요구 등이 그 원인이다.
Observation and assessment of trainee performance in ‘real-life’ professional settings has been a cornerstone of health professions education for centuries. It is the potentially best way of collecting data and providing feedback on what trainees actually do in day-to-day practice. Indeed, current assessment practices are characterized by growing emphasis on workplace-based assessment (WBA), stimulated by the widespread implementation of competency-based curricula, increasing demands for physician accountability and concerns about health care quality as well as calls for improved supervision and assessment of medical trainees (Davies 2005; Norcini 2005; Kogan et al. 2009; Holmboe et al. 2010). 

비록 WBA가 형성적 평가에 유용하다는 일반적인 동의가 있지만, 총괄적 평가에 대한 WBA의 유용성은 논쟁의 여지가 있다(Norcini and Burch 2007; McGaghie et al. 2009). WBA의 효용성에 대한 주요 우려는 WBA의 [내재적 주관성]과 [측정 품질의 취약점]과 관련이 있다. 일반적으로 (훈련되지 않은) 평가판단의 특이성은 WBA의 수행능력 평정 사이의 큰 차이, 낮은 평가자 간 및 평가자 내 신뢰성, 의심스러운 타당도를 초래한다(Albanese 2000; Williams et al. 2003). 더 나아가, 다양한 영역의 성능 평가에 대한 연구는 특이 평가자 효과idiosyncratic rater effect가 성능 등급에서 29%에서 50% 이상에 이르는 상당한 변동을 설명한다는 것을 시사한다(Viswesvaran et al. 1996; Scullen et al.). 2000; Hoffman 등. 2010). 결과적으로, WBA를 개선하려는 시도는 평가 절차의 표준화 및 평가자 훈련을 통해 '주관성 요소'를 최소화하는 데 초점을 맞추는 경향이 있다. 그러나 그러한 조치는 기껏해야 엇갈린 성공을 거두었다.  
Although there is general agreement that WBA is useful for formative assessment, its usefulness for summative assessment is not undisputed (Norcini and Burch 2007; McGaghie et al. 2009). Major concerns about the utility of WBA relate to its inherent subjectivity and the resulting weaknesses in the quality of measurement. In general, the idiosyncratic nature of (untrained) rater judgments results in large differences between performance ratings, low interand intra-rater reliabilities and questionable validity of WBA (Albanese 2000; Williams et al. 2003). More to the point, research into performance appraisals in various domains suggests that idiosyncratic rater effects account for substantial variance in performance ratings, ranging from 29 % to over 50 % (Viswesvaran et al. 1996; Scullen et al. 2000; Hoffman et al. 2010). Consequently, attempts to improve WBA tend to focus on minimizing the ‘subjectivity factor’ through standardization of assessment procedures and rater training. However, such measures have met with mixed success at best (Williams et al. 2003; Lurie et al. 2009; Holmboe et al. 2010; Green and Holmboe 2010).  

연구 결과에 따르면 교육 및 연습(세부) 평가 도구를 사용함에도 불구하고 평가자의 행동이 변화에 영향을 받지 않는 여러 가지 이유가 제시됩니다. 예를 들어, 산업 및 조직 심리학 연구는 평가자가 종종 암묵적인 성과 이론을 가지고 있다는 것을 나타내며, 이는 조직에서 지정한 이론과 다를 수 있다(Borman 1987; Ostroff and Ilgen 1992; Uggerslev and Sulsky 2008). 더 나아가, 평가 결과는 [국지적 규범과 가치, 시간 압력, 평가 목표 및 정서적 요인]과 같은 평가 과정의 [사회적 환경에서 복잡하고 상호 연관된 요인 집합]에 의해 결정된다는 것을 보여준다. 
Research findings suggest many reasons why rater behaviour may be quite impervious to change despite training and/or the use of worked out (detailed) assessment tools. Research in industrial and organizational psychology, for instance, indicates that raters often have implicit performance theories, which may diverge from those specified by the organization (Borman 1987; Ostroff and Ilgen 1992; Uggerslev and Sulsky 2008). Research furthermore indicates that rating outcomes are determined by a complex and interrelated set of factors in the social setting of the assessment process, such as local norms and values, time pressure, assessment goals and affective factors (Murphy and Cleveland 1995; Levy and Williams 2004).

긴즈버그 외 연구진(2010)에 의한 최근 연구는 [의학적 영역의 평가 도구]와 전문적 역량의 이론적 모델에서도 감독자의 업무수행 이론을 적절히 반영하지 못할 수 있으며, 이는 역량영역의 'blurring'과 외견상 유효하지 않거나 부정확한('덜 진위') 수행능력 평정을 초래할 수 있음을 시사한다. 다시 말해, [평가자가 어떻게 생각하거나 행동해야 한다고 생각하는가(theory espoused)] 와 [실제로 생각하고 실천하는 것(theory in use)] 사이에 불일치가 있을 수 있습니다. 이와 유사하게 Holmboe 외 연구진(2010)은 "사실 우리는 교수들의 효과적인 관찰 기술과 행동에 대해 거의 알지 못한다"고 언급했습니다.

Recent research by Ginsburg et al. (2010) suggests that also in the medical domain assessment tools and theoretical models of professional competence may not adequately reflect supervisors’ theories of work performance, resulting in ‘blurring’ of competency domains and seemingly invalid or inaccurate (‘‘less authentic’’) performance ratings. In other words, there may very well be discrepancies between how we feel that raters should think or act (theory espoused) and what they actually think and do in practice (theory in use). Similarly, Holmboe et al. (2010) state that in fact ‘‘…we know very little about effective faculty observation skills and behaviors’’. 

개념 프레임워크
Conceptual framework


사회적 인식자 평가
Raters as social perceivers


모든 정보는 궁극적으로 평가자가 나타내는 [인지 필터]를 통과해야 한다는 것이 WBA에 내재되어 있다. 이것은 실생활에서의 성과평가를 이해하는 것은 기본적으로 평가자가 (대인관계 및 사회적 환경에 있는 다른 사람들에 대해) 어떻게 [인상을 형성하고 추론을 하는지]를 이해하는 것(예: 판단과 결정)이라는 것을 의미한다. 실제로, 점점더 수행능력을 평가할 때 평가자는 '동기부여된 사회적 판단'을 제공하는 '사회적 인식자social perceiver'로 여겨지고 있다. 이 접근법의 중심적 가정은 평가자들이 역동적이고 복잡한 사회 환경 내에서 판단과 의사결정을 위해 [정보를 수집, 해석, 통합 및 검색하는 인지적 작업에 직면하는 능동적 정보 처리자]라는 것이다.
It is inherent in WBA that all information must ultimately pass the cognitive filter represented by the rater (Landy and Farr 1980; Smith and Collins 2009). This implies that understanding the evaluation of performance in real life is basically about understanding how raters form impressions and make inferences (e.g. judgments and decisions) about other people in interpersonal and social environments. Indeed, it is increasingly recognized that raters are to be seen as ‘social perceivers’ providing ‘motivated social judgments’ when evaluating performance (Murphy and Cleveland 1995; Klimoski and Donahue 2001; Levy and Williams 2004). A central assumption in this approach is that raters are active information processors who, within a dynamic and complex social setting, are faced with the cognitive tasks of gathering, interpreting, integrating and retrieving information for judgment and decision making (DeNisi 1996; Klimoski and Donahue 2001; McGaghie et al. 2009). 

평가자가 성과를 어떻게 인식하고 판단하는지에 대한 이러한 견해는 사회적 인식의 한 요소로서 [사회적 인식의 이론적 프레임워크]에 캐스팅될 수 있습니다. 실제로, 성과 평가는 '특정 목적을 위한 사회적 인식의 특정 적용'으로 간주될 수 있으며, 평가자의 행동의 대부분은 [사회적 인식 현상social perception phenomena]에 뿌리를 둔 것으로 간주될 수 있다(Klimoski and Donahue 2001; Barnes-Farrell 2001).  
This view of how raters perceive and judge performance can be cast in theoretical frameworks of social perception as an element of social cognition. In fact, performance assessment might be seen as a ‘specific application of social perception for specific purposes, and much of raters’ behaviours can be considered to be rooted in social perception phenomena’ (Klimoski and Donahue 2001; Barnes-Farrell 2001). 

성과 평가 및 사회적 인식
Performance assessment and social perception

사회적 인식 연구의 연구 결과는 일관되게 다른 사람들에게 인상을 주고 판단을 내릴 때 사회적 인식자들은 기존의 지식 구조, 즉 '스키마'를 사용하는 경향이 있음을 나타냅니다. 스키마는 특히 정보가 불완전하거나 모호하거나 상황적 제약(예: 시간 압박, 상충하는 작업)이 있는 상황에서 효율적으로 정보를 처리할 수 있는 적응형 메커니즘으로 생각할 수 있다. 사회적 인식에서 대부분의 사람들은 [역할, 사건 및 개인 스키마]를 사용한다(Pennington 2000, 페이지 69–75). 
Findings from social perception research consistently indicate that, when forming impressions and making judgments of others, social perceivers tend to use pre-existing knowledge structures, or ‘schemas’. Schemas can be thought of as adaptive mechanisms that enable people to efficiently process information, especially in situations where information is incomplete, ambiguous or where there are situational constraints (e.g. time pressure, conflicting tasks). In social perception most people use role, event and person schemas (Pennington 2000, pp. 69–75). 

  • [역할 스키마]는 특정 사회적 지위(예: 경찰관, 교사, 가정의사)에 있는 사람에게 기대되는 행동 집합으로 정의할 수 있습니다.
  • [사건 스키마]는 특정 사회적 상황에서 예상된 사건의 순서(예: 취업 면접 또는 성과 평가 면접)와 관련된 타인의 행동에서 일반적으로 기대하는 것을 기술한다.
  • [개인 스키마]는 누군가의 행동에서 언어적, 비언어적 단서를 통해 그들을 알아가는 과정에서, 이용 가능한 정보에 기초하여 우리가 누군가에 대해 하는 추론이다. 개인 스키마는 예상 행동 패턴, 성격 특성 및 기타 추론을 포함할 수 있으며, 예를 들어 누군가의 지식 기반이나 사회적 범주(예: '우수한 성과' 또는 '부실한 성과')에 대한 결론을 내리게 된다.
  • A role schema can be defined as the sets of behaviours expected of a person in a certain social position (e.g. a policeman, teacher, family physician).
  • Event schemas describe what we normally expect from other people’s behaviours in specific social situations, related to the predicted sequence of events in such a situation (e.g. a job interviewor performance appraisal interview).
  • Person schemas reflect the inferences we make about someone on the basis of (limited) available information, as we get to know them through verbal and non-verbal cues in their behaviour. Person schemas may include expected patterns of behaviour, personality traits and other inferences, such as conclusions about someone’s knowledge base or social category (for instance, ‘excellent performer’ or ‘poor performer’).

세 가지 유형의 스키마는 완전히 구별되거나 분리된 것으로 간주해서는 안 됩니다. 스키마는 사람들이 어떻게 행동하는지 이해하려고 할 때 대화형으로 사용됩니다(Pennington 2000). 

The three types of schema should not be regarded as entirely distinct or separate: schemas are used interactively when we are trying to understand how people behave (Pennington 2000). 


앞에서 설명한 프레임워크의 주요 기능은 [업무 기반 수행능력 평가]의 맥락에서 쉽게 번역translated 수 있습니다. 
Key features of the framework we have described can easily be translated to the context of work-based performance assessment. 

첫째, 문헌(예: 1987년 보먼, 오스트로프와 일겐, 1992년, 어거슬레프와 슐스키, 2010년)은 작업 환경에서 평가자가 일반적으로 효과적인 직무 수행의 개인적 구성이나 '이론'을 개발할 것을 제안한다. 이러한 '수행능력 이론performance theories'은 직무와 관련이 있는 것으로 간주되는 성과 치수와 관련하여 효과적인 행동의 집합 또는 클러스터를 포함한다는 점에서 [역할 스키마]와 매우 유사하다. 수행능력 이론은 (전문적) 경험, 사회화, 훈련을 통해 발전하기 때문에, 수행능력 이론의 내용은 평가자에 따라 달라질 가능성이 높고, 그에 따라 평가자 특이성 수준이 달라질 수 있다(Uggerslev와 Sulsky 2008). 
Firstly, the literature (e.g. Borman 1987; Ostroff and Ilgen 1992; Uggerslev and Sulsky 2008; Ginsburg et al. 2010) suggests that raters in work settings develop personal constructs or ‘theories’ of effective job performance in general. These ‘performance theories’ are very similar to role schemas in that they include sets or clusters of effective behaviours in relation to any number of performance dimensions considered relevant to the job. Since performance theories develop through (professional) experience, socialization and training, the content of performance theories is likely to vary between raters, resulting in varying levels of rater idiosyncrasy (Uggerslev and Sulsky 2008). 

둘째, 연구 결과에 따르면 [효과적인 수행능력과 관련된 특정 행동 집합은 과제의 세팅과 특정 특징에 따라 과제마다 다를] 수 있다(예: Veldhuijen et al. 2007). 벨드하이젠 외 예를 들어, (2007)은 의사들이 상황적 요구에 따라 서로 다른 의사소통 전략을 사용한다는 것을 보여주었다. 따라서 장기간의 직무 경험으로 인해 평가자는 고도로 분화된 (자신만의) 수행능력 스키마를 개발하며, 이는 다양하고 차별화된 직무 관련 업무 및 업무 상황에 대해 각기 다른 효과적인 행동 세트를 나타낸다. 평가자가 과제 수행 중에 다른 사람을 관찰할 때, 과제특이적 또는 상황특이적 단서는 (특히 경험이 풍부한 평가자의 경우) 수행능력을 판단하기 위해 과제특이적 또는 사건특이적 스키마의 사용을 촉발할 수 있다. 
Secondly, research findings indicate that the particular set of behaviours related to effective performance may differ from one task to another, depending on the setting and specific features of the task (e.g. Veldhuijzen et al. 2007). Veldhuijzen et al. (2007), for instance, showed that physicians use different communication strategies depending on situational demands. It is therefore to be expected that, as a result of prolonged job experience, raters develop highly differentiated performance schemas, each representing different sets of effective behaviours for various and differentiated job-related tasks and task settings. When raters are observing others during task performance, task- or situation- specific cues may trigger the use of task- or event-specific schemas to judge performance, especially in more experienced raters. 

마지막으로, 평가 목적으로 성과를 관찰할 때, 평가자들은 불가피하게 개별 피평가자ratee에 대한 지식을 구성하기 위해 '개인 스키마'를 개발할 것이다. 평가자는 예를 들어 평가자의 지식 기반, 역량 수준 또는 행동 성향에 대한 관찰을 해석하고 정보를 통합하며 추론을 작성합니다. 
Finally, when observing performance for assessment purposes, raters will inevitably develop ‘person schemas’ to organize their knowledge about individual ratees. Raters interpret observations, integrate information, and make inferences, for instance about a ratee’s knowledge base, level of competence or behavioural disposition. 

타인이 성과에 대한 판단과 의사결정을 할 때, 평가자는 

  • 평가자의 개인 성과 이론('역할 스키마')
  • 과제특이적 행동의 규범적 기대(과제 특이적 스키마),
  • 피평가자에 대한 추론(개인 스키마)

...등 세 가지 스키마 유형을 모두 상호작용적으로 사용할 가능성이 높다(Cardyet). al. 1987; 보먼 1987). 
When making judgments and decisions about performance by others, raters are likely to use all three schema types interactively:

  • raters’ personal performance theory (‘role schema’),
  • normative expectations of task-specific behaviours (task-specific schema) and
  • inferences about the ratee (person schema)

...may all influence assessment outcomes (Cardy et al. 1987; Borman 1987). 

현재 연구 The present study

방법
Method


참여자 Participants

본 연구의 참여자들은 일반실무에서 대학원생들을 감독하고 평가하는 데 적극적으로 참여한 GP-감독자들이었습니다. 네덜란드 대학원 과정은 일반적으로 교육 프로그램 전반에 걸쳐 체계적인 직접 관찰 및 평가의 오랜 전통을 가지고 있습니다. 
The participants in our study were GP-supervisors who were actively involved in supervising and assessing postgraduate trainees in general practice. The Dutch postgraduate programmes in general practice have a long tradition of systematic direct observation and assessment of trainee performance throughout the training programme. 

연구 절차 및 데이터 수집
Research procedure and data collection

참가자들은 두 건의 비디오 케이스(VC)를 시청했는데, 각각 6학년 의대생이 환자와 '실제'를 맞닥뜨리는 장면을 보여주었다. 참가자들은 이 연구 전에 학생들을 만난 적이 없었다. VC는 일반적인 환자 문제와 다양한 학생 성과를 제시하기 위해 선택되었습니다. 두 VC 모두 아토피 습진과 협심증 등 일반 관행에 흔히 있는 '직접' 사례를 제시했다. 
Participants watched two video cases (VCs), each showing a sixth-year medical student in a ‘real-life’ encounter with a patient. The participants had not met the students before the study. The VCs were selected purposively to present common patient problems and different student performance. Both VCs presented ‘straightforward’ cases that are common in general practice: atopic eczema and angina pectoris. 

VC1(아토픽 습진)은 약 6분간 지속되었으며, 의사소통 및 대인관계 기술과 관련하여 원형적이고 분명히 표준 이하의 성능을 보이는 학생을 제시했습니다. 
VC1 (atopic eczema) lasted about 6 min and presented a student showing prototypical and clearly substandard performance with respect to communication and interpersonal skills. 

VC2(협심증)는 약 18분간 지속되었으며, 의사소통과 환자 관리 모두에 대해 복잡한, 즉 더 차별화된 성과를 보이는 학생을 제시했습니다. 
VC2 (angina pectoris) lasted about 18 min and presented a student showing complex, i.e. more differentiated, performance with respect to both communication and patient management. 

참가자들의 인지능력은 verbal protocol analysis(Chi 1997)을 통해 파악됐다.
Participants’ cognitive performance was captured through verbal protocol analysis (Chi 1997).

  • 1. 영상이 시작되었습니다. 참가자가 학생의 성적을 판단할 수 있을 때 신호를 보내고, 비디오가 정지됩니다(T1). 참가자는 학생의 수행에 대한 첫 번째 판단(언어적 의전(VP) 1)을 구두로 말합니다. 
    1. The video is started. The participant signals when he or she feels able to judge the student’s performance; the video is then stopped (T1). The participant verbalizes his/ her first judgment of the student’s performance (verbal protocol (VP) 1).
  • 2. 참가자는 1차원 등급 척도로 전반적인 성과 등급을 부여합니다(그림 1). 등급 양식(VP2)을 작성하면서 큰 소리로 생각합니다. 
    2. The participant gives an overall rating of performance on a one-dimensional rating scale (Fig. 1), thinking aloud while filling in the rating form (VP2).
  • 3. 동영상은 T1에서 정지된 지점에서 재개됩니다. 동영상이 종료되면(T2) 참가자는 자신의 판단(VP3)을 구두로 말하며 최종 종합 평점을 부여합니다. 
    3. The video is resumed at the point where it was stopped at T1. When the video ends (T2), the participant verbalizes his/her judgment (VP3) while giving a final overall rating. 

 



자료 분석 Data analysis

질적 분석 Qualitative analysis

평가자의 성능 이론과 작업별 성능 스키마(Elo 및 Kyngaes 2008, Thomas 2006)를 살펴보기 위해 먼저 모든 프로토콜(VP1, VP2, VP3 풀링)의 상향식 개방형 코딩 작업을 수행했습니다. 
We first performed bottom-up open coding of all protocols (VP1, VP2, and VP3 pooled) to explore the raters’ performance theories and task-specific performance schemas (Elo and Kynga¨s 2008; Thomas 2006). 

우리는 [개인 스키마]의 사용을 탐구하기 위해 우선순위 코드인 하향식(top-down)을 사용했다. ['개인 스키마']에 대한 코딩 범주는 클라이모스키와 도나휴(2001)가 제안한 이론적 프레임워크를 기반으로, 판단 과제에서 5가지 공통 유형의 추론 프로세스를 기술했다.

  • 지식,
  • 특성,
  • 성향(가능 행동 패턴),
  • 의도(즉각적 목표),
  • 사회적 범주 구성원 자격

We used top-down, a priori coding to explore the use of person schemas. The coding categories for ‘person schemas’ were based on the theoretical framework proposed by Klimoski and Donahue (2001), describing five common types of inference processes in judgment tasks: inferences regarding

  • knowledge,
  • traits,
  • dispositions (probable patterns of behaviour),
  • intentions (immediate goals) and
  • social category membership. 

표 1은 정성 데이터 분석을 위한 소프트웨어를 사용하는 모든 구두 프로토콜에 적용되는 최종 코딩 프레임워크를 제시한다(Atlas-ti 6.1). 
Table 1 presents the final coding framework, which was applied to all verbal protocols using software for qualitative data analysis (Atlas-ti 6.1). 



양적 분석 Quantitative analysis

[성과 이론]과 [과제특이적 성과 스키마]의 사용에 대한 평가자 간의 차이를 탐구하기 위해, 언어 프로토콜은 표 1에 제시된 코딩 프레임워크를 사용하여 재분석되었다. 이러한 분석을 위해 VP1과 VP2를 통합하여 T1에서 모든 구두발언을 포함하는 단일 구두 프로토콜을 만들었습니다. 언어 프로토콜의 녹취록은 연구자 중 한 명(MG)에 의해 segment로 분할되었습니다. 각 segment은 훈련생 또는 훈련생 성과에 대한 하나의 일관성 있는 생각 또는 진술을 나타냈습니다. (예: 성과 차원 내의 특정 행동에 대한 설명 또는 특정 성과 차원에 대한 전반적인 효과성에 대한 판단 의견). 또한, 훈련생 성과에 대한 진술은 긍정 대 부정 차원에 따라 코드화되었습니다.(예: 효과적 행동 대 비효과적 행동). 반복은 그렇게 코드화되었다.  
In order to explore differences between raters in the use of performance theories and taskspecific performance schemas, the verbal protocols were reanalyzed using the coding framework as presented in Table 1. For this analysis, VP1 and VP2 were merged to create a single verbal protocol containing all verbal utterances at T1. The transcripts of the verbal protocols were segmented into phrases by one of the researchers (MG). Each segment represented a single coherent thought or statement about the trainee or trainee performance (e.g. description of a particular behaviour within a performance dimension or a judgment remark about overall effectiveness on a particular performance dimension). Additionally, statements about trainee performance were coded along the dimension positive versus negative (i.e. effective versus ineffective behaviour). Repetitions were coded as such. 

[수행능력 차원]과 관련된 [평가자 특이성 수준]은 해당 치수를 사용하는 등급의 백분율에서 추론할 수 있다.

  • 0과 100%는 최대 등급 간 일치(완전 특이성 결여)를 나타내고
  • 50%는 최대 불일치(최대 특이성)를 나타낸다.

Levels of rater idiosyncrasy in relation to any performance dimension can be inferred from the percentage of raters using that dimension, with

  • 0 and 100 % indicating maximum interrater agreement, i.e. complete absence of idiosyncrasy, and
  • 50 % indicating maximum disagreement, i.e. maximum level of idiosyncrasy.

따라서 비율이 50%에 가까울수록 특이성 수준이 높아집니다. 또한 각 수행능력 차원에 대해 차원 관련 성과(효과적 행동 대 비효과적 행동)를 나타내는 문장의 수를 계산하였다. 
So, the closer the percentage moves to 50 %, the higher the level of idiosyncrasy. Additionally, the number of statements representing dimension-related performance (effective versus ineffective behaviours) was calculated for each of the performance dimensions. 

Ethical approval

결과
Results


수행능력 이론
Performance theory

언어 프로토콜을 분석하여 평가자가 환자와의 만남 동안의 훈련생 행동을 평가할 때 사용하는 17가지 performance dimension를 식별하였다. 평가자들은 네 가지 주요 차원(GP처럼 생각/행동), '의사-환자 관계', '(바이오) 의학적 측면의 처리', '구조/시간 관리')과 다양한 하위 차원을 구분했다. 
Analysis of the verbal protocols resulted in identification of seventeen performance dimensions, used by the raters in assessing trainee behaviour during patient encounters. The raters distinguished four main dimensions (

  • ‘Think/act like a GP’,
  • ‘doctor-patient relationship’,
  • ‘handling of (bio)medical aspects’ and
  • ‘structuring/time management’

...) and various sub-dimensions. 

'의사-환자 관계' 차원에서 두 개의 큰 하위 차원이 식별되었다. 

  • 하나의 하위 차원에는 효과적이고 효율적인 환자-의사 커뮤니케이션을 위한 "좋은 분위기 조성"과 관련된 일련의 행동이 포함되었습니다. 이 하위 차원은 특히 consultation이 시작될 때 평가자들이 고려하였다. 
  • 두 번째 하위 차원('균형잡힌 환자 중심성')에는 상담 내내 환자의 참여를 촉진하는 동시에 전문 의료 전문가로서 의사가 상담을 담당하도록 보장하는 일련의 행동이 포함되어 있습니다. 

Within the dimension ‘doctor-patient relationship’, two large subdimensions were identified.

  • One sub-dimension included sets of behaviours relating to ‘‘creating a good atmosphere’’ for effective and efficient patient-doctor communication. This sub-dimension was considered by the raters at the beginning of the consultation in particular.
  • The second sub-dimension (‘‘balanced patient centeredness’’) contains sets of behaviours facilitating patient involvement throughout the consultation while at the same time ensuring that the physician, as a professional medical expert, remains in charge of the consultation. 


수행능력 차원, 상호 관계 및 성과 관련 행동의 예는 그림 2에 제시되어 있습니다. 
The performance dimensions, their interrelationships and examples of performancerelated behaviours are presented in Fig. 2. 

 



작업특이적 스키마
Task-specific schema


언어 프로토콜 분석 결과, 과제별 성과 스키마의 사용을 반영하는 [세 가지 주요 범주]가 나타났다(표 1).

  • 사례 특이적 단서 식별,
  • 사례 특이적 단서와 관련하여 (비)효과적인 특정 행동의 식별,
  • 훈련생 행동이 특정 환자에 미치는 영향

Analysis of the verbal protocols resulted in three major categories reflecting the use of taskspecific performance schemas (Table 1):

  • identification of case-specific cues,
  • identification of particular behaviours as (in)effective, explicitly in relation to case-specific cues, and
  • effects of trainee behaviour on the particular patient.

이러한 범주는 평가자의 [성과 이론]의 이산적 측면뿐만 아니라, (비효과적인) 행동과 성과를 [사례특이적 단서]에 명시적으로 그리고 구체적으로 연결하는 코멘트를 나타낸다. 이러한 [과제-특이적 성과 스키마]의 특징은 [과제 특이적 성과 요건을 이해하려는 평가자의 노력]과 [환자 encounter 중에 일어나는 일]을 해석하고 평가하기 위한 '과제-특이적 성과 이론'의 사용을 반영한다.

These categories represent comments that focus not only on discrete aspects of raters’ performance theory, but also explicitly and specifically link (in)effective behaviours and performance to case-specific cues. These features of task-specific performance schemas reflect raters’ efforts to understand the requirements of task-specific performance and the use of ‘task-specific performance theory’ to interpret and evaluate what is happening during the patient encounter. 

사람 스키마
Person schema


표 2는 그룹 및 VC당, T1 및 T2에서 추론을 반영하는 구두발언의 종류와 개수뿐만 아니라 수습생에 대한 추론을 하는 평가자의 비율을 나타낸다. 그 결과에 따르면, 대다수의 평가자들이 특히 두드러진 행동(VC1)과 관련하여, 그들의 성과를 관찰하고 평가하는 동안 훈련생에 대해 추론을 하였다. 표 2는 또한 평가자가 첫인상을 형성할 때 T1에서 추론을 할 가능성이 가장 높다는 것을 보여준다. (단일 환자 접촉 시 훈련생 성과 평가에는) Klimoski와 Donahue(2001)에 의해 기술된 5가지 추론 처리 유형이 모두 존재하는 것으로 보였다. 각 VC에 대한 서로 다른 평가자의 추론의 예는 표 3에 제시되어 있다. 
Table 2 presents the percentage of raters making inferences about the trainee as well as the type and number of verbal utterances reflecting inferences, per group and per VC, and at T1 and T2. The results show that the majority of raters made inferences about trainees while observing and evaluating their performance, especially with regard to salient behaviours (VC1). Table 2 also shows that raters were most likely to be making inferences at T1, when they were forming their first impressions. All five types of inference processing described by Klimoski and Donahue (2001) appeared to be present in the assessment of trainee performance during single patient encounters. Examples of inferences by different raters for each of the VCs are presented in Table 3. 

 



평가자 특이성
Rater idiosyncrasy

등급별 특이성에 대한 결과는 표 4와 5에 제시되어 있다.
The results for rater idiosyncrasy are presented in Tables 4 and 5.

표 4는 T1과 T2에서 각 평가자 그룹(경험이 있는 평가자 및 경험이 없는 평가자)과 각 비디오 사례에 대해 수습생 성과를 평가할 때 [특정 performance dimension를 사용하는 평가자의 비율]을 보여줍니다. 백분율이 매우 높거나 매우 낮으면(100 또는 0%에 가까움) 등급 간 일치 수준이 높음을 나타냅니다(등급 특이성 수준이 낮음). 그러나 비율이 50%에 가까울수록 특정 성능 차원 사용과 관련하여 더 많은 등급이 달라지므로 등급 특이성 수준이 높다는 것을 나타냅니다. 표 4는 (거의) 모든 평가자가 두 VC에서 주 performance dimension 중에서 '의사-환자 관계' 또는 그 하위 치수 중 적어도 하나를 사용했음을 보여준다. 
Table 4 shows the percentage of raters using a specific performance dimension when rating trainee performance at T1 and T2, for each group of raters (experienced and nonexperienced) and for each of the videocases. Very high or very low percentages (close to 100 or 0 %) indicate high levels of between-rater agreement (low levels of rater idiosyncrasy). The closer a percentage moves to 50 %, though, the more raters differ with respect to use of the specific performance dimension, indicating high levels of rater idiosyncrasy. Table 4 shows that (nearly) all raters used the main performance dimension ’doctor-patient relationship’ or at least one of its sub-dimensions in both VCs. 

다른 모든 (하위)차원dimension의 경우, 해당 차원을 사용하는 평가자의 백분율은 다양했고(종종 0 또는 100%에서 멀리 떨어져 있음), 훈련생 성과 평가 중 성과 이론(즉, 평가자 특이성)의 사용에 있어 평가자 간 상당한 차이를 나타냈다. 평가자 간 차이와 평가자 전문지식에 대해 일관된 관계를 찾을 수 없었다. 
For all other (sub-)dimensions the percentages of raters using the dimension varied (often far from 0 or 100 %), indicating considerable between-rater differences in the use of performance theory (i.e. rater idiosyncrasy) during assessment of trainee performance. No consistent relationship was found for between-rater differences and rater expertise. 



표 5는 T1과 T2의 각 VC에 대한 성과(하위) 단위별 효과적이고 비효과적인 훈련생 행동에 관한 구두발언의 수를 나타낸다. 표 5는 일반적으로 평가자의 판단이 '의사-환자 관계'에 비해 'Consultation의 생체의학적 측면 처리'에 대한 진술이 적다는 것을 보여준다. 
Table 5 presents the number of verbal utterances concerning effective and ineffective trainee behaviours per performance (sub-) dimension, for each group of raters, for each VC at T1 and T2. Table 5 shows that, in general, raters’ judgments included fewer statements on ‘handling biomedical aspects of the consultation’ compared to ‘doctor-patient relationship’. 



평가자 전문 지식과 작업별 스키마 사용
Rater expertise and the use of task-specific schemas


과제별 스키마 사용에 관한 결과는 표 6에 제시되어 있다. 경험 많은 평가자들은 훈련생 성과를 평가할 때 과제특이적 요소에 훨씬 더 많은 주의를 기울였습니다. 
Results with respect to the use of task-specific schemas are presented in Table 6. Experienced raters paid significantly more attention to task-specific factors in assessing trainee performance. 

복합심장환자(VC2)의 경우 T1과 T2(U = 77.5, p = 0.02, U = 86, p = 0.04, ES = 35)에서 과제특이적 성과 요소 수(A1 + A2 + A3)에 대해 그룹 간 유의한 차이가 발견되었다. 
For the complex cardiac case (VC2), significant between-group differences were found with respect to the number of task-specific performance elements (A1 + A2 + A3) per rater at T1 and T2 (U = 77.5, p = .02, ES = .41 and U = 86, p = .04, ES = .35). 

피부과 환자(VC1)의 경우 T1에서 유사하고 거의 유의미한 차이가 발견되었다(U = 57, p = 0.07). T2에서 과제별 요소(A1 + A2)에 대해 그룹 간 유의한 차이가 발견되었다(U = 73, p = 0.01, ES = 0.44). 
For the dermatology case (VC1), similar and near-significant differences were found at T1 (U = 57, p = .07). At T2, significant between-group differences were found for task-specific elements (A1 + A2) (U = 73, p = .01, ES = .44). 

표 6은 [과제특이적 수행능력 스키마와 관련된 진술]이 경험이 많은 평가자의 구두 프로토콜의 상당한 부분을 나타내며, 경험이 적은 평가자 집단이 덜 자주 사용한다는 것을 명확히 보여준다. 
Table 6 clearly shows that statements related to task-specific performance schemas represent a substantial part of the verbal protocols of the more experienced raters, and are less frequently used by the group of less experienced raters. 



고찰 Discussion

실제 평가 작업 시 think-aloud 절차를 사용하여 성능 평가 시 GP 평가자가 사용하는 수행능력의 차원을 설정할 수 있었습니다. 그림 2의 performance dimensions는 34명의 GP-감독자가 각각 다른 환자 만남을 수행하는 두 명의 성과를 평가한 생각-라우드 절차 분석에서 도출되었습니다. performance dimensions 와 하위 차원은 함께 '평가자가 실제적으로 주목하고 코멘트하는 것'이 무엇인가에 기초하여, 일반적인 실무에서의 의사 수행능력에 대한 [규범적 성과 이론] 또는 ['성과 스키마']를 반영하는 것으로 간주될 수 있다.
We used think-aloud procedures during actual rating tasks, which enabled us to establish dimensions of performance used by GP-raters during performance assessment. The performance dimensions in Fig. 2 emerged from the analysis of think-aloud procedures of 34 GP-supervisors rating the performance of two different trainees each conducting a different patient encounter. Performance dimensions and sub dimensions together could be considered to reflect a normative performance theory, or ‘performance schema’, of physician performance in general practice, built upon what ‘raters actually pay attention to and comment upon in practice’.

본 연구의 결과는 평가자들이 직업 역량에 대한 1차원 또는 2차원 개념('인지적/임상적' 및 '인문적/(정신적)사회적')을 가지고 있고, 그래서 서로 다른 역량이나 차원을 구별할 수 없다는 WBA에 대한 이전의 연구와 일치하지 않는 것 같습니다. 이러한 소위 후광 효과는 일반적으로 전지구적 인상 형성, 분류 또는 '고정관념화'로 인한 평가 오류에 기인한다.
The results from our study seem to be inconsistent with previous research on WBA indicating that raters have a one- or two-dimensional conception of professional competence (‘cognitive/clinical’ and ‘humanistic/(psycho)social’) and are therefore unable to discriminate between different competencies or dimensions (Cook et al. 2010; Pulito et al. 2007; Archer et al. 2010). This so-called halo effect is generally attributed to rater error, resulting from global impression formation, categorization or ‘stereotyping’. 

본 연구의 결과는 평가자들이 성능을 평가할 때 상당히 많은 수의 서로 다른 performance dimensions를 구별하고 상호작용적으로 여러 차원을 사용했음을 명확히 보여준다. 예를 들어, 평가자들은 병력 청취, 신체 검사 또는 환자 관리 시 성과를 평가할 때, 문제의 (바이오) 의료 또는 '의료 기술' 측면뿐만 아니라 의사소통 및 대인관계 및 시간 관리 능력도 평가했습니다.
The results from our study clearly show that raters distinguished a fairly large number of different performance dimensions and used dimensions interactively when assessing performance. For example, when assessing performance during history taking, physical examination or patient management, raters assessed not only students’ ability to adequately handle (bio)medical or ‘medico-technical’ aspects of the problem, but also their communication and interpersonal as well as time management skills. 

다시 말해, 평가자들이 사용하는 성과 이론(또는 역량 체계)은 performance dimensions를 엄격히 분리된 별개의 기업(예: 전형적인 미니 CEX 형식)으로 제시하는 대부분의 표준화 평정 척도의 체계에 [깔끔하게 매핑되지 않는다]. 서로 다른 performance dimensions 간의 진정한 상관 관계는 높을 수 있으며, 관찰된 후광 효과는, 적어도 부분적으로만이라도, 훈련생 수행능력에 대한 (평가자의 무능력 또는 자동적 하향식 범주화의 결과보다는) '진정한 후광'으로 간주될 수 있습니다. 
In other words, the performance theory (or competency framework) used by the raters does not map neatly onto the frameworks of most standardized rating scales, which present performance dimensions as strictly separate, distinct entities (e.g. the typical mini-CEX format). True correlations between different performance dimensions may be high, and observed halo effects may— at least partially—be considered as ‘true halo’ rather than as the result of rater incompetence or automatic top-down categorization of trainee performance. 

우리의 연구 결과는 또한 GP-감독자가 성능 평가에 사용한 치수에 차이가 있어 다양한 평가자의 특이성을 나타냈다는 것을 보여준다. 또한 평가자들은 환자를 마주치는 동안 실제로 본 내용에 따라 다른 dimension를 사용했다. 모든 dimension이 모든 경우에 동등하게 관련되거나 중요한 것은 아니다. 일반적으로 [표준화된 평정 척도]는 사전에 정의된 순서에 따라 performance dimensions(또는 역량)의 집합을 나타내도록 설계되고, 이는 각 수행능력 영역의 동일한 중요성을 시사한다. 따라서 평가자에게 모든 성과 차원에 대한 평가 점수를 작성하도록 요구하는 것은 연습생의 성과에 대한 정확한 묘사에 방해가 될 수 있습니다. 우리의 연구 결과는 평가 대상 전공의에 따라 dimension가 다양한 중요도를 차지한다는 것을 발견한 긴즈버그 외 연구진(2010)의 연구 결과와 일치한다. 
Our findings also show that GP-supervisors differed in the dimensions they used in performance assessment, indicating varying levels of rater idiosyncrasy. Furthermore, raters used different dimensions, depending on what they actually saw during the patient encounter: apparently not all dimensions are equally relevant or important in all cases. In general, standardized rating scales are designed to represent a given set of performance dimensions (or competencies) in a predefined order, suggesting equal importance of each performance domain. Requiring raters to fill in a rating score for all performance dimensions may therefore hinder accurate depiction of trainee performance. Our findings are in line with findings from Ginsburg et al. (2010), who found that dimensions took on variable degrees of importance, depending on the resident that was being evaluated. 

본 연구는 복잡한 작업을 처리할 때 '전문가'가 행동 계획이나 해결 방안을 결정하기 전에 상황별 또는 상황별 요소에 더 많은 주의를 기울인다는 것을 나타내는 전문성에 관한 연구 결과를 확인한다(예: Ross et al. 2006). 환자와의 만남에서 학생들의 성과를 평가할 때, 경험이 풍부한 GP 평가자들은 과제특이적 단서에 더 많은 관심을 기울였습니다. 더욱이 경험 많은 평가자들은 경험이 부족한 평가자들보다 과제특이적 또는 사례특이적 단서를

  • 훈련생 행동에 연결시키고,
  • 훈련생 행동이 환자와 환자 상담 결과 모두에 미치는 영향을 명시적으로 연계할 가능성이 더 높은 것으로 보였다. 

The present study confirms findings of expertise research indicating that, when handling complex tasks, ‘experts’ pay more attention to contextual or situation-specific factors before deciding on a plan of action or solution (e.g. Ross et al. 2006). When assessing student performance in patient encounters, experienced GP-raters paid (significantly) more attention to task-specific cues. Furthermore, experienced raters seemed to be more likely than inexperienced raters to explicitly link task-or case-specific cues

  • to specific trainee behaviours and
  • to effects of trainee behaviour on both the patient and the outcome of the patient consultation.

본 연구에서는 평가자들이 훈련생 수행능력을 관찰하기 시작한 순간부터 [개인 스키마]를 개발하기 시작했음을 명확히 보여줍니다. 평가자는 훈련생에 대해 알고 있는 것(예: 훈련 단계)에 따라 지식과 기질에 대한 추론을 했을 뿐만 아니라, 하지만 적어도 일부 평가자는 성격 판단 및 행동 해석에 따라 연수생들 분류하는 것 같았다. 비록 우리의 조사 결과가 개인 연습생에 대한 일부 추론에 대해 평가자들 사이에 공감대를 보여주고 있지만, 상당한 의견 차이도 있었다. 이러한 발견은 [인식자의 <특이적> 해석 과정]사람 인식의 급격한 차이를 만들어 낼 수 있다는 것을 일관되게 보여주는 사람 인식 연구와 일치한다(Mohr와 Kenny 2006). 일반적으로 사람들은 자발적으로 사회적 추론을 하고, 평가자의 개인 스키마는 (일단 개발되면) 후속 평가에서 (선택적) 주의를 유도하고 미래 정보의 해석을 색칠할 수 있다. 따라서 WBA 맥락에서 평가자가 [개인 스키마]를 구성하는 방법의 차이는 평가 결과의 차이를 뒷받침하는 주요 요인 중 하나가 될 수 있다. 
Findings from our study clearly indicate that raters started to develop person schemas from the moment they began to observe trainee performance. Raters not only made inferences about knowledge and disposition based on what they knew about the trainee (phase of training, for instance), but at least some raters also seemed to categorize trainees according to personality judgments and behavioural interpretations. Although our findings show consensus among raters with respect to some inferences about individual trainees, there was also considerable disagreement. These findings are in line with person perception research, which consistently shows that perceivers’ <idiosyncratic> interpretive processes may produce sharp differences in person perception (Mohr and Kenny 2006). In general, people make social inferences spontaneously (Uleman et al. 2008; Macrae and Bodenhausen 2001), and raters’ person schemas—once developed—may guide (selective) attention in subsequent assessments and colour the interpretation of future information. Differences in the way raters form person schemas in WBA contexts may therefore be one of the major factors underlying differences in rating outcomes. 



Limitations of our study

함의 Implications of our study

첫째, 우리의 연구 결과는 Holmboe(2008)가 제안한 '기준 체계'(frame-of-reference, FOR) 훈련의 이행을 추가로 지원하기 위해 평가 훈련에 영향을 미칠 수 있다. 앞에서 언급한 바와 같이, 평가자 훈련의 결과는 종종 실망스러우며, 평가자 훈련이 평가자의 선행 성과 이론을 무시하고 사전 정의되고 표준화된 평가 도구를 사용하는 방법에 초점을 맞추는 경향이 있기 때문일 수 있습니다. 그 결과, 교육 transfer가 제한될 수 있습니다. 반면, F-O-R 교육은 평가자들에게 성과를 평가하는 개인적인 방법을 성찰하도록 요청하며, 성과 차원, 성과 관련 행동 및 성과 수준을 논의하고 정의함으로써 독특한 등급 경향을 줄이는 것을 목표로 한다. 즉, F-O-R 훈련은 성과를 관찰하고 평가하기 위한 '공유 정신 모델' 또는 '공유 성과 이론'을 확립한다. 수행능력 평가 영역에서는 F-O-R 훈련이 등급별 훈련에 대한 가장 유망한 접근법으로 부상하고 있으며 현장 환경에 성공적으로 적용되었다 (Sulsky and Kline 2007; Holmboe et al. 2004).  
Firstly, our findings may have implications for rater training, providing further support for the implementation of ‘frame-of-reference’ (FOR) training as proposed by Holmboe (2008). As indicated before, results of rater training are often disappointing and one of the major reasons may be that rater training tends to focus on how to use predefined and standardized assessment instruments, ignoring raters’ a priori performance theories. As a consequence, transfer of training may be limited. FOR training on the other hand asks raters to reflect on their personal methods of evaluating performance, and aims to reduce idiosyncratic rating tendencies through discussing and defining performance dimensions, performance-related behaviours and performance levels. FOR training, in other words, establishes a ‘shared mental model’ or ‘shared performance theory’ for observing and evaluating performance. In the performance appraisal domain, FOR training has emerged as the most promising approach to rater training and it has been successfully applied in field settings (Sulsky and Kline 2007; Holmboe et al. 2004). 

둘째, 우리의 연구 결과는 WBA의 맥락에서 평가자를 선택하는 방법에 영향을 미칠 수 있다. 연구 결과에 따르면, 경험이 풍부한 평가자가 직무별 성과 스키마를 사용하면 학습자/교육자에게 제공되는 피드백에 영향을 미칠 수 있습니다. 경험 많은 평가자들에 의한 상황적 단서contextual cues의 통합은 질적으로 다른, 보다 전체적인 피드백으로 이어질 수 있으며, 다양한 이슈에 초점을 맞추고 수행의 다른 측면을 통합하여 환자 접점에서 일어나고 있는 일에 의미를 부여할 수 있습니다. 더 나아가 산업 및 조직 심리학의 연구에 따르면 보다 차별화된 성과 스키마를 사용하는 경험 있는 평가자들이 더 정확한 등급을 제공한다(예: Cardy et al. 1987; Ostroff and Ilgen 1992). 스키마 사용과 등급 정확도 사이의 관계를 조사하는 것을 목표로 하지는 않았지만, 우리의 연구 결과는 작업 기반 성과 평가의 정확성에 대한 등급 전문성의 영향에 대한 추가 연구가 필요하다고 지적합니다.  

Secondly, our findings may have implications for the way we select raters in the context of WBA. Based on the findings from our study, the use of task-specific performance schemas by more experienced raters may affect feedback given to learners/trainees. The incorporation of contextual cues by experienced raters can result in qualitatively different, more holistic feedback, focusing on a variety of issues and giving meaning to what is happening in the patient encounter by integrating different aspects of performance. Furthermore, research in industrial and organizational psychology indicates that more experienced raters who use more differentiated performance schemas provide more accurate ratings (e.g. Cardy et al. 1987; Ostroff and Ilgen 1992). Although we did not aim to investigate the relationship between the use of schemas and rating accuracy, our findings point to a need for further research into effects of rater expertise on the accuracy of workbased performance assessment. 


그 결과는 또한 WBA의 평정 척도 또는 평정 형식 설계에 영향을 미칠 수 있다. 앞에서 언급한 바와 같이, 평가 척도가 평가자의 [수행능력 이론]을 적절히 반영하지 못할 경우, 평가 점수에 대한 올바른 해석과 수행능력 평정의 유용성이 저하될 수 있습니다. 우리의 실험 환경이나 FOR 훈련 절차의 일부로서 ''사용 중인 성과 이론performance theory-in-use''을 도출하는 것은 숙련된 실무자들이 훈련생들의 판단에 중요하다고 여기는 것을 반영하여 평가 프레임워크와 도구의 개발에 기여할 수 있다. 평가자의 [자연 인지 처리natural cognitive processing]와 [역량 프레임워크]에 부합하는 평가기구를 활용하면, 보다 타당하고 진정한authentic 성과등급이 생성돼 WBA 결과의 유용성이 향상될 것으로 기대된다. 
The results may also have implications for the design of rating scales or rating formats in WBA. As indicated before, correct interpretation of rating scores and usefulness of performance ratings may be compromised when rating scales do not adequately mirror raters’ performance theories. Eliciting ‘‘performance theory-in-use’’, as in our experimental setting or as part of FOR-training procedures, may contribute to the development of assessment frameworks and instruments, reflecting what experienced practitioners consider to be of importance in the judgment of trainees. It is to be expected that the use of rating instruments that are in line with raters’ natural cognitive processing and competency frameworks will generate more valid and authentic performance ratings, thereby improving the usefulness of WBA results. 

그러나 더 중요한 것은 우리의 연구 결과가 WBA에서 묘사적, 서술적 피드백의 중요성을 보여준다는 것이다. 우리의 조사 결과에서, 평가 척도의 단순한 점수는 단지 평가자들에 의한 복잡하고 독특한 정보 처리의 빙산의 일각일 뿐이라는 것이 분명하다. 따라서 수행능력 점수를 의미 있게 해석하려면 평가자의 개인적 동기 및 논증에 대한 통찰력을 제공하는 추가 서술 코멘트가 필요합니다. 따라서 서술적 피드백과 논평은 역량 달성에 대한 신뢰할 수 있고 방어가능한 의사결정을 뒷받침할 것이다. 더욱이 서술적 피드백이 건설적인 방식으로 제공된다면, 훈련생들이 성과에서 강점과 약점을 정확하게 파악하고 역량 개발을 효과적으로 이끌 수 있는 유일한 방법입니다. 
More importantly, however, we feel that our findings illustrate the importance of narrative, descriptive feedback in WBA. From our findings, it is clear that a simple score on a rating scale merely represents the tip of the iceberg of the complex and idiosyncratic information processing by raters. Meaningful interpretation of performance scores therefore requires additional narrative comments providing insight into raters’ personal motivations and argumentations. Narrative feedback and comments will thus support credible and defensible decision making about competence achievement. Moreover, narrative feedback—provided it is provided in a constructive way—is the only way to help trainees to accurately identify strengths and weaknesses in their performance and to effectively guide their competence development. 

마지막으로, [개인 스키마person schemas]의 개발 및 사용은 WBA 결과의 타당성 위협이 될 수 있다(예: 고정관념화 위험). 그러나 성과 평가에서 스키마 기반 처리가 불가피할 수 있음을 인식하는 것이 중요합니다. 스키마를 사용하면 평가자가 피평가자에 대한 정보를 효율적으로 처리하고 정리할 수 있습니다. 따라서 WBA를 개선하기 위한 노력은 [스키마 기반 프로세싱의 의도하지 않은 영향]이 상쇄되는 평가 환경을 설계하는 것에 집중되어야 한다. 우선, 평가자들이 연습생 실적에 대한 인상을 형성하는 과정을 인지하고 인식하는 것이 중요해 보입니다. 이를 위해서는 평가 프로세스에 참여하는 다른 사람과의 상호작용뿐만 아니라 수행능력 평정에 대한 교육, 피드백 및 성찰이 필요합니다. 
Finally, the development and use of person schemas may pose a threat to the validity of WBA results (e.g. risk of stereotyping). It is important to realize, however, that schemabased processing in performance assessments is likely to be inevitable: use of schemas helps raters to efficiently process and organize information about ratees. Therefore, efforts to improve WBA should be directed at designing assessment environments in which any unintended effects of schema-based processing are countered. First of all, it seems important for raters to be aware of and recognize the processes by which they form impressions of trainee performance. This requires training, feedback and reflection on performance rating as well as interactions with others involved in the assessment process. 

그러나 더 중요한 것은 판단(예: 고정관념의 적용)의 기초가 되는 [사회적 인식 과정social-cognitive process]이 인식자의 사회적 목표, 동기, 감정 상태 및 타인과의 관계에 매우 융통성 있고 적응적이다는 최근 증거가 있다는 것입니다(Smith and Seemin 2007). 즉, 이전에는 [잠재의식적이고 자동적]이라고 여겨졌던 개인 스키마와 같은 정신적 표현이나 지식 구조의 활성화와 적용은, [판단이 이루어지는 사회적 맥락]에 의해 영향을 받습니다.  
More importantly, however, there is recent evidence that social-cognitive processes that underlie judgments (for example the application of stereotypes) are extremely malleable and adaptive to the perceiver’s social goals, motives, emotional state and relationships with others (Smith and Semin 2007). In other words: activation and application of mental representations or knowledge structures, such as person schemas, formerly thought to be subconscious and automatic, are influenced by the social context in which judgments are made.

다른 영역의 작업 환경에 대한 연구를 바탕으로 효과적인 개입은 다음을 포함합니다. 

  • 적절한 자원(시간 및 비용)의 배분 
  • 평가자에게 훈련생을 관찰하고 평가할 수 있는 적절한 기회 제공  
  • 장기간의 관여 보장 
  • 평가자의 의사결정에 대한 책무성 강조
  • 감독자와 훈련생 사이의 상호 의존성을 강조 

Based on research in work settings in other domains, effective interventions include

  • allocation of adequate resources (time and money) and
  • providing raters with adequate opportunities to observe and evaluate trainees;
  • ensuring prolonged engagement;
  • holding raters accountable for their decisions; and
  • underscoring mutual interdependence between supervisor and trainee (Operario and Fiske 2001).

서로 다른 평가자/평가자 간의 '비판적 대화'와 같은 의사결정 전략의 신중한 설계를 통해 신뢰성과 의사결정의 엄격함을 더욱 높일 수 있다(Vander Vleuten et al. 2010; Moss 1994).

Trustworthiness and rigour of decision making can furthermore be achieved through careful design of decision making strategies, such as ‘critical dialogue’ between different raters/assessors (Van der Vleuten et al. 2010; Moss 1994). 

결론 Conclusive remarks

우리는 연구의 발견이 임상 영역에서 업무 기반 평가의 기초가 되는 과정을 더 잘 이해하는 데 기여한다고 느낀다. 평가자는 성과를 평가할 때 (장기간의 업무 경험을 통해 발전시켜온) 수행능력에 대한 [개인적 구조와 이론]을 활용한다. 평가자가 관찰 및 평가 중에 도달하는 [개인 모델]뿐만 아니라, [성과 이론]의 특이적 사용은 평가 결과를 결정한다. 우리는 평가자가 평가가 이루어지는 [사회적 맥락에 내재된 능동적 정보 처리자]임을 고려할 때, 우리의 연구 결과는 사회 심리학적 관점에서 WBA에 대한 접근방식을 지지한다고 결론짓는다.

We feel that the findings of our study contribute to a better understanding of the processes underlying work-based assessments in the clinical domain. When assessing performance, raters make use of personal constructs and theories about performance that develop through prolonged task experience. Idiosyncratic use of performance theories as well as person models that raters arrive at during observation and assessment determine rating outcomes. We conclude that our findings support approaches to WBA from a socialpsychological perspective, considering raters to be active information processors embedded in the social context in which assessment takes place. 

 

 

 

 


Adv Health Sci Educ Theory Pract. 2013 Aug;18(3):375-96.

 doi: 10.1007/s10459-012-9376-x. Epub 2012 May 17.

Workplace-based assessment: raters' performance theories and constructs

M J B Govaerts 1M W J Van de WielL W T SchuwirthC P M Van der VleutenA M M Muijtjens

Affiliations collapse

Affiliation

  • 1Department of Educational Research and Development, FHML, Maastricht University, PO Box 616, 6200 MD Maastricht, The Netherlands. marjan.govaerts@maastrichtuniversity.nl

Free PMC article

Abstract

Weaknesses in the nature of rater judgments are generally considered to compromise the utility of workplace-based assessment (WBA). In order to gain insight into the underpinnings of rater behaviours, we investigated how raters form impressions of and make judgments on trainee performance. Using theoretical frameworks of social cognition and person perception, we explored raters' implicit performance theories, use of task-specific performance schemas and the formation of person schemas during WBA. We used think-aloud procedures and verbal protocol analysis to investigate schema-based processing by experienced (N = 18) and inexperienced (N = 16) raters (supervisor-raters in general practice residency training). Qualitative data analysis was used to explore schema content and usage. We quantitatively assessed rater idiosyncrasy in the use of performance schemas and we investigated effects of rater expertise on the use of (task-specific) performance schemas. Raters used different schemas in judging trainee performance. We developed a normative performance theory comprising seventeen inter-related performance dimensions. Levels of rater idiosyncrasy were substantial and unrelated to rater expertise. Experienced raters made significantly more use of task-specific performance schemas compared to inexperienced raters, suggesting more differentiated performance schemas in experienced raters. Most raters started to develop person schemas the moment they began to observe trainee performance. The findings further our understanding of processes underpinning judgment and decision making in WBA. Raters make and justify judgments based on personal theories and performance constructs. Raters' information processing seems to be affected by differences in rater expertise. The results of this study can help to improve rater training, the design of assessment instruments and decision making in WBA.

상호 불일치로서 평가자간 변동: 평가자의 발산적 관점 식별(Adv in Health Sci Educ, 2017)
Inter-rater variability as mutual disagreement: identifying raters’ divergent points of view
Andrea Gingerich1 • Susan E. Ramlo2 • Cees P. M. van der Vleuten3 • Kevin W. Eva4 • Glenn Regehr4

 

 

도입
Introduction

인간의 판단은 의학 교육에서 필수적인 것으로 여겨져 왔다(Schuwirth and Van der Vleuten 2011). 그러나 여러 관측자는 (동일한 수행능력에 대해서도) 평정을 제공할 때마다 평가자 간 변동이 만연합니다(Crossley 및 Jolly 2012). 평가자 간 변동은 종종 평가자가 실수를 저지르거나 누락되거나 편향된 결과로 해석된다(Albanese 2000; Downing 2005; Williams et al. 2003). 그 결과로 나타난 '평가자 특이적 분산idiosyncratic rater variance'은 사이코메트리 모델에서 사용할 수 없는 측정 오차(O'Neill et al. 2015)로 간주되며, 평가 결정의 방어성을 위협하기에 충분한 규모일 수 있다(Crossley et al. 2002; Downing 2004). 따라서, 평가자 인식을 탐구하는 연구의 대다수는 [가변성의 기저에 있는 무의식적 인지 편향] 뿐만 아니라 [통제 가능한 판단 과정]을 탐색했다  
Human judgment has been considered indispensable to programs of assessment in medical education (Schuwirth and Van der Vleuten 2011). However, whenever multiple observers provide ratings, even of the same performance, inter-rater variation is prevalent (Crossley and Jolly 2012). This inter-rater variation is often interpreted as the result of raters committing mistakes, making omissions or being biased (Albanese 2000; Downing 2005; Williams et al. 2003). The resulting ‘idiosyncratic rater variance’ is considered to be unusable error of measurement in psychometric models (O’Neill et al. 2015) and can be of sufficient magnitude to threaten the defensibility of our assessment decisions (Crossley et al. 2002; Downing 2004). Thus, the majority of research exploring rater cognition has searched for the controllable judgment processes as well as the unconscious cognitive biases that may underlie rating variability (Gauthier et al. 2016; Gingerich et al. 2014a; Kogan et al. 2011; Tavares and Eva 2013; Williams et al. 2003; Wood 2014).  

최근 평가자 간 가변성을 조사하는 의학교육 연구자들은 평가자에 대해 다음을 발견했다.

  • 때로는 [성과에 대해 서로 다른 측면을 강조]하고(즉, 서로 다른 측면을 가장 중요하게 보고),
  • 때로는 동일한 수행 측면에 대해서도 완전히 동의하지 않으며(즉, 동일한 측면을 다르게 보고),
  • 때로는 확인되지 않은 사회적 추론을 내린다.(예: 성격 특성 및 동기에 관한 추론)

Recently, medical education researchers investigating inter-rater variability have found that raters

  • sometimes emphasize different aspects of the performance (i.e. seeing different aspects as most important),
  • sometimes outright disagree on the same aspects of the performance (i.e. seeing the same aspect differently) and
  • sometimes make unchecked social inferences (e.g. inferences regarding personality traits and motives) (Gauthier et al. 2016; Govaerts et al. 2013; Herbers et al. 1989; Kogan et al. 2011; Mazor et al. 2007; Yeates et al. 2013).

이러한 발견과 해석은 특이적인 '평가자 오차rater error'로서 평가자 변동성rater variability의 개념화와 확실히 일치한다. 그러나 Gingerich 외 연구진(2014b)은 평가자 간 변동을 탐구하는 연구에서 평가자 응답에서 [판단이 특이하다고 이야기되는 것만큼 특이하지는 않다]는 것을 시사할 수 있는 패턴을 발견했다. 더 구체적으로, 각 임상 성과에 대해 다수의 [동의 클러스터]를 식별했으며, 각 동의 클러스터에는 주어진 임상 성과에 대한 유사한 인상이나 해석을 보고한 여러 의사 평가자가 포함되어 있었다. 기술된 인상의 내용과 가치는 종종 클러스터 간에 크게 달랐으며, 이는 합의의 여러 클러스터가 성능에 대한 서로 다르지만 완전히 독특한 관점은 아님을 시사한다. 이러한 발견은 사회적 상호작용에서 사람들이 수행자에 대해 하는 사회적 추론을 바탕으로 관찰하는 사람들을 다르게 분류하는 경향이 있지만 [완전히 특이하지는 않다]는 사회 심리학 문헌의 연구와 일치했다(Fiske et al. 2007; Macrae와 Bodenhausen 2000; Mohrand). Kenny 2006; Park et al. 1994). 중요한 것은, [주어진 임상 수행능력]에 대한 [합의의 클러스터(즉, 각 평가자가 속한 클러스터를 설명함)]는 종종 성과에 대한 평가자의 점수의 유의한 분산 비율을 설명한다는 것이다.  

These findings and interpretations are certainly consistent with the conceptualization of rater variability as idiosyncratic ‘rater error’. In a study exploring inter-rater variation, however, Gingerich et al. (2014b) discovered patterns in raters’ responses that might suggest their judgments are not as idiosyncratic as they have been characterized. More specifically, multiple clusters of consensus were identified for each clinical performance with each cluster of consensus containing several physician raters who reported similar impressions or interpretations of the given clinical performance. The content and valence of the impressions described often varied widely between clusters, suggesting that the multiple clusters of consensus represented different, but not entirely idiosyncratic, perspectives on the performance. These findings were consistent with research from the social psychology literature which suggests that in social interactions people will tend to differently (but not entirely idiosyncratically) categorize those they are observing based on the social inferences they make about the performer (Fiske et al. 2007; Macrae and Bodenhausen 2000; Mohr and Kenny 2006; Park et al. 1994). Importantly, these clusters of consensus for a given clinical performance (i.e. accounting for the cluster to which each rater belonged) often explained a significant proportion of variance in raters’ scores of the performance. 

지금까지의 연구는 등급 인지에 대한 중요한 통찰력을 제공했지만, 이전의 모든 조사는 등급에 대한 평가자의 의견과 정당성을 수집하는 도구로 인터뷰나 텍스트 상자와 같은 [개방형 응답 형식]을 사용했다. 이는 초기 연구에서 중요한 설계 요소였습니다. 평가자들은 연구자들의 선입견에 구애받지 않고 자신의 아이디어를 자유롭게 표현할 수 있었습니다. 그러나 참가자가 [개방형 텍스트 형식]을 사용할 때 더 많은 구조화된 응답을 제공하도록 요청되었을 때보다 상세한 응답을 제공하지 못하는 것으로 확인되었기 때문에 잠재적으로 제한된 설계 요소이기도 하다(Herbers et al. 1989). 
While the research to date has offered important insights into rater cognition, all of the previous investigations have used open response formats, such as interviews or text boxes, as tools for collecting raters’ comments and justifications for their ratings (Chahine et al. 2016; Gauthier et al. 2016; Gingerich et al. 2014b Govaerts et al. 2013; Herbers et al. 1989; Kogan et al. 2011; Mazor et al. 2007; St-Onge et al. 2016; Tavares et al. 2016; Tweed and Ingham 2010; Yeates et al. 2013, 2015). This has been an important design element in these early studies–allowing raters the freedom to articulate their own ideas without being limited by the researchers’ preconceived notions. However, it is also a potentially limiting design element because participants have been found to provide less detailed responses when using an open text format than when they were prompted to provide more structured responses (Herbers et al. 1989). 

따라서 [개방형 응답]의 유연성은 평가자가 일부 특성만을 [불균형적으로 강조]할 수 있도록 하는 동시에, 평가 판단에 중요하고 잠재적으로 영향력이 있는 다른 특징들은 생략할 수 있다. 그렇다면, 결과적으로 개방형 텍스트 응답은 기본 평가자 인지에 대한 왜곡된 표현을 제공할 것이고, 후속 분석은 평가자의 인식의 유의한 차이에 기인하는 것보다 연구 설계의 아티팩트로 더 잘 설명되는 평가자 인지에 대한 변동성을 식별할 것이다.

Therefore, the flexibility of the open response format may allow raters to disproportionately emphasize some features, while omitting other features that were nonetheless salient and potentially influential in their assessment judgments. If so, the resulting open text responses would provide a distorted representation of the underlying rater cognition and their subsequent analysis would identify variability in rater cognitions that is better explained as an artifact of the study design than it is attributable to meaningful differences in raters’ cognitions.

[Q 방법론]에서 모든 참가자는 동일한 진술 세트를 제시받으며 다른 모든 진술(Stephenson 1953; Watts and Stenner 2012)과 관련하여 어떤 진술이 가장 두드러지는지를 (조사 주제에 대한 개인적 관점에 따라) 표시하도록 지시받습니다. [Q 방법론]을 선택한 이유는 참여자들이 (평가하는 순간만이 아니라) 임상적 encounter의 잠재적으로 중요한 각각의 특징을 명시적으로 반영해야 하고, 단순히 개방형 응답 형식으로 말하지 않은 것에 대한 의견을 보다 명확하게 나타내는 상대적 순위를 만들 것을 요구하기 때문이다(Brown 1980). 그런 다음 참가자가 보유한 다양한 관점을 식별하기 위해 특정 분석 절차를 사용할 수 있습니다(Stephenson 1953; Watts and Stenner 2012). 
In Q methodology every participant is presented with the same set of statements and is instructed to indicate which statements are most salient (according to their personal viewpoint on the topic of investigation) by sorting them in relation to all of the other statements (Stephenson 1953; Watts and Stenner 2012). Q methodology was chosen because it requires that participants explicitly reflect on each of the potentially salient features of the clinical encounter (after, not during their ratings) and requires them to create a relative ranking that more clearly indicates their opinions about things that might simply be left unsaid in a free response format (Brown 1980). A specified set of analytic procedures can then be used to identify the different points of view held by the participants (Stephenson 1953; Watts and Stenner 2012).

따라서 Q 방법론은 다른 방법을 사용하여 이전의 연구 결과를 복제하고 방법론이 제공하는 분석에서 발생하는 새로운 통찰력을 제공함으로써 평가자 인식 문헌을 확장할 수 있는 기회를 제공한다. (Q-요인에 기초한) 유사한 관점의 평가자 집단이 존재하고 등급의 상당한 변동을 설명한다면, 그 집단에 대한 근거의 검토는 평가자 간 변동성이 단순히 측정오차를 나타내는 것이라는 일반적인 관점을 유지할 수 있는지 여부를 결정하는 데 도움이 될 것이다. 즉, Q 방법론은 발생 상황에 대한 의견 불일치 또는 발생한 일의 중요성에 대한 의견 불일치로부터 연결실체의 관점의 차이가 어느 정도 발생하는지를 탐구할 수 있도록 한다.

Q methodology, therefore, offers the opportunity to extend the rater cognition literature both by replicating previous findings using a different method and by providing novel insights that arise from the analyses that the methodology affords. If groupings of raters with similar viewpoints (based on Q-factors) exist and explain substantial variability in ratings, then examination of the basis for the groupings would help determine if the commonly held view that inter-rater variability is simply representative of measurement error can be maintained. That is, Q methodology allows us to explore the extent to which the differences in the groups’ perspectives arise from disagreements about what happened in the encounter, or disagreements about the importance of what happened.

방법 Methods

Q-정렬 절차 및 분석
Q-sort procedure and analysis


1단계: 임상 성과 내에서 중요한 측면 식별
Step 1: Identifying salient aspects within the clinical performances

Q-연구 설계의 첫 번째 단계는 참가자에 의해 [정렬될 일련의 문장을 식별]하는 것입니다. 이 토론회는 관심 주제를 폭넓게 대표하는 다양한 성명서(McKown and Thomas 1988, Watts and Stenner 2012)를 모으는 것으로 시작됩니다. 우리의 합의는 가능한 한 평가 판단에 영향을 미치는 임상적 만남의 많은 중요한 측면을 포함할 필요가 있었다. 따라서 앞서 연구한 임상 성과에서 수집된 데이터를 활용하여 성과에 대한 모든 주요 측면을 포함하는 일련의 진술을 생성하는 것이 필수적이었다. 2단계에서 설명하는 최종 과제를 참가자들이 실현 가능하도록 하기 위해(즉, 소요 시간을 약 1시간으로 제한하기 위해), 이전 연구에서 사용한 7개 중에서 비디오 녹화 임상 성과 4개 세트(비디오 1, 2, 6, 7)를 선택했다(Gingerich et al. 2014b). 
The first step in the design of a Q-study is identifying a set of statements that will be sorted by participants. It begins with gathering a large array of statements that are broadly representative of the topic of interest, known as the concourse (McKeown and Thomas 1988; Watts and Stenner 2012). Our concourse needed to include as many salient aspects of the clinical encounters that influence assessment judgments as possible. Therefore, it was essential to utilize data collected from previously studied clinical performances to generate a set of statements that contained all salient aspects of the performances. To make the eventual task described in Step 2 feasible for participants (i.e. to limit the amount of time required to approximately 1 h), we selected a set of four video-recorded clinical performances (videos 1, 2, 6, 7) from seven used in an earlier study (Gingerich et al. 2014b). 

전체 협점이 확인되면 일부 문장이 선택되어 Q-샘플을 형성합니다. Q-샘플은 참가자들이 협력할 수 있는 합리적인 크기여야 하지만 콩코스의 대표성을 유지하고 분석 중에 발견될 수 있는 가능한 관점에 걸쳐 균형을 이루어야 합니다. 우리는 피셔의 실험 설계 접근법(Brown 1980; Stephenson 1953; Watts and Stenner 2012)으로 알려진 [구조화된 Q-샘플]을 개발하기 위해 가장 공식적인 접근법을 사용했다. 우리는 한 명의 저자(AG)가 각 비디오에 대한 가장 독특한 응답으로 초점을 줄였습니다. 이로써 전체 공개 텍스트 응답 수는 195개로 줄어들었습니다. 그런 다음 이를 Q-sort에 사용할 적절한 길이의 짧은 문장으로 구문 분석했습니다. 중복을 제거하고 의미상 유사한 문장을 결합했다(예: ''호감 가는 사람'' ''매우 호감 가는 사람'' ''동료와 환자들에게 존경받는 사람'' ''동료 레지던트들에게 호감 가는 사람'' 등을 [동료 및 환자가 좋아한다]로 통합) 그런 다음 두 명의 저자(AG 및 SER)는 Mini-CEX의 하위척도 각각과 다양한 유형의 사회적 판단(예: 이름 지정, 심리 상태 추론 등)을 균형 있게 설명하는 방식으로 가장 상징적인 문장을 선정하도록 했습니다. 그 결과 60개의 문장이 작성되었습니다. 
Once the full concourse is identified, a subset of statements is selected to form the Q-sample. The Q-sample should be a reasonable size for participants to work with but remain representative of the concourse and be balanced across the possible points of view that might be found during analysis (McKeown and Thomas 1988; Watts and Stenner 2012). We used the most formal approach to developing a structured Q-sample, known as Fisher’s Design of Experiments approach (Brown 1980; Stephenson 1953; Watts and Stenner 2012). We began with one author (AG) reducing the concourse to the most distinctive responses for each video. This reduced the number to 195 complete open text responses. These were then parsed into shorter statements of suitable length to be used in a Q-sort. Duplicates were removed and semantically similar statements were combined (e.g. statements such as ‘‘a likeable person’’, ‘‘very likeable, very personable’’, ‘‘well respected by peers and patients’’, ‘‘well-liked by fellow residents’’ were combined to form a single statement: Is liked by peers and patients). Two authors (AG and SER) then conferred to select the most iconic statements in a way that balanced the number of statements referring to each of the subscales on the Mini-CEX and different types of social judgments (e.g. naming personality traits, inferring state of mind etc.) for each video. This resulted in a set of 60 statements. 

Q-sort 프로세스를 통해 반대 의견을 전달하기 위해 하나의 문을 서로 다른 그리드 위치에 배치할 수 있기 때문에(아래 그림 1과 더 자세한 내용 참조) 반대 설명자를 포함할 필요가 없었다(예: '효율적' 또는 '비효율적'을 포함할 수 있지만 둘 다 필요하지 않았다). 표본의 각 ''반대편'' 쌍에서 항목을 하나씩 제거하면 문장의 수가 44개로 줄어들었다. 두 차례에 걸친 시범 테스트를 통해 참가자들이 불확실성을 표출하는 것에 대응해 진술 문구를 다듬었지만, 이전 연구 참여자들의 원래 문구는 최대한 유지됐다. 44개 문장의 최종 리스트(표 1에 표시됨)는 다음을 포함합니다.

  • 상담 및 인문학적 자질/전문직업성의 Mini-CEX 하위 척도를 나타내는 11개의 진술(교제-구축 능력의 제목으로 묶음)
  • Mini-CEX의 의료 인터뷰 스킬, 임상 판단 및 조직/효율성 스킬(의료 전문 스킬의 제목에 따라 분류됨) 서브세일즈를 대표하는 18개 문구
  • 관계 구축 또는 의료 전문지식과 관련이 없는 사회적 추론을 포함하는 15개의 진술.

Because the Q-sort process enables one statement to be placed in different grid positions to convey opposing opinions (see Fig. 1 and more details below) there was no need for opposing descriptors to be included (e.g. we could include ‘efficient’ or ‘inefficient’ but did not need both). Removal of one item from each pair of ‘‘opposites’’ in the sample reduced the number of statements to 44. Through two rounds of pilot testing, the phrasing of the statements was refined in response to participants’ expressions of uncertainty, but the original phrasing from participants in the previous study was maintained as much as possible. The final list of 44 statements (displayed in Table 1) contained

  • 11 statements representing the Mini-CEX subscales of counseling and humanistic qualities/professionalism (grouped under the heading of rapport-building skills);
  • 18 statements representing the Mini-CEX subscales of medical interviewing skills, clinical judgment and organization/efficiency skills (grouped under the heading of medical expertise skills); and
  • 15 statements containing social inferences not related to rapport-building or medical expertise. 


2단계: Q-sort의 구조화된 응답 형식을 사용한 데이터 수집
Step 2: Data collection using the structured response format of a Q-sort


Q 방법론의 두 번째 단계는 [참가자에 의한 Q-sort 완료]입니다. Q-sort 동안 특정 주제(이 경우 전공의의 성과)에 대한 각 참가자의 관점은 "내 관점과 가장 일치"부터 "가장 상반되는 관점"까지에 이르는 강요된 준정규 분포를 사용하여 Q-sample의 문장을 정렬하도록 함으로써 수집된다(브라운 1980, 와트 및 스텐너 2012). 따라서 이 기법을 통해 연구자들은 제공된 Q-표본과 분포를 사용하여 의사의 평가 인상의 주관성을 Q-sort 형태로 포착할 수 있었습니다. 따라서 이러한 Q 분류는 다양한 평가자가 [잠재적으로 관련성이 있는 많은 진술 집합]에서 선택한 [임상 성과 중 가장 두드러진 측면]을 나타내기 위한 [구조화된 응답 형식]을 제공한다. 
The second step in Q methodology is the completion of a Q-sort by participants. During a Q-sort each participant’s point of view on the specified topic (in this case, the performance of the resident) is collected by having them sort the statements in the Q-sample using a forced quasi-normal distribution ranging from ‘‘most consistent with my perspective’’ to ‘‘most contrary to my perspective’’ (Brown 1980; Watts and Stenner 2012). This technique, therefore, allowed the researchers to capture the subjectivity of physicians’ assessment impressions in the form of their Q-sorts using the Q-sample and distribution provided. These Q sorts, therefore, offer a structured response format to indicate the most salient aspects of the clinical performance selected from a large set of potentially relevant statements by a diverse set of raters. 

이 프로세스를 작동하기 위해 참가자들에게 초대 이메일이 발송되었으며, 여기에는 QSortOnline 웹 사이트에 대한 링크가 포함되어 있습니다. 참가자들은 참가 동의를 한 뒤 무작위로 제시된 동영상을 보고 Mini-CEX 평정을 완성했다. 
To operationalize this process, an invitation email was sent to participants that included a link to the website QSortOnline. After giving consent to participate, participants viewed a randomly presented video and completed Mini-CEX ratings. 

Mini-CEX 등급을 완료하는 즉시, 참가자들은 다음 지침에 따라 Q-sort를 완료하도록 요청받았다. 
Upon completing the Mini-CEX rating, participants were asked to complete a Q-sort using the following instructions:

이 레지던트에 대한 솔직하고 여과되지 않은 소감을 공유하고 '이 레지던트에 대한 나의 인상과 그들의 성과에 가장 부합한다'부터 '이 레지던트 및 그들의 성과에 대한 나의 인상과 가장 상반되는 것'까지 평가해 주시기 바랍니다.
We would like you to share your honest and unfiltered impressions of this resident and ask that you rank the statements from ‘MOST consistent with my impressions of this resident and their performance’ to ‘MOST contrary to my impressions of this resident and their performance’. 


FlashQ 소프트웨어는 Q-sort를 용이하게 하기 위해 사용되었으며, Q-sort 작업에 권장되는 여러 단계(자세한 내용은 그림 1 참조)로 완료되었습니다(Newman 및 Ramlo 2010, Watts 및 Stenner 2012). Q-Sort를 완료한 후, 참가자들은 다음을 설명하기를 요청받았다.

  • (a) "-4" 그리드 위치의 두 문장을 자신의 인상과 가장 상반되는 것으로 선택한 이유, 
  • (b) '+4" 그리드 위치의 두 문장을 자신의 인상과 가장 일치하는 것으로 선택한 이유,
  • (c) 분류 작업을 하면서 직면한 문제

FlashQ software was used to facilitate the Q-sort, which was completed in multiple steps (see Fig. 1 for more details) as is recommended for Q-sorting tasks (Newman and Ramlo 2010; Watts and Stenner 2012). After completing the Q-Sort, participants were prompted to explain

  • (a) why they selected the two statements in the ‘‘-4’’ grid positions as being most contrary to their impression,
  • (b) why they selected the two statements in the ‘‘?4’’ grid positions as being most consistent with their impression, and
  • (c) any problems they encountered with performing the sorting task. 




3단계: Qsort 분석을 통해 평가 인상에 대한 공감대 파악
Step 3: Identifying consensus in assessment impressions through analysis of the Qsorts

Q 방법론의 세 번째 단계는 [Q 분류 분석]으로, 주어진 임상 성과에 대해 얼마나 많은 관점이 있는지, 그리고 얼마나 많은 의사가 각각의 관점을 공유하는지 파악할 수 있습니다. 이는 비슷한 관점을 가진 참여자들이 비슷한 방식으로 보고서를 분류할 것으로 예상되기 때문에 가능하다.
The third step in Q methodology is the analysis of the Q sorts which enables us to identify how many points of view there are for a given clinical performance along with how many physicians share each of those points of view. This is possible because participants with similar points of view are expected to sort the statements in a similar way.

유사한 Q-sort는 높은 상관관계가 있으므로 참여자와 참여자의 Q-sort는 인자 분석을 통해 Q-factor로 함께 그룹화할 수 있습니다(Stephenson 1953; Watts and Stenner 2012). 이는 기존의 요인 분석이 '항목별by-item' 매트릭스를 사용하여 상관 관계가 높은 항목을 인자로 그룹화하는 것처럼(Stephenson 1953; Watts and Stenner 2012) 높은 Q-sort를 가진 참가자를 인자로 그룹화하기 때문에 '개인별by-person' 인자 분석이라고 불린다. 
Similar Q-sorts are highly correlated and, therefore, participants and their Q-sorts can be grouped together into Q-factors via factor analysis (Stephenson 1953; Watts and Stenner 2012). This is called a ‘by-person’ factor analysis because it groups together participants with highly correlated Q-sorts into a factor, just as a conventional factor analysis uses a ‘by-item’ matrix to group together highly correlated items into a factor (Stephenson 1953; Watts and Stenner 2012). 

무료 사용자 정의 소프트웨어 PQMethod 2.35(Schmolk 2014)를 사용하여 Q-sort 데이터를 분석했습니다. 우리는 인자 추출을 위해 전통적인 중심 기법을 사용했고 인자의 바리맥스 회전을 사용했습니다. 얼마나 많은 요소를 추출해야 하는지를 고려하면서, 우리는 특별히 주의를 기울였다.

  • 고유값이 1인 경우(와트 및 스테너 2012),
  • 험프리의 규칙을 초과하는 규칙(즉, 회전하지 않은 행렬에서 인자에 대한 두 개의 최고 하중의 교차곱이 표준 오차의 두 배를 초과한 규칙)과
  • 두 개 이상의 측정기가 상당히 로드된 측정기(p\.01)(Brown 1980, Watts 및 Stenner 2012).

We analyzed the Q-sort data using free custom software PQMethod 2.35 (Schmolck 2014). We used the classic centroid technique for factor extraction followed by varimax rotation of the factors. In considering how many factors to extract, we paid special attention to 

  • those with eigenvalues > 1 (Watts and Stenner 2012);
  • those exceeding Humphrey’s rule (i.e. those for which the cross-product of the two highest loadings for a factor in the unrotated matrix exceeded twice the standard error) (Watts and Stenner 2012); and
  • those on which at least two raters loaded significantly (p\.01) (Brown 1980; Watts and Stenner 2012).

그러나 Q 방법론(McKown 및 Thomas 1988)에서 이론적 유의성이 통계적 유의성보다 더 중요하다는 점에 유의해야 한다. 그 결과 각 요인 솔루션의 적합성 및 해석 가능성을 검사하여 최적의 솔루션을 선택했습니다. 
It is important to note, however, that theoretical significance is more important than statistical significance in Q methodology (McKeown and Thomas 1988). As a result, each factor solution was examined for fit and interpretability with the best solution selected. 

4단계: Q-요인 해석을 통해 각 관점 특성화
Step 4: Characterizing each point of view through Q-factor interpretation


Q 방법론의 네 번째 단계는 [Q-요인을 해석]하여 각 요인에 반영되는 관점을 밝히는 것입니다. [주어진 요인으로 그룹화된 모든 Q-sort]는 statement와 비슷한 정렬 또는 '구성configuration'을 가집니다. 그러나 이러한 구성은 동일하지 않습니다. 따라서 PQMethod 소프트웨어가 수행한 분석 중 하나는 '인자 배열factor array'(McKown and Thomas 1988; Newman and Ramlo 2010)로 알려진 각 Q-factor(표 1의 각 열)에 대한 대표적인 Q-sort의 식별이다. 이 인자 배열은 Watts 및 Stenner(2012)에서 설명한 절차를 사용하여 각 인자와 관련된 관점을 해석하는 데 사용됩니다.  

The fourth step of Q methodology is interpretation of the Q-factors to reveal the points of view reflected by each. All Q-sorts that are grouped into a given factor have similar sorts or ‘configurations’ of the statements. However, those configurations are not identical. Thus, one of the analyses performed by the PQMethod software is the identification of a representative Q-sort for each Q-factor (each column of Table 1), known as the ‘factor array’ (McKeown and Thomas 1988; Newman and Ramlo 2010). This factor array is used to interpret the point of view associated with each factor using procedures described by Watts and Stenner (2012). 

 



5단계: Q-요인 간 차이점 식별
Step 5: Identifying points of divergence between Q-factors


'요인 행렬'은 모든 요인 배열을 나란히 표시하여 각 Q-요인에 대한 모든 statement과 해당 격자 위치를 표시합니다. 이를 통해 여러 요인 간에 각 문을 비교할 수 있습니다. 예를 들어, 행렬은 특정 statement이 인자 1의 '''3''' 그리드 위치와 인자 2의 '''-4''' 위치에 배치되었음을 나타낼 수 있다. 이러한 비교는 동일한 성능 특성이 어떻게 다르게 해석될 수 있는지를 나타내는 두 가지 정보를 제공한다. 
The ‘factor matrix’ displays all the factor arrays side by side, showing every statement and its grid position for each Q-factor. This enables comparisons of each statement across factors. For example, the matrix could indicate that a particular statement was placed in the ‘‘ +3’’ grid position in Factor 1 and the ‘‘-4’’ position in Factor 2. This comparison provides two pieces of information that can be used as indications of how the same performance features may have been differently interpreted. 

첫째, 한 요소와 높은 상관관계를 갖는 Q-sort 참가자가 특정 문장을 원위부 그리드 위치(예: ''-4', '?4', '-3', '?'3)에 배치하고 다른 요소와 높은 상관관계를 갖는 Q-sort 참가자가 동일한 문장을 중앙 그리드 위치(예: '' -1', '0', '1)에 배치하는 경우? 첫 번째 참가자 집합이 다른 참가자에 비해 더 두드러지거나 두드러집니다. 
First, if participants with Q-sorts that highly correlate with one Factor place a particular statement in a distal grid position (e.g. ‘‘-4’’, ‘‘+4’’, ‘‘-3’’ or ‘‘+3’’) and participants with Q-sorts that highly correlate with another Factor place the same statement in a central grid position (e.g. ‘‘ -1’’, ‘‘0’’, ‘‘?1’’) it can be inferred that the performance feature is more prominent or salient for the first set of participants compared to the other. 

둘째, 한 요인에서 그리드의 '내 인상과 반대되는' 쪽(예: ''-4', ''-3', ''-2')에 문구가 배치되고 다른 요인에서 그리드의 '내 인상과 일치하는 쪽(예: '+4', '+3', '+2')에 문구가 배치되면 이는 [performance feature의 해석에 대한 불일치 표시]일 수 있습니다. 항목 간에 이러한 패턴을 해석하면 두 요인이 서로 다른 관점을 나타내는 방법(즉, 평가자 인식의 체계적 차이)을 결정할 수 있습니다. 

Second, if a statement is placed on the ‘contrary to my impression’ side of the grid (e.g. ‘‘-4’’, ‘‘-3’’, ‘‘-2’’) in one Factor and on the ‘consistent with my impression’ side of the grid (e.g. ‘‘?4’’, ‘‘?3’’, ‘‘ ?2’’) in another Factor, this could be an indication of disagreement in the interpretation of the performance feature. Interpreting these patterns across items allows us to determine how the two factors represent different points of view (i.e. systematic differences in rater cognition). 


Q-요인과 Mini-CEX 등급 간의 관계 파악
Identifying the relationship between Q-factors and Mini-CEX ratings


서로 다른 관점이 의사가 할당한 등급과 관련이 있는지 확인하기 위해, 참가자들은 Q-정렬이 가장 높은 상관 관계를 갖는 Q-요인에 할당되었고, Q-요인 할당을 일원 분산 분석에서 독립 변수로 사용하여 설명할 수 있는 분산 비율을 결정했습니다(부분 에타 제곱) '전체 임상 역량' Mini-CEX 등급에 포함됩니다. 
To determine if differing points of view were related to the ratings physicians assigned, participants were assigned to the Q-factor with which their Q-sort was most highly correlated and then Q-factor assignment was used as the independent variable in a one-way ANOVA to determine the proportion of variance that could be explained (partial eta squared) in the ‘overall clinical competence’ Mini-CEX ratings. 

참여자
Participants


Q 방법론은 각 참가자가 개인별 요인 분석(McKown 및 Thomas 1988, Newman 및 Ramlo 2010, Watts 및 Stenner 2012)에서 변수로 간주되기 때문에 주제에 대한 가능한 모든 관점을 다루기 위해 참가자를 의도적으로 모집해야 한다. 따라서 실제 전공의의 역량 판단을 담당하는 다양한 임상 평가자를 포함하는 것이 목표였다. 우리는 그들의 진정한 평가 인상과 평점을 파악하기 위해 노력했기 때문에 추후 교육은 제공되지 않았습니다. 따라서 본 연구의 참가자를 모집하기 위해, 우리는 동료들에게 (우리를 대신하여) 우수하고 존경받고 경험이 풍부한 전공의의 평가자에게 접근해 줄 것을 요청했다.  
Q methodology requires purposeful recruitment of participants to cover all possible viewpoints on the topic because each participant is considered a variable in the by-person factor analysis (McKeown and Thomas 1988; Newman and Ramlo 2010; Watts and Stenner 2012). The goal was, therefore, to include a diverse range of clinical assessors who were responsible for judging the competence of medical residents in real-life. Because we strove to capture their authentic assessment impressions and ratings no rater training was provided. Thus, to recruit participants for this study, we asked colleagues to approach, on our behalf, physicians who they considered to be good, well-respected and experienced assessors of residents. 

결과
Results


참여자 Participants

2014년 11월부터 2015년 2월까지 46명의 고유 참가자가 1~4편의 동영상에 대해 동일한 44개의 문장을 정렬하여 총 128개의 Q-sort를 제출했습니다. 참가자들은 캐나다 5개 주와 미국 5개 주의 19개 도시에서 왔다. 

Between November 2014 and February 2015, 46 unique participants submitted a total of 128 Q-sorts by sorting the same 44 statements in response to 1–4 videos. The participants were from 19 different cities in 5 provinces in Canada and 5 states in the USA. 

Q-요인 분석을 통한 공감대 클러스터 식별
Identifying clusters of consensus through Q-Factor Analysis


모든 참가자가 임상 성과에 대한 단일 관점을 공유했다면, 우리는 그들이 유사한 구성으로 문장을 분류하고 단일 Q-factor를 식별할 것으로 예상할 것이다. 이런 일은 일어나지 않았다. 대신, 2-요인 솔루션이 4개의 비디오 각각에 가장 적합하다고 판단되었습니다(요인 추출 및 회전에 관한 자세한 내용은 표 2 참조). 즉, 유사한 Q-sorts의 하위 집합을 바탕으로 분석 결과 각 임상 성과에 대한 참가자의 인상 중 두 가지 주요 공감대가 나타났다. 

If all participants had shared a single point of view on the clinical performance, we would expect them to sort the statements in a similar configuration and a single Q-factor to be identified. This did not occur. Instead, a 2-factor solution was determined to be the best fit for each of the four videos (see Table 2 for details regarding factor extraction and rotation). In other words, based on subsets of similar Q-sorts the analysis revealed two major clusters of consensus among participants’ impressions for each of the clinical performances. 



Q-요인 해석을 통한 각 관점 특성화
Characterizing each perspective through Q-factor interpretation


네 가지 임상 성과 각각과 관련된 관점의 수를 파악한 후, 인자 배열의 문장 구성을 조사했습니다. 각 관점 내에서 다르게 해석되었던 임상적 특징을 확인하면서 흥미로운 패턴이 나타났다. 표 1에서 회색 음영을 사용하여 강조된 바와 같이, 모든 비디오에 대한 한 관점(먼저 열거된 요소)은 거의 전적으로 [관계 구축] 진술을 나타내기 위해 그리드의 원위부 위치(±3 및 ±4)를 사용했다. [의료 전문지식]과 [사회적 판단] 문장은 덜 극단적인 위치(0 ~ ±2)에 놓였다. 반대로, 다른 관점에서는 원위적 입장을 거의 독점적으로 사용하여 [의료 전문지식]을 언급하고, [관계 구축] 및 [사회적 판단] 진술에 대한 극단적 입장을 덜 제시하였다. 이러한 정렬 구성을 바탕으로 대부분의 비디오에서 한 그룹의 의사는 평가 인상에서 가장 두드러지게 공감대를 형성하는 기술을 강조한 반면, 다른 그룹은 의료 전문 기술을 가장 두드러지게 강조했습니다
After identifying the number of points of view associated with each of the four clinical performances, we examined the configuration of the statements in the factor arrays. An interesting pattern emerged as we identified the clinical features that had been differently interpreted within each point of view. As highlighted using grey shading in Table 1, one point of view for every video (the factor listed first) used the distal position on the grid (±3 and ±4) almost exclusively to represent rapport-building statements; with the medical expertise and social judgment statements being placed in less extreme positions (0 to ±2). Conversely, the other point of viewused the distal positions almost exclusively to represent statements referring to medical expertise leaving the less extreme positions to represent the rapport building and social judgment statements. Based on these sorting configurations, it appears that for most videos, one group of physician raters emphasized rapport-building skills most prominently in their assessment impressions whereas the other group emphasized medical expertise skills as most salient. 

표 2의 각 비디오에 대한 다양한 관점에 대해서도 유사한 해석을 찾을 수 있습니다. 일부 비디오(예: 비디오 2와 7)에서는 두 가지 관점의 차이가 더 두드러졌고, 다른 비디오(예: 비디오 1과 비디오 6에 대해서는 긍정적으로 상관된 관점)에서는 덜 두드러졌다. 예를 들어, 비디오 1은 부족한 관계 구축을 강조하는 데 있어 관점이 훨씬 더 일치합니다. 그러나 네 가지 임상 성과 모두에 대해 평가 판단의 내용은 일부 합의 사례에도 불구하고 구별되는 관점으로 식별될 수 있을 만큼 충분히 달랐다. 이러한 관점에서 의사 구성원 자격membership을 검사한 결과, 구성원 자격이 네 가지 성과에 걸쳐 [안정적이지 못했으며] (즉, [의료 전문지식]보다 [관계 구축] 기술을 강조하는 의사 그룹이 매번 동일하지 않았음), 구성원 자격을 인구 통계적 요인(표 2 참조)에 기인할 수 없었다.  

Similar interpretations can be found for each of the various perspectives on each video in Table 2. The distinction between the two perspectives was more striking for some videos (e.g. video 2 and 7) and less so for others (e.g. video 1 and positively correlated points of view for video 6). For example, there is much more agreement across the points of view for Video 1 in emphasizing deficient rapport building. However, for all four clinical performances the content of the assessment judgments was sufficiently different as to be identifiable as distinct points of view despite some instances of agreement between them. Examination of physician membership within these points of view revealed that membership was not stable across the four performances (i.e. it was not the same group of physicians emphasizing rapport-building skills over medical expertise every time) and membership could not be attributed to demographic factors (as shown in Table 2). 

Q-요인 간 비교를 통해 의견 일치 클러스터 간 차이 식별
Identifying divergences between clusters of consensus by comparison across Q-factors


전반적으로, 주어진 임상적 만남에 대한 다른 평가 인상이 많은 성과 특성의 유사한 해석을 포함할 수 있지만, 의사가 [다르게 가중치를 부여]하고, 때로는 일부 [수행능력 특성의 해석에 동의하지 않기] 때문에 수집된 평가 판단이 달라질 수 있다. 그 결과 발생하는 일련의 관점은 단일 수행능력에 대한 [관계 구축] 또는 [의료 전문성] 에 상반된 평가자 판단을 나타내는 것으로 이해될 수 있습니다. 
Overall, it appears that different assessment impressions of a given clinical encounter can include similar interpretations of many of the performance features and yet the collated assessment judgments can diverge due to physicians differently weighting and sometimes disagreeing on the interpretation of a few performance features. The resulting set of points of view can then be understood to represent conflicting rater judgments of rapport-building and/or medical expertise skills for a single performance. 

Q-요인과 Mini-CEX 등급 간의 관계 파악
Identifying the relationship between Q-factors and Mini-CEX ratings


표 3에서 볼 수 있듯이, 4개의 비디오 모두에 대해 [서로 다른 관점에 속하는 의사]들은 [상당히 다른 Mini-CEX 평정]과 연관되었습니다. 각 비디오의 시점별 평균 등급은 시점의 내용과 일치하는 방향으로 차이가 있었습니다. 예를 들어, 임상 수행능력의 많은 결함을 강조하는 관점(예: 비디오 1과 7의 요인 1, 비디오 2의 요인 2)은 더 낮은 평균 등급과 관련이 있었다. 
As shown in Table 3, physicians belonging to different points of view were associated with significantly different Mini-CEX ratings for all four videos. The mean ratings for the points of view for each video differed in a direction consistent with the content of the point of view. For example, the points of view emphasizing a greater number of deficiencies in the clinical performance (such as factor 1 for videos 1 and 7 and factor 2 for video 2) were associated with lower mean ratings. 



고찰
Discussion


Q 방법론을 사용하여 참가자들이 수행능력에 대한 중요한 특징을 설명하는 동일한 44개의 문장을 정렬하도록 선택했습니다. 44개 문장은 이전에 (Gingerich et al. 2014b)에서 수집된 세 가지 개방형 질문 형식을 사용하여 수집한 것이다.
이러한 설계는 [모든 평가자가 하나의 관점]에서 각 성과를 쉽게 해석하거나, [각 참가자에게 고유한 완전히 독특한 관점]을 가질 것이라고 해석할 수 있었습니다. 그러나 이 두 가지 가능성 모두 나타나지 않았다. 대신 각 임상 성과에 대해 [두세 가지 뚜렷한 관점]이 식별되었다. 각 성과에 대한 두세 가지 다른 관점에 대한 의사의 가입은 다양한 인구통계학적 배경을 가진 참가자를 포함함에도 불구하고 의료 전문성, 성별, 지리 또는 거주자 평가 경험에 기인할 수 없다.
We used Q methodology, choosing to have participants sort the same 44 statements describing salient features of performances (previously collected in (Gingerich et al. 2014b) using three different open question formats) for each of the four performances. This design could have easily resulted in each performance being interpreted froma single point of view by all raters, or in a set of completely idiosyncratic points of view unique to each participant. However, neither of these two possibilities emerged. Instead, two or three distinct points of view were identified for each clinical performance. Physicians’ membership in the two or three different points of view for each performance could not be attributed to their medical specialty, gender, geography or experience with assessing residents despite the inclusion of participants with varied demographic backgrounds. 

여러 관점의 일치 및 다양성
Consensus and divergence of multiple points of view

주어진 임상 성과에 대해 둘 이상의 관점을 식별한 것은 [여러 의사들이 임상 수행능력에 대해서 제한된 일련의 뚜렷한 인상 중 하나를 공유]하는 것으로 확인된 Gingerich et al.(2014b) 발견을 반복한다. 서로 다른 관점을 검토한 결과, 의사들은 자신의 평가 인상 내에서 성과에 대한 몇 가지 측면을 다르게 강조했으며 특정 측면에 대해 완전히 동의하지 않는 경우는 거의 없었다. 이는 단일 임상 만남에 대한 차별적 유의성differential salience 및 평가자 불일치rater disagreement에 대한 이전의 의학교육 연구 결과에 대한 지원을 추가한다(Govaerts et al. 2013; Herbers et al. 1989; Kogan et al. 2011; Mazor et al. 2007; Yates et al. 2013). 의사의 Q-인자 멤버십 자격을 설명할 때 MiniCEX 평정에서 21-53% 변동이 설명될 수 있기 때문에, 정렬 구성sorting configuration의 변동은 거짓일 것 같지 않다. 주어진 임상 수행능력에 대한 평가자의 응답 내에서 합의의 다중 클러스터의 일관성은, 이것을  참가자 표본에서 찾고, 두 가지 다른 방법론을 사용했기에, 평가자 간 변동성이 단순히 측정 오류라는 가정에 도전한다. 
Identifying more than one point of view for a given clinical performance replicates the Gingerich et al. (2014b) finding of multiple physicians sharing one of a limited set of distinct impressions for a clinical performance. Examination of the different points of view indicates that physicians differently emphasized a few aspects of the performance within their assessment impression and rarely outright disagreed on a given aspect. This adds support to previous medical education research findings of differential salience and rater disagreement regarding a single clinical encounter (Govaerts et al. 2013; Herbers et al. 1989; Kogan et al. 2011; Mazor et al. 2007; Yeates et al. 2013). The variations in the sorting configurations are unlikely to be spurious since 21–53 % of variance in the MiniCEXratings could be explained when physician’s membership in a Q-factor was accounted for. The consistency of finding multiple clusters of consensus within raters’ responses for a given clinical performance across two samples of participants and using two different methodologies challenges the assumption that inter-rater variability is simply measurement error. 

또한 우리의 원래 이론화(Gingerich et al. 2011, 2014b)와 달리, 이러한 데이터는 의사 평가자가 [사회적 판단(지능, 게으름 또는 오만성에 대한 추론 등)]을 성과에 대한 인상에서 특히 두드러진 측면으로 보지 않는다는 것을 시사한다. 그러한 사회적 판단을 포함하는 진술이 임상 기술에 대한 추론과 판단을 포함하는 진술과 정면 충돌했을 때, 의사들은 그러한 진술이 설득력이 없다고 생각했고 일반적으로 채점표에서 0 또는 ±1의 위치로 강등시켰다. 참가자들은 평가 판단을 하면서 사회적 판단의 형성이나 영향을 받지 않을 수 있었다. 그러나 이러한 진술은 기존 연구에서, 의사 평가자가 비디오를 시청하면서 생성된 것임을 알 수 있습니다. 더욱이, 우리는 이러한 사회적 추론의 할인이 어느 정도 사회적으로 바람직한 반응을 반영하는지 또는 무의식적인 편견이 반응에 영향을 미치는지 판단하지 못한다. 따라서, 평가자 간 변동성의 유의한 원천으로서 사회적 판단을 배제하기 위해 추가적인 삼각측량 방법을 사용한 추가 연구가 필요할 것이다. 

It is also worth noting that contrary to our original theorizing (Gingerich et al. 2011, 2014b) these data suggest that physician raters do not see social judgments (such as inferences about intelligence, laziness, or arrogance) as particularly salient aspects of their impressions of the performance. When statements containing such social judgments were put head-to-head with statements containing inferences and judgments regarding clinical skills, physicians did not appear to find them compelling and generally relegated them to positions of 0 or ±1 on the scoring sheet. It could be that participants were able to avoid forming or being influenced by social judgments while making assessment judgments. However, it is noteworthy that these statements were generated by a previous cohort of physician raters watching these videos. Moreover, due to our use of a self-report design feature we cannot determine the extent to which this discounting of social inferences reflects socially desirable responses or if any unconscious biases influenced the responses. Thus, further research using additional triangulating methods will be needed to rule-out social judgments as a significant source of inter-rater variability. 

평가자 간 변동성 및 평가자 인식의 재개념화
Re-conceptualizing inter-rater variability and rater cognition


각 성과에 대해 식별된 관점은 [관계 구축] 및 [의료 전문지식]에 대한 서로 다른 평가 판단을 반영합니다. 성과 평가 등급의 기초가 되는 두 가지 요인의 식별은 이전의 의학 교육 연구(Chahine et al. 2016; Nasca et al. 2002; Ramsey and Wenrich 1993; Silber et al. 2004; Verhulst et al. 1986). 또한 사회적 판단은 [사회성/도덕성] 대 [역량/능력] 판단에 기초하여 이루어진다는 [사회적 범주화의 2차원 이론]과도 잘 일치한다(Bauvois 및 Dubois 2009; Fiske et al. 2007; Wojciske 2005).  
The identified points of view for each performance reflect differing assessment judgments of skill in rapport-building and medical expertise. The identification of two factors underlying performance assessment ratings is consistent with prior medical education research (Chahine et al. 2016; Nasca et al. 2002; Ramsey and Wenrich 1993; Silber et al. 2004; Verhulst et al. 1986). It also aligns well with the two-dimensional theories of social categorization which posit social judgments are made based on judgments of sociability/morality versus competence/ability (Beauvois and Dubois 2009; Fiske et al. 2007; Wojciszke 2005).  


의사에게 평가 척도가 아닌 Q-sort를 사용하여 평가 인상을 제공하도록 요청했지만, 그 결과 관점은 이 [두 가지 기본 차원]에 대한 [차등적 판단]을 나타내는 것으로 보인다. 그렇다면 [평가자간 변동성]은 평가자 특이적인 변동성보다는, [관계 구축] 및 [의료 전문지식] 중 [어떤 것을 차등적으로 강조하는지]로 개념화할 수 있다. 마찬가지로, 보다 중요한 인식은 두 가지 판단의 [형성formation]과 [결합combination]으로 개념화될 수 있습니다. 즉, 충분한 조치가 필요한 것이며 환자와 동맹을 맺는 동안 이루어져야 하는 것입니다. 

Although physicians were asked to provide their assessment impressions using Q-sorts and not rating scales, the resulting points of view seem to represent differential judgments on these two underlying dimensions. If so, inter-rater variability could be conceptualized as differential emphasis on rapport-building and/or medical expertise rather than idiosyncratic rater variations. Likewise, rater cognition could be conceptualized as the formation and combination of two judgments: was what needed to be done sufficiently done and was it done while building an alliance with the patient. 

한계 및 추가 조사가 필요한 영역
Limitations and areas requiring further investigation


연구 함의
Implications of this research


[동일한 임상 만남에 대해 서로 다른 관점을 형성]할 때, 수반되는 관점의 상대적 정확성이나, 실제 인지 과정과 무관하게, [하나의 판단으로 쉽게 조정될 수 없는 복수의 해석]이라는 결과는 평정 분석에 문제가 된다. 가장 비판적으로, 이 연구는 [평정이 상호 호환되지 않는다]는 예비 증거를 제공한다. 이는 [동질성 가정]을 위반하고, 과도한 분산이 심리측정모형의 평가자에 귀속되는 결과를 초래할 것이다(Kane 2002). 평가자가 복수의 알려지지 않은 관점에 속했기 때문에, 다른 평가 판단을 보고하거나 다른 등급을 지정할 것으로 예상될 수 있다면, 현재 우리의 측정 모델은 관련 평가 정보를 추출하고 요약하는 데 비효율적일 것이다.
Regardless of the relative accuracy of the points of views or the actual cognitive processes involved with forming differing points of view for the same clinical encounter, the finding of multiple interpretations that cannot be easily reconciled into a single judgment is problematic for the analysis of ratings. Most critically, this study provides preliminary evidence that raters are not interchangeable. This would violate the homogeneity assumption and result in excess variance being attributed to the raters in psychometric measurement models (Kane 2002). If raters could be expected to report different assessment judgments or assign different ratings because they belonged to one of multiple unknown points of view, our current measurement models would be inefficient in extracting and summarizing the relevant assessment information.  

 


Adv Health Sci Educ Theory Pract. 2017 Oct;22(4):819-838.

 doi: 10.1007/s10459-016-9711-8. Epub 2016 Sep 20.

Inter-rater variability as mutual disagreement: identifying raters' divergent points of view

Andrea Gingerich 1Susan E Ramlo 2Cees P M van der Vleuten 3Kevin W Eva 4Glenn Regehr 4

Affiliations collapse

Affiliations

  • 1Northern Medical Program, University of Northern British Columbia, 3333 University Way, Prince George, BC, V2N 4Z9, Canada. andrea.gingerich@unbc.ca.
  • 2Department of Engineering and Science Technology, University of Akron, Akron, OH, USA.
  • 3School of Health Professions Education, Maastricht University, Maastricht, Netherlands.
  • 4Centre for Health Education Scholarship, University of British Columbia, Vancouver, BC, Canada.
  • PMID: 27651046
  • DOI: 10.1007/s10459-016-9711-8AbstractKeywords: Inter-rater variability; Mini-CEX; Q methodology; Rater cognition; Rater-based assessment; Workplace-based assessment.
  • Whenever multiple observers provide ratings, even of the same performance, inter-rater variation is prevalent. The resulting 'idiosyncratic rater variance' is considered to be unusable error of measurement in psychometric models and is a threat to the defensibility of our assessments. Prior studies of inter-rater variation in clinical assessments have used open response formats to gather raters' comments and justifications. This design choice allows participants to use idiosyncratic response styles that could result in a distorted representation of the underlying rater cognition and skew subsequent analyses. In this study we explored rater variability using the structured response format of Q methodology. Physician raters viewed video-recorded clinical performances and provided Mini Clinical Evaluation Exercise (Mini-CEX) assessment ratings through a web-based system. They then shared their assessment impressions by sorting statements that described the most salient aspects of the clinical performance onto a forced quasi-normal distribution ranging from "most consistent with my impression" to "most contrary to my impression". Analysis of the resulting Q-sorts revealed distinct points of view for each performance shared by multiple physicians. The points of view corresponded with the ratings physicians assigned to the performance. Each point of view emphasized different aspects of the performance with either rapport-building and/or medical expertise skills being most salient. It was rare for the points of view to diverge based on disagreements regarding the interpretation of a specific aspect of the performance. As a result, physicians' divergent points of view on a given clinical performance cannot be easily reconciled into a single coherent assessment judgment that is impacted by measurement error. If inter-rater variability does not wholly reflect error of measurement, it is problematic for our current measurement models and poses challenges for how we are to adequately analyze performance assessment ratings.

근무지-기반 평가: 평가자 전문성의 효과(Adv in Health Sci Educ, 2011)
Workplace-based assessment: effects of rater expertise
M. J. B. Govaerts • L. W. T. Schuwirth • C. P. M. Van der Vleuten • A. M. M. Muijtjens

 

도입
Introduction

의료 교육의 연속적인 최근 발전은 업무 수행 평가, 즉 전문 역량에 대한 직장 기반 평가(WBA)에 대한 관심이 증가하고 있음을 보여줍니다. 성과-기반 또는 역량-기반 교육 프로그램에서 직장 내 성과 평가는 필수적입니다(Van der Vleuten 및 Schuwirth 2005). 또한 전문 서비스의 우수성excellence과 평생학습에 대한 강조가 높아짐에 따라, 전문가는 경력 전반에 걸쳐 일상적인 성과에 대한 평가, 개선 및 증거를 제공해야 합니다. 따라서 직장 기반 평가(WBA)는 항공, 군사 및 사업(Cunnington and Southgate 2002; Norcini 2005)과 같은 다른 전문 영역과 마찬가지로 의료 분야에서 면허 및 (재) 인증 절차의 필수적인 부분이 될 가능성이 높다.  
Recent developments in the continuum of medical education reveal increasing interest in performance assessment, or workplace-based assessment (WBA) of professional competence. In outcome-based or competency-based training programs, assessment of performance in the workplace is a sine qua non (Van der Vleuten and Schuwirth 2005). Furthermore, the call for excellence in professional services and the increased emphasis on life-long learning require professionals to evaluate, improve and provide evidence of dayto-day performance throughout their careers. Workplace-based assessment (WBA) is therefore likely to become an essential part of both licensure and (re)certification procedures, in health care just as in other professional domains such as aviation, the military and business (Cunnington and Southgate 2002; Norcini 2005). 

WBA에 대한 연구는 일반적으로 측정 품질에 초점을 맞춘 심리측정적 관점을 취합니다

  • 예를 들어 Norcini는 (환자 혼합, 환자 난이도 및 환자 번호와 같은) 통제할 수 없는 변수로부터 신뢰성과 타당성에 대한 위협을 지적합니다.
  • 다른 연구들은 낮은 평가자간 신뢰성과 후광 효과, 관대화 성향, 범위range 제한과 같은 평가자 효과로 평가 결과의 효용이 저하된다는 것을 보여준다. 

Research into WBA typically takes the psychometric perspective, focusing on quality of measurement.

  • Norcini (2005), for instance, points to threats to reliability and validity from uncontrollable variables, such as patient mix, case difficulty and patient numbers.
  • Other studies show that the utility of assessment results is compromised by low inter-rater reliability and rater effects such as halo, leniency or range restriction (Kreiter and Ferguson 2001; Van Barneveld 2005; Gray 1996; Silber et al. 2004; Williams and Dunnington 2004; Williams et al. 2003).

그 결과, WBA를 개선하려는 시도는 일반적으로 [평정 척도 형식을 조정]하고, [평가자 교육]을 통해 [평가자 오류를 제거]함으로써 [측정의 표준화와 객관성]에 초점을 맞춘다. 그러한 조치는 기껏해야 엇갈린 성공을 거두었다(Williams et al. 2003)

As a consequence, attempts to improve WBA typically focus on standardization and objectivity of measurement by adjusting rating scale formats and eliminating rater errors through rater training. Such measures have met with mixed success at best (Williams et al. 2003). 

그러나 양적 평가 결과에 초점을 맞춘 전통적인 심리측정 체계에 대한 배타적 초점이 WBA 연구에 적합한지 의문을 제기할 수 있다. 산업 심리학의 연구는 직장에서의 [성과 평가]란 [상호 관련된 일련의 과정]으로 정의되는 [복잡한 작업]이라는 것을 증명합니다. WBA는 일반적으로 [시간의 압박] 속에, [표준화되지 않은 작업] 또는 [잘 정의되지 않거나 서로 상충하는 목표]의 맥락에서 평가 작업을 수행해야 하는 [전문가의 판단]에 의존합니다
One might question, however, whether an exclusive focus on the traditional psychometric framework, which focuses on quantitative assessment outcomes, is appropriate in WBA-research. Research in industrial psychology demonstrates that assessment of performance in the workplace is a complex task which is defined by a set of interrelated processes. Workplace-based assessment relies on judgments by professionals, who typically have to perform their rating tasks in a context of time pressure, non-standardized assessment tasks and ill-defined or competing goals (Murphy and Cleveland 1995).

퍼포먼스 평가에 대한 연구 결과도 [맥락적 요인]이 평가자의 행동에 영향을 미치고 따라서 평가 결과에 영향을 미친다는 것을 나타낸다(Levy and Williams 2004; Hawe 2003). 따라서 평가자들은 성과 데이터를 샘플링하고, 결과를 해석하고, 평가 기준을 식별 및 정의하며, [개인의 판단]을 [합당한(허용 가능한) 의사 결정]으로 변환하는 데 지속적으로 어려움을 겪고 있다. 어쩌면, 직장에서의 [퍼포먼스 평정performance rating]은 '측정'에 관한 것이 아니라 역동적인 환경에서 '추리', '판단', '의사 결정'에 관한 것일지도 모른다

Findings from research into performance appraisal also indicate that contextual factors affect rater behavior and thus rating outcomes (Levy and Williams 2004; Hawe 2003). Raters are thus continuously challenged to sample performance data; interpret findings; identify and define assessment criteria; and translate private judgments into sound (acceptable) decisions. Perhaps performance rating in the workplace is not so much about ‘measurement’ as it is about ‘reasoning’, ‘judgment’ and ‘decision making’ in a dynamic environment. 

[정보 처리자information processors]로서의 평가자의 개념은 인식-기반cognition-based 수행능력 평가 모델의 중심이다(Feldman 1981; De Nisi 1996). 기본적으로, 이러한 모델은 [평가 결과]는 평가자가 아래의 활동을 어떻게 하느냐에 따라 달라진다고 가정한다.

  • 관련 정보 인식 및 선택(정보 획득)
  • 기억memory에 정보를 해석하고 정리(평가대상자 행동의 인지적 표현 포함)
  • 추가 정보 검색
  • 최종적으로 판단과 의사결정에 관련된 정보를 검색하고 통합 

The idea of raters as information processors is central to cognition-based models of performance assessment (Feldman 1981; De Nisi 1996). Basically, these models assume that rating outcomes vary, depending on how raters

  • recognize and select relevant information (information acquisition);
  • interpret and organize information in memory (cognitive representation of ratee behavior);
  • search for additional information; and
  • finally retrieve and integrate relevant information in judgment and decision making.

이러한 [기본적인 인지 프로세스]는 경영, 항공, 군사 및 의학과 같은 다양한 전문 영역에서 기술된 정보 처리와 유사하다(Walsh 1995; Ross et al. 2006; Gruppen and Frohna 2002). 

These basic cognitive processes are similar to information processing as described in various professional domains, such as management, aviation, the military and medicine (Walsh 1995; Ross et al. 2006; Gruppen and Frohna 2002). 

영향, 동기, 시간 압력, 현지 관행 및 이전 경험과 관련하여 정보 처리에서 [사람마다 variation]이 크게 발생할 수 있다(Levy and Williams 2004, Gruppen and Frohna 2002).  
large individual variations in information processing can occur, related to affect, motivation, time pressure, local practices and prior experience (Levy and Williams 2004; Gruppen and Frohna 2002).  

실제로 [과제-특이적 전문성]은 정보처리 (따라서 과제 수행까지)의 차이를 이해하는 데 핵심적인 변수인 것으로 나타났다(Ericson 2006). [오랜 직무 경험]은 복잡한 업무를 처리함에 있어, [많은 양의 정보를 효율적으로 처리할 수 있는 인지 프로세스]의 적응뿐만 아니라, [광범위하고 잘 구조화된 지식 기반]을 획득함으로써, 초보자가 전문가와 같은 수행자로 발전하는 데 도움이 된다는 것을 보여주는 충분한 연구가 있다. 연구 결과는 이러한 [인지 구조] 및 [(인지) 프로세스]의 차이가 숙련도와 작업 수행의 품질에 영향을 미친다는 것을 일관되게 보여줍니다(Chi 2006). 

In fact, task-specific expertise has been shown to be a key variable in understanding differences in information processing––and thus task performance (Ericsson 2006). There is ample research indicating that prolonged task experience helps novices develop into expertlike performers through the acquisition of an extensive, well-structured knowledge base as well as adaptations in cognitive processes to efficiently process large amounts of information in handling complex tasks. Research findings consistently indicate that these differences in cognitive structures and processes impact on proficiency and quality of task performance (Chi 2006).

예를 들어, [전문가 행동]의 주요 특징은 [일상적 문제에서 신속하고 자동적인 패턴 인식]이 우세하여, 매우 [빠르고 정확한 문제 해결]이 가능하다는 것이다(Klein 1993; Coderre et al. 2003). 그러나 익숙하지 않거나 복잡한 문제에 직면할 경우, 전문가들은 문제를 더 잘 이해하기 위해 정보를 수집하고 분석하며 평가하는 데 더 많은 시간이 걸리는 반면, 초보자들은 최소한의 정보만 수집한 후에, 문제 해결 방법이나 행동 방침을 생성하기 시작하는 경향이 더 많다(Ross et al. 2006; Voss et al. 1983). 

For instance, a main characteristic of expert behavior is the predominance of rapid, automatic pattern recognition in routine problems, enabling extremely fast and accurate problem solving (Klein 1993; Coderre et al. 2003). When confronted with unfamiliar or complex problems, however, experts tend to take more time to gather, analyze and evaluate information in order to better understand the problem, whereas novices are more prone to start generating a problem solution or course of action after minimal information gathering (Ross et al. 2006; Voss et al. 1983). 

전문성 연구에 대한 또 다른 강력한 연구 결과는, 비전문가와 비교했을 때, 전문가들은 [사물을 다르게 보고 다른 것을 본다]는 것입니다. 일반적으로, 전문가들은 정보에 대한 [더 많은 추론]을 하고, 정보를 [의미 있는 패턴과 추상화]로 묶습니다(Chi et al. 1981; Feltovich et al. 2006).

  • 예를 들어, [의학 전문가] 행동에 대한 연구는 전문가들이 환자 문제에 대해 더 일관성 있는 설명을 하고, 데이터에서 더 많은 추론을 하며, 더 적은 문자 그대로의 정보 해석을 제공한다는 것을 보여준다(Van de Wiel et al. 2000). 
  • [교사 감독관]에 대한 연구(Kerrins와 Cushing 2000)에서도 유사한 결과가 설명되었다. 구두 프로토콜을 분석한 결과 [경험이 부족한 감독관]들은 대부분 비디오테이프에서 본 내용을 문자 그대로 묘사한 것으로 나타났다. [경험 많은 감독관]들은 초보자들보다 그들의 관찰을 해석하고 다양한 정보를 의미 있는 교실 수업 패턴으로 결합해 평가 판단을 내렸다. 전반적으로 [전문가]의 관찰은 학생과 학생 학습에 초점을 맞춘 반면, [비전문가]는 교육의 이산적discrete 측면에 더 초점을 맞췄다

Another robust finding in expertise studies is that, compared with non-experts, experts see things differently and see different things. In general, experts make more inferences on information, clustering sets of information into meaningful patterns and abstractions (Chi et al. 1981; Feltovich et al. 2006).

  • Studies on expert behavior in medicine, for instance, showthat experts have more coherent explanations for patient problems, make more inferences from the data and provide fewer literal interpretations of information (Van de Wiel et al. 2000).
  • Similar findings were described in a study on teacher supervision (Kerrins and Cushing 2000). Analysis of verbal protocols showed that inexperienced supervisors mostly provided literal descriptions of what they had seen on the videotape. More than novices, experienced supervisors interpreted their observations as well as made evaluative judgments, combining various information into meaningful patterns of classroomteaching. Overall, experts’ observations focused on students and student learning, whereas non-experts focused more on discrete aspects of teaching. 


연구 결과는 또한 [전문가]들은 [초보자들이 무시하는 단서와 정보에 주의]를 기울인다는 것을 보여준다. 예를 들어, 전문가들은 일반적으로 정보를 모니터하고 수집하는 동안 [맥락적 및 상황별 단서]에 더 많은 주의를 기울이는 반면, 초보자들은 [문제의 문자 그대로 교과서적인 측면]에 집중하는 경향이 있다. 실제로 의료 전문가에 의한 자동 처리는 맥락적 정보에 크게 의존하는 것으로 보인다(예: Hobus et al. 1987). 
Research findings also indicate that experts pay attention to cues and information that novices tend to ignore. For instance, experts typically pay more attention to contextual and situation-specific cues while monitoring and gathering information, whereas novices tend to focus on literal textbook aspects of a problem. In fact, automated processing by medical experts seems to heavily rely on contextual information (e.g. Hobus et al. 1987). 

마지막으로, 전문가들은 일반적으로 [자기 모니터링 능력이 더 우수(정확)]하고, 통제가 필요한 수행능력 측면에 대한 [인지적 통제력]이 더 뛰어납니다. 전문가들은 과제 수행 중에 인지 능력을 자기 모니터링에 쏟을 수 있을 뿐만 아니라, 더 풍부한 정신 모델을 통해 추론 오류를 더 잘 감지할 수 있습니다. 예를 들어, 펠토비치 외 연구진(1984)은 진단 작업에 대해 전문가 대 비전문가의 유연성flexibility을 조사했습니다. 그 결과 초보자일수록 경직되고 초기 가설에 집착하는 경향이 있는 반면, 전문가들은 초기 진단이 잘못되었음을 발견하고 그에 따라 추론을 조정할 수 있었다. 
Finally, experts generally have better (more accurate) self-monitoring skills and greater cognitive control over aspects of performance where control is needed. Not only are experts able to devote cognitive capacity to self-monitoring during task performance, their richer mental models also enable them to better detect errors in their reasoning. Feltovich et al. (1984), for instance, investigated flexibility of experts versus non-experts on diagnostic tasks. Results showed that novices were more rigid and tended to adhere to initial hypotheses, whereas experts were able to discover that the initial diagnosis was incorrect and adjust their reasoning accordingly. 

본 연구는 임상작업장 내 성과를 관찰하는 평가자의 판단 및 의사결정과 관련된 인지과정을 조사하는 것을 목적으로 한다. 
The present study aims to investigate cognitive processes related to judgment and decision making by raters observing performance in the clinical workplace. 


방법
Method


참여자 Participants

본 연구의 참가자는 일반 실습 레지던트 교육에 감독자-평가자로 적극적으로 참여한 GP-감독자였습니다. 네덜란드에서의 general practice training 은 훈련 프로그램 전반에 걸쳐 체계적인 직접 관찰과 평가의 오랜 전통을 가지고 있다. 
The participants in our study were GP-supervisors who were actively involved as supervisor-assessor in general practice residency training. General practice training in the Netherlands has a long tradition of systematic direct observation and assessment of trainee performance throughout the training program. 

본 연구에서는 [감독관-평가자로서 직무 관련 경험의 연수years]로 전문성 수준을 정의했습니다. 엘리트 등급 성과에 해당하는 공식적 수준이 없기 때문에 전문지식에 대한 상대적 접근법을 채택했습니다. 이 접근법은 초보자가 광범위한 직무 경험과 훈련을 통해 전문가로 발전한다고 가정한다(Chi 2006; Norman et al. 2006). 일반적으로 전문가 퍼포먼스를 달성하려면 [특정 분야에서 약 7년의 지속적인 경험]이 필요하다(예: 2006년 Arts 외). 
In our study, we defined the level of expertise as the number of years of task-relevant experience as a supervisor-rater. Since there is no formal equivalent of elite rater performance we adopted a relative approach to expertise. This approach assumes that novices develop into experts through extensive task experience and training (Chi 2006; Norman et al. 2006). In general, about 7 years of continuous experience in a particular domain is necessary to achieve expert performance (e.g. Arts et al. 2006). 

평정 대상 Rating stimuli

참가자들은 DVD 2장을 보았는데, 각각 의대 3학년 학생이 환자와 '실제'를 맞닥뜨리는 모습을 보여주었다. DVD는 환자 문제와 학생의 성과 모두에 대해 의도적으로 선택되었습니다. 두 DVD 모두 아토피 습진과 협심증이라는 일반적인 관습에서 흔히 볼 수 있는 '직설적인' 환자 문제를 제시했다. 
The participants watched two DVDs, each showing a final-year medical student in a ‘reallife’ encounter with a patient. The DVDs were selected purposefully with respect to both patient problems and students’ performance. Both DVDs presented ‘straightforward’ patient problems that are common in general practice: atopic eczema and angina pectoris. 

평정 양식 Rating forms

참가자들은 학생들의 성과를 평가하기 위해 두 가지 도구를 사용했다(그림 1, 2) 

  • 5점짜리 리커트 척도에서 학생 성과에 대한 1차원 전체 등급(1 = 불량 ~ 5 = 미결)(R1) 및
  • 6가지 임상 역량 목록(병력 청취, 신체 검사, 임상 추론 및 진단, 환자 관리, 환자와의 커뮤니케이션, 전문직업성)을 각각 5점 리커트 척도(1 = 불량 ~ 5 = 우수)(R2)로 평가해야 한다.

The participants used two instruments to rate student performance (Figs. 1, 2):

  • a one-dimensional, overall rating of student performance on a five-point Likert scale (1 = poor to 5 = outstanding) (R1), and
  • a list of six clinical competencies (history taking; physical examination; clinical reasoning and diagnosis; patient management; communication with the patient; and professionalism), each to be rated on a five-point Likert scale (1 = poor to 5 = outstanding) (R2).

등급 척도는 최대한의 특이적 인지 처리가 가능하도록 단순하게 유지되었다. 참가자들은 평가 도구에 익숙하지 않았고 사용법을 배우지 못했다. 
Rating scales were kept simple to allow for maximum idiosyncratic cognitive processing. The participants were not familiar with the rating instruments and had not been trained in their use. 



연구 절차 및 데이터 수집
Research procedure and data collection



인지적 퍼포먼스를 캡처하기 위해 구두 프로토콜 분석을 위한 표준 절차를 따랐다(Chi 1997).1 첫 DVD를 시작하기 전에 참가자들에게 절차에 대한 정보를 제공했고 일련의 구두 지시를 받았다. 평가자들은 특히 "큰 소리로 생각하라think aloud"고 요청받았고, 생각이 떠오르면 마치 방안에 혼자 있는 것처럼 모든 생각을 말로 표현하도록 했다. 참가자가 몇 초 이상 침묵을 지키면 연구 보조원이 계속하라고 일깨워줬다. 
We followed standard procedures for verbal protocol analysis to capture cognitive performance (Chi 1997).1 Before starting the first DVD, participants were informed about procedures and received a set of verbal instructions. Raters were specifically asked to ‘‘think aloud’’ and to verbalize all their thoughts as they emerged, as if they were alone in the room. If a participant were silent for more than a few seconds, the research assistant reminded him or her to continue. 

1 [언어 프로토콜verbal protocol]은 참가자들이 인지 작업 수행 중 또는 수행 직후에 자신의 생각과 행동에 대해 구두로 표현하는 것을 말합니다. 일반적으로, 참가자들은 "큰 소리로 생각"하고, 그 생각들을 설명하거나 분석하려고 하지 않고, 그들이 등장할 때 그들의 모든 생각들을 말로 표현하도록 요청 받는다. 구두 분석은 이러한 구두 표현의 내용에 대한 주관적 또는 질적 부호화를 정량화하기 위한 방법론이다(Chi 1997). Chi(1997)는 언어 데이터를 분석하는 특정 기법을 언어 프로토콜의 수집과 전사를 제외한 여러 단계로 구성한다고 설명한다. 이러한 단계는 본 연구에서 설명한 것처럼 아래와 같다.
- 프로토콜의 내용 정의;
- 프로토콜 분할;
- 부호화 계획의 개발;
- 데이터를 코드화하고 필요한 경우 코드화 방식을 세분화합니다.
- 해석의 모호성 해소
- 코딩 패턴 분석.

1 Verbal protocols refer to the collection of participants’ verbalizations of their thoughts and behaviors, during or immediately after performance of cognitive tasks. Typically, participants are asked to ‘‘think aloud’’ and to verbalize all their thoughts as they emerge, without trying to explain or analyze those thoughts (Ericsson and Simon 1993). Verbal analysis is a methodology for quantifying the subjective or qualitative coding of the contents of these verbal utterances (Chi 1997). Chi (1997) describes the specific technique for analyzing verbal data as consisting of several steps, excluding collection and transcription of verbal protocols. These steps, as followed in our research, are:
- defining the content of the protocols;
- segmentation of protocols;
- development of a coding scheme;
- coding the data and refining coding scheme if needed;
- resolving ambiguities of interpretation; and
- analysis of coding patterns. 

 

1. DVD가 시작됩니다. 참가자가 학생의 성적을 판단할 수 있을 때 신호를 보내고, DVD가 시작되는 시점부터 지금까지의 시간(T1)이 기록된다. T1은 문제 표현, 즉 연습생 수행의 초기 표현에 필요한 시간을 나타냅니다
1. DVD starts. The participant signals when he or she feels able to judge the student’s performance, and the time from the start of the DVD to this moment is recorded (T1). T1 represents the time needed for problem representation, i.e. initial representation of trainee performance. 

2. DVD가 T1에 정지되어 있습니다. 참가자는 연습생의 수행에 대한 첫 번째 판단(언어적 의전(VP) 1)을 구두로 표현합니다. 
2. The DVD is stopped at T1. The participant verbalizes his/her first judgment of the trainee’s performance (verbal protocol (VP) 1). 

3. 참가자는 1차원 등급 척도(R1T1)에서 전반적인 성능 등급을 제공하고, 등급 양식(VP2)을 작성하면서 큰 소리로 생각합니다. 
3. The participant provides an overall rating of performance on the one-dimensional rating scale (R1T1), thinking aloud while filling in the rating form (VP2). 

4. T1에서 DVD 보기를 다시 시작합니다. DVD가 종료되면(T2) 참가자는 자신의 판단(VP3)을 구두로 말하고 전체 등급(R1T2)을 제공합니다. 
4. Viewing of the DVD is resumed from T1. When the DVD ends (T2), the participant verbalizes his/her judgment (VP3) and provides an overall rating (R1T2). 

5. 참가자는 DVD(DVD 1 또는 DVD 2) 중 하나에 대한 다차원 등급 양식(R2)을 작성하고 자신의 생각을 구두로 표현합니다(VP4). 
5. The participant fills in the multidimensional rating form (R2) for one of the DVDs (alternately DVD 1 or DVD 2) and verbalizes his or her thoughts while doing so (VP4). 

데이터 분석
Data analysis


언어 프로토콜의 전사는 연구자 중 한 명(MG)에 의해 구문phrases으로 분할되었다. 세그먼트는 의미적 특징(구문과 같은 비내용 특징과는 반대로 내용 특징)에 기초하여 식별되었다. 각 부문은 하나의 생각, 아이디어 또는 진술을 나타내었습니다(몇 가지 예는 표 1 참조). 
The transcriptions of the verbal protocols were segmented into phrases by one of the researchers (MG). Segments were identified on the basis of semantic features (i.e. content features-as opposed to non content features such as syntax). Each segment represented a single thought, idea or statement (see Table 1 for some examples).

각 세그먼트는 정성 데이터 분석을 위한 소프트웨어(Atlas.ti 5.2)를 사용하여 코딩 범주에 할당되었습니다. '진술의 성격', '언어 프로토콜의 유형', '임상 프레젠테이션'(표 1)을 명시하기 위해 서로 다른 코딩 체계를 사용했다. '진술의 성격'에 대한 코딩 범주는 전문가 초보자 정보 처리의 초기 연구(Kerrins and Cushing 2000, Boshuizen 1989, Sabers et al. 1991)에 기초했으며 다음을 포함했다.

  • '기술',
  • '해석',
  • '평가',
  • '맥락적 단서'
  • '자기 모니터링'

Each segment was assigned to coding categories, using software for qualitative data analysis (Atlas.ti 5.2). Different coding schemes were used to specify ‘the nature of the statement’; ‘type of verbal protocol’ and ‘clinical presentation’ (Table 1). The coding categories for ‘nature of statement’ were based on earlier studies in expert-novice information processing (Kerrins and Cushing 2000; Boshuizen 1989; Sabers et al. 1991) and included

  • ‘description’,
  • ‘interpretation’,
  • ‘evaluation’,
  • ‘contextual cue’ and
  • ‘self-monitoring’.

반복되는 것도 마찬가지로 하였다.

Repetitions were coded as such. 

두 독립 검체의 비모수 비교에 대해 제안된 것처럼 ES = Z/HN 공식을 사용하여 효과 크기를 계산했다. 여기서 Z는 Mann-Whitney 통계량의 z 점수이고 N은 총 표본 크기이다(Field 2009, 페이지 550). 효과 크기가 각각 0.1, 0.3 및 0.5와 같으면 작은 효과, 중간 효과 및 큰 효과를 나타냅니다. 전체 등급(R1T1 대 R1T2)의 그룹 내 차이에 대해서는 Wilcoxon 부호 순위 검정이 적용되었습니다. 

We calculated effect sizes by using the formula ES = Z/HN as is suggested for non-parametric comparison of two independent samples, where Z is the z-score of the Mann–Whitney statistic and N is the total sample size (Field 2009, p. 550). Effect sizes equal to 0.1, 0.3, and 0.5, respectively, indicate a small, medium, and large effect. For within-group differences of overall ratings (R1T1 versus R1T2) the Wilcoxon signed rank test was applied. 

결과
Results


표 2는 문제 발생 시간 표시(T1)에 대한 결과와 각 DVD의 전반적인 성능 등급을 보여줍니다. T1까지의 시간은 프로토타입 동작(DVD 1)을 관찰할 때 경험이 풍부한 평가자와 경험이 없는 평가자의 경우와 유사했다.

Table 2 shows the results for the time to problem representation (T1) and the overall performance ratings for each DVD. Time to T1 was similar for experienced and nonexperienced raters when observing prototypical behavior (DVD 1). 

그러나 DVD 2에서 보다 [복잡한 행동 패턴]을 관찰할 때, 

  • [경험 있는 평가자]들은 정보 모니터링 및 수집에 유의하게 시간이 더 오래 걸렸지만, 
  • [경험이 부족한 평가자]들은 시간 증가가 거의 없었다. (U = 79.00, p = 0.03, ES = 0.38) 

However, when observing the more complex behavioral pattern in DVD 2, experienced raters took significantly longer time for monitoring and gathering of information, whereas there was only minimal increase in time for non-experts (U = 79.00,p= .03, ES = 0.38). 



표 2는 등급 점수에서 두 그룹 간의 유의하지 않은 차이를 보여줍니다. 그러나 Wilcoxon 서명한 순위 검정은 T1과 T2에서 등급 점수 간에 그룹 내 상당한 차이를 보였다. 
Table 2 shows non-significant differences between the two groups in the rating scores. A Wilcoxon signed ranks test, however, showed significant within-group differences between the rating scores at T1 and T2. 

표 3은 언어 프로토콜별 및 모든 프로토콜(= 전체, VP1 ? VP2 ? VP3 ? VP4)에 대한 각 그룹의 문장 특성에 대한 백분율(분위간, 사분위간 범위)을 보여줍니다. 
Table 3 presents the percentages (median, inter-quartile range) for the nature of the statements for each group, by verbal protocol and across all protocols (= overall, VP1 ? VP2 ? VP3 ? VP4). 




고찰
Discussion


연습생의 초기 성과에 도달하는 데 걸린 시간의 차이에 대해, 그 결과는 우리의 가설을 부분적으로 확인시켜줍니다. 전형적 행동을 보이는 사례에서 [전문가 평가자]가 [비전문가 평가자]만큼 많은 시간을 소요한 것은 우리의 예상과 어긋나지만, [복잡한 수련생 행동]의 사례에서는 전문가가 비전문가보다 훨씬 많은 시간을 할애하였고, 우리의 기대는 확인되었습니다. 이 연구 결과는 전문 연구에 대한 다른 연구 결과와 일치합니다(Ericson 및 Lehmann 1996).

  • 경험이 없는 평가자들은 관찰된 행동의 복잡성에 관계없이 올바른 솔루션(예: 판단 또는 성과 점수)을 제공하는 데 초점을 맞추는 반면,
  • 전문가 평가자들은 복잡한 훈련생 성과에 대한 의사결정에 도달하기 전에 정보를 모니터링하고 수집하고 분석하는 데 더 많은 시간이 걸린다. 

As for the differences in the time taken to arrive at the initial representation of trainee performance, the results partially confirm our hypothesis. It is contrary to our expectations that the expert raters took as much time as the non-expert raters with the case presenting prototypical behavior, but our expectations are confirmed for the case with complex trainee behavior, with the experts taking significantly more time than the non-experts. This finding is consistent with other findings on expertise research (Ericsson and Lehmann 1996).

  • Whereas non-experienced raters seem to focus on providing a correct solution (i.e. judgments or performance scores) irrespective of the complexity of the observed behavior,
  • expert raters take more time to monitor, gather and analyze the information before arriving at a decision on complex trainee performance. 


[전형적prototypical 행동]에 대해서 (전문가와 비전문가 사이에) 유의하지 않은 결과는 본 연구의 등급 자극rating stimulus으로 설명할 수 있습니다. 피부과 사례는 너무 짧았을 수 있고, 전형적인 학생 행동이 연속적으로 이뤄졌기에, 차이를 끌어내기에는 너무 시간이 짧았을quick 수 있다. 더욱이 DVD1에서는 명백한 기준 미달의 수행능력을 보였기에, 두 집단 모두에서 자동 정보처리 및 패턴 인식을 유도했을 수 있다(Eva 2004).   
Our non-significant results with respect to prototypical behavior may be explained by the rating stimulus in our study. The dermatology case may have been too short, and the succession of typical student behaviors too quick to elicit differences. Moreover, the clearly substandard performance in the stimulus may have elicited automatic information processing and pattern recognition in both groups (Eva 2004).

그러나 심장내과 사례에 대한 우리의 결과는, [더 복잡한 행동]에 대해서, [경험 있는 평가자]들이 초기 정보에 대한 해석과 관련하여 [경험이 없는 평가자]들과 다른 것으로 보인다는 것을 확인시켜 준다. 경험 있는 평가자들은 추가 정보를 검색하고 훈련생 행동에 대해서 더 긴 시간 모니터링을 한다.
Our results for the cardiology case, however, confirm that, with more complex behaviors, experienced raters seem to differ from non-experienced raters with respect to their interpretation of initial information -causing themto search for additional information and prolonged monitoring of trainee behavior. 

구두 프로토콜의 경우, 전체적인 결과는 성과를 관찰하고 판단하면서 정보 처리에서 전문가와 비전문가 사이의 차이로 생각했던 가설을 확인하여주었다. 경험이 없는 평가자와 비교했을 때, 경험 있는 평가자는 [학생 행동의 정보에 대한 추론과 해석]을 더 많이 생성한 반면, 경험이 없는 평가자는 [관찰된 행동에 대한 더 문자 그대로의 설명]을 제공했다. 이러한 발견은

  • [경험이 없는 평가자]는 수행능력의 구체적이고 이산적인 측면에 더 많은 관심을 기울이는 반면,
  • [경험이 많은 평가자]는 다양한 정보를 취합하여 통합된 청크와 의미 있는 정보 패턴을 생성한다는 것을 시사합니다.

As for the verbal protocols, the overall results appear to confirm the hypothesized differences between expert and non-expert raters in information processing while observing and judging performance. Compared to non-experienced raters, experienced raters generated more inferences on information and interpretations of student behaviors, whereas non-experienced raters provided more literal descriptions of the observed behavior.

  • These findings suggest that non-experienced raters pay more attention to specific and discrete aspects of performance,
  • whereas experienced raters compile different pieces of information to create integrated chunks and meaningful patterns of information. 

우리의 결과는 또한 전문가 평가자들이 [맥락적 및 상황-특이적 단서를 분석하고 평가할 수 있는 탁월한 능력]을 가지고 있음을 시사한다. 본 연구의 평가자들은 [맥락적 정보]에 더 많은 관심을 기울이고, (최소한 성과 판단을 말로 설명한 것에서는) [더 넓은 관점]을 취하는 것으로 보였습니다. [관련 배경 정보]와 [관찰된 행동]을 [종합적 수행능력 평가에 통합]합니다. 전문가와 비전문가 간의 차이는 정보 수집 및 성능 평가(VP1)의 초기 단계에서 가장 두드러졌다. 환자 만남의 설정, 환자 특성 및 평가 과제의 맥락은 모두 전문가의 초기 판단에 고려되는 것으로 보인다. 

Our results also suggest that expert raters have superior abilities to analyze and evaluate contextual and situation-specific cues. The raters in our study appeared to pay more attention to contextual information and to take a broader view, at least in their verbalizations of performance judgments. They integrate relevant background information and observed behaviors into comprehensive performance assessments. The differences between experts and non-experts were most marked at the initial stage of information gathering and assessment of performance (VP1). The setting of the patient encounter, patient characteristics and the context of the assessment task all seem to be taken into account in the experts’ initial judgments. 

우리의 연구 결과는 전문성 개발의 다른 많은 연구와 일치하며, 이는 초보자들에 비해 전문가들이 [맥락적 정보가 풍부한 더 정교하고, 잘 구조화된 정신 모델]을 가지고 있다는 것을 일관되게 보여준다. 
Our findings are in line with many other studies in expertise development, which consistently demonstrate that compared with novices, experts have more elaborate and well-structured mental models, replete with contextual information. 

연구 결과는 그룹 내(전문가-비전문가)에서, 전체 DVD(T2)를 본 후 T1에서의 초기 등급이 등급과 크게 다르다는 것을 보여주었다. 따라서 전문가 평가자와 비전문가 평가자 모두 지속적으로 추가 정보를 모색하고 활용하며, 훈련생 수행능력을 관찰하면서 [판단을 재조정하고 있음]을 알 수 있습니다. 또한, 이러한 발견은 [짧은 관찰 후 판단한 평정 점수가 전체 성과를 정확하게 반영하지 못할 수 있다]는 가능성을 지적합니다. 이는 WBA에서 최소한의 관측 시간과 성과 표본 추출에 대한 지침의 결과를 초래할 수 있다. 우리의 결과는 전문가와 비전문가 간의 평가 점수에서 큰 차이를 드러내지 않았다. 
The results of our study showed that, within groups, the initial ratings at T1 differed significantly from the ratings after viewing the entire DVD (T2). Thus our findings suggest that both expert and non-expert raters continuously seek and use additional information, readjusting judgments while observing trainee performance. Moreover, this finding points to the possibility that rating scores, provided after brief observation, may not accurately reflect overall performance. This could have consequences for guidelines for minimal observation time and sampling of performance in WBA. Our results did not reveal significant differences in rating scores between experts and non-experts. 

가능한 설명은, 지금까지의 general practice 에서의 훈련과 경험의 결과로, 두 그룹 모두 무엇이 general practice 에서 [기준 미달 대 허용 성과]를 구성하는지에 대한 공통의 개념을 가질 수 있다는 것이다. 공유된 frame of reference로서 평정 척도가 수행능력 점수에서 과도한 variation이 나타나는 것을 막았을 수 있으며, 표본 크기가 작은 것이 두 그룹에서 동등한 평정의 원인이 되었을 수도 있다.
Possible explanations are that, as a result of previous training and experience in general practice, both groups may have common notions of what constitutes substandard versus acceptable performance in general practice. Shared frames of reference, a rating scale that precludes large variations in performance scores and the small sample size may have caused the equivalent ratings in both groups. 

우리의 예상과 달리, 본 연구의 전문가들은 성과를 평가하는 동안 더 많은 자기 모니터링 행동을 보이지 않는 것 같습니다. 참가자들에게 [타인에 대한 판단을 하면서 큰 소리로 생각하도록 한 우리의 실험 환경]이 더 많은 self-explanation을 유도했다는 것으로 이 결과를 설명할 수 있다. 평가 척도를 작성하면서 생각을 구두화하고 성과 점수를 제공하는 작업은, 경험이 풍부한 평가자와 경험이 없는 평가자 모두 (그렇게 지시받지 않았음에도 불구하고), 평가 과제에 책무성accountability의 측면을 갖게 함으로써, 자신의 행동을 설명하고 정당화해야 한다고 느끼게 만들었을 수 있다. 이러한 자기 설명과 성과 등급의 정당성은 그룹 간 등급 점수에 유의한 차이가 없음을 설명할 수도 있다. 
Contrary to our expectations, the experts in our study do not appear to demonstrate more self-monitoring behavior while assessing performance. An explanation might be that our experimental setting, in which participants were asked to think aloud while providing judgments about others, induced more self-explanations. The task of verbalizing thoughts while filling out a rating scale and providing a performance score may have introduced an aspect of accountability into the rating task, with both experienced and non-experienced raters feeling compelled to explain and justify their actions despite being instructed otherwise. These self-explanations and justifications of performance ratings may also explain the absence of any significant differences in rating scores between the groups. 

몇몇 연구는 설명을 통해 피험자의 성과를 향상시킨다는 것을 보여주었다(예: Chi et al. 1994). 따라서 소리 내어 생각하는 절차는 두 그룹 모두에서 상당히 정확한 평가 점수를 산출했을 수 있습니다. 이러한 설명은 구두화의 효과에 대한 여러 평가자들의 논평으로 입증된다[예: "내가 큰 소리로 생각하지 않았다면 나는 3점을 주었을 것이다." 그러나 만약 내가 전에 말했던 것을 재고한다면, 나는 2점을 주고 싶다." 
Several studies have shown that explaining improves subjects’ performance (e.g. Chi et al. 1994). The think aloud procedure may therefore have resulted in fairly accurate rating scores in both groups. This explanation is substantiated by the comments of several raters on effects of verbalization [e.g. ‘‘If I had not been forced to think aloud, I would have given a 3 (satisfactory), but if I now reconsider what I said before, I want to give a 2 (borderline)’’]. 


우리의 연구 결과는 무엇을 의미하며 WBA에 어떤 영향을 미칩니까?
What do our findings mean and what are the implications for WBA?


이러한 전문가와 초보자의 차이는 평가 과정에서 교육생에게 주어진 피드백에 영향을 미칠 수 있습니다.
Such expert-novice differences may impact the feedback that is given to trainees in the assessment process.

첫째, [경험 많은 평가자]들에 의한 보다 [풍부한 처리와 상황별 단서의 통합]은, 다양한 이슈에 초점을 맞춘 교육생들에게 질적으로 다른, 보다 전체적인 피드백holistic feedback을 제공할 수 있습니다. 전문가 평가자들은 평가 과제의 맥락에서 연습생의 행동을 해석하고 성과에 대한 다양한 측면을 통합하는 등 더 넓은 시각을 가지고 있는 것으로 보인다. 이를 통해 환자와의 만남에서 일어나는 일에 의미를 부여할 수 있습니다. 반면에 경험이 없는 평가자는 개별적인 '체크리스트' 측면의 성과에 더 초점을 맞출 수 있다. 케린스와 쿠싱(2000년)은 교사 감독 연구를 통해 비슷한 연구 결과를 보고했다. 
Firstly, more enriched processing and better incorporation of contextual cues by experienced raters can result in qualitatively different, more holistic feedback to trainees, focusing on a variety of issues. Expert raters seem to take a broader view, interpreting trainee behavior in the context of the assessment task and integrating different aspects of performance. This enables them to give meaning to what is happening in the patient encounter. Non-experienced raters on the other hand may focus more on discrete ‘checklist’ aspects of performance. Similar findings have been reported by Kerrins and Cushing (2000) in their study on supervision of teachers. 

둘째, 보다 정교한 수행능력 스크립트performance scripts 덕분에, 전문가 평가자는 성능을 관찰하고 판단할 때, (특히 시간 제약 및 상충적 책임의 역할을 수행할 때), 하향식top-down 정보 처리 또는 패턴 인식에 더 자주 의존할 수 있습니다. 결과적으로, 전문가 판단은 행동 세부사항을 무시하고, [성과에 대한 일반적이고 전체적인 인상]에 의해 추진driven될 수 있다(Murphy and Balzer 1986; Livens 2001). 반면 경험이 없는 평가자들은 행동 수준에서 더 정확할 수 있다.

  • 그러나 다른 영역의 연구는 정상normal 조건에서 정보를 청크할 가능성이 높음에도 불구하고, 전문가들은 추론과 의사결정에 기초하는 '기본basic' 지식을 사용하고 기억하는 능력을 잃지 않는다는 것을 보여주었다(Schmidt와 Boshuizen 1993).
  • 또한, 연구 결과에 따르면 전문가들에게 [사건을 의도적으로 정교하게 처리하도록 요청했을 때] 관련 데이터의 우수한 리콜을 입증한다(Norman et al. 1989; Wimmers et al. 2005).
  • 이와 유사하게, [정보를 정교하고 의도적으로 처리할 의무]가 있는 경우, 경험 있는 평가자는 특정한 행동과 성과 측면을 상기하는 데 있어 경험이 없는 평가자 못지 않을 수 있다.

Secondly, thanks to more elaborate performance scripts, expert raters may rely more often on top-down information processing or pattern recognition when observing and judging performance -especially when time constraints and/or competing responsibilities play a role. As a consequence, expert judgments may be driven by general, holistic impressions of performance neglecting behavioral detail (Murphy and Balzer 1986; Lievens 2001), whereas non-experienced raters may be more accurate at the behavioral level.

  • However, research in other domains has shown that, despite being likely to chunk information under normal conditions, experts do not lose their ability to use and recall ‘basic’ knowledge underlying reasoning and decision making (Schmidt and Boshuizen 1993).
  • Moreover, research findings indicate that experts demonstrate excellent recall of relevant data when asked to process a case deliberately and elaborately (Norman et al. 1989; Wimmers et al. 2005).
  • Similarly, when obliged to process information elaborately and deliberately, experienced raters may be as good as non-experienced raters in their recall of specific behaviors and aspects of performance.

따라서 [WBA의 최적화]를 위해서는 평가자에게 [자신의 판단을 상세히 설명]하고, [관찰한 행동에서 구체적, 특이적 예시를 사용]하여, 자신의 평정을 입증substantiate할 수 있는 [평가 절차와 형식]이 필요할 수 있다. 
Optimization of WBA may therefore require rating procedures and formats that force raters to elaborate on their judgments and substantiate their ratings with concrete and specific examples of observed behaviors. 

마지막으로, 우리의 연구 결과는 초보 평가자뿐만 아니라 경험이 풍부한 평가자에게도 평가 훈련에 영향을 미칠 수 있습니다. 확실히, 공식적인 훈련이 어떤 것을 달성할 수 있는지는 한계가 있고, 실제 경험을 통해 전문성이 발전하는 것 같아 보입니다. 개인 경험, 신념, 태도의 결과로서 독창적인 수행능력 스키마performance schemata가 개발되기 마련이다. 그러나 [공유된 정신 모델]을 개발하고, 진정한 전문가가 되기 위해서는, [정기적인 피드백][서로 다른(ill-defined) 맥락에서 (복잡한) 수행능력을 판단할 때 사용한 전략에 대한 지속적 성찰]을 동반한 [의도적 연습]이 필요하다.
Finally, our findings may have consequences for rater training, not only for novice raters, but for more experienced raters as well. Clearly, there is a limit to what formal training can achieve and rater expertise seems to develop through real world experience. Idiosyncratic performance schemata are bound to develop as a result of personal experiences, beliefs and attitudes. Development of shared mental models and becoming a true expert, however, may require deliberate practice with regular feedback and continuous reflection on strategies used in judging (complex) performance in different (ill-defined) contexts (Ericsson 2004). 

WBA 최적화를 위한 조치를 고안할 때, 일반적으로 정신분석 평가 체계에서 가정하는 바와 같이, [평가자는 서로 교환할 수 있는 측정 수단이 아니라는 점]을 우선적으로 고려해야 한다. 실제로 수행능력 평가에 대한 인지접근법의 기본적 특징은 [평가자의 정보처리]가 [수행능력과 수행능력평가의 '정신적 모델']에 의해 안내guided된다는 것이다. 우리의 연구는 평가자의 판단과 의사결정 과정이 업무 경험으로 인해 시간에 따라 변화한다는 것을 보여줍니다.
In devising measures to optimize WBA we should first and foremost take into account that raters are not interchangeable measurement instruments, as is generally assumed in the psychometric assessment framework. In fact, a built-in characteristic of cognitive approaches to performance assessment is that raters’ information processing is guided by their ‘mental models’ of performance and performance assessment. Our study shows that raters’ judgment and decision making processes change over time due to task experience, 

 


Adv Health Sci Educ Theory Pract. 2011 May;16(2):151-65.

 doi: 10.1007/s10459-010-9250-7. Epub 2010 Sep 30.

Workplace-based assessment: effects of rater expertise

M J B Govaerts 1L W T SchuwirthC P M Van der VleutenA M M Muijtjens

Affiliations collapse

Affiliation

  • 1FHML, Department of Educational Research and Development, Maastricht University, The Netherlands. marjan.govaerts@maastrichtuniversity.nl

Free PMC article

Abstract

Traditional psychometric approaches towards assessment tend to focus exclusively on quantitative properties of assessment outcomes. This may limit more meaningful educational approaches towards workplace-based assessment (WBA). Cognition-based models of WBA argue that assessment outcomes are determined by cognitive processes by raters which are very similar to reasoning, judgment and decision making in professional domains such as medicine. The present study explores cognitive processes that underlie judgment and decision making by raters when observing performance in the clinical workplace. It specifically focuses on how differences in rating experience influence information processing by raters. Verbal protocol analysis was used to investigate how experienced and non-experienced raters select and use observational data to arrive at judgments and decisions about trainees' performance in the clinical workplace. Differences between experienced and non-experienced raters were assessed with respect to time spent on information analysis and representation of trainee performance; performance scores; and information processing--using qualitative-based quantitative analysis of verbal data. Results showed expert-novice differences in time needed for representation of trainee performance, depending on complexity of the rating task. Experts paid more attention to situation-specific cues in the assessment context and they generated (significantly) more interpretations and fewer literal descriptions of observed behaviors. There were no significant differences in rating scores. Overall, our findings seemed to be consistent with other findings on expertise research, supporting theories underlying cognition-based models of assessment in the clinical workplace. Implications for WBA are discussed.

 

USMLE Step 2 CS 시험의 중단: 과거로부터 배워서 미래를 정의하기(Acad Med, 2021)
Discontinuation of the USMLE Step 2 Clinical Skills Examination: Studying the Past to Define the Future
Lisa D. Howley, PhD, and Deborah L. Engle, EdD, MS

2021년 1월 26일주 의료 위원회(FSMB)와 국가 의료 검사 위원회(National Board of Medical Examiners, NBME)는 미국 의료 면허 시험(USMLE) 2단계 임상 기술(CS)을 중단할 것이라고 발표했습니다.1 이 결정은 미국에서 임상 기술을 평가하는 데 있어 중요한 이정표를 세웠고 의대생, 교육자, 연구자 및 기타 사람들에게 역사적으로나 실질적인 중요성을 지닌 결정이었다. 면허시험에서 수행능력 시험을 중단하기로 한 결정에도 논란이 없는 것은 아니었으며, 이러한 사안에 대한 상세한 탐구는 이 논평의 범위를 벗어나지만, 이 중대한 결정의 역사적 맥락은 더 면밀히 살펴볼 필요가 있다고 본다. 결국 공자는 우리에게 "미래를 정의하고 싶다면, 과거를 공부하라"는 것을 일깨워주고, 역사의 몇 가지 핵심 교훈은 이 새로운 임상 성과 평가 시대에 앞으로 나아가는 우리의 길을 더 잘 알려줄 수 있을 것이다.
On January 26, 2021, the Federation of State Medical Boards (FSMB) and the National Board of Medical Examiners (NBME) announced the United States Medical Licensing Exam (USMLE) Step 2 Clinical Skills (CS) would be discontinued.1 This decision marked a significant milestone in the assessment of clinical skills in the United States and one that has historical as well as practical significance for medical students, educators, researchers, and others. The decision to suspend the licensing performance examination was not without controversy, and although a detailed exploration of these issues is beyond the scope of this commentary, we believe the historical context of this significant decision warrants a closer look. After all, Confucius reminds us to “study the past, if you would define the future,” and several key lessons from history may better inform our path forward in this new era of clinical performance assessment.


USMLE에는 3단계로 이뤄져있고, 최근까지 의사 면허를 얻기까지는 4가지 시험을 통과해야 했다. 이 시험들은 "건강과 질병에 중요하고 안전하고 효과적인 환자 진료의 기초를 이루는 지식, 개념 및 원칙을 적용하고 환자 중심의 기본적인 기술을 보여줄 수 있는 의사 역량 평가"를 목적으로 한다. 면허 취득을 위한 각 단계는 의사 교육에서 개발적으로 적절한 시기에 완료되며, 일반적으로 2단계(CK와 CS로 구성)는 의과대학 교육 3학년이 끝날 때 완료됩니다. 수십 년 동안 임상 성과 평가에 깊이 관여해온 의료 교육자로서, 우리는 포괄적이고 공정하며 학생 중심적이며 환자 중심의 임상 성과 평가를 위한 새로운 시대와 경로를 고려할 때 몇 가지 역사적 이정표와 교훈을 공유합니다.

The USMLE includes 3 steps and, until recently, 4 examinations toward medical licensure. It is intended to assess a physician's ability to “apply knowledge, concepts, and principles, and to demonstrate fundamental patient-centered skills, that are important in health and disease and that constitute the basis of safe and effective patient care.”2 Each Step toward licensure is completed at a developmentally appropriate time in a physician’s training, and Step 2—parts CK (Clinical Knowledge) and the former CS—is typically completed at the end of the third year of medical school training. As medical educators who have been deeply engaged in clinical performance assessment for decades, we share several historic milestones and lessons as we consider a new era and the path forward for comprehensive, equitable, student-focused, and patient-centered clinical performance assessment.

 

1960년대 ~ 1970년대: 기원시대
1960s
1970s: Era of Origination

현대의 수행 평가는 1963년 서던 캘리포니아 대학의 신경과 의사이자 교육자인 하워드 바로우 박사가 병상에서 직원들에게 임상 기술을 가르치면서 고군분투했던 때로 거슬러 올라간다. 이를 해결하기 위해 그는 환자처럼 행동하고 수많은 신체적 징후와 증상, 영향을 제시하는 사람을 모집하고 훈련시켰으며, 의대생들은 개별적으로 이 '프로그램된' 환자에 대한 이력 및 신체검사를 실시했다. 결국 표준화된 환자(SP)라고 불리는 것이 탄생했다. Barrows 박사는 "그렇지 않았다면 결코 찾을 수 없었을 학생들에 대한 것들을 배우고 있었다"고 학생들과 함께 SP를 사용한 경험에 대해 평했다. 처음에는 조롱과 웃음거리가 되었던 이 선구적인 작품(SP)은 북미 전역에 임상기술 교수와 평가의 새로운 시대를 열었고, 인간 시뮬레이션을 바탕으로 한 더 많은 포맷의 기반을 닦았다. SP 혁신은 유연성, 표준화, 안전성 등의 이점을 갖춘 의학 교육에서 가장 보편적인 교육 방법론 중 하나로 성장할 것입니다.

The modern-day performance assessment dates back to 1963 when Dr. Howard Barrows, a neurologist and educator at the University of Southern California, struggled while teaching his clerks clinical skills at the bedside. To solve this challenge, he recruited and trained a person to act like a patient and present numerous physical signs, symptoms, and affect while his medical students individually conducted a history and physical examination of this “programmed” patient. What would eventually be termed the standardized patient (SP) was born. “[I was] learning things about those students I would have never found otherwise,” Dr. Barrows commented about his experiences using SPs with students.3 This pioneering work, which was originally met with ridicule and laughter, launched a new era of clinical skills teaching and assessment across North America and paved the way for more formats based on human simulation. The SP innovation would grow to become one of the most pervasive teaching methodologies in medical education with benefits including flexibility, standardization, and safety.

1980~1990년대: 심리측정의 시대
1980s
1990s: Era of Psychometrics

그 후 20년 동안 [교육 프로그램을 지원하기 위해 개발되고 있는 SP 프로그램의 수가 증가하면서] [의과대학 전반의 임상기술 수행평가]에서 적응과 발전이 이뤄졌다. 관적 구조화 임상시험, 임상능력 평가 등을 포함한 형성적, 총괄적 성과 평가의 다양한 모델이 개발되었습니다. 이러한 시기적절한 검사는 의대생이 여러 SP와 상호 작용하면서 교수진 및 종종 훈련된 SP 자신으로부터 병력 청취, 신체 검사, 환자 교육, 커뮤니케이션, 임상 추론 등 다양한 임상 기술을 수행할 수 있는 능력에 대해 상세한 구술 및 서면 피드백을 받아야 했습니다.
The 2 decades that followed resulted in adaptations and advances in the performance assessment of clinical skills across medical schools with a growing number of SP programs being developed to support the educational program. Various models of formative and summative performance assessment were developed, including objective structured clinical exams, clinical skills assessments, and more. These timed examinations required medical students to interact with multiple SPs while receiving detailed oral and written feedback from faculty, and often the trained SPs themselves, on their ability to perform a variety of clinical skills, such as history taking, physical examination, patient education, communication, and clinical reasoning.

1980년대 후반, Josiah Macy Jr 재단의 지원과 AAMC의 승인을 받아, ECFMG(Educational Commission for Foreign Medical Greaders)와 NBME Southern Illinois University School of Medical School은 미국 전역의 의과대학에서 SP 기반 검사의 채택을 촉진하기 위한 [공동 보급 프로젝트]를 수행했다
1992년 AAMC는 임상기술 교수 및 평가에서 [표준화 환자 활용에 관한 컨센서스 컨퍼런스]를 개최하였고, [SP 기반 교수 및 평가]를 진전시키기 위해 AAMC의 교육 문제에 관한 동호단체affinity group의 특별 이익 집단special interest group을 구성하였다 (나중에 국제 표준화 환자 교육자 협회(International Association of Standardized Patient Educators)가 됨). 이러한 복잡한 표준 평가 방법의 심리학적 특성은 교육 연구자들의 중심 초점이 되었다. 1980년에서 2000년 사이에 13,000개 이상의 출판물을 만들어냈으며, 1990년대에는 Lisa D. Howley 의 박사 논문을 포함하여 87%가 출판되었다.

In the late 1980s, with the support of the Josiah Macy Jr. Foundation and endorsement by the AAMC, the Educational Commission on Foreign Medical Graduates (ECFMG), and the NBME, Southern Illinois University School of Medicine undertook a collaborative dissemination project to stimulate the adoption of SP-based examinations across medical schools throughout the United States. In 1992, the AAMC hosted the Consensus Conference on the Use of Standardized Patients in the Teaching and Evaluation of Clinical Skills, and a special interest group of the AAMC’s affinity group on educational affairs was formed to advance SP-based teaching and assessment (later becoming the independent international Association of Standardized Patient Educators). The psychometric properties of these complex standard assessment methods became a central focus of educational researchers and resulted in over 13,000 publications between 1980 and 2000, with 87% of those in the 1990s, including L.D.H.’s doctoral dissertation.5


이 기간 [국제연수 의과대학 졸업생의 미국 레지던트과정이나 펠로우십 프로그램 진학 준비성 평가]를 담당했던 ECFMG는 국제졸업생의 임상능력을 효과적으로 평가하기 위해 고군분투했다. 1998년, 성과 평가를 위한 SP의 사용에 대한 많은 교훈과 상당한 연구를 바탕으로, ECFMG는 영어로 환자 및 보건 전문가와 대화할 수 있는 졸업생의 능력을 평가하기 위한 [대규모 임상 기술 평가]를 성공적으로 시작했습니다. 업계 최초의 국가 임상 성과 검사가 수립되었다.

During this time, the ECFMG, which was responsible for assessing the readiness of internationally trained medical graduates to enter U.S. residency or fellowship programs, struggled to effectively assess the clinical skills of international graduates. In 1998, building from the many lessons and considerable research on the use of SPs for performance assessment, the ECFMG successfully launched a large-scale clinical skills assessment, intended to assess a graduate’s ability to communicate with patients and health professionals in English. The first national clinical performance examination in the profession was established.

2000년대 초반: 라이선스 시대
Early 2000s: Era of Licensure

[(그 당시까지의) [의사면허시험]은 모두 단일 형식의 객관식 문항으로 지식만을 테스트]하는 반면, [국제 졸업생(IMG)들은 미국 국내 졸업생들보다 광범위한 임상 성과 평가를 통과해야 한다]는 우려 때문에 FSMB와 NBME는 2004년에 USMLE 2단계 CS 시험을 테스트하고 시행했습니다. 이 새로운 자격증 시험은 학생들의 병력청취, 신체진찰수행, 결과 전달 능력을 평가했습니다. ECFMG 임상 기술 평가는 새로운 USMLE 2단계로 대체되었으며, 처음으로 [국제 졸업생]과 [미국에서 훈련된 의대생]이 모두 임상 기술 성과 평가를 완료하게 되었다. 
Due in part to concerns that all medical licensing examinations tested knowledge with a single format of multiple-choice questions and that international graduates were required to pass a broader assessment of clinical performance than U.S. graduates, the FSMB and the NBME tested and launched the USMLE Step 2 CS exam in 2004. This new licensing exam assessed students’ abilities to take a history, perform a physical exam, and communicate findings. The ECFMG clinical skills assessment was replaced by the new USMLE Step 2, and for the first time, all international graduates and U.S.-trained medical students would complete a clinical skills performance assessment.

현대 2단계 CS 시험은 이력 기록, 신체 검사, 기록 환자 메모의 3가지 요소로 구성되었습니다. 각 검사자는 12명의 표준화된 환자를 접하게 되었고, 각 환자의 기록을 15분 동안 기록하고, 필요한 경우 집중적인 신체 검사를 수행해야 했습니다. 각각의 encounter 후에 응시자들은 10분 동안 추가로 자신의 발견 내용과 계획에 대한 환자 메모를 작성하게 되었습니다.6

The modern Step 2 CS exam consisted of 3 components: history taking, physical examination, and a written patient note. Each examinee was required to encounter 12 standardized patients and had 15 minutes to take each patient’s history and, if relevant, perform a focused physical exam. Following each encounter, the examinees had 10 additional minutes to write a patient note about their findings and plan.6


미국에서 의사면허시험에 이와같은 평가 모델의 확대과정이 논란이 없이 나온 것이 아니다.

  • 12시간 동안 진행된 2단계 CS 검사는 미국 내 6개 테스트 센터 중 1곳에서 완료해야 했으며 의대생들이 완료하는 데 (시험을 보기 위한 이동 및 숙박 비용 외에도) 약 1,500달러가 소요되었습니다. 이는 다른 USMLE 자격증 시험보다 약 60% 더 높은 수치였습니다.
  • 합격-불합격 검사는 약 95%의 높은 합격률을 기록했으며 학생들에게 임상 기술에 대한 구체적인 성과 피드백을 제공하지 않았습니다.
  • 또한 사이트 전반에서 표준화의 필요성이 증가하고 SP 평가자에 대한 의존도가 높아짐에 따라 임상 encounter가 체크리스트와 환자 노트를 통해 문서화된 개별 관찰 가능한 행동으로 축소되었다.
  • 검사에 포함된 만남 또는 스테이션은 [단일 환자]의 [초기 방문]으로 제한되었고 임상 결정에 informing하는 다양한 자원에 대한 접근은 제한되었다.

 

This expanded assessment model for medical licensure in the United States did not come without controversy.

  • The 12-hour Step 2 CS examination had to be completed at 1 of 6 testing centers in the United States and cost medical students approximately $1500 to complete (in addition to the expenses associated with travel and time away from their training program), which was approximately 60% higher than the other USMLE licensing exams.
  • The pass–fail examination had a high pass rate of approximately 95% and did not provide specific performance feedback to students about their clinical skills.
  • In addition, due to the increased need for standardization across sites and its reliance on SP raters, the clinical encounter was reduced to discrete observable behaviors documented via a checklist and a patient note.
  • The encounters or stations included in the examination were limited to initial visits with single patients, and access to resources for informing clinical decisions was limited.

 

이에 대응하여, 임상 능력 평가를 위한 새로운 모델을 설계하고 연구하던 많은 지역 SP 프로그램들은 2단계 CS 모델에 보다 긴밀하게 맞추기 위해 접근 방식을 변경하였습니다.

In response, many local SP programs that had been designing and researching new models for clinical skills assessment changed their approach to more closely align with the Step 2 CS model.


이 새로운 자격증 시험은 또한 [지역local SP 기반 임상 성과 평가]의 개발을 증가시켰으며, 이는 부분적으로 2단계 CS를 위한 학생들을 준비시키기 위한 것이었다. 이러한 [지역적 방법]들은 그것들을 개발한 학교의 더 큰 평가 시스템의 일부가 되었다. 비록 이 짧은 논평의 범위를 벗어나지만, 교육 프로그램의 설계, 구현 및 평가와 학습자의 평가에 대한 결과 기반 접근 방식인 역량 기반 의료 교육(CBME)을 향한 광범위한 움직임도 언급하지 않을 수 없다. 의과대학은 CBME 접근방식을 채택하기 시작하면서 평가 시스템을 더욱 빈번한 준거-기반, 형성적, 직무현장-기반 방법을 포함하도록 확장했다. 또한, 이러한 변화는 훈련생에 대한 판단을 내리는 그룹 과정group process의 가치를 강조했습니다. CBME의 맥락 속에서는, 오로지 의대생들의 임상능력을 보다 [빈번하고 효과적으로 평가해야 할 필요성]이 높아질 뿐이었다.

This new licensure exam also resulted in the increased development of local SP-based clinical performance assessments, which were intended, in part, to prepare students for Step 2 CS. These local methods became part of the larger assessment system of the school that developed them. Although beyond the scope of this brief commentary, we would be remiss not to mention the broader movement toward competency-based medical education (CBME), which is an outcomes-based approach to the design, implementation, and evaluation of educational programs and the assessment of learners. As medical schools began to adopt a CBME approach, they also broadened their assessment systems to include more frequent criterion-based, formative, and workplace-based methods. Additionally, this shift underlined the value of group process in making judgments about trainees. The need to more frequently and effectively assess medical students’ clinical skills was only heightened within the context of CBME.

 

2020년대 이후: 창의적 협업의 시대
2020s and Beyond: Era of Creative Collaboration

2020년 5월, COVID-19 대유행으로 인해 FSMB와 NBME는 언젠가는 다시 시작할 것을 염두에 두고 2단계 CS를 12개월에서 18개월 동안 (일시) 중단했다. 그들은 "기존의 방식보다 눈에 띄게 더 나은 2단계 CS 시험을 다시 시작할 것"이라고 설명했지만, 2021년 1월에 그들은 Step 2를 (영구히) 중단할 것이라고 발표하며, "의학교육 및 주 의료 위원회에서 종사하는 동료들과 함께 작업하여 [임상기술을 평가하는 혁신적인 방법]을 결정하는 데 집중"할 수 있는 기회를 가질 것이라고 발표했다. 미래를 정의하기 시작하면서 임상 성과 평가의 역사와 진화에 대한 몇 가지 교훈을 제안합니다.
In May 2020, due to the COVID-19 pandemic, the FSMB and the NBME suspended Step 2 CS for 12 to 18 months with the intent of reinstating. They explained they would bring back “a modified Step 2 CS exam that was appreciably better than the prior assessment,” but in January 2021, they announced their decision to discontinue the Step and to take the opportunity to “focus on working with our colleagues in medical education and at the state medical boards to determine innovative ways to assess clinical skills.”1As we begin to define the future, we propose several lessons from the history and evolution of clinical performance assessment.


첫째, 우리가 역사를 통해 해왔던 것처럼 의학교육계는 임상 능력 평가 방법을 지속적으로 혁신하고 협력하며 개선해야 합니다. SP 기반 모달리티는 환자 중심 평가를 위한 강력한 방법인 동시에 학습자와 환자를 위험으로부터 보호합니다. 우리는 [다양한 환자, 가족, 팀 및 다양한 설정을 대표하는 임상 만남]을 [시뮬레이션]하는 [성과 기반의 형성적 및 종단적 방법]을 제공하기 위해 노력해야 한다. 2단계 CS의 중단으로 [의과대학의 창의성과 혁신성이 향상]되어 다양한 환자 및 팀과 소통하고 공정하고 안전한 직접적 및 가상적 관리를 제공하는 등 학생들의 복잡한 임상 기술을 측정하는 평가를 모색할 수 있을 것이다. 또한, 이러한 방법들은 [직장 기반 방법의 사용을 증가]시키는 것을 포함하여 [학교의 광범위한 평가 시스템과 맥락을 같이] 하여 검토되어야 한다. [서로 다른 설정]에 걸쳐 그리고 [수많은 평가자]에 의해 이루어진 [여러 평가 형식]은 학생들의 역량에 대한 [종단적] 평가에 더 많은 정보를 제공할 것입니다.
First, as we have done throughout history, the medical education community should continue to innovate, collaborate, and improve upon our methods of clinical skills assessment. SP-based modalities remain a powerful method for patient-centered assessment while also protecting our learners and patients from harm. We should work to provide performance-based formative and longitudinal methods that simulate clinical encounters that are representative of diverse patients, family members, teams, and varied settings. The discontinuation of Step 2 CS may allow for greater creativity and innovation at medical schools to explore assessments that measure the complex clinical skills of its students, including communicating with diverse patients and teams and providing in-person and virtual care that is equitable and safe. Furthermore, these methods should also be considered in context with the school’s broader assessment system, including the increasing use of workplace-based methods. Multiple assessment formats, across different settings and by numerous assessors, will better inform longitudinal evaluation of students’ competence.


둘째, 의학 교육자는 평가를 위해 보다 복잡하고 학생 중심적인 접근법으로 계속 전환해야 합니다. 우리는 [학생 주도student-driven 평가]를 [구조화되지 않은 환경을 제공]하고, [자연적 조건에 대해 현실적]이며, [학생들에게 선택 사항 목록을 제한하거나 특정 추론 경로를 따르도록 강요하지 않는 것]으로 정의한다.7 임상 기술의 복잡성을 [순수하게 분리된 행동 체크리스트로 축소]해서는 안 된다. 대신 우리는 학생들이 임상적 추론을 개발하고, 결정을 내리고, 오류를 범하고, 역량을 개발하는 방법에 대한 우리의 증가하는 이해를 평가 방법에 통합해야 합니다. 우리는 Dyad(학생-SP 쌍)에 대한 과도한 의존에서 벗어나서, 예를 들어, [다수 사람의 시뮬레이션multiple-person simulation]으로 나아가야 한다. 또한 지금과 같은 체크리스트 기반의 측정방법을 [고급 인지 능력]을 평가할 수 있는 것으로 바꿔나가야 한다. 궁극적으로, 이러한 [덜 환원주의적 접근법]은 임상 역량에 대한 보다 인지적으로 발전된 측정으로 이어질 수 있다.
Second, medical educators should continue to shift to more complex and student-driven approaches for assessment. We define student-driven assessments as those that provide an unstructured environment, are realistic with respect to the natural conditions, and do not limit students to lists of options or force them to take a certain path of reasoning.7The complexity of clinical skills should not be reduced to a purely discrete checklist of behaviors. We should instead integrate into our assessment methods our growing understanding of how students develop clinical reasoning, make decisions, make errors, and develop competency. We should shift from overreliance on dyad (student–SP) encounters, for example, to multiple-person simulations and modify the method of measurement from checklists to measures more capable of assessing advanced cognitive skills. Ultimately, these less reductionist approaches may lead to more cognitively advanced measures of clinical competence.


셋째, 의학 교육자는 계속해서 평가의 역할에 대해 재고하고, 부담stake의 정도나 평가의 유형에 관계없이 [모든 평가]가 학생들이 강점과 약점을 식별할 수 있는 [충분한 피드백을 제공하도록 해야] 합니다. 또한, 우리는 우리의 방법이 [공정]하고, 모든 학생들이 [접근]할 수 있으며, [편견이 없도록] 노력해야 합니다. 다시 말해, 우리는 [학습에 대한 평가]에서 [학습을 위한 평가]와 [형평성을 위한 평가]로 계속 전환해야 합니다. 마찬가지로, 가상 및 직접 검사를 위한 [다중 기관 및 지역 협업]을 포함하여, SP 기반 평가를 설계하고 관리할 때 효율성을 높이기 위해 노력해야 합니다. 의대, 협력기관, 인허가기관 등 의학교육계는 [임상기술이 적절하고 공정하며 균일하게 평가될 수 있도록] 해야 할 [공공public에 대한 의무]를 공유하고 있다. 임상 술기 평가는 국지적으로 계속 확장되어야 하며, 국가 의사면허 취득으로 가는 경로pathway 내에 있어야 한다. 궁극적으로 평가가 지역적이든, 국가적이든, 공동 설계 및 관리이든 간에, 우리의 광범위한 공동체는 협력적으로 일하고, 공유된 과거로부터 교훈을 얻으며, 임상 기술 평가의 새로운 미래를 설계해야 한다.
Third, medical educators should continue to rethink the role of assessment and ensure that all assessments, regardless of stakes or type, provide sufficient feedback for the student to identify areas of strength and weakness. In addition, we should work to ensure that our methods are equitable, accessible for all students, and free of bias. In other words, we should continue to shift from the assessment of learning toward the assessment for learning and equity. Similarly, we should work toward identifying greater efficiencies when designing and administering SP-based assessments, including multi-institutional and regional collaborations for virtual and in-person examinations. The medical education community, including medical schools, their affiliates, and licensing and accrediting bodies, have a shared obligation to the public to ensure clinical skills are appropriately, fairly, and uniformly assessed. Clinical skills assessment should continue to expand locally and should remain within the national licensing pathway. Ultimately whether the assessment is locally, nationally, or jointly designed and administered, our broad community should work collaboratively, take lessons from our shared past, and design our new future of clinical skills assessment.


지난 한 해는 COVID-19가 의료 교육의 거의 모든 관행에 지장을 주면서 변혁을 가져왔다. 미국 국가 면허 검사의 실질적인 변화는 의과대학 내부와 대학 전반에서 우리 학생들의 임상 능력을 평가하는 방법과 무엇을 발전시킬 수 있는 기회를 포함하여 많은 파급 효과를 가져올 것입니다. 미래가 어떻게 될지 알 수는 없지만 창의성과 협업을 강화함으로써 포괄적이고 공정하며 학생 중심적이고 환자 중심적인 임상 능력 평가를 포함하는 미래를 정의하게 될 것으로 전망합니다.

The past year has been transformative as COVID-19 has disrupted nearly all practices in medical education. Substantial changes to the U.S. national licensing examination will have many ripple effects, including opportunities for advancing what and how we assess the clinical skills of our students within and across our medical schools. Although we cannot know what the future will hold, we predict that through greater creativity and collaboration, we will have defined a future that includes comprehensive, equitable, student-focused, and patient-centered assessment of clinical skills.

 


Acad Med. 2021 Jun 22.

 doi: 10.1097/ACM.0000000000004217. Online ahead of print.

Discontinuation of the USMLE Step 2 Clinical Skills Examination: Studying the Past to Define the Future

Lisa D Howley 1Deborah L Engle

Affiliations collapse

Affiliation

  • 1L.D. Howley is senior director of strategic initiatives and partnership, Association of American Medical Colleges, Washington, DC, and adjunct associate professor, University of North Carolina School of Medicine, Chapel Hill, North Carolina. D.L. Engle is assistant dean of assessment and evaluation and associate professor, Duke University School of Medicine, Durham, North Carolina.
  • PMID: 34166236
  • DOI: 10.1097/ACM.0000000000004217Abstract
  • The United States Medical Licensing Examination (USMLE) Step 2 Clinical Skills (CS) was discontinued in January 2021, marking a significant milestone in assessment of clinical skills. In this commentary, the authors trace the history of the Step 2 CS exam-beginning with its early roots in the 1960s, to its establishment as a performance-based licensing exam in 2004, to 2021. In this new era, the medical education community is replete with opportunities for advancing methodology and content associated with clinical skills assessment. The authors propose 3 main lessons gleaned from this rich history and modern evolution, which are aimed at defining a future that includes creative collaboration toward development of comprehensive, equitable, student-focused, and patient-centered clinical performance assessment. First, as it has done throughout history, the medical education community should continue to innovate, collaborate, and improve upon methods of clinical skills assessment. Second, medical educators should continue to shift to more complex and student-driven approaches of assessment, that is, assessments that provide an unstructured environment, are realistic with respect to the natural conditions, and do not limit students to lists of options or force them to take a certain path of reasoning. Third, medical educators should continue to rethink the role of assessment and ensure that all assessments, regardless of stakes or type, provide sufficient feedback for the student to identify areas of strength and weakness.

USMLE에서 임상술기평가의 진화: Step 2 CS 중단 이후를 바라보다 (Acad Med, 2021)
Evolution of Clinical Skills Assessment in the USMLE: Looking to the Future After Step 2 CS Discontinuation
Peter J. Katsufrakis, MD, MBA, and Humayun J. Chaudhry, DO, MS

  

2021년 1월 26일, NBME와 주 의료 위원회 연맹은 미국 의료 면허 검사(USMLE) 프로그램이 2단계 임상 기술(CS) 검사를 [수정하여 재개시하는 작업을 중단]했다고 발표했다.1 이 결정은 2020년 3월에 발표된 2단계 CS의 최초 일시적 중단에 이어, SARS-CoV-2(COVID-19를 유발하는 바이러스)의 감염이 미국 전역으로 확산되기 시작했고, 이후 2020년 5월에 12-18개월간 중단이 연장되었다. 사건이 전개되고 COVID-19 대유행으로 미국 전역에서 감염, 입원, 사망자가 급증함에 따라, 바이러스 전염의 위험을 상당히 줄인 버전의 2단계 CS를 재개할 계획이 영구적 중단으로 바뀌었다. 이러한 계획 변경에는 USMLE 프로그램의 내부 및 외부 요소에 대한 세심한 검토가 수반되었습니다. 그러나 이 결정은 면허 시험에서 임상 능력 평가의 중요성을 축소minimize하기 위한 것은 아니다. USMLE 프로그램 내에서 그리고 의료 교육 및 훈련 기간 내내 임상 기술을 평가하는 것은 매우 중요합니다. 이 논평에서 논의하겠지만, 우리의 목표는 USMLE에서 임상 기술 평가를 발전시킬 때 교육 및 임상 실무의 진화를 모두 반영하는 것입니다.

On January 26, 2021, the NBME and the Federation of State Medical Boards (FSMB) announced that the United States Medical Licensing Examination (USMLE) program had discontinued its work to modify and relaunch the Step 2 Clinical Skills (CS) examination.1 This decision followed the initial, temporary cessation of Step 2 CS announced in March 2020, as infection with SARS-CoV-2 (the virus that causes COVID-19) began spreading throughout the United States, and the subsequent May 2020 extension of the suspension for 12–18 months. As events unfolded and the COVID-19 pandemic caused alarming surges of infections, hospitalizations, and deaths around the United States, our plans to resume a version of Step 2 CS that substantially reduced the risk of virus transmission evolved to a permanent discontinuation of the exam. This shift in plans involved a careful consideration of multiple factors intrinsic and external to the USMLE program. By no means, however, is this decision intended to minimize the importance of assessing clinical skills in the licensure exam. Evaluating clinical skills within the USMLE program and throughout the duration of medical education and training is critically important. As we will discuss in this commentary, our goals are to reflect evolution of both educational and clinical practice as we evolve clinical skills assessment in the USMLE.

USMLE 거버넌스 및 2단계 CS 결정
USMLE Governance and the Step 2 CS Decision

USMLE 프로그램의 공동 후원자로서 FSMB와 NBME는 [전체 시험 시퀀스의 프로그램 감독에 대한 궁극적인 책임]을 지고 있습니다. NBME와 ECMG(외국인의료졸업생을 위한 교육위원회)가 공동으로 2단계 CS 구성요소를 관리하였다. 시험 내용 결정, 합격점수 컷오프 및 관련 운영 문제와 같은 많은 USMLE 정책 결정은 의과대학 교수진, 주 의료 위원회 및 일반인으로 구성된 다양한 감독 위원회에 위임됩니다. 2단계 CS 중단 결정은 FSMB 및 NBME의 거버넌스 및 직원 리더십이 ECFMG의 거버넌스 및 직원 리더십과 협의하여 이루어졌다. 
As cosponsors of the USMLE program, the FSMB and NBME have ultimate responsibility for program oversight of the entire exam sequence. The NBME and Educational Commission for Foreign Medical Graduates (ECFMG) collaboratively administered the Step 2 CS component. Many USMLE policy decisions—such as determination of exam content, cutoffs for a passing score, and related operational matters—are delegated to various oversight committees comprising volunteers from medical school faculties, state medical boards, and the public. The decision to discontinue Step 2 CS was made by governance and staff leadership of the FSMB and NBME in consultation with governance and staff leadership of the ECFMG.

평가를 강화하기 위한 USMLE 프로그램의 지속적인 노력의 일환으로, 지난 몇 년간 연구는 [임상 능력 평가의 장기적인 전환]에 집중되어 왔습니다. 예를 들어, 2단계 CS에서 아바타나 멀티미디어를 활용한다거나, Step 2 CS에 대한 기타 개선사항이 포함되어 있으며, 이는 통해 [평가의 특성]과 [응시자 경험]을 개선하고자 했다.
팬데믹으로 인한 셧다운과 [수정된 시험을 시작하려는 움직임]은 예상하지 않았던 [추가 자원을 이 작업에 투입할 수 있는 기회]를 제공했습니다. 2단계 CS의 12~18개월 공백이 2020년 5월에 발표되었을 때, USMLE 프로그램은 단기 개정short term revision과 2020년 3월에 중단되었던 시험에 비해 [상당히 개선된 시험의 재개시]에 다시 초점을 맞췄다. 우리는 [테크놀로지를 활용]하며, 시험과 관련된 [COVID-19 위험을 줄이거나 제거]하고, [수험생 여행의 필요성을 줄이거나 제거]했으며, 2004년 Step 2 CS 시험이 처음 시행된 이후의 [의학교육의 변화를 반영]하는 변화의 조합을 구상했다.
As part of the USMLE program’s continous efforts to enhance assessment, research over the past several years has been focused on longer-term transformation of clinical skills assessment—by using avatars, multimedia, and other enhancements in Step 2 CS to improve not only the nature of the assessment but also the experience of the examinee. The pandemic shutdown and the drive to launch a revised exam provided an unforeseen opportunity to commit additional resources to this work. When the 12–18-month hiatus of Step 2 CS was announced in May 2020, the USMLE program refocused on shorter-term revisions and relaunching an exam that was appreciably enhanced compared with the exam that was suspended in March 2020. We envisioned some combination of changes that harnessed technology, reduced or eliminated exam-associated COVID-19 risk, reduced or eliminated the need for examinee travel, and reflected changes in medical education arising since the exam was first launched in 2004.

2020년의 나머지 기간 동안 USMLE 직원들은 의과대학 및 레지던시 프로그램 설정에서 일하는 교육자들과 협력하고, 이해관계자 그룹의 의견을 구했으며, 2단계 CS 재출시가 가능하도록 다양한 기술 솔루션을 탐색했습니다. 좋은 진전이 있었지만, FSMB와 NBME는 2021년 1월에 목표 기간 내에 적절히 강화된 시험을 재개하는 것이 가능하지 않다고 공동으로 결정했다.
During the rest of 2020, USMLE staff worked to analyze current elements of medical practice, engaged with educators working in medical school and residency program settings, solicited input from stakeholder groups, and explored various technology solutions to enable relaunch of Step 2 CS. While good progress had been made, the FSMB and NBME jointly determined in January 2021 that it was not feasible to relaunch an exam that was appropriately enhanced within our targeted timeframe.

 

2단계 CS 의사결정에 기여하는 요인
Factors Contributing to the Step 2 CS Decision

이렇게 결정된 요인은 어느 하나로 설명할 수 없다. 2단계 CS를 중단하기로 한 결정에는

  • USMLE 프로그램 목표에 대한 전체적인 검토,
  • 시험 재개시를 향한 발전과정progress
  • 다양한 이해관계자로부터 수집된 의견,
  • 교육 및 실습 환경의 분석이 포함되었습니다. 

No single factor led to this determination. The decision to discontinue Step 2 CS involved

  • a holistic review of USMLE program goals,
  • progress made toward relaunching the exam,
  • input collected from varied stakeholders, and
  • analysis of the education and practice environments.

 

우리는 아래에 몇 가지 중요한 고려사항들을 간략히 요약합니다.
We briefly summarize, below, some of the salient considerations.


모든 연령대와 인구 통계에 걸친 위험과 함께 전 세계로 빠르게 확산된 COVID-19는 2단계 CS에 대한 우리의 계획을 크게 변화시켰습니다. Step 2 CS는 그 설계상 수험생과 시험 직원, 특히 표준화된 환자 역할을 하는 직원 간의 긴밀한 신체적 근접과 신체적 접촉을 요구했습니다. 표준화된 환자 및 기타 직원의 안전과 복지가 그러하듯이, 전염병의 불확실성으로 인한 스트레스와 불안 등 [수험생의 안전과 건강]이 가장 큰 관심사였다. 우리는 처음에 검사와 관련된 잠재적인 COVID-19 위험을 줄이거나 제거하기 위해 응시자 및 직원이 다른 사람과 접촉할 필요가 없는 [가상 원격 건강 플랫폼을 시뮬레이션]하는 방식으로 시험을 수정하려고 했습니다. 우리는 또한 수험생의 [여행 관련 비용을 줄이거나 제거]할 수 있는 원격 관리 모델을 개발하기 위해 노력했습니다. 이렇게 시험 설계를 바꾸게 된다면 [정보 수집, 상호작용 방식, 환자 및 동료와의 결과 전달]과 관련된 [비인지 영역]에 대한 평가를 유지하지만, [신체 검사 기술]에 대한 평가를 갖추지는 못할 것이다.
The rapid spread of COVID-19 throughout the world, with risks across all age groups and demographics, dramatically changed our plans for Step 2 CS. The exam by design required close physical proximity and physical contact between examinees and exam staff, especially staff acting as standardized patients. The safety and health of examinees, including stress and anxiety caused by the uncertainty of the pandemic, were of paramount concern, as were the safety and welfare of standardized patients and other staff. We initially sought to modify the exam to simulate a virtual telehealth platform where neither examinees nor staff would need to come into contact with others, in order to reduce or eliminate potential COVID-19 risks associated with the exam. We also strove to develop a model for remote administration that could reduce or eliminate the travel-associated costs for examinees. These exam design characteristics would have retained assessment of noncognitive domains involving information gathering, manner of interaction, and communicating findings to patients and colleagues, but not assessment of physical examination skills.

[원격 시험]의 이점benefit에 대해서 균형을 잡을 때 고려해야 했던 것은, [기술, 보안, 형평성 및 시험 로지스틱스]와 관련된 과제뿐 아니라 [버추얼 수행능력 평가]에서는 [신체 검사 능력 평가]가 명백히 제한된다는 점이었습니다. 우리는 [원격 시험]을 시도하는 다른 규제 기관이 겪었던 어려운 경험과 의과대학에서의 학교 기반 시험 원격 검사의 성공적 론칭으로부터 많은 것을 배울 수 있었지만, 이러한 경험이 [USMLE 프로그램의 요구에 부합]할 정도로까지 대규모 국가 면허 시험으로 [충분히 일반화되지 않았다]는 것을 알게 되었다. 결국 충분한 가치를 제공하는 원격 관리 솔루션을 확보하지 못했습니다. 
Balanced against the benefits of a remotely administered exam were the challenges associated with technology, security, equity, and exam logistics, as well as the obvious limitations to assessing physical examination skills via a virtual performance assessment. While we had the benefit of learning from the cautionary experiences of other regulatory organizations attempting remote exam administration and from the successful NBME launch of school-based remote proctoring of exams in medical schools, we found that these experiences did not adequately generalize to a large-scale national licensing exam specific to the USMLE program’s needs. Ultimately, we did not identify a remote administration solution that would provide sufficient value.


또한 2004년 2단계 CS가 시행된 이후부터 기존의 지식과 내용 영역을 뛰어넘는 기술을 시험 응시자들에게 보여주도록 함으로써 면허 도구로서의 상당한 발전을 대변하는 [의미 있는 의학교육의 발전]이 이루어졌다. 이 발전에는

  • 미국 MD-granting 및 DO-granting 의과대학의 객관적 구조 임상 검사(OSCE) 연구소의 설립과
  • 의학교육의 연속체를 따라 학습자의 진척도를 평가하는 역량 프레임워크의 채택도 포함된다 (EPA, ACGME/ABMS의 core competencies, GME의 마일스톤 등)

In addition, meaningful advances in medical education have occurred since Step 2 CS was launched in 2004, when it represented a significant advance as a licensing tool by requiring examinees to demonstrate skills beyond traditional knowledge and content areas. These developments include

  • the establishment of objective structured clinical examination (OSCE) labs at U.S. MD-granting and DO-granting medical schools and
  • the adoption of a competency framework—including entrustable professional activities, Accreditation Council for Graduate Medical Education (ACGME)/American Board of Medical Specialties core competencies, and graduate medical education (GME) milestones—to assess learners’ progress along the continuum of medical education.2

 

그러나 [국가 표준]에 대한 [독립적인 제3자 검증 및 지원]은 여전히 미국의 강력한 의료 면허 시스템의 초석으로 남아 있다. [주 의료 위원회]는 [USMLE 프로그램]에 의존하며, 주 의료 위원회State Medical Board의 라이센스 결정은 다음을 포함하는 교육 및 훈련 시스템에 의해 결정된다.

  • [학부 의학 교육(UME) 프로그램]의 성공적인 완료.
  • [GME 프로그램]의 일부 또는 전체 완료.
  • UME 및 GME 프로그램에 대한 독립적이고 별도의 [인증].
  • 국제 의대 졸업자의 경우 [ECFMG에 의한 의사 지원자의 자격 증명]

Independent, third-party verification and support for a national standard, however, remain cornerstones of a robust system of medical licensure in the United States. State medical boards rely on the USMLE program,3 and their licensing decisions are predicated on an education and training system that includes

  • successful completion of a program of undergraduate medical education (UME);
  • completion of some or all of a program of GME;
  • independent and separate accreditation of UME and GME programs; and,
  • for international medical graduates, certification of physician applicants’ qualifications by the ECFMG.

이러한 [강력한 평가, 인증 및 규제 시스템]의 맥락에서 USMLE 리더십은 수정된 2단계 CS의 재출시에 따른 점진적인incremental 부가 가치를 평가했습니다.
In the context of this robust system of assessment, certification, and regulation, the USMLE leadership weighed the incremental additional value of relaunching a modified Step 2 CS.

[미국 의과대학의 임상 기술 훈련과 평가 프로그램의 성장]은 (그 prevalence와 sophistication 모두) 틀림없이 새로 들어온 의사들이 레지던트 교육에 들어갈 준비를 개선시켰다. 2단계 CS 도입 이후 임상술기 훈련과 평가 시스템이 진화하면서, 실제 의료행위(practice of medicine)는 시험의 모습을 반영하지 않는 방향으로 발전했다. [온라인 자료의 참고, 인공지능 의사 결정 보조 도구 활용, 기타 테크놀로지-기반 도구와 같은 자원]은 의학의 practice과 진료 전달 방식을 변화시켰다. [텔레헬스]는 COVID-19 대유행 이전에 수용도와 활용도가 증가하고 있었지만, 2020년에는 의사와 환자의 사용이 급격하게 증가했습니다. [2단계 CS 시험을 전염병에 맞게 수정하여 재개하는 작업]에 요구되는 중요한 인력 자원을, 그 대신 [더 혁신적인 방식으로 임상 술기 평가를 발전시키는 데 투입될 수 있다]는 데 동의했습니다.

The growth in U.S. medical schools’ clinical skills training and assessment programs, both in prevalence and sophistication, has arguably improved the preparation of newly minted physicians entering residency training. As the systems for training and assessing clinical skills have evolved since the launch of Step 2 CS,4 the practice of medicine has also evolved in ways not reflected in the exam. Resources such as online reference materials, artificial intelligence decision aids, and other technology-enabled tools have changed how medicine is practiced and care is delivered. While telehealth was growing in acceptance and utilization prior to the COVID-19 pandemic, the year 2020 saw a dramatic increase in its use by physicians and patients. The significant staff resources required to relaunch a Step 2 CS exam modified for the pandemic, we agreed, could instead be devoted to advancing the assessment of clinical skills in a more transformative fashion.

미래를 내다보기
Looking to the Future

[주 의료 위원회]는 [의사가 안전하고 효과적인 환자 관리를 제공하도록 보장]하기 위해 계속 노력하고 있습니다. USMLE 프로그램은 지속적으로 이 미션에 복무serve할 것이며, [알려진 요구사항]과 [새롭게 대두되는 요구사항]을 충족하는 평가를 지속적으로 이행할 것입니다. 우리는 의과대학 교수, 레지던트 프로그램 이사 및 교수진, 의대 학생, 수험생, 개업 의사 및 일반인 등 미래의 의사 교육과 훈련에 직접 및 간접적으로 관여하는 주 의료 위원회 구성원과 대표자를 포함한 주요 이해관계자들의 의견을 구하고 있습니다. 이해관계자의 가이드를 탐색seeking할 때, 어떻게 해야 의학교육/훈련/실무의 진화가 USMLE 평가에 가장 잘 반영될지를 파악하기 위한 노력을 한다. 또한 임상술기 평가에 대한 가장 큰 요구가 어디에 존재하는지 이해하려고 합니다. 우리가 수집한 정보는 후속 연구 및 개발의 우선순위를 정하는 데 도움이 될 것입니다. 또 다른 조사 라인은 의료 면허의 맥락에서 적용할 수 있는 임상 기술 평가의 혁신을 추구합니다.
State medical boards remain committed to ensuring that physicians provide safe and effective patient care. The USMLE program will continue to serve that mission and deploy assessments that meet the known and emerging requirements of medical licensure. We are soliciting input from key stakeholders, including members and representatives of state medical boards and individuals involved directly and indirectly in the education and training of future physicians— medical school faculty, residency program directors and faculty, medical students, examinees, practitioners, and members of the public. In seeking stakeholder guidance, we are striving to identify how the evolution of medical education, training, and practice should best be reflected in USMLE assessments. One line of inquiry seeks to understand where the greatest needs for clinical skills assessment exist. The information we gather will help prioritize subsequent research and development. Another line of inquiry seeks innovations in clinical skills assessment that are applicable to the context of medical licensure.


이미 받은 피드백을 바탕으로 의료 실무practice에 특히 중요한 주제(예: 임상적 추론)주 의료 위원회에서 식별한 결함 영역(예: 커뮤니케이션)을 더 강조하는 방향으로 바꿀 수 있다.5 USMLE 검사의 임상스킬 평가의 초기 향상은 현재 형식을 강화하고 기존 검사 구조에 통합될 것입니다. (이해당사자의 투입을 통해 식별된) 수정이 필요한 내용은 3단계 시험 및/또는 3단계 시험의 컴퓨터 케이스 시뮬레이션에서 모두 객관식 문항에 반영될 수 있습니다. 
Based on the feedback we have already received, we are likely to increase emphasis on subjects particularly important to medical practice (e.g., clinical reasoning) and areas in which state medical boards identify deficiencies (e.g., communication).5The initial enhancements to clinical skills assessment in USMLE exams will augment current formats and integrate into the existing exam structure. To the extent possible, content revisions identified through stakeholder input may be reflected in multiple-choice questions in all three Step exams and/or computer case simulations in the Step 3 exam.

그러나 지속적인 연구를 통해 다음과 같은 내용을 포함하여 이러한 형식의 한계를 극복할 것이다.

  • 오디오 및 비주얼 미디어의 발전,
  • 환자 아바타,
  • 자연어 처리,
  • 인공지능,
  • 평가와 관련된 다른 과학과 테크놀로지의 결합

이는 임상 스킬 평가의 한계를 확장시켜줄 것이며, 테크놀로지의 발전은 새로운 유형의 문항이 개발될 가능성이 높다.

Ongoing research, however, will seek to push beyond the limitations of these formats, incorporating

  • advances in audio and visual media,
  • patient avatars,
  • natural language processing,
  • artificial intelligence, and
  • other combinations of assessment science and technology

...that extend the frontiers of clinical skills assessment. It is likely that technological advances will result in the development of new item types.


위에서 설명한 프로세스(유망한 [테크놀로지 혁신]을 목표로 하는 [연구 및 개발]과 결합된 [다양한 이해관계자 의견])가 USMLE 프로그램에서 임상 스킬 평가를 위한 최적의 개발 경로를 만들 것이라고 믿는다. 우리가 아래의 것들을 이루고자 할 때, 다양한 [시험]과 [디자인 특성 사이]에 절충tradeoff이 있을 것은 거의 확실하다. 

  • 신체 검사 및 의사소통 기술을 평가한다. 
  • 감독되는 실무 및 감독되지 않은 후속 실무에 대한 진입 준비에 대한 결정을 알려줍니다. 
  • 임상적 추론을 평가한다. 
  • 현대 의료 관행을 반영한다. 
  • 형평성과 접근성을 보장한다. 
  • 수험생 경험을 최적화합니다. 

We believe that the process outlined above—diverse stakeholder input combined with research and development that targets promising technological innovations—will create the optimal developmental path for clinical skills assessment in the USMLE program. There will almost certainly be tradeoffs among various exam and design characteristics as we strive to

  • assess physical examination and communication skills;
  • inform determinations of readiness for entry into supervised practice and subsequent unsupervised practice;
  • assess clinical reasoning;
  • reflect contemporary medical practice;
  • ensure equity and access; and
  • optimize the examinee experience.

2단계 CS를 중단하기로 결정하면서, 일부 학습자와 교육자가 [임상 스킬 평가가 더 이상 중요하게 여겨지지 않는다]처럼 잘못된 결론을 내릴 가능성이 있음을 알게 되었다. USMLE 프로그램은 임상 기술 평가에 전념하고 있습니다.

  • 따라서 교육자와 관리자는 표준이 느슨해지지 않도록 해야하며, 임상 기술 훈련 및 평가에 투입되는 시간과 자원을 계속적으로 우선시해야 한다6.
  • 교육 및 규제 시스템의 모든 당사자는 공공의 이익에 부합하는 의료 교육의 연속체에 걸쳐 지속적으로 독립적으로 협력적으로 일할 필요가 있다.
  • 이와 별도로, 의학 교육자는 [USMLE 시험에 반영 여부와 상관없이], 의학을 수행하는 데 필요한 다양한 지식과 기술을 지속적으로 다뤄야 하며,
  • USMLE 프로그램은 수험자의 실무 준비 상태를 확인하는 기능을 지속적으로 수행해야 합니다. 

In deciding to discontinue Step 2 CS, we recognized the potential for some learners and educators to wrongly conclude that clinical skills assessment is no longer being valued. The USMLE program remains committed to assessment of clinical skills.

  • As such, educators and administrators should resist relaxation of their standards6and continue to prioritize the time and resources devoted to clinical skills training and assessment.
  • All parties in the education and regulatory systems will need to continue to work independently and collaboratively across the continuum of medical education in the public interest.
  • Working independently, medical educators must continue to address the broad array of knowledge and skills necessary to practice medicine regardless of whether they are reflected in USMLE exams, and
  • the USMLE program must continue to serve its function of validating examinees’ readiness to practice.

USMLE Scoring에 대한 Invitational Conference의 최근 경험과 의사 책임 연합의 UME-GME 검토 위원회의 현재 작업을 통해 의료 교육, 평가 및 규정의 시스템 개선을 안내할 수 있는 여러 이해관계자 간의 효과적이고 조정된 협업을 위한 모델을 제공할 수 있기를 바랍니다. 우리의 단기 및 장기 계획은 특히 의사-환자 간 커뮤니케이션 영역에서 주 의료 위원회와 우리가 공동으로 봉사하는 일반인의 진화하는 요구를 충족시키기 위해 USMLE 프로그램의 모든 단계를 전환하면서 검사자의 임상 기술 평가를 강화하는 것입니다.

 We are hopeful that our recent experience with the Invitational Conference on USMLE Scoring7 and the current work of the Coalition for Physician Accountability’s UME-GME Review Committee8 provide models for effective, coordinated collaboration among multiple stakeholders to guide systemic improvements to medical education, assessment, and regulation. Our short-term and long-range plans are to enhance the assessment of examinees’ clinical skills, particularly in the area of physician-patient communication, as we transform all Steps of the USMLE program to meet the evolving needs of state medical boards and the public we collectively serve.

 


Acad Med. 2021 Jun 22.

 doi: 10.1097/ACM.0000000000004214. Online ahead of print.

Evolution of Clinical Skills Assessment in the USMLE: Looking to the Future After Step 2 CS Discontinuation

Peter J Katsufrakis 1Humayun J Chaudhry

Affiliations collapse

Affiliation

  • PMID: 34166234
  • DOI: 10.1097/ACM.0000000000004214Abstract
  • The COVID-19 pandemic interrupted administration of the United States Medical Licensing Examination (USMLE) Step 2 Clinical Skills (CS) exam in March 2020 due to public health concerns. As the scope and magnitude of the pandemic became clearer, the initial plans by the USMLE program's sponsoring organizations (NBME and Federation of State Medical Boards) to resume Step 2 CS in the short-term shifted to long-range plans to relaunch an exam that could harness technology and reduce infection risk. Insights about ongoing changes in undergraduate and graduate medical education and practice environments, coupled with challenges in delivering a transformed examination during a pandemic, led to the January 2021 decision to permanently discontinue Step 2 CS. Despite this, the USMLE program considers assessment of clinical skills to be critically important. The authors believe this decision will facilitate important advances in assessing clinical skills. Factors contributing to the decision included concerns about achieving desired goals within desired timeframes; a review of enhancements to clinical skills training and assessment that have occurred since the launch of Step 2 CS in 2004; an opportunity to address safety and health concerns, including those related to examinee stress and wellness during a pandemic; a review of advances in the education, training, practice, and delivery of medicine; and a commitment to pursuing innovative assessments of clinical skills. USMLE program staff continue to seek input from varied stakeholders to shape and prioritize technological and methodological enhancements to guide development of clinical skills assessment. The USMLE program's continued exploration of constructs and methods by which communication skills, clinical reasoning, and physical examination may be better assessed within the remaining components of the exam provides opportunities for examinees, educators, regulators, the public, and other stakeholders to provide input.

효과적인 강의 만들고 발표하기 (J Contin Educ Health Prof, 2020)
Creating and Presenting an Effective Lecture
Jennifer M. Babik, MD, PhD; Vera P. Luther, MD

 

 

문제 설명
PROBLEM STATEMENT

강의는 의학 교육자가 전문성 발전과 지속적인 의학 교육의 일환으로 여러 단계의 학습자에게 콘텐츠를 전달하기 위한 핵심 도구입니다. 그러나 많은 교육자들은 효과적인 프레젠테이션을 하는 방법에 대한 공식적인 교육에 참여할 시간이나 기회가 없었습니다. 전통 강의에 대한 비판은 여러 가지가 있지만, 잘만 한다면 여전히 활기차고 매력적인 교육 도구가 될 수 있다. 많은 교육자와 의료 실무자들은 효과적인 강의의 생성과 발표를 안내하는 증거 기반 원칙을 알지 못한다.

Lectures are a key tool for the medical educator to deliver content to multiple levels of learners as part of continuing professional development and continuing medical education. However, many educators have not had the time or opportunity to participate in formal training on how to give an effective presentation. Although there are multiple common criticisms of the traditional lecture, if done well, the lecture can still be a vibrant and engaging educational tool. Many educators and health care practitioners are not aware of the evidence-based principles that guide the creation and presentation of an effective lecture.

해결 방법
SOLUTION

본 논문에서는 효과적인 교수법, 슬라이드 구성 및 디자인, 능동적 학습, 대중 연설의 증거 기반 원칙을 활용하여 효과적인 강의를 만들고 발표하기 위한 종합적인 가이드를 제공합니다. 우리는 이러한 모범 사례를 도출하기 위해 (건강 전문가 내부와 외부 모두에서) 교육 문헌을 폭넓게 검토했다. 이 글의 내용은 강의나 교육 프로그램을 시행하는 모든 분야의 실무자들이 모든 단계의 실무자들이 도구 상자로 활용할 수 있다.
In this article, we provide a comprehensive guide for creating and presenting an effective lecture using evidence-based principles of effective teaching, slide organization and design, active learning, and public speaking. We reviewed the education literature broadly (both within and outside the health professions) to derive this set of best practices. The contents of this article can be used as a toolbox by practitioners at all levels and across all specialties of practice who give lectures or implement educational programs.

[기존 강의에 대한 비판]은 여러 가지가 있습니다. 강의는 학습자 중심의 강의가 아니라 수동적이고, 정적이며, "일률적"이며, 다른 교육 방법보다 지식 유지율이 낮다는 것이다.1-3 그러나, 강의는 "죽은" 것이 아니며, 지속적인 의학교육을 포함한 다양한 환경에서 커리큘럼을 전달하는 중요하고 효과적인 수단이다. 특히 강의는 많은 수의 학습자에게 사실 정보를 전달하기 위한 효율적인 방법을 제공하며, 주어진 주제에 대한 더 큰 관심을 갖게 할 영감을 제공하는 데 효과적일 수 있으며, 기록하여 미래의 학습자에게 제공할 수 있습니다. 강의가 잘 이루어지면 대화형 강의가 될 수 있고 앞서 언급한 많은 비판은 이 기사에서 설명한 것처럼 효과적인 프레젠테이션을 만들고 전달하는 모범 사례를 사용함으로써 완화될 수 있습니다.
There are multiple criticisms of the traditional lecture: that it is passive, static, “one-size-fits all,” not learner-centric, uninspiring, and can lead to less knowledge retention than other methods of instruction.1–3 However, lectures are not “dead” and are still an important and effective means of delivering curriculum in various settings, including in continuing medical education.4–8 Specifically, lectures provide an efficient method for delivering substantial amounts of factual information to a large group of learners, can be effective at providing inspiration to further interest in a given subject, and can be recorded and made available to learners at a future date.6,9 If done well, lectures can be interactive and engaging,1,4,8 and many of the criticisms mentioned previously can be mitigated by using best practices for creating and delivering an effective presentation, as will be outlined in this article.

준비 및 효과적인 교육
Preparation and Effective Teaching

보건 분야 강의의 주요 목표는 학습자에게 정보를 전달하고 주제에 대해 영감을 주는 것입니다. 본질적으로 효과적인 강의는 기억에 남는 강의지만, 학습자들은 강의의 절반 이하를 수업 노트에 담았고, 심지어 몇 주 후 강의의 10% 미만을 기억하고 있는 것으로 나타났다. 그렇다면 어떻게 하면 기억에 남는 강의를 만들 수 있을까요?

The main goals of a lecture in the health professions are to transmit information to learners and inspire them about the topic.1,4,9 In essence, an effective lecture is a memorable lecture; however, it has been shown that learners capture less than half of a lecture in their class notes and even worse and remember less than 10 percent of a lecture several weeks later.10 Then, how can we create lectures that will memorable?

기억에 남는 강의를 구성하는 방법에 대한 토대groundwork를 마련하기 위해서는 기억 형성, 학습, 효과적인 가르침에 대한 이론을 간략히 검토하는 것이 중요합니다.10–12 학습 과정의 [세 가지 핵심 구성요소]가 있습니다(그림 1A).10,11 
To set the groundwork for how to construct a memorable lecture, it is important to review briefly the theory behind memory formation, learning, and effective teaching.10–12 There are three core components of the learning process: attention, comprehension, and integration (Figure 1A).10,11 

  • 첫째, [청중의 관심]을 집중시키기 위해 질문, 사례 시나리오, 개인적인 일화, 강력한 인용문 또는 삽화로 강의를 시작할 수 있습니다.
  • 둘째, 발표의 제목, 개요, 학습 목표에 대한 사려 깊은 고려를 통해 [이해에 대한 "로드맵"]을 만들어 이해를 촉진할 수 있습니다. 이 첫 번째 두 단계는 학습자가 단기 기억을 만드는 데 도움이 됩니다.
  • 그러나 [장기적인 기억]을 형성하기 위해서는 청중들이 응용과 검토를 통해 [새로운 정보를 기존 정보와 연관]시킬 수 있는 기회를 만들어 [통합]을 도모해야 한다. 프레젠테이션의 정보를 사용하여 사례 시나리오에 적용하도록 요청하거나, 문제나 딜레마를 해결하거나, 개념을 비교 및 대조하도록 할 수 있습니다. 

  • First, to focus the audience's attention, you can start your lecture with questions, case scenarios, personal anecdotes, powerful quotes, or illustrations.
  • Second, you can facilitate comprehension by creating a “roadmap” to understanding with thoughtful consideration of a presentation's title, outline, and learning objectives. These first two steps help the learner create short-term memories.
  • However, to form long-term memories, you must also foster integration by creating opportunities for the audience to relate new information to existing information through application and review. You can ask the audience to use information from your presentation to apply to a case scenario, use it to solve a problem or dilemma, or have them compare and contrast concepts. 

강의 후 청중과 함께하지 않을 경우 검토 기회가 어려울 수 있습니다. 하지만, 당신은 여전히 검토를 위해 청중들을 준비prime 시킬 수 있습니다. 

  • 중요한 사항 요약, 
  • 세션의 자료를 적용하는 방법에 대한 지침과 함께 프리젠테이션을 마칩니다. 
  • 청중들이 여러분의 프레젠테이션의 주요 개념을 다시 살펴볼 수 있도록 유인물을 제공하거나 자료를 식별하는 것입니다.

Opportunities for review may be difficult if you will not be with the audience after the lecture; however, you can still prime the audience for review by

  • summarizing important points,
  • closing the presentation with instructions on how to apply material from the session, and by
  • providing a handout or identifying resources that allow the audience members to revisit key concepts from your presentation.

 

 

효과적인 가르침의 주요 원칙은 이러한 배움의 핵심 요소들과 연결되어 있다. Bulger는 이러한 원칙을 "4가지 에이스"라고 설명했으며, 이러한 원칙은 정보 보유의 증가와 관련이 있다(그림 1B).12 

The main principles of effective teaching are linked to these core components of learning. Bulger described these principles as the “four aces,” and they are linked to increased retention of information (Figure 1B).12 

첫 번째 "에이스"인 성과-기반 교육은 [성과를 염두에 두고 시작해야 한다]는 것을 상기시킨다. 여러분은 스스로에게 "내 청중들이 나에게서 배워야 할 것이 무엇이 있는가?"와 "그들이 무엇을 할 수 있기를 바라는가?"라고 자문해 보아야 한다. 중요한 구성 요소는 학습자가 주제를 처음 접하는 사람인지 아니면 전문가인지 등 결과가 적절하도록 "청중을 아는" 것입니다. 이해도를 높이고 주제를 상황에 맞게 작성하기 위한 핵심 질문을 통해 학습자 중심의 자세를 유지합니다.12,13
The first “ace,” outcomes-based teaching, is a reminder to start with the outcome in mind. You should ask yourself, “What do my audience members need to learn from me?” and “What do I want them to be able to do?” A critical component is to “know your audience” so that your outcomes are appropriate: are the learners new to the topic or are they experts? Stay learner-focused by asking key questions to facilitate understanding and to put topics in context.12,13

두 번째 "에이스"는 [명확성]이고, 이것은 조직화과 자제를 중심으로 합니다. 사려 깊은 학습 목표는 정보를 구성하는 데 도움이 될 수 있으며 구체적이고 측정가능해야 합니다. 그들은 "누가 언제까지 무엇을 얼마나 잘 할 것인가?"라는 질문에 대답해야 한다. 14 예를 들어, "이 강의가 끝날 때, 참석자들은 클로스트리디움 난이도 감염에 대한 세 가지 위험 요인을 파악할 수 있을 것이다." 여러분은 또한 사려 깊은 개요의 사용과 프리젠테이션을 구성하기 위한 [개념적 질문]을 통해 정보를 구성할 수 있습니다. 예를 들어, "우리는 항생제 내성 메커니즘을 논의할 것이다"라고 말하는 대신 "세균이 어떻게 항생제에 내성을 갖게 되는가?"라고 물을 수 있다. 이것은 즉시 청중들의 관심을 끌기 시작할 것이고, 청중들이 주제에 대해 생각하기 시작하도록 자극할 것입니다.
The second “ace” is clarity and centers around organization and restraint. Thoughtful learning objectives can help you organize information and should be specific and measurable. They should answer the question: “Who will do how much (and possibly how well) of what by when?”14 For example, “At the end of this lecture, attendees will be able to identify three risk factors for Clostridium difficile infection.” You can also organize information through the use of a thoughtful outline and by asking conceptual questions to organize your presentation. For example, instead of stating, “We will discuss mechanisms of antibiotic resistance,” you can ask, “How do bacteria become resistant to antibiotics?” This will immediately begin to engage your audience and stimulate them to start thinking about the topic. 

마지막으로, 시간을 계획하고 청중들의 집중력을 염두에 두세요. 이때 자제restraint가 필요하고, '정보 과부하'를 피하는 것이 중요하다. 프레젠테이션에 정보를 그룹화하거나 "청크"할 계획을 세우고 검토, 성찰 및 통합 시간을 허용하는 연습을 통합합니다. 개념을 주기적으로 검토하는 [간격을 둔 반복spaced repetition]은 정보 보존을 강화하는 기술이다. 이는 개념을 요약하고 강의 내내 핵심 요점을 다시 살펴봄으로써 수행될 수 있습니다.12
Finally, plan your time and be mindful of your audience's attention span. This is where restraint and avoiding “information overload” come into play. Plan to group or “chunk” information in your presentation and incorporate exercises that allow time for review, reflection, and integration. Spaced repetition, where concepts are periodically reviewed, is a technique that has been shown to enhance retention of information. This can be done by summarizing concepts and revisiting key take home points throughout your lecture.12

세 번째 "에이스"는 [참여]입니다.12 청중들과 함께하기 위해서는 여러분의 발표를 일방통행보다는 대화로 생각하세요. 여러분은 눈을 마주치고, 비언어적인 의사소통을 하고, 청중들에게 질문을 하고, 가장 중요한 것은 능동적인 학습을 통합함으로써 이것을 할 수 있습니다. [능동적 학습]은 [학습자가 무엇인가를 하도록 만들고, 자신이 하고 있는 일에 대해 생각하도록 하는 것]으로 정의된다.15 여러 가지 이유로 인해 능동적 학습은 정보의 보유를 증가시키는 것으로 나타났다:

  • 청중들이 학습자료에 관여하고, 수동적인 사고방식에서 능동적인 사고방식으로 전환하기 위한 메커니즘을 만든다
  • 또한 프리젠테이션을 한입 크기로, 다루기 쉽고, 기억에 남는 부분으로 나눈다

 
The third “ace” is engagement.12 To engage with your audience, think of your presentation as a conversation rather than a one-way street. You can do this through eye contact, nonverbal communication, posing questions to the audience, and most importantly, by incorporating active learning. Active learning is defined as anything that involves learners in doing things and thinking about the things they are doing.15 It has been shown to increase retention of information for several reasons:

  • not only does it create a mechanism for the audience to engage with the material and transition from a passive to active mindset
  • but also it breaks up the presentation into bite-sized, manageable, and memorable portions.15 

네 번째 '에이스'는 [열정]으로, 어느 정도 [참여]와 관련이 있다. 주어진 주제에 대한 열정을 어떻게 자연스럽게 전달하는지 생각해보고 그것을 바탕으로 발전시켜보세요. 본질적으로, 너 자신이 되어 즐겁게 지내라.

The fourth “ace” is enthusiasm, which is somewhat related to engagement. Consider how you naturally convey enthusiasm for a given topic and build off of that. In essence, be yourself and have fun.

슬라이드 구성 및 설계
Slide Organization and Design

강의를 구성하는 첫 번째 단계는 학습 목표와 일치하도록 전달하고자 하는 핵심 사항을 계획하는 것입니다. 또한 전체 강의에 걸쳐 얼마나 많은 슬라이드를 사용하여 이러한 내용을 전달할 것인지 계획하는 것도 도움이 될 수 있습니다. "올바른" 숫자를 지원하는 데이터는 없지만, 적절한 규칙은 분당 하나의 슬라이드(또는 그 이하)로 제한하고 슬라이드당 하나의 아이디어로 콘텐츠를 유지하는 것입니다. 여기서 중요한 것은 여러분의 청중들을 정보로 압도하지 않도록 자제하는 것입니다. 슬라이드 수를 줄이는 데 문제가 있는 경우 강의의 학습 목표를 준수하십시오. 학습자가 참고용으로 사용하길 원하는 슬라이드가 있는 경우, 참고를 위해 부록이나 강의요강에 넣되 프레젠테이션 자체는 생략합니다.
The first step in organizing your lecture is to map out the key points you want to deliver that are in alignment with your learning objectives. It can also be helpful to plan out how many slides you will use over the entire lecture to convey these points. There are no data to support a “right” number, but a good rule of thumb is to limit yourself to one slide per minute (or less) and keep your content at one idea per slide. The key here is to show restraint (this can be hard) so as to not overwhelm your audience with information. If you have trouble cutting down the number of slides, make sure you are adhering to the learning objectives for your lecture. If you have slides that you want your learners to use as a reference, put them in an appendix or syllabus for reference but leave them out of the presentation itself.

강의를 구성할 때는 크게 [소개], [내용 섹션], [결론]의 세 부분으로 구성하면 도움이 된다. 이 구성을 강조하려면 섹션 머리글 또는 개요 슬라이드를 사용하여 각 섹션의 "Signpost"를 해야 합니다. 그래야 청중이 강의에서 여러분과 강의자가 어디에 있는지 추적할 수 있습니다. 다음은 리처드 메이어의 교육 설계 연구 기반 원리 중 하나인 [신호 원리]의 예입니다. 사람들은 중요한 자료들이 개요와 제목을 사용하여 강조될 때 더 잘 배운다.16 당신의 강의의 세 가지 주요 부분을 계획할 때, 서론은 학습을 위한 반갑고 안전한 분위기를 조성하고 개인적인 이야기나 감정적인 갈고리로 청중의 관심을 끌어야 한다. 그런 다음 컨텐츠를 10분에서 18분 사이의 섹션으로 구성해야 합니다. 이 짧은 길이는 강의 중 10분에서 18분 정도 지나면 학생들이 집중력을 잃기 때문이다.17 사실 TED 대화는 정확히 이런 이유로 18분짜리 발표로 설계된다.18 마지막으로 요점을 요약하고 마무리하는 결론으로 마무리한다.
When constructing a lecture, it is helpful to organize it into three main parts: an introduction, content sections, and a conclusion. To highlight this organization, you should use section headers or outline slides to “signpost” each section so the audience can keep track of where you (and they) are in the lecture. These are both examples of the signaling principle, one of Richard Mayer's research-based principles for instructional design: People learn better when essential material is highlighted using an outline and headings.16 When mapping out the three main parts of your lecture, the introduction should establish a welcoming and safe climate for learning and get the audience's attention with a personal story or emotional hook. Your content should then be organized into 10- to 18-minute sections. This short length is because during a lecture, students have a lapse in attention after just 10 to 18 minutes.17 In fact, TED talks are designed as 18-minute presentations for precisely this reason.18 Finally, wrap up with a conclusion where you summarize the main points and provide closure.

슬라이드 템플릿을 선택할 때는 기본 색상 설계 원칙을 고려하는 것이 중요합니다.

  • 먼저 간단한 템플릿을 사용하여 내용을 강조 표시하되 내용을 방해하지 마십시오. 그래픽이나 패턴 위의 텍스트는 읽기가 매우 어려울 수 있으므로 배경으로 사용하지 않는 것이 현명합니다. 사진을 배경으로 사용하는 것은 때때로 좋은 터치가 될 수 있지만, 그 위에 텍스트가 거의 없을 때만 가능합니다.
  • 둘째, 어두운 색(파란색, 검은색 또는 보라색)과 밝은 색(베이지, 흰색 또는 회색)을 설정하여 대비되는 색상을 사용합니다. 배경은 밝은 색 텍스트로 어둡거나 그 반대일 수 있습니다. 그러나 미팅룸이 밝게 켜져 있으면 어두운 색 텍스트가 있는 밝은 배경은 읽기 쉽습니다.
  • 세 번째, 강한 색상은 서로 충돌하므로 서로 사용하지 마십시오(예: 밝은 빨간색과 밝은 파란색). 마찬가지로, 색맹인 청중들은 빨간색과 초록색을 함께 넣는 것을 피하세요.

When choosing a slide template, it is important to consider basic color design principles. First, use a simple template to highlight your content but not distract from it. Text over graphics and patterns can be very hard to read, so it is wise to avoid their use as backgrounds. Using a photograph as a background can occasionally be a nice touch but only if there is very little text on top of it. Second, use colors that contrast by setting dark colors (blue, black, or purple) against light ones (beige, white, or gray). Backgrounds can be dark with light-colored text or vice versa; however, if a meeting room is brightly lit, then a light background with dark text will be easier to read. Third, avoid using strong colors next to each other as these will clash (eg, bright red and bright blue). Similarly, avoid putting red and green together as members of your audience who are color-blind will have difficulty distinguishing them.

슬라이드 설계의 주요 원칙은 슬라이드의 잡음을 제한하는 것입니다. 정보의 시각적 표현에 대해 폭넓게 쓴 에드워드 터프트는 "어수선함과 혼란은 디자인의 실패이지 정보의 속성이 아니다."19 슬라이드를 빈 캔버스로 생각하며, 빈 공간에 슬라이드의 중요한 정보를 강조 표시해야 합니다. 즉, 슬라이드에 있는 양을 제한하여 외부 과부하를 제한하려고 합니다(외부 자료를 너무 많이 처리하면 학습에 방해가 됩니다. 이것이 메이어의 [응집성coherence 원칙]의 기초입니다. 사람들은 관련이 없고 관련이 없는 자료가 없을 때 더 잘 배운다.16

A key principle in slide design is to limit clutter on your slides. Edward Tufte, who has written extensively about the visual presentation of information, said, “clutter and confusion are failures of design, not attributes of information.”19 Think of your slide as a blank canvas, where the blank space should highlight the important information on the slide. In short, you want to limit how much is on the slide to limit extraneous overload (where too much processing of extraneous material interferes with learning). This is the foundation of Mayer's coherence principle: People learn better without extraneous, irrelevant material.16

전달하려는 모든 정보가 포함된 슬라이드를 만드는 동시에 응집성 원칙을 준수하는 것이 과제입니다. 이를 위한 세 가지 주요 방법을 제안합니다.

  • (1) 텍스트를 시각자료로 변환한다. 이렇게 하면 잡동사니를 피할 수 있을 뿐만 아니라 유지력도 향상됩니다. 메이어의 멀티미디어 원리는 사람들이 단어 하나에서 배우는 것보다 단어와 그림에서 배우는 것이 더 낫다는 연구로 알려진다. 예를 들어, 단어에 비주얼을 추가하는 교육 전략을 사용하면 발표 후 3일 후에 리콜을 10%에서 65%로 개선할 수 있다. 표 1에서 시각 자료를 효과적으로 사용하기 위한 여러 전략을 개략적으로 설명합니다.
  • (2) 슬라이드에 있는 텍스트의 양은 (학습 결과에 반드시 영향을 미치는 것은 아니지만) 인지 부하 증가에 기여합니다. 따라서 텍스트를 핵심 포인트로 제한한 다음 참고 섹션을 사용하여 기억하고 싶은 텍스트를 저장하는 것이 유용합니다. 이렇게 하면 깨끗한 슬라이드를 만들 수 있지만 다음 번에 강의할 때 참고할 뿐만 아니라 연습용으로 노트에도 모든 정보가 남아 있습니다.
  • (3) 마지막으로 부록 슬라이드, 유인물 또는 강의요강에 추가 정보를 입력할 수 있습니다. 유인물과 보충 자료는 특히 학습자가 자료를 다시 살펴보거나 나중에 주제를 철저히 검토할 수 있는 유용한 도구가 될 수 있습니다.

The challenge is creating a slide that contains all of the information you want to deliver but also adheres to the coherence principle. We propose three main ways to accomplish this:

  • (1) Turn text into visuals. This not only helps to avoid clutter but also improves retention. Mayer's multimedia principle is informed by research showing that people learn better from words and pictures than from words alone.16 For example, using an instructional strategy of adding visuals to words can improve recall from 10 to 65% at three days after a presentation.20 We outline a number of strategies for using visuals effectively in Table 1.
  • (2) Although the amount of text on slides does not necessarily impact learning outcomes, it does contribute to increased cognitive load.21,22 As such, it is helpful to limit the text to key points and then use the notes section to store text that you want to remember to say. In this way, you will have clean slides but still have all of the information in the notes, both for practicing as well as for reference the next time you want to give the lecture.
  • (3) Finally, you can put extra information into an appendix slide, handout, or syllabus. Handouts and supplementary materials can be particularly helpful tools that allow your learners to revisit material or have an opportunity to thoroughly examine subject matter at a later date.


텍스트에 대한 몇 가지 다른 팁은 최소 24 포인트 이상의 글꼴 크기, 가급적 큰 글꼴을 사용하고 Arial 또는 Calibri와 같은 간단한 글꼴을 사용하는 것입니다. 마지막으로 애니메이션을 신중하게 활용합니다. 특히 사용량이 많은 슬라이드 내에서 애니메이션화하는 데 도움이 될 수 있지만 슬라이드를 정리하거나 텍스트를 적게 사용할 수 있는 방법이 있는지 항상 고려하십시오. 애니메이션을 사용할 때는 나타나거나 사라지거나 하는 간단한 애니메이션 기능을 선택하고 회전, 비행 등 산만한 애니메이션을 피해야 한다.

A few other tips for text are to use at least 24-point font size, preferably larger, and to use a simple font such as Arial or Calibri. Finally, use animation thoughtfully. Although it can help to animate within a slide that is particularly busy, always consider if there is a way to de-clutter the slide or use less text. When animation is used, choose a simple animation function such as appear or disappear and avoid distracting animations like spinning and flying.

 

 

 

 

능동적 학습 기법
Active Learning Techniques

능동적인 학습을 어떻게 통합할 것인지에 대해 생각하는 동안, 안전한 학습 환경을 어떻게 조성할 것인지에 대해 잠시 생각해 보십시오. 이렇게 하는 방법 중 하나는 기대를 거는 것이다. 청중에게 무엇을 부탁할 것인지 알려주고, 그룹의 규모가 중요하다는 것을 기억하세요. 더 많은 청중들을 위해, 여러분은 청중들에게 (정답이 하나만 있는 질문을 하기 보다는) 경험을 되새겨보라고 하는 것과 같은 낮은 부담의 질문들을 제기하는 편이 낫다.
As you are thinking about how you will incorporate active learning, take a moment to think about how you will create a safe learning environment. One way to do this is to set expectations (nobody likes a pop-quiz). Let your audience know what you will be asking them to do, and remember that the size of the group matters. For larger audiences, you may want to pose lower stakes questions such as asking your audience members to reflect on an experience (rather than asking them a question that has only one right answer).

앞서 언급한 바와 같이, 주어진 청중들의 평균 주의력 지속 시간이 18분 미만이기 때문에, 적어도 15분에서 20분마다 한 번씩 적극적인 학습 활동을 통합할 계획이다.17,18 그러나, 만약 누군가가 하루 동안 여러 번 수업을 받았다면(예: 지속적인 의료 교육 과정 중)관심 범위가 훨씬 더 짧을 것으로 예상할 수 있습니다. 그러한 상황에서는, 여러분은 수업 시간, 청중, 그리고 주제에 따라 훨씬 더 자주(예: 10분마다) 능동적인 학습 기술을 통합해야 할 수도 있습니다.
As a rule of thumb, plan to incorporate an active learning activity at least once every 15 to 20 minutes because, as mentioned previously, the average attention span of a given audience member is less than 18 minutes.17,18 However, if someone has been in several teaching sessions throughout the day (eg, during a continuing medical education course), you can expect that their attention span will be even shorter. In those situations, you may want to incorporate an active learning technique even more frequently (eg, every 10 minutes) depending on the teaching session, audience, and subject matter.

다양한 능동적 학습 기법이 있어 여러분의 교육 세션을 향상시킬 수 있으며, 표 2의 다양한 기술에 대한 구체적인 사례와 실행 요령을 제공합니다.
There are a variety of active learning techniques that can enhance your teaching sessions, and we give specific examples and implementation tips for various techniques in Table 2.

 

일시 중지 절차
Pause Procedures

일시 중지 절차는 학습자가 정보를 관련, 검토, 명확화 및/또는 통합할 수 있는 기회를 제공하는 강의 중 주기적인 휴식입니다. 잠시 멈추는 동안 청중들에게 조용히 요점을 되새기거나, 질문에 대한 답변을 적어보거나, "짝꿍이 공유pair-share"를 하도록 요청할 수 있습니다. 짝을 이루는 활동은 청중들이 그들의 이웃을 바라보고, 응답을 서로 토론하는 것을 포함한다. 시간적 여유에 따라 더 큰 그룹과 논의한 내용을 공유할 것을 요청할 수도 있고 요청하지 않을 수도 있습니다. 만약 여러분이 그들에게 공유를 요청한다면, 여러분은 그들에게 명확하지 않은 프리젠테이션의 요점에 대해 논의하도록 요청하는 것을 고려해 볼 수 있습니다("가장 애매한 부분"). 정지 시간은 30초에서 3분까지이며, 유지력을 높이고 청중 만족도를 높이는 것으로 나타났습니다.23

Pause procedures are periodic breaks during lectures that allow learners an opportunity to relate to, review, clarify, and/or integrate information. During the pause, you can ask your audience to quietly reflect on a key point, jot down their response to your question, or “pair-share.” A pair-share activity involves audience members turning to their neighbor and discussing their responses. Depending on the amount of time you have, you may or may not ask them to share what they discussed with the larger group. If you are asking them to share, you can consider asking them to discuss points from your presentation that were unclear (the “muddiest points”) to offer you an opportunity to clarify concepts. Pauses can be 30 seconds to 3 minutes in length and have been shown to both enhance retention and increase audience satisfaction.23

청중 응답 질문
Audience Response Questions

이러한 절차는 일반적으로 사용되며 전용으로 고려할 가치가 있는 [일시 중지 절차]의 특정 유형입니다. 청중 응답 질문은 청중과 대화하는 데 도움이 될 수 있으며, "저기술"(how-tech)(손뼉치기) 또는 "첨단"(시청자 응답 시스템, 소프트웨어 또는 웹 기반 기술 사용)이 될 수 있습니다. 질문을 제기하는 데 필요한 시간을 고려하여 청중에게 답변을 허용한 다음 답변을 브리핑합니다. 정답과 오답 모두에 대한 추론에 대해 토론할 계획입니다.24

These are a specific type of pause procedure, which are commonly used and deserve dedicated consideration. Audience response questions can help you to dialogue with your audience and can either be “low-tech” (show of hands) or “high tech” (using an audience response system, software, or web-based technology). Be sure to consider the time allotment you will need to pose the question, allow the audience to respond, and then debrief the responses. Plan to discuss the reasoning behind both the correct and incorrect answers.24

청중 패널 참여
Audience-Panel Engagement

또 다른 기법은 청중 패널 참여 전략을 사용하여 패널 토론을 수동적 경험에서 능동적 경험으로 전환하는 것입니다. 이 기술은 전문적 학습이나 다양한 관점이 도움이 될 때 효과적입니다. 서너 명의 교수진을 패널로 초대하는 것을 고려해보세요. 강의 시간에 패널과 청중 모두에게 질문이나 시나리오를 제시하되 패널이 바로 대답하도록 내버려 두지 마십시오. 잠시 멈추고 청중들이 토론하고 답변하도록 합니다. 그런 다음, 패널들에게 답변을 하고 청중들이 그들의 대답이 어떻게 일치하는지 볼 수 있도록 하세요.25

Another technique is to turn a panel discussion from a passive experience to an active one by using the audience-panel engagement strategy. This technique works well for interprofessional learning or when a variety of perspectives would be helpful. Consider inviting three or four faculty to be on your panel. During your teaching session, pose a question or a scenario to both the panel and the audience, but do not let the panel answer right away. Pause and have audience members discuss and commit to a response. Then, have the panelists answer and allow your audience to see how their response matches up.25

소규모 그룹
Small Groups

소규모 그룹 토론 또는 브레이크아웃 세션을 규모가 작고 덜 공식적인 환경에서 사용할 수 있습니다. 청중은 사례를 토론하고 문제를 해결하며 집에서 세션의 정보를 적용하는 방법에 대한 실행 계획을 세울 수 있습니다. 이러한 소규모 그룹 토론은 주어진 주제에 대해 깊이 있게 가르칠 수 있는 유용한 도구입니다.26
Small group discussions or breakout sessions can be used in smaller, less formal environments. Your audience can discuss cases, solve problems, and perhaps formulate an action plan on how they will apply information from your session at home. These small group discussions are helpful tools to teach about a given topic in depth.26

게임.
Games

게임을 통합하는 것을 고려해야 하는 한 가지 이유는 게임이 재미있기 때문입니다. 이러한 기능은 덜 공식적인 세션에 가장 적합하며 원칙을 강화하고, 토론의 발판으로 사용할 수 있으며, 약간의 우호적인 경쟁을 장려하는 데에도 사용할 수 있습니다. 예를 들어, 관심 주제에 대한 위험 스타일의 퀴즈 게임이나 그림 기반 드로잉 게임이 있습니다. 게임에 따라 방을 소규모 그룹 또는 대규모 팀으로 나눌 수 있으며 경품도 받을 수 있습니다. 게임은 의학 교육에 널리 사용되고 있기 때문에 많은 청중들이 이미 그 개념을 잘 알고 있을 것이다.27,28
One reason to consider incorporating games is that they are fun. These are best suited for less formal sessions and can be used to reinforce principles, as a springboard for discussion, and even to encourage a little friendly competition. Examples include playing jeopardy-style quiz games or pictionary-based drawing games on the topic of interest. You can split the room into small groups or larger teams, depending on the game, and even play for prizes. Games are widely used in medical education, so many of your audience members may be familiar with the concept already.27,28

청중들의 규모와 발표의 형식은 여러분이 어떤 활동적인 학습 전략을 포함하고 싶은지 알려줄 것입니다. 예를 들어, 

  • 매우 크고 공식적인 프레젠테이션의 경우 일시 중지 절차 및 청중 응답 질문을 선택할 수 있습니다. 
  • 덜 공식적인 세션의 경우, 청중 패널 참여 활동, 소규모 그룹 토론 및/또는 게임을 포함할 수 있습니다.

The size of your audience and the formality of your presentation will inform which specific active learning strategies you may want to incorporate. For example,

  • for very large and formal presentations, you may choose pause procedures and audience response questions.
  • For less formal sessions, you may choose to incorporate audience-panel engagement activities, small group discussions, and/or games.

 

대중 연설
Public Speaking

 

기억에 남는 연사를 떠올리면, 그 혹은 그녀가 그렇게 효과적이기 위해 그렇게 효과적이었을까? 비언어적 의사소통(즉, 바디 랭귀지)과 자신감은 효과적인 프레젠테이션을 하는 데 있어 중요한 구성요소이며 프레젠테이션 수행과 교육 효과를 위해 더 높은 점수로 연결되어 있습니다.29,30 중요 구성 요소에는 다음이 포함된다.

  • [비언어적 의사소통]에는 개방적인 자세, 편안한 자세, 표현적인 몸짓, 포괄적인 아이 컨택, 따뜻한 표정 등이 포함됩니다.
  • [자신감 있는 행동]에는 눈을 잘 마주치는 것, 강한 목소리를 사용하는 것, 여유로워 보이는 것, 그리고 권위를 전달하는 태도를 가지는 것이 포함됩니다.

If you think back on a memorable speaker, what did he or she do to be so effective? Nonverbal communication (ie, body language) and confidence are important components of giving an effective presentation and have been linked to higher scores for presentation performance and teaching effectiveness.29,30 Important components of

  • nonverbal communication include an open posture, relaxed stance, expressive gestures, inclusive eye contact, and warm facial expression;
  • confident behaviors include making good eye contact, using a strong voice, appearing relaxed, and having a manner that conveys authority.30

[교사의 열정]은 또한 교육 효과와 학습자의 내재적 동기 부여 및 참여의 증가와 관련이 있다; 중요한 것은 이것이 고정된 특성이 아니라 오히려 배울 수 있는 것이다.31 열정은 다음과 같이 나타낼 수 있다.

  • 목소리 톤과 속도,
  • 움직임 사용(걷기, 시선 마주치기, 연단 뒤에 서지 않기) 및
  • 유머(자신을 알기는 하지만)

Teacher enthusiasm is also highly linked to teaching effectiveness and increasing learner intrinsic motivation and engagement; importantly, this is not a fixed characteristic but rather is something that can be learned.31 Enthusiasm can be shown by

  • varying tone and pace of voice,
  • using movement (walking around, making eye contact, and avoiding standing behind the podium), and
  • humor (although know thyself).

만약 여러분이 단상을 피할 수 없다면(예: 큰 강의실) 여전히 조금 움직이면서 단상의 옆구리를 잡지 않도록 하세요. 이것이 여러분을 긴장하게 만들 수 있기 때문입니다.
If you cannot avoid the podium (eg, in a large lecture hall), try to still move around a little and avoid gripping the sides of the podium, as this can make you look nervous.

청중을 끌어들이는 두 가지 다른 방법이 눈에 띕니다. (1) 슬라이드를 사용할 때 청중은 자연스럽게 이 방법에 끌리게 됩니다. 파워포인트를 사용할 때 슬라이드 포커스를 벗어나 스피커로 전환하려면 키보드의 'B' 키를 누르면 화면이 검게 변하며, (2) 감성적인 후크로 디테일한 스토리를 살려 붙는 스토리를 들려준다.
Two other ways of engaging the audience are notable: (1) When using slides, your audience will naturally be drawn to these. When using PowerPoint, if you want to shift the focus off your slides and onto you as the speaker, you can press the “B” key on your keyboard and it will turn your screen black. (2) Tell stories that stick by using a detailed story with an emotional hook.

많은 사람들이 연설에 대한 두려움을 가지고 있다: 사실, 한 연구에서 키, 곤충, 심지어 죽음에 대한 두려움보다 대중 연설에 대한 두려움을 더 많이 가지고 있었다.32 여러분은 연설이 얼마나 흔한지를 인식하고, 발표를 연습하며, 강연할 방을 정찰함으로써 대중 연설에 대한 두려움을 극복할 수 있다.도착해도 놀랄 일은 없습니다. 완전히 것을 알기 위해 강의를 연습하면 자신이 무슨 말을 할지 걱정하기보다는 청중들을 끌어들이기 위해 에너지를 사용할 수 있다. '슬라이드 읽기'(강사들에 대한 일반적인 비판)를 피하는 데 도움이 되고, 발표 시간을 적절하게 맞출 수 있도록 하거나, 가급적 일찍 끝낼 수 있도록 해줍니다. 여러분은 청중들을 사로잡을 입문 발언으로 강의를 강하게 시작하고자 합니다. 이것들을 연습해 보십시오. 이것은 종종 슬라이드 없이 주어지며, 여러분이 말할 것을 연습하면 청중들에게 좋은 첫인상을 줄 것입니다.
Many people have a fear of public speaking: in fact, in one study, more people were afraid of public speaking than were afraid of height, insects, and even death.32 You can overcome this fear of public speaking by recognizing how common it is, by practicing your presentation, and by scouting the room where you will be giving your lecture so there are no surprises when you arrive. Practicing a lecture so that you know it cold allows you to use your energy to engage the audience rather than worry about what you are going to say. It will help you avoid “reading your slides” (a common criticism of lecturers) and allow you to time your presentation appropriately so that you end on time or, preferably, even a bit early. You want to start your lecture strong with introductory remarks that will hook the audience—practice these. These are often given without a slide and practicing what you will say will give the audience a great first impression.

마지막으로 프레젠테이션에 대한 피드백을 받는 것이 중요합니다. 현재 많은 기관들이 공식적인 동료 교육 관찰 프로그램을 가지고 있지만, 비공식적인 피드백 또한 매우 도움이 될 수 있다. 동료나 멘토가 직접 피드백이나 비디오테이프를 주도록 하세요. 작성된 피드백을 주의 깊게 읽으십시오. 이를 통해 맹점을 식별할 수 있습니다. 예를 들어, 여러분이 알지 못할 수 있는 신체적, 언어적 매너리즘을 확인할 수 있습니다.

Finally, it is critical to get feedback on your presentation. Many institutions now have formal peer teaching observation programs, but informal feedback can also be very helpful. Have a colleague or mentor give you feedback or videotape yourself. Carefully read any written feedback you may get. This can allow you to identify blindspots: for example, physical and verbal mannerisms of which you may not be aware.

결론
CONCLUSION

효과적인 강의를 할 수 있는 능력은 의학 교육자의 도구상자에서 매우 중요한 부분입니다. 강의가 잘 진행된다면, 지속적 전문 발전에 중요한 정보를 전달하기 위한 매력적이고, 활기차고, 상호작용적이며, 효과적인 수단이 될 수 있습니다. 여기서 요약한 효과적인 프레젠테이션을 구성하고 발표하는 도구는 모두 교육 문헌에서 파생되었으며 학습, 기억, 교육 설계 및 대중 연설의 증거 기반 원칙을 포함하고 있습니다. 이 두 가지를 종합하면 효과적인 강의를 만들고, 구성하고, 발표할 때 자기 계발을 위한 체크리스트로 사용할 수 있는 루브릭을 형성합니다(그림 2).

Being able to deliver an effective lecture is a critical part of the medical educator's toolbox. The lecture, if done well, can be an engaging, vibrant, interactive, and effective means to deliver key information in continuing professional development. The tools for constructing and presenting an effective presentation that we have outlined here are all derived from the education literature and incorporate evidence-based principles of learning, memory, instructional design, and public speaking. Taken together, they form a rubric that can be used as a checklist for self-improvement when creating, organizing, and presenting an effective lecture (Figure 2).

 

 

 

 


J Contin Educ Health Prof. Winter 2020;40(1):36-41.

 doi: 10.1097/CEH.0000000000000281.

Creating and Presenting an Effective Lecture

Jennifer M Babik 1Vera P Luther

Affiliations expand

  • PMID: 32149947
  • DOI: 10.1097/CEH.0000000000000281Abstract
  • Lectures are a key tool for large group teaching in continuing professional development and continuing medical education within the health care professions. However, many practitioners who deliver lectures have not had the time or opportunity to participate in formal training on how to give an effective presentation. In this article, we will provide a comprehensive guide for creating and presenting an effective lecture. We will discuss evidence-based principles of effective teaching, slide organization and design, active learning, and public speaking.

의과대학생은 어떻게 다른사람이 자신의 자기조절학습에 영향을 준다고 인시하는가? (Med Educ, 2017)
How clinical medical students perceive others to influence their self-regulated learning
Joris J Berkhout,1 Esther Helmich,1 Pim W Teunissen,2,3 Cees P M van der Vleuten2 & A Debbie C Jaarsma4

 


도입
INTRODUCTION

학생들은 특히 임상 전 의학 교육에서 임상 의학 교육으로 전환할 때 임상 환경에서 학습하는 데 어려움을 겪기 쉽습니다. 학생들은 자신이 무엇을 기대할 수 있고 무엇을 기대하는지 이해하기 어려워 불확실성이 커질 수 있다. 기본적으로 가르치고 배우도록 설계되지 않은 임상적 맥락에서 학생들은 더 이상 정확히 무엇을 배워야 하는지 듣지 못하며are told, 스스로의 학습을 통제할 것으로 기대된다. 소위 SRL(self-reculated learning)에 참여하는 것은 의대생들에게 큰 도전입니다.
Students are prone to struggle with learning in clinical environments, especially when transitioning from preclinical to clinical medical education.1–3 Students may have a hard time understanding what they can expect and what is expected of them, resulting in high levels of uncertainty.4 In a clinical context that is not primarily designed for teaching and learning, students are no longer told what exactly to learn, and are expected to take control of their own learning.3 Being expected to engage in so-called self-regulated learning (SRL) poses a large challenge to undergraduate medical students.5 

SRL에서 개인은 원하는 수준의 역량을 달성하기 위해 [정서적, 인지적, 행동적 프로세스]를 능동적으로 조절하여 학습의 방향을 설정한다direct learning. 여기에는 목표 설정, 감정 조절, 환경 구조화, 피드백 수집 및 자기 성찰이 포함됩니다. 많은 교육자와 연구자들은 SRL이 학습에 유익하다는 것에 동의한다. Bridges와 Butler의 SRL situated model에 따르면 SRL은 개인과 학습이 이루어지는 맥락 사이의 상호작용에서 발생하는 복잡한 프로세스이다. 따라서 SRL의 프로세스와 결과에 [개인과 맥락이 모두 영향]을 미친다. 따라서 SRL은 병원과 같이 정신없고 끊임없이 변화하는 환경에서 어려운 것으로 알려져 있습니다. 
In SRL, an individual proactively modulates affective, cognitive and behavioural processes, to direct learning in order to achieve a desired level of competence.6 This includes goal setting, emotion control, environment structuring, gathering feedback and self-reflection.6,7 Many educators and researchers agree on SRL being beneficial for learning.8,9 Following Brydges and Butler’s situated model of SRL, SRL results from a complex process that happens in the interaction between an individual and the context in which learning takes place.9 Consequently, both individual and context influence the process and outcome of SRL.10 Therefore, SRL is known to be difficult in a hectic, ever-changing environment, such as the hospital.11 

역사적, 문화적, 교육학적, 물리적, 사회적 요인을 포함한 광범위한 [맥락적 요인]이 학생들의 SRL에 영향을 미치는 것으로 설명되었다. 사회문화적 관점에서 직장 기반 학습workplace-based learning은 사회적 과정이며 결과적으로 사회적 요소가 필수적입니다. 학생들의 SRL에 영향을 미치는 사회적 요인에는

  • 직장에 있는 다른 사람들,
  • (그들과) 학생의 관계,
  • (그들과) 학생의 친숙함,
  • 학생들에게 주는 피드백,
  • 학생들이 SRL에 참여하고 독립적으로 연습할 수 있는 기회를 만들려는 다른 사람들의 의지,
  • 이러한 사람들의 교육에 대한 경험과 동기부여
  • 팀에 학생들의 참여
  • 학생들이 팀으로부터 받는 사회적 지원. 

A broad variety of contextual factors, including historical, cultural, pedagogical, physical and social factors, have been described to influence students’ SRL.6,11–15 From a socio-cultural perspective, workplace-based learning is a social process and consequently social factors are essential.16 Social factors that have been described to influence students’ SRL include

  • other people in a workplace,
  • students’ relationships with them,
  • students’ familiarity with them,
  • the feedback they give to students,
  • the willingness of other people to create opportunities for students to engage in SRL and practice independently,
  • these peoples’ experience in and motivation for teaching,
  • the engagement of students in the team and
  • the social support students receive from the team.9,11,13

이전의 연구는 학생들이 임상 환경에서 자신의 성과를 비교하고 정체성을 개발하기 위해 또래를 사용하는 방법 등 클리닉에서 학생들의 학습에 영향을 미치는 사회적 요인의 구체적인 측면에 초점을 맞추었다. 그러나 목표 설정, 다양한 규제 메커니즘 및 규제 평가를 포함하여 임상 환경에서 다른 사람들이 자율 규제 학습 과정에 어떻게 영향을 미치는지에 대한 연구는 없는 것으로 알고 있다.6 

Previous research has focused on specific aspects of social factors that influence student learning in a clinic, such as how students use peers to compare their performance and develop an identity in a clinical environment.17–19 However, to our knowledge there have not been any studies on how others influence the process of self-regulated learning in clinical settings, including goal setting, various regulatory mechanisms and regulatory appraisals.6 


본 연구에서는 특히 학생들의 SRL에 영향을 미치는 임상 환경의 사람들이 누구인지, 이러한 사람들이 어떤 영향을 미치는지, 어느 정도인지에 대해 관심을 가졌다.
In this study we were specifically interested in: who are the people in a clinical environment affecting students’ SRL, how these people have an influence and to what extent.


방법
METHOD


설계 Design

우리는 현실이 주관적이고 맥락에 특정하며 궁극적인 진실은 없다고 믿고 [구성주의 패러다임]에 우리 스스로를 위치시킨다.24 SRL 참여에 영향을 미치는 관계에 대한 참가자의 관점을 체계적으로 분석하기 위해 근거 이론 방법론에서 질적 연구 차입 방법을 수행했으며, 목적적 샘플링을 사용하여 이론적 충분성에 도달할 때까지 반복적으로 데이터를 수집 및 분석하였다. 우리는 학생들이 자유롭게 자신의 개인적인 경험을 상세히 설명할 수 있는 안전한 환경을 만들기 위해 데이터 수집에 대한 개별 접근 방식을 선택했습니다.
We position ourselves in a constructivist paradigm, believing that reality is subjective and context-specific and that there is no ultimate truth.24 We carried out a qualitative study borrowing methods from grounded theory methodology in order to do a systematic analysis of participants’ perspectives on relationships that are influential in their engagement in SRL, using purposive sampling and iteratively gathering and analysing data until theoretical sufficiency was reached.25 We chose an individual approach for the data collection to create a safe environment in which students would feel free to elaborate on their personal experiences. 

세팅 Setting

우리는 매년 350명의 코호트에 입학하는 네덜란드의 한 의과대학의 의대생을 모집했다. 의료 커리큘럼에는 임상 전 단계(1~3년)와 임상 단계(4~6년)가 포함된다. 임상 단계는 3주에서 16주 사이의 순환 임상실습으로 구성됩니다. 이러한 임상실습에서 의대생들은 환자 진료와 관련된 다양한 활동에 참여합니다. 모든 학생은 비슷하게 지원받고 세심한 감독을 받는다.
We recruited medical students from one large Dutch medical school with entering cohorts of 350 students per year. The medical curriculum includes a preclinical phase (years 1–3) and a clinical phase (years 4–6). The clinical phase consists of rotational clerkships ranging from 3 to 16 weeks. During these clerkships, medical students participate in a wide range of activities regarding patient care. All students are supported similarly and are closely supervised.

참여자 Participants

다양한 경험을 보장하기 위해 참가자들에게 연령, 성별, 경력 및 현재 임상실습과 관련된 의도적 표집을 실시하였다.
To ensure a wide variety in experiences, the participants were purposively sampled regarding age, gender, experience and current clerkship.

우리는 14명의 학생들을 포함했다. 참가자에 대한 자세한 내용은 표 1에 나와 있습니다. 면접이 끝난 후 참가자들은 시간 보상으로 10유로의 상품권을 받았다.
We included 14 students. Details of the participants are given in Table 1. After the interview, participants were given a €10 gift certificate as compensation for their time.

자료 수집 Data collection

첫 번째 저자가 모든 인터뷰를 진행했습니다. 그는 최근에 임상실습들을 직접 경험했기 때문에 학생들의 이야기를 공감하고 그들의 경험을 구상할 수 있었다. 
The first author conducted all the interviews. Because he has recently experienced the clerkships himself, he was able to relate to the students’ narratives and envision their experiences. 

첫 번째 저자의 SRL 연구 경험은 Sitzmann과 Ely가 설명한 다양한 SRL 이론과 관련된 구조에 대한 구체적인 질문을 가능하게 했다. 부정적 영향은 후속 질문의 초점이 너무 맞추어져 있거나 개인적 경험에 의해 채색되어 있는 것일 수 있다.

The first author’s experience in SRL research allowed for specific questions regarding constructs related to various SRL theories as described by Sitzmann and Ely.6 A possible adverse effect might have been that follow-up questions were too focused or coloured by personal experiences.

면접관은 인구통계 및 의료적 이해관계에 대한 사전동의배경정보를 얻은 후 자기조절학습은 [목표설정, 계획, 모니터링, 진척상황 반성, 미래학습에 대한 생각을 통해 스스로 학습 방향을 지시하는 것]을 의미한다고 간략히 설명했다. 다음으로, 그는 참가자들에게 킹 외 연구진들이 묘사한 픽터 기법에 따라 특정한 환경에서 다른 사람들의 역할과 관계를 표현하도록 요청하였다. 학생들은 자율 학습에 영향을 미치는 모든 사람이나 집단을 화살표 모양의 접착식 노트에 기록하고 이 노트를 큰 종이에 붙여 화살에 그려진 사람들에게 영향을 받은 SRL의 시각적 표현이나 이야기를 작성하도록 지시받았다. 참가자들은 그들의 경험을 묘사하는데 있어서 어떤 면에서도 제한되지 않았다. 이들은 설명 단어, 화살표 또는 기타 시각적 도구를 포함하도록 요청받았으며 인터뷰 내내 픽터 차트를 변경할 수 있었습니다. 우리는 참가자들이 말뿐만 아니라 시각적으로도 이야기를 할 수 있도록 시각적 표현을 활용했습니다. 픽터 차트 작성 후 진행된 인터뷰는 약 1시간 동안 진행되었습니다. 
After obtaining informed consent and some background information regarding demographics and medical interests, the interviewer briefly explained that self-regulated learning refers to directing ones’ own learning through goal setting, planning, monitoring, reflecting on progress and thinking about future learning. Next, he asked participants to construct a representation of roles and relationships of other people in a specific setting following the Pictor technique as originally described by King et al.23 Students were instructed to write all people or groups influencing their self-regulated learning on arrow shaped adhesive notes and to stick these notes to a large sheet of paper, creating a visual representation or story of how their SRL was influenced by the people depicted on the arrows. Participants were not limited in any way in portraying their experiences. They were invited to include explanatory words, arrows or other visual tools and were allowed to change their Pictor chart throughout the interview. We used the visual representation as a prompt to help participants tell their stories not only through words but also visually. The interviews following the creation of the Pictor charts lasted for approximately 1 hour. 

인터뷰는 음성녹음 후 전사되었다. 우리는 모든 학생들에게 가명을 주었다. 첫 번째 작성자는 인터뷰가 끝날 때마다 예비 분석을 실시했으며, 참가자들에게 member check이 가능하도록 인터뷰 요약을 반 페이지씩 제공했다. 참가자들은 또한 차트 사진을 받았고, 추가적인 변화가 필요한지 질문을 받았다. 

The interviews were audio-recorded and transcribed verbatim. We gave all students an alias. The first author performed a preliminary analysis after each interview and provided participants with a half-page summary of the interview to enable a member check. Participants also received a picture of their charts and were asked if any supplemental changes were desired. 

자료 분석 Data analysis

각 인터뷰가 끝난 후 첫 번째 저자(JB)는 스크립트와 픽터 차트를 모두 지속적인 비교를 통해 개방코딩하였고, 스크립트와 픽터 차트의 데이터를 검토하고 일치시키고자 했다. 인터뷰 기록과 픽터 차트는 오픈 코딩을 사용하여 지속적으로 유도적으로 비교되었습니다. 새로운 개념을 사용하여 다른 참가자들과의 다음과 같은 인터뷰를 안내했습니다. 개방 코딩  이후 축 코딩 및 해석 분석이 수행되었습니다. 
After each interview, the first author (JB) open coded both the transcripts and the Pictor charts using constant comparison to review and match the data in the transcript and Pictor chart. The interview transcripts and Pictor charts were constantly inductively compared using open coding. Emerging concepts were used to guide the following interviews with other participants. Open coding was followed by axial coding and interpretive analysis. 

첫 번째 및 두 번째 저자(JB 및 EH)는 4개월의 기간 동안 격주로 분석의 대본, 픽터 차트 및 새로운 개념에 대해 논의했습니다. 또한, 분석 및 작성이 진행되는 동안 새롭게 떠오른 아이디어와 흥미로운 발견에 대해 연구 그룹과 총 6회에 걸쳐 논의했습니다. 우리의 해석을 추적하기 위해, 첫 번째 저자는 메모와 새로운 아이디어와 개념을 모두 기록할 수 있는 일지를 작성했습니다. 브리지와 버틀러에 의한 SRL의 위치 사회문화 이론과 SRL에 관련된 구성을 분석의 sensitizing concept으로 사용했으며, Sitzmann과 Ely의 메타 분석에서 보고되었다.
The first and second author (JB and EH) discussed the transcripts, Pictor charts and emerging concepts of the analysis biweekly during a period of 4 months. Additionally, we discussed the emerging ideas and interesting findings with the research group during the analysis and writing-up, six times in total. To keep track of our interpretations, the first author kept memos and a log to record all emerging ideas and concepts. We used the situated sociocultural theory of SRL by Brydges and Butler and the constructs involved in SRL as reported in Sitzmann and Ely’s meta-analysis, as sensitising concepts supplementary to our analysis.6,9,26


Ethical considerations

결과
RESULTS


사람들은 역할 명확화, 목표 설정, 학습 기회, 자기 성찰, 감정 대처에 영향을 미침으로써 학생들의 SRL에 영향을 미칠 수 있습니다. 경험이 많은 학생들 중 다수는 임상실습을 거치면서 직장 내 다른 사람들의 역할과 관계에 대한 인식에 큰 변화를 느꼈다고 표현했습니다. 

People could influence students’ SRL through affecting role clarification, goal setting, learning opportunities, self-reflection and emotional coping. Many of the more experienced students expressed that they perceived large changes in their perceptions of the roles of, and relationships with, others in the workplace as they progressed through the clerkships. 


임상실습 초기 학생
Novice students in clerkships

초보 학생은 [핀볼이 핀볼 기계로 발사되는 것]을 비유적으로 특징 지을 수 있다. 학생들은 임상실습으로 옮겨졌고 뚜렷한 궤적 없이 임상 환경에서 앞뒤로 움직였으며, 이는 말론의 픽터 차트(그림 1)에 나타나 있습니다. 그는 지식이 보통 컨설턴트로부터 전공의들을 통해 자신에게로 흘러간다고 어떻게 생각하는지 묘사했다. 이 과정에서 많은 사람들이 그와 상호작용했고 양방향 화살표로 시각화된 그의 SRL에 영향을 주었다. 그의 Pictor 차트는 얼마나 많은 초보 학생들이 레지던트 및 동료들과 긴밀한 관계를 맺고 있는지를 보여줍니다. 임상 환경에서 환자, 간호사, 컨설턴트 등 타인이 초보자 SRL에 미치는 영향은 훨씬 작았다. 따라서 우선 레지던트들과 또래들이 초보 학생들의 SRL에 어떤 영향을 미쳤는지를 먼저 살펴보고, 이후에는 컨설턴트, 간호사, 환자가 어떤 영향을 미칠 수 있는지에 초점을 맞출 것이다. 
A novice student metaphorically can be characterised by a pinball being shot into a pinball machine. Students were launched into clerkships and they bounced back and forth in a clinical setting without a clear trajectory, which is illustrated by the Pictor chart of Marlon (Fig. 1). He portrayed how he perceived that knowledge usually flows from consultants through residents to him. During this process, many people interacted with him and influenced his SRL, visualised by the bidirectional arrows. His Pictor chart illustrates how many novice students describe having close relationships with residents and with peers. The influence of others, such as patients, nurses and consultants, in a clinical environment on novice students’ SRL was much smaller. We will therefore first focus on how residents and peers influenced novice students’ SRL and afterwards on the influence consultants, nurses and patients could have. 

초보자 학생들의 SRL에는 대부분의 시간을 함께 보내는 사람인 전공의들이 결정적인 역할을 했다. 전공의는 SRL의 측면을 용이하게 할 수 있다. 레지던트는

  • 초보자 학생들이 어떤 목표를 세워야 할지 결정할 수 있도록 도와줌으로써 초보자 학생들의 목표 설정에 영향을 미쳤고,
  • 질문을 던짐으로써 반응적 on-the-spot 학습을 자극했으며,
  • 학생들에게 피드백을 주고 간단한 질문(오늘 무엇을 배웠나요?)으로 성찰을 자극했기 때문에 자기 성찰에 중요한 역할을 했다. 

Residents played a decisive role in novice students’ SRL because they are the people students spend most of their time with. Residents could facilitate aspects of SRL. Residents

  • influenced novice students’ goal setting through helping students decide what goals they should be working on,
  • stimulated reactive on-the-spot learning through the questions they asked, and
  • played an important role in aiding self-reflection because they gave feedback to students and stimulated reflection by simple questions such as: What did you learn today?

 

 

초보자 학생들은 [자신의 역량에 대한 자기평가 기준]으로 [전공의의 행동과 역량]을 어떻게 활용했는지를 설명하였다. 많은 초보자 학생들이 전공의로서 기능을 발휘하는 것이 얼마나 큰 목표였는지를 보여준다. 

Novice students explained how they used residents’ behaviours and competencies as a standard of reference for self-assessment of their own competencies, indicating how a major goal of many novice students was to be able to function as a resident. 

[동료peers]들은 많은 초보 학생들의 SRL에서 중요한 역할을 한 또 다른 그룹의 사람들이었다. 전공의와 마찬가지로 동료들도 SRL의 모든 측면을 촉진할 수 있다. 초보자 학생들이 새로운 역할에 대한 불확실성에 직면하고 그들에게 무엇을 기대해야 할지 모를 때, 그들은 종종 더 경험이 많은 또래들에게 그들을 안내해 달라고 부탁했다. 기본적인 소개 외에도, [무엇이 현실적인 학습목표]가 될 수 있는지, 특정 부서에서 구체적으로 해야 할 일과 하지 말아야 할 것에 대한 생각을 주었습니다. 학생들은 동료들에게 도움을 요청하는 데 있어 낮은 장벽을 경험했으며, 동료들은 서로에게 질문을 함으로써 반응적 현장 학습을 촉발할 수도 있습니다. 일부 고성능 동료는 역할 모델 역할을 할 수도 있습니다. 마지막으로 또래들은 사회적 비교를 통해 자기평가 기준을 정하고 질문을 통한 성찰을 자극하는 등 SRL의 자기성찰 과정에서 전공의들과 유사한 역할을 했다. 여기에 더해 또래들은 임상환경에서의 경험으로 인한 감정반응에 대처하는데 도움을 줄 수 있기 때문에 초보자 학생들의 SRL에서 독특한 역할을 했다. 또래와 정서적 경험을 나누는 것은 사회적 지지의 중요한 원천으로 경험되었다. 그러나 일부 학생들은 경쟁심을 느껴 SRL을 방해하는 또래 학생들도 있다고 보고했다. 
Peers were the other group of people who played an important role in many novice students’ SRL. Similar to residents, peers could also facilitate all aspects of SRL. When novice students faced uncertainty in their new roles and were unclear of what was expected of them, they often asked more experienced peers to show themaround. Besides a basic introduction, this gave themsome idea of what realistic learning goals may be and the specific dos and don’ts of the department. Students experienced a low barrier to asking peers for help, and peers could also trigger reactive on-the-spot learning by asking each other questions. Some high-functioning peers could even serve as role models. Lastly, peers played a similar role to residents in the self-reflection process of SRL by setting a standard of reference for selfassessment through social comparison and by stimulating reflection through questions. Additionally to this, peers played a unique role in novice students’ SRL because they could assist in coping with emotional reactions resulting fromexperiences in a clinical environment. Sharing emotional experiences with their peers was experienced as an important source of social support. However, some students also reported peers hindering their SRL because they experienced a feeling of competition. 


또한 픽토 차트에서 초보자 학생들은 그들의 SRL에 영향을 미치는 것으로 컨설턴트, 간호사, 환자를 언급했지만, 그 정도는 덜했다.

  • 초보자 학생들은 컨설턴트와 거의 접촉하지 않았다고 설명했지만, 컨설턴트는 초보자 학생들에게 자신이 할 수 있는 목표에 대해 알려줄 수 있었다.
  • 목표 설정 외에도 컨설턴트와 간호사가 안전한 학습 환경긍정적인 분위기를 조성하고 학생들이 팀에 참여하는 데 중요한 역할을 했습니다. 이것은 초보 학생들의 SRL 전략을 촉진시켰는데, 이는 그들이 실수를 저지르고, 질문을 하고, 학습 기회를 만들고, 피드백을 구할 수 있게 해주었기 때문이다.
  • 초보 학생들은 컨설턴트나 간호사 등 다른 사람들을 관찰하며 배우기도 한다. 이 롤모델 함수는 메건의 인용문에 예시되어 있습니다.
  • 환자의 문제가 학습 기회의 내용을 결정했기 때문에, 환자의 영향은 학습 기회에 영향을 미치는 것으로 제한되었습니다. 컨설턴트와 간호사의 질문과 마찬가지로 환자와 그 가족의 질문도 반응적 현장 학습을reactive on-the-spot learning 시작할 수 있다.

In their Pictor charts novice students also referred to consultants, nurses and patients as influencing their SRL, but to a lesser extent.

  • Consultants could instruct novice students about the goals they could be working on, although novice students explained that they rarely had contact with consultants.
  • Besides goal setting, consultants and nurses played an important role in creating a safe learning environment and a positive atmosphere and engaging students in the team. This facilitated novice students’ SRL strategies because this permitted themto make mistakes, ask questions, create learning opportunities and seek feedback.
  • Novice students also learned by observing others such as consultants and nurses. This role model function is exemplified in the quote by Megan.
  • A patient’s influence was limited to affecting learning opportunities because a patient’s problemdetermined the content of learning opportunities. Questions from patients and their families, similar to questions from consultants and nurses, could also initiate reactive on-the-spot learning. 



경험이 쌓인 임상실습생
Experienced students in clerkships

초심자novice 학생을 핀볼머신의 핀볼로 특징지을 수 있다면, 경험 많은experienced 학생은 내리막길을 굴러가는 눈덩어리라고 생각할 수 있다. 이 학생들은 학습의 궤적이 명확해지면서 구르면서 더욱 강력해지고, 중요한 장애물만이 그들의 진로에서 벗어나게 만든다고 설명했습니다. Laci의 Pictor 차트(그림 2)는 이를 시각적으로 보여줍니다. 화살에 근접해 있다는 것은 그녀가 자신의 SRL에 도움이 되는 의사 보조원이나 간호사 등 많은 다른 사람들을 어떻게 인식했는지를 나타냅니다. Laci의 Pictor 차트는 Marlon의 차트보다 더 체계적이며 그녀가 임상 환경을 이해하고 임상 팀의 진정한 구성원처럼 느꼈던 방식을 상징합니다.

If novice students can be characterised as pinballs in a pinball machine, experienced students can be thought of as snowballs rolling downhill. These students explained a clear trajectory in their learning, becoming more powerful whilst rolling, and that only significant obstacles could deviate them from their path. The Pictor chart of Laci (Fig. 2) illustrates this visually. The proximity of the arrows to herself portrays how she perceived many others, such as physician assistants and nurses, to be beneficial to her SRL. Laci’s Pictor chart is also more structured than Marlon’s and symbolises how she understood the clinical environment and felt like a true member of the clinical team. 

그녀는 자신의 그림 차트에 있는 모든 사람들을 자신의 학습에 유익하게 사용하는 전략을 논의했습니다. 이러한 전략들 때문에, 일반적으로 한 사람single person이 SRL에 미치는 영향은 초보 학생들에 비해 작았다. 경험 많은 학생들은 종종 어떤 의사가 되고 싶은지 분명한 목표를 가지고 있었습니다. 목표 설정을 돕기 위해 동료가 필요하지 않았지만 컨설턴트의 도움에 더 의존하여 적절한 학습 기회를 창출했습니다. 이는 말론의 차트와 비교했을 때 라시의 픽터 차트에 잘 나타나는데, 이는 동료와 자신의 화살표 사이의 거리가 더 큰 반면 컨설턴트를 나타내는 화살표는 자신과 더 가깝고 다른 전문 분야의 컨설턴트도 언급되기 때문이다. 초보생과 같은 순서로 레지던트, 또래, 컨설턴트, 간호사, 환자 등의 역할을 논의한다. 
She discussed having strategies to use all people in her Pictor chart to benefit her learning. Because of these strategies, the influence a single person had on her SRL in general was smaller than for novice students. Experienced students often had a clear objective of what kind of doctor they wanted to become. They did not need peers to help with goal setting, but were more dependent on the help of consultants to assist them in creating adequate learning opportunities. This is illustrated in Laci’s Pictor chart, compared with Marlon’s chart, as the distance between the arrow representing peers and her own is larger, whereas the arrows representing consultants are closer to her own and consultants of other specialties are also mentioned. We will discuss the roles of residents, peers, consultants, nurses, patients and others in the same order as for the novice students. 


(Novice와 비교했을 때) Experienced student에게는 전공의의 역할이 달랐다. 왜냐하면 이들은 전공의를 near-peers로 생각하기 시작했기 때문이다. 이로 인해 전공의는 SRL의 모든 측면에 영향을 미치지만, 경험 많은 학생의 SRL에 결정적이지는 않았다. 또한, 전공의들은 정서적 경험에 대처하는 것을 지지할 수 있고 사회적 지원의 감정을 조성할 수 있다. Experienced 학생들은 또한 그들의 개인적인 목표를 전공의들과 공유할 가능성이 더 높았다. 이는 전공의들이 최근 비슷한 상황에 처했을 가능성이 높기 때문에 특정 목표에 도달하기 위한 효과적인 전략을 제공할 수 있다는 것을 깨달았기 때문이다. 인터뷰에서 (experienced) 학생들은 전공의들이 [학생들에게 해야 하거나 배워야 하는 것을 지시하는 것]이 아니라, (경험 많은 학생들에게는) SRL을 지원하기 위해 필요한 [자율성과 책임을 제공하는 것]이 중요하다고 강조했다. 
The role of residents is different for experienced students compared with novice students, because experienced students started to regard residents as near-peers. This resulted in residents affecting all aspects of SRL, but not being decisive in the SRL of experienced students. Additionally, residents may also support coping with emotional experiences and may create a feeling of social support. Experienced students were also more likely to share their personal goals with residents. This was because they realised the residents might be able to provide effective strategies to reach certain goals, as residents were likely to have recently been in a similar situation. In the interviews, students emphasised that it was important that residents provided experienced students with the autonomy and responsibilities they require in order to support their SRL, instead of just directing what students had to do or learn. 


초보 학생들과 마찬가지로 경험 많은 학생들도 SRL을 위해 또래들을 자주 이용했다. 피어는 SRL의 모든 측면에 영향을 줄 수 있지만 그 영향은 작았다. 또래 학생들은 목표 설정에 큰 영향을 미치지 않았고, 경험 많은 학생들은 임상 환경의 정서적 경험에 대처할 수 있었기 때문에 정서적 지지의 필요성이 적었다. Jennifer가 설명했듯이, 동료들은 예를 들어, frame of reference로 기능함으로써, experienced students의 SRL에 상당한 영향을 미친다influential role. 
Similar to novice students, experienced students also frequently used peers for their SRL. Peers could influence all aspects of SRL, but their influence was smaller. Student-peers did not have a large influence on their goal setting and experienced students were able to cope with the emotional experiences of a clinical environment; therefore, the need for emotional support was smaller. Peers do have an influential role in experienced students’ SRL, for instance by functioning as a frame of reference, as Jennifer explained. 


Experienced students는 (초보 학생의 SRL에 있어서) 레지던트 역할을 부분적으로 수행했기 때문에, 컨설턴트의 역할이 초보자보다 훨씬 컸다

  • 컨설턴트는 목표 설정에는 거의 영향을 미치지 않았지만 학생들에게 가장 흥미롭고 도전적인 학습 기회를 부여할 수 있는 전문가로 평가되어 학습 기회와 전략에 큰 영향을 미쳤다. 컨설턴트와 전공의들은 [경험 있는 학생들의 SRL을 위한 기회]에 큰 영향을 미쳤다.
  • 대부분의 경험 많은 학생들은 컨설턴트, 레지던트, 동료들이 만든 [학습 환경의 안전성에 대한 의존도가 낮다]고 설명했다.
  • 원하는 것이 무엇인지 알고 있기 때문에, 필요하다고 느낄 때 집중적인 피드백을 요청하였으며, [평가보다는 학습에 더 신경]을 쓴다고 설명했다.
  • 경험이 많은 학생들은 동기부여가 낮은 컨설턴트, 레지던트, 또래, 간호사들이 자신들이 쏟는 노력을 방해할 수 있지만, [학생 스스로 본질적인 동기부여와 목표, 학습전략을 가지고 있다]고 설명했다.
  • 특히 많은 경험 많은 학생들의 SRL은 자율감, 목표와 함께 책임감 증가, 자극적인 사람들에 둘러싸여 있다는 느낌이었다. 

The role of consultants in the learning of experienced students was much bigger than for novice students because they partially fulfill the role residents’ play in novice students’ SRL.

  • Consultants had little influence on goal setting, but had a large impact on learning opportunities and strategies because consultants were regarded as experts who could grant students the most interesting and challenging learning opportunities. Together, consultants and residents had a major influence on experienced students’ opportunities for SRL.
  • Most experienced students described a smaller dependence on the safety of the learning environment created by consultants, residents and peers.
  • Because they knew what they wanted, they would ask for focused feedback when they felt they needed it, and explained that they cared more for learning than assessment.
  • Experienced students explained that consultants, residents, peers and nurses with low motivation could hinder the amount of effort they put in, but that students themselves still had their own intrinsic motivation, goals and learning strategies to rely on.
  • Especially important for many experienced students’ SRL was a feeling of autonomy, getting increasing responsibilities in line with their goals, and being surrounded by stimulating people. 

 

초보자에 비해, 임상환경에서 (간호사, 기획담당자 등) 타인이 Experienced students의 SRL에 미치는 영향은 크다. 경험이 많은 학생들은 [임상 팀의 일원]으로서 더 많은 것을 느꼈고 SRL 전략에 [다른 사람들을 참여시키는 방법]을 배웠습니다. 경험이 많은 학생들은 동료, 컨설턴트, 간호사를 포함한 많은 다른 학생들과 목표를 공유하며 자신의 지식을 사용하여 목표를 달성하기 위해 어떤 전략을 사용할지 논의합니다. 

The influence of others, such as nurses and the people in charge of the planning, on experienced students’ SRL in a clinical environment is large in comparison to novice students. Experienced students felt more a part of a clinical team and knew how to involve others in their SRL strategies. Experienced students would share their goals with many others, including peers, consultants and nurses, using their knowledge to discuss which strategy to use to achieve their goals. 


초보자에서 숙련된 학생으로 전환
Transitioning from novice into an experienced student

자신의 임상실습을 돌아보며, 많은 경험 많은 학생들은 그들이 어떻게 변했는지를 설명했는데, 그 이유는 [그들 스스로 자신의 학습에 대해 통제해야 한다는 것]을 깨달았기 때문이다. [학습의 주도권]을 쥐게 되면서 학습 목표에 더욱 집중하게 되고, 보다 효율적인 학습 전략을 사용하며, 학생들이 필요하다고 느끼는 역량을 성취하는 데 대한 피드백을 요청하게 되었다. 학생들이 이 과정을 설명하는 방법에는 여러 가지가 있었다. 많은 경험 많은 학생들은 임상실습에서 3~6개월을 보낸 후 이런 일이 일어났다고 설명했다. 
Looking back on their clerkships, many of the experienced students explained how they had changed because they gradually realised they needed to take control of their learning. Taking control of one’s learning led to more focused learning goals, using more efficient learning strategies, and asking for feedback on achieving the competencies students felt they needed. There were multiple ways students described this process. Many experienced students explained that this happened after 3–6 months in the clerkships. 

  • 그 시점에 그들은 자신이 어떤 의사가 되고 싶은지 깨닫기 시작했고, 그에 따른 학습 목표를 설정했다. 
  • 그들은 임상 환경에서 더 편안함을 느꼈고, 자신들이 '방해꾼'이 아닌 임상 팀에 부가가치가 될 수 있다는 것을 깨달았다
  • 많은 학생들은 정서적 임상 상황에 대처하기 위한 효과적인 전략을 가지고 있다고 설명했습니다. 
  • 그들은 [질문을 하고, 학습 기회와 피드백을 요청함으로써] 더 자주 학습에 많은 사람들을 참여시켰습니다.
  • 이들은 컨설턴트와 대화할 때 위계적 장벽을 덜 느꼈고, 전공의들은 더 이상 우상화되지 않았으며, 종종 더 경험이 많은 동료로 여겨지기도 했다.

 

  • At that point they started to realise what type of doctor they wanted to become and set learning goals accordingly.
  • They felt more comfortable in a clinical environment and realised they could be of added value to a clinical team, instead of being a ‘nuisance’.
  • Many students described having effective strategies to cope with emotional clinical situations.
  • They frequently involved many people in their learning by asking questions, and asking for learning opportunities and feedback.
  • They experienced less of a hierarchical barrier when talking to consultants and residents were no longer idolised, but often seen as more experienced near-peers.



고찰
DISCUSSION

본 연구는 역할 설명, 목표 설정, 학습 기회, 자기 성찰, 정서 대처에 영향을 미침으로써 임상 환경에서 다른 사람들이 학부생들의 SRL에 어떻게 영향을 미치는지 통찰합니다. 
Our study provides insight into how other people influence undergraduate medical students’ SRL in a clinical environment through affecting role clarification, goal setting, learning opportunities, self-reflection and emotional coping. 

[초보자]로서, 학생들의 사회적 맥락은 그들이 함께 일하는 의료팀에만 국한된다. 그 결과, 초보자 학생들의 SRL은 종종 [전공의과 동료들의 지원에 크게 의존]한다. 이것은 그들과 상호작용하는 누군가에 의해 쉽게 영향을 받을 수 있으며, 따라서 그들의 SRL은 종종 [핀볼과 같은 예측 불가능한 궤적]을 가질 수 있다. 
As novices, students’ social contexts are limited to the medical teamthey work with. As a result, novice students’ SRL often heavily relies on the support of residents and peers. It can be easily affected by anyone interacting with them, and therefore their SRL may often have the unpredictable trajectory of a pinball. 

[경험이 많은 학생들]은 임상 환경에 대한 이해가 더 높기 때문에, 사회적 맥락을 더 잘 탐색하고 특정 목표에 도달하는 데 도움을 받을 수 있습니다. 이러한 학생들이 임상 환경에서의 학습을 파악해나가고, 자신의 역할이 무엇인지 알고, 자신이 되고자 하는 사람이 누구인지 알게 되기 때문에 SRL이 더 잘 이뤄진다.
experienced students appear to be able to enhance their understanding of a clinical environment, enabling themto better navigate the social context and find support in reaching specific goals. Their SRL is further supported as these students get a grasp of learning in a clinical environment, knowing what their role is, and knowing who they want to become. 

학생들이 다른 사람들이 자신의 SRL에 영향을 미친다고 인식하는 방식은 문화, 교육학, 사회 환경을 다르게 해석하는 데서 비롯되는 것으로 보인다.

  • 초보 학생들은 자신의 역할에 대한 이해가 부족하여 임상 직장 문화를 탐색하지 못하는 경우가 많습니다. 초보 학생들은 다른 사람들이 자신의 학습에 적극적으로 관여하기를 기대합니다. 초보 학생 스스로가 SRL에 자주 교류하는 사람들만 적극적으로 참여시킨다.
  • 반면에 경험 많은 학생들은 함께 일하는 많은 사람들과 관계를 쌓기 위해 노력했습니다. 그들은 컨설턴트를 그들의 학습에 관여시키고, 그것으로부터 이익을 얻으려고 더 적극적으로 노력했습니다. 

How students perceive others to influence their SRL seems to result from interpreting culture, pedagogy and a social environment differently.

  • Novice students are often unable to navigate a clinical workplace culture because of a lack of understanding of their role in it. Novice students expect others to actively engage in their learning. Novice students themselves only actively involve people they have frequent interactions with in their SRL.
  • Experienced students on the other hand tried to build relations with many people they worked with. They more actively tried to engage consultants in their learning and benefit from it. 



초보 학생들은 [자신의 added value가 거의 없거나, 심지어 임상 팀에 성가신 존재라는 느낌] 때문에 SRL이 방해를 받는다고 보고했다. 이러한 느낌은 그들의 전임상 교육에서 비롯될 수 있으며, 한 개인의 SRL은 [역사와 경험의 영향]을 받기 때문에, 이 학생들이 역사적으로 어떻게 학습하도록 훈련받았는지를 반영한다. 초보 학생들은 이런 감정적인 스트레스를 다루기 힘들어했는데, 이는 스스로를 unwanted한 사람으로 느끼게 했기 때문이다. 그들은 이러한 감정이 SRL을 하려는 동기를 감소시킬 수 있으며, 이러한 감정을 극복하기 위해서는 동료들의 정서적인 지원이 필요하다고 설명했다. 하지만 학생들 사이에 경쟁이 느껴진다면feeling of competition 또래들의 [정서적 지지]가 억제될 수 있다. 

Novice students reported their SRL to be hindered by a feeling of being of little added value or even being a nuisance to a clinical team. This feeling may be founded in their preclinical education and reflect how they are historically trained to learn, as a person’s SRL is influenced by history and experiences.9 Novice students had difficulty coping with this emotional stress because it made them feel unwanted. They explained that this could decrease their motivation for SRL and required emotional support from peers to overcome these feelings. Emotional support by peers could be inhibited if there was a feeling of competition among students. 


강점과 한계
Strengths and limitations

교육 및 연구 함의
Implications for practice and future research


우선, 우리의 연구 결과는 초보 학생들이 새로운 환경에서 완전히 자율적으로 학습하기를 기대하는 것이 많은 사람들에게 매우 어려울 수 있다는 믿음을 강화합니다. 따라서 초보자도 타인의 적극적인 지원으로 효익을 얻을 수 있다. 또한 초보 학생들은 컨설턴트와 거의 교류하지 않는 것으로 나타났습니다. 따라서 이러한 맥락에서 개발 이니셔티브는 전공의가 학생의 SRL을 효과적으로 지원할 수 있도록, 전공의에게 더 잘 초점을 맞출 수 있다. 임상 환경에서 학생의 학습에 대한 [전공의와 동료의 중요성]은 역할 모델링 및 사회적 비교에 대해 이전에 설명되었습니다. 우리의 결과는 (특히 초보자 학생들에게) 이러한 중요성을 더욱 강조합니다. 왜냐하면 학생들이 [또래와 전공의들이 목표 설정, 기회, SRL 전략 및 자기 성찰에 가장 큰 영향을 미친다]고 보고했기 때문입니다.

First of all, our findings strengthen the belief that expecting novice students to fully self-regulate their learning in a new environment may be very difficult for many. Thus, novices may benefit fromactive support by others. Our results also show that novice students report rarely interacting with consultants. In this context, development initiatives may therefore be better focused on residents to enable themto effectively support students’ SRL. The importance of residents and peers for students’ learning in a clinical environment has been described before regarding role modelling and social comparison.18,32 Our results emphasise this importance even more (especially for novice students) because students reported that peers and residents have the largest impact on their goal setting, opportunities, SRL strategies and self-reflection.

아마도 가장 중요한 것은 임상 환경에서 [초보 학생의 '핀볼']에서 [경험많은 학생의 '스노볼']로, 그리고 뒤이은 SRL로의 전환은 [임상 환경에서 편안함]을 느끼는 것에서 기인하며, 궁극적으로는 [개인적 목표를 향해 작업work]하는 것을 촉진한다. 따라서 종단적 통합 임상실습 및 조기 임상 노출의 원칙에 따라 임상실습에서의 학생 배치를 늘림으로써 임상 환경에서 학생들의 SRL을 지원할 수 있다. 이를 통해 학생들은 어휘를 포함한 공동체 문화에서 길을 찾을 수 있고, 전환의 스트레스를 줄일 수 있으며, 초보 학생들이 자신의 역할을 이해하도록 돕고, 궁극적으로 학생들이 건강관리팀의 일원이 될 수 있도록 도와준다.

Perhaps most importantly, a student’s transition from a novice ‘pinball’ to an experienced ‘snowball’ and subsequent SRL in a clinical environment appears to result fromfeeling comfortable in a clinical environment and facilitates working towards personal goals. Therefore supporting students’ SRL in a clinical environment could be improved by lengthening student placements in a clerkship, following principles of longitudinal integrated clerkships and early clinical encounters. This enables students to find their way in the culture of the community, including the vocabulary, reduces the stress of transitions, helps novice students understand their role and ultimately helps students become part of the health care team.28,33–35 

 



6 Sitzmann T, Ely K. A meta-analysis of self-regulated learning in work-related training and educational attainment: what we know and where we need to go. Psychol Bull 2011;137 (3):421–42. 

23 King N, Bravington A, Brooks J, Hardy B, Melvin J, Wilde D. The Pictor technique: a method for exploring the experience of collaborative working. Qual Health Res 2013;23 (8):1138–52. 

 

 

 

 


Med Educ. 2017 Mar;51(3):269-279.

 doi: 10.1111/medu.13131. Epub 2016 Nov 23.

How clinical medical students perceive others to influence their self-regulated learning

Joris J Berkhout 1Esther Helmich 1Pim W Teunissen 2 3Cees P M van der Vleuten 2A Debbie C Jaarsma 4

Affiliations collapse

Affiliations

  • 1Center for Evidence-Based Education, Academic Medical Center (AMC-UvA), University of Amsterdam, Amsterdam, The Netherlands.
  • 2Department of Educational Development and Research, Faculty of Health, Medicine and Life Sciences, Maastricht University, Maastricht, The Netherlands.
  • 3Department of Obstetrics and Gynecology, VU University Medical Center, VU University Amsterdam, Amsterdam, The Netherlands.
  • 4Center for Research and Innovation in Medical Education, University Medical Center Groningen, University of Groningen, Groningen, The Netherlands.

Free PMC article

Abstract

Objectives: Undergraduate medical students are prone to struggle with learning in clinical environments. One of the reasons may be that they are expected to self-regulate their learning, which often turns out to be difficult. Students' self-regulated learning is an interactive process between person and context, making a supportive context imperative. From a socio-cultural perspective, learning takes place in social practice, and therefore teachers and other hospital staff present are vital for students' self-regulated learning in a given context. Therefore, in this study we were interested in how others in a clinical environment influence clinical students' self-regulated learning.

Methods: We conducted a qualitative study borrowing methods from grounded theory methodology, using semi-structured interviews facilitated by the visual Pictor technique. Fourteen medical students were purposively sampled based on age, gender, experience and current clerkship to ensure maximum variety in the data. The interviews were transcribed verbatim and were, together with the Pictor charts, analysed iteratively, using constant comparison and open, axial and interpretive coding.

Results: Others could influence students' self-regulated learning through role clarification, goal setting, learning opportunities, self-reflection and coping with emotions. We found large differences in students' self-regulated learning and their perceptions of the roles of peers, supervisors and other hospital staff. Novice students require others, mainly residents and peers, to actively help them to navigate and understand their new learning environment. Experienced students who feel settled in a clinical environment are less susceptible to the influence of others and are better able to use others to their advantage.

Conclusions: Undergraduate medical students' self-regulated learning requires context-specific support. This is especially important for more novice students learning in a clinical environment. Their learning is influenced most heavily by peers and residents. Supporting novice students' self-regulated learning may be improved by better equipping residents and peers for this role.

'나는 이 공간에 있을 가치가 없어요': 의과대학생에게 수치의 근원(Med Educ, 2020)

‘I'm unworthy of being in this space’: The origins of shame in medical students
William E. Bynum IV1 | Lara Varpio2 | Janaka Lagoo3 | Pim W. Teunissen4

 

 

1 | 소개
1 | INTRODUCTION


'인간 경험에 편재하는 마스터 감성master emotion'(P34)으로 불려온 수치심은 개인에게 파괴적인 영향을 미칠 수 있다. 자신에 대한 전 세계적인 부정적 평가로 인해 수치심은 상당한 고통을 야기할 수 있으며 회피, 숨기기, 방어, 자책감을 조장할 수 있습니다. 의학 교육의 수치심 경험에 대한 겸손한 연구는 졸업후 의학 교육에 초점을 맞추었고, 연구들은 전공의의 수치심이 다음을 포함한 부정적인 결과를 유발하는 '감정적 사건'이 될 수 있다는 것을 보여준다: 심리적 고통(예: 번아웃), 고립, 직무 성과 저하, 공감 장애, 전문적이지 못한 행동 및 학습으로부터의 이탈. 
Shame, which has been called 'a master emotion because of its ubiquity in human experience’(P34),1 can have devastating effects on individuals. Resulting from a global, negative evaluation of the self, shame can cause significant distress and promote avoidance, hiding, defensiveness and self-blame.2 The modest body of research on experiences of shame in medical education has focused on graduate medical education,3-6 with studies showing that shame in residents can be a ‘sentinel emotional event’6 that triggers negative outcomes, including psychological distress (eg, burnout), isolation, poor job performance, impaired empathy, unprofessional behaviour and disengagement from learning.5,6 

그러나 수치심 경험은 레지던트 훈련에만 국한되지 않는다. 의대생들은 학대, 학업 투쟁, 과도기 등 많은 수치심을 유발하기 때문에 수치심에 노출되기 쉽다. 더 나아가 의대생들은 계급의 최하위에 있기 때문에, 학생들은 수치심 반응을 유발하는 상황에 노출되거나, 수치심이 유발되는 자기평가를 겪을 가능성이 높다. 수치심과 관련된 부정적인 결과를 고려할 때, 의대생들이 이러한 감정을 어떻게 경험하는지 이해하는 것이 필수적입니다.  
However, shame experiences are not confined to residency training; medical students are likely susceptible to shame because they are exposed to many of the same shame triggers, including mistreatment,7 academic struggle and transition periods.8,9 Furthermore, medical students' position at the lower end of the medical hierarchy may expose them to situations and predispose them to self-evaluative tendencies that lead to shame reactions.10,11 Given the negative outcomes with which shame is associated, it is essential that we understand how medical students experience this emotion. 

[교육적 안전]의 개념(심리적 안전이라는 용어에 기반한 표현으로써, 자신의 자기-이미지나 지위에 대한 부정적인 결과를 두려워하지 않고 업무에 참여할 수 있는 정도를 의미함)은 의대생들에게 수치심을 연구할 필요성을 더욱 강조합니다. Tsuei 등은 최근 '[교육적 안전]'을 다음과 같이 제안했다. 
The notion of educational safety12—a term built upon psychological safety, or the degree to which an individual can engage at work without fearing negative consequences to their self-image or status13—further underscores the need to study shame in medical students. Tsuei et al recently proposed ‘educational safety’ as: 


학습자가 자신의 투사된 이미지를 스스로 모니터링할 필요 없이, 학습 과제 참여에 진정하고 전적으로 집중할 수 있도록, 타인의 판단 의식에서 해방된 주관적 상태입니다.
The subjective state of feeling freed from a sense of judgment by others such that learners can authentically and wholeheartedly concentrate on engaging with a learning task without a perceived need to self-monitor their projected image.

 

쯔이 외 연구진 자료에 따르면 교육 안전

  • [다른 사람에게 역량을 발휘할 필요가 있다는 느낌]과 관련이 있다.
  • 학생들이 타인의 기대에 반하여against 지속적으로 자기평가 한다고 느끼는 정도에 영향을 받습니다.
  • 개인이 유능한 자기이미지를 보여줄 필요가 덜하다고 느낄 때 촉진됩니다.12

Tsuei et al's data suggest that educational safety

  • is related to the feeling of needing to display competency to others;
  • is affected by the degree to which students feel compelled to continuously self-assess against others' expectations; and
  • is facilitated when an individual feels less need to present a competent self-image.12

(개인 스스로가 부족하고 무능하며 가치가 없다고 판단할 때 발생하는) 수치심은 교육 안전의 구조와 밀접하게 반비례한다. 수치심은 이탈, 고립, 심리적 고통, 판단의 공포를 초래하기 때문에, 수치심을 느끼는 사람은 교육 안전 수준이 낮다고 인식하기 쉽다. 마찬가지로, 교육 안전 수준이 낮으면 수치심의 위험이 높아질 수 있습니다. 그 결과 자기이미지에 부정적인 영향을 미치고 인식된 판단을 유발할 수 있습니다. 낮은 교육 안전과 높은 수치심의 환경에서는 학습, 환자 관리 및 웰빙에 잠재적으로 심각한 다운스트림 효과가 뒤따를 수 있습니다.

Shame—which occurs when an individual assesses themselves to be deficient, incompetent and/or unworthy2—is intimately and inversely linked with the construct of educational safety. Due to its tendency to cause disengagement, isolation, psychological distress and fear of judgment,6 an individual experiencing shame is likely to perceive low levels of educational safety. Likewise, low levels of educational safety—which may negatively impact self-image and cause perceived judgment—are likely to increase the risk of shame.14 In settings of low educational safety and high amounts of shame, potentially profound downstream effects on learning, patient care and well-being may follow.12,14,15 

따라서, 교육적으로 안전한 환경을 조성하고, 의료 훈련에서 안전한 환자 관리를 보장하고, 학습자의 참여와 웰빙을 촉진하기 위해, 우리는 수치스러운 경험과 이를 전파하는 힘에 적응해야 합니다. 그러나 의대생들이 수치심을 어떻게 경험하고 이러한 경험이 어떻게 발전하는지에 대해서는 알려진 바가 거의 없다. 

Thus, to facilitate educationally safe environments, ensure safe patient care in medical training and promote learner engagement and well-being, we must be attuned to the presence of shame experiences and the forces that propagate them. However, little is known about how medical students experience shame and how these experiences develop. 


2 | 방법
2 | METHODS


2.1 | 헤르메네틱 현상학
2.1 | Hermeneutic phenomenology

해석적(헤르메네틱) 현상학은 어떤 현상을 묘사하고 그 근본적인 의미를 살아있는 경험의 맥락 안에서 전달하는 것을 목적으로 하는 질적인 방법론이다.16 헤르메네틱 현상학은 현상을 형성하는 '살아 있는 경험의 구조'를 통해 전달되는 현상의 의미에 대한 풍부한 설명을 만들어낸다. 
Hermeneutic phenomenology is a qualitative methodology aimed at describing a phenomenon and conveying its underlying meaning within the context of lived experience.16 Hermeneutic phenomenology produces a rich description of the meaning of a phenomenon, conveyed through the ‘structures of lived experience’ that shape the phenomenon.17

우리는 해석적 현상학을 연구에 사용했다. 왜냐하면

  • 해석적 현상학은 살아 있는 맥락에서 개인의 경험을 강조하기 때문이다.
  • 해석적 현상학은 인간 경험의 숨겨진 측면을 드러내는 능력이 있기 때문이다.
  • 해석적 현상학은 연구자들이 그 현상에 대해 살아 있는 경험을 분석 과정에 도입할 것을 요구하기 때문이다.

We used hermeneutic phenomenology in our research because of

  • its emphasis on individuals' experiences in their lived contexts;
  • its ability to reveal hidden aspects of human experience18; and
  • its requirement that researchers bring their own lived experience with the phenomenon into the analytic process.19

이러한 특징들은 우리의 조사에 중요한 이유는 수치심은 맥락적으로 영향을 받는 감정이기 때문이다. 수치심은 종종 깊이 간직되어 있고 공개적으로 공유되거나 쉽게 이해되지 않습니다. 게다가, 우리는 개인으로서 우리를 형성하고 우리가 이 연구 프로그램에 참여하도록 동기부여하는 우리 자신의 수치스러운 경험들을 믿을 수 있게 분류할 수 없습니다.

These characteristics are important to our investigation because shame is a contextually influenced emotion6 that is often deeply held and not openly shared nor easily understood. Furthermore, we cannot reliably bracket off our own shame experiences, which shape us as individuals and motivate us to engage in this program of research. 



2.2 | 참가자 모집
2.2 | Participant recruitment


우리는 미국의 한 사립 의과대학에서 16명의 자원봉사자를 모집했습니다.
We recruited 16 volunteer participants from a private medical school in the United States.

2.3 | 반사율
2.3 | Reflexivity


학술 가정의학과 의사인 WB가 인터뷰를 진행하며 연구 과정의 모든 측면을 주도했으며 의학 교육의 수치심을 조사하는 연구 프로그램이 활발하게 진행되고 있다. 따라서 그는 의대생, 레지던트, 주치의 및 배우자로 경험했던 자신의 수치심 경험을 연구에 가져왔습니다. 이는 의대생들의 데이터가 전공의 자신의 경험 및 데이터와 어떻게 일치하고 다른지에 대해 WB를 민감하게 만들었다. 이런 데이터는 모두 이 연구의 이론적 및 개념적 분석에 도움이 되었다.
WB, an academic family medicine physician, conducted the interviews, led all aspects of the research process, and has an active program of research investigating shame in medical education. Accordingly, he brought his own experiences of shame—experienced as a medical student, resident, attending physician and spouse—to the study. This sensitised WB to how the data from medical students aligned with and differed from his own experiences and data collected in residents,6 both of which informed this study's theoretical and conceptual analyses. 

JL은 가정의학과 레지던트이자 의대생으로서 수치스러운 경험을 통해 데이터 분석에 대한 관점과 기여도를 알게 되었습니다. PT는 산부인과 의사이자 의학 교육 분야의 연구자입니다. 그는 의대생, 레지던트, 주치의, 배우자로서의 수치스러운 경험을 이용했다. LV는 의학 교육 분야에서 10년 이상의 경력을 가진 박사 교육을 받은 자질 연구자입니다. LV는 임상의가 아니며 관리자로서 수치심을 경험하지 않았지만, 데이터에 대한 자신의 관점에 기여한 배우자, 부모, 친구 및 학자로서의 수치심을 여러 번 경험했습니다.

JL is a family medicine resident whose shame experiences as a resident and medical student informed her perspectives on, and contributions to, the data analysis. PT is a gynaecologist and researcher in the field of medical education. He drew on his shame experiences as a medical student, resident, attending physician and spouse. LV is a PhD-trained qualitative researcher with over 10 years of experience in the fiel d of medical education. LV is not a clinician and has not experienced shame as a care provider; however, she has experienced several shame experiences as a spouse, parent, friend and scholar that contributed to her perspectives on the data.


2.4 | 데이터 수집
2.4 | Data collection


우리는 각 참가자와 개별적으로 3부로 된 데이터 수집 프로세스를 수행했습니다. 2시간 동안의 단일 데이터 수집 세션에서, 참가자들은 먼저 성찰적 글쓰기(부록 S1)을 작성하도록 요청받았다. 그들은 심리학으로부터 수치심의 정의를 제공받았고 의과대학에서 수치심이 느껴질 때의 구체적인 경험에 대해 쓰라고 요청받았다.
We engaged in a three-part data collection process individually with each participant. In a single, 2-hour data collection session, participants were first asked to compose a written reflection ( Appendi x S1) . They were provi ded wi th a definition of shame from psychology and asked to write about a specific experience in medical school when they felt shame.

마지막으로, WB는 인터뷰 후 참가자가 정서적 고통의 존재 여부를 평가하고, 지지적 리소스(원하는 경우 당일 또는 일상적인 상담 포함)을 제공하고, 참가자의 연구에 대한 기여에 대한 통찰력과 감사를 제공하는 보고 기간을 통해 참가자를 이끌었다. 
Finally, after the interview, WB led the participant through a debriefing period during which he assessed for the presence of emotional distress, provided resources for support (which included same-day or routine counselling if desired) and provided insights about, and appreciation for, the participant's contributions to the study. 

2.5 | 데이터 분석
2.5 | Data analysis

이 과정에서 우리는 코딩 노트(데이터에 대한 이해의 진화를 위해 개발한 시각화 및 은유 포함)와 연구 회의록 작성을 통해 상세한 감사 추적을 유지했습니다. 우리는 해석적 방법을 고수했고 과거의 수치심 경험을 포함하여 데이터에 대한 우리의 반응을 공개적으로 논의함으로써 성찰성을 달성했습니다. 왜냐하면, 그녀의 해석적 철학자 마틴 하이데거에 따르면, 언어는 인간의 의식과 인식을 형성하기 때문이다, 22 우리는 참여자들이 수치심을 느낄 때 어떻게 자신을 묘사하는지, 그리고 그들이 이러한 감정을 설명할 때 사용한 은유 등을 포함하여, 우리는 참여자들이 사용하는 언어에 주의 깊게 주목했다. 첫 번째 연구에서 우리가 개발한 전문 지식과 이해력과 결합했을 때, 이 초점들은 데이터에 대한 효율적이고 깊은 몰입감을 촉진했습니다. 

Throughout this process, we maintained a detailed audit trail through coding notes (including visualisations and metaphors we developed to frame our evolving understandings of the data) and written minutes of research meetings. We adhered to the hermeneutic method and achieved reflexivity by openly discussing our reactions to the data, including our own past shame experiences. Because, according to hermeneutic philosopher Martin Heidegger, language shapes human consciousness and perception,22 we carefull y attended to the language used by participants, including how they described themselves when feeling shame and the metaphors they used to explain these feelings. When combined with the expertise and understanding we developed in the first study,6 these foci facilitated an efficient and deep immersion into the data. 

2.6 | 참가자 익명성 보호
2.6 | Protecting participant anonymity

참가자의 수치 경험의 독특한 특성은 독특한 문제를 제기했습니다. 어떻게 하면 참가자의 익명성을 보호하는 동시에 조사 결과에 대한 증거를 제공하기 위해 데이터를 보고할 수 있을까요? 참가자의 독특한 이야기나 장황한 발췌 데이터를 공유하는 것은 참가자를 알아볼 수 있게 하기 때문에 가능하지 않았다. 따라서 여러 참여자의 데이터에서 경험과 발췌한 내용을 통합하여 익명성을 유지하면서 수집된 데이터를 정확하게 보고하는 3가지 예시 내러티브를 구성하였습니다. 
The idiosyncratic nature of our participants' shame experiences posed a unique challenge: how could we report our data to provide evidence of our findings while simultaneously protecting the anonymity of our participants? Presenting participants' unique stories or lengthy, verbatim data excerpts was not possible because sharing those data would render participants recognisable. Therefore, we constructed three illustrative narratives within which we integrated experiences and excerpts from multiple participants' data, simultaneously preserving their anonymity and accurately reporting the collected data. 

원고를 완성한 후 참가자들에게 논문 최종 초안을 보내 익명을 지키면서 수치심 요소를 정확하고 진실하게 제시했는지를 물었다. 15명의 참가자가 만족스러운 익명화와 정확성을 확인했으며, 한 명은 우리가 채택한 사소한 제안을 요청했습니다. 

After completing the manuscript, we sent participants the final draft of the paper and asked if we had correctly and truthfully presented elements of their shame experiences while also protecting their anonymity. Fifteen participants confirmed satisfactory anonymisation and accuracy, and one requested a minor suggestion that we adopted. 

 

3 | 결과
3 | RESULTS


참가자들이 묘사한 부끄러움 경험은 개인과 환경 간의 동시적-다층적 상호작용으로 구성되었습니다. 이러한 상호작용의 의미를 찾으면서 우리는 불fire의 은유를 통해 참가자들의 수치심을 이해하게 되었습니다. 불이 기질에 미칠 수 있는 잠재적 영향과 같이, 수치심은 우리의 참가자들에게 깊은 영향을 미칠 수 있습니다: 대부분은 세계적으로 부정적인 자기 평가로 구성된 강렬하고, 음흉하며, 매우 골치아픈 수치 반응을 경험한다고 보고됩니다. 학생들은 자신을 '좋지 않다'(P10), '완전히 가치가 없다'(P12), '부적절한 의대생'(P15)이 '작다'(P8, P11), '멍청하다'(P6)고 말했다. 수치심의 감정적인 경험은 종종 압도적이었다.

The shame experiences described by participants consisted of simultaneous, multi-layered interactions between the individual and their environment. In seeking the meaning of these interactions, we came to understand participants' shame experiences through the metaphor of fire. Like the potential impact of fire on a substrate, shame could profoundly affect our participants: most reported experiencing intense, insidious and/or deeply troublesome shame reactions that consisted of globally negative self-assessments. Students reported viewing themselves as ‘no good’ (P10), ‘completely worthless’ (P12), ‘an inadequate medical student’ (P15) feeling ‘small’ (P8, P11) and feeling ‘stupid’ (P6). The emotional experience of shame was often overwhelming:

이름 없는 이 부정적인 감정에 빠져드는 것 같았어요. (P15)
I felt like I was drowning in this negative emotion that I didn't have a name for. (P15)

 

3.1 | 수치심 트리거
3.1 | Shame triggers


수치심 트리거는 우리가 스파크에서 화재가 발생한다고 인식하는 것처럼, 수치심 반응을 촉발하는 구체적인 사건, 행동 또는 사건이었다. 즉, 참가자들은 이러한 사건의 발생과 동시에 수치심(전 세계적으로 결함이 있거나 부족하거나 가치가 없다는 느낌)이 발달했다고 보고하였다. 
Shame triggers, which we conceptualised as the sparks that initiated a fire, were the specific events, actions or incidents that precipitated shame reactions. In other words, participants reported that feelings of shame (ie, a sense of being globally flawed, deficient or unworthy) developed upon the occurrence of these events. 


참가자들이 보고한 수치심 유발은 주로 다른 사람과의 상호작용과 학습과 관련이 있었다.

다른 사람과의 상호작용과 관련된 수치심 트리거는 네 가지 범주로 나뉩니다. 

  • 감독의사의 학대(예: 경멸적 발언, 신체 수치심), 
  • 동료의 학대(예: 무시적 취급, 경멸적 논평), 
  • 자신에 대한 개인적인 것을 다른 사람에게 드러내는 것(예: 성적 정체성 드러내기, 감정 드러내기)과 
  • 환자와의 상호작용에 대한 도전(예: 부담이 되는 느낌, 잘못된 환자에게 검사 수행)

Shame triggers reported by participants were primarily related to interactions with others and learning. Shame triggers related to interactions with others were broken into four categories:

  • supervisor mistreatment (eg, derogatory comments, body shaming),
  • peer mistreatment (eg, dismissive treatment, derogatory comments),
  • revealing something personal about one's self to others (eg, revealing sexual identity, showing emotion) and
  • challenging interactions with patients (eg, feeling like a burden, performing an examination on the wrong patient).


학습과 관련된 수치심 유발 요인은 두 범주로 나뉩니다. 

  • 학습 프로세스(예: 작업량을 따라가지 못하는 경우, 교정 중, 그룹 앞에서 고군분투하는 경우)와
  • 평가(낮은 USMLE 1단계 점수, 명예롭지 않은 임상 성적 획득, 부정적인 피드백 받기)

Shame triggers related to learning were broken into two categories:

  • struggle with learning processes (eg, inability to keep up with the workload, undergoing remediation, struggling in front of a group) and
  • assessment (low USMLE Step 1 score, earning non-honours clinical grades, receiving negative feedback). 

Table 2.



3.2 | 수치심 촉진자
3.2 | Shame promoters

우리가 화재 추진제로 개념화한 [수치심 촉진제]는 수치심 반응의 발생 위험을 높이거나 이미 촉발된 수치심 반응의 강도나 지속시간을 증폭시켰다.
Shame promoters, which we conceptualised as fire propellants, increased the risk of developing a shame reaction or amplified the intensity or duration of an already triggered shame reaction.

우리의 분석에 따르면 세 가지 유형의 수치심 유발자가 나왔다. 

  • 개인적 수치심 촉진자는 주로 개인과 연결되었고 과소 표현, 성과 기반 자존감, 완벽주의, 고정적 사고방식, 임포스터 증후군을 포함했습니다. 
  • 환경적 수치심 촉진자는 사람들은 주로 주변 환경과 관련이 있었고 심리적으로 안전하지 않은 환경, 기관의 기대, 의료 훈련의 혹독함을 포함했습니다.
  • 관계적 수치심 촉진자는 개인과 환경 간의 상호작용에서 발생하였으며 타인과의 비교, 판단에 대한 두려움, 정체성 이동 및 소속감 저하를 포함하였다. 

Our analysis yielded three types of shame promoters.

  • Intrapersonal shame promoters were primarily connected to the individual and included underrepresentation, performance-based self-esteem, perfectionism, fixed mindsets and imposter syndrome.
  • Environmental shame promoters were primarily connected to the surroundings and included psychologically unsafe environments, institutional expectations and the rigours of medical training.
  • Interactive shame promoters arose from the interaction between the individual and their environment and included comparisons to others, fear of judgment, shifting identity and impaired belonging. 

Table 3.

3.3 | 수치심 유발과 촉진자가 수치심 반응에서 어떻게 상호작용하는지
3.3 | How shame triggers and promoters interact in a shame reaction

수치심과 같은 복잡한 현상을 별개의 요소로 줄이는 것은 본질적으로 인위적인 과정이다. 참가자들의 생생한 경험 속에서 위의 요소들(예: 개인, 환경, 유발자 및 촉진자)은 복잡하고 혼합된 독특한 방식으로 상호작용하여 수치심을 유발합니다. 참가자들의 경험의 본질을 전달하기 위해 연구 참여자들이 공유하는 구체적인 수치심 경험의 측면을 포함하는 세 가지 내러티브를 만들었습니다. 이러한 내러티브는 우리가 식별한 모든 수치심 유발자 또는 촉진자를 묘사하지 않습니다(표 1과 2) 대신, 수치심으로 이어지기 위해 특정 요소들이 어떻게 상호작용할 수 있는지를 보여줍니다. 

Reducing a complex phenomenon like shame into discrete elements is an inherently artificial process. Within the lived experience of our participants, the elements above (eg, the individual, environment, triggers and promoters) interacted in a complex, amalgamised and unique fashion to lead to shame. To convey the essence of our participants' experiences, we created three illustrative narratives wherein we have included aspects of the specific shame experiences shared by our research participants. These narratives do not depict all of the shame triggers or promoters that we identified (Tables 1 and 2); instead, they illustrate how specific elements can interact to lead to shame. 

3.3.1 | 서술 #1: 과소표현, 임포스터 증후군 및 수치심
3.3.1 | Narrative #1: Underrepresentation, imposter syndrome, and shame

모니크의 수치스러운 경험은 학업 부진에서 비롯된다. 그러나 Monique의 수치 경험의 기원은 수많은 개인적, 환경적, 상호작용적 요인(즉 수치심을 조장하는 요인)에 의해 채워집니다. 과소대표는 모니크의 수치심에 가장 큰 기여자이다. 아프리카계 미국인이자 작은 주립대 출신의 1세대 대학생인 그녀의 배경은 의대에 입학할 만한 가치가 있다는 것을 증명해야 한다는 압박감을 증폭시켰다. underrepresented 배경을 가진 참가자도 비슷하게 다음과 같이 언급했다.
Monique's shame experience is triggered by academic underperformance. However, the origins of Monique's shame experiences are fuelled by numerous intrapersonal, environmental and interactive factors (ie, shame promoters). Underrepresentation is a central contributor to Monique's shame. Her background as an African-American and first-generation college student from a small state university has ratcheted up the pressure to prove herself worthy of admission to medical school. A participant from an underrepresented background similarly recounted:

다수의 참가자들은 인종적/민족적 소수자, 퀴어적/레즈비언적, 트랜스젠더, 공립대학에서 학부 과정 이수하고, 낮은 사회경제적 계층 출신, 특정 지역에서 성장 등이 자신들의 수치심 경험에 기여하는 형태로 과소표현의 형태를 보고하였다. 
Multiple participants reported forms of underrepresentation as contributing to their shame experiences, including being a racial/ethnic minority, being queer/lesbian, being transgender, completing undergraduate studies at a public university, coming from a low socio-economic demographic and growing up in a certain region of the country. 

의대에 도착한 모니크는 자신보다 남들이 똑똑하다고 인식하는 환경을 접하게 되고 자신과 비슷한 배경을 가진 사람들을 찾기 위해 고군분투하며 소속감과 자기 의구심, 자기 표현에 대한 거부감을 심화시킨다. 모니크의 수치심 반응은 1학기 내내 계속되는 추세인 1차 시험에서 평균보다 훨씬 낮은 점수를 받았을 때 불을 붙인다. 그녀의 수치심은 다른 학생들과 비교했을 때, 그리고 다른 참가자들에 의해 비슷하게 표현된, 덜 대표적인 학생이 되는 것의 무게로 인해 더욱 악화됩니다. 
Upon arriving to medical school, Monique encounters an environment in which she perceives others as smarter than her, and she struggles to find people with similar backgrounds to hers, deepening her questions of belonging, feelings of self-doubt and unwillingness to express herself. Monique's shame reaction ignites when she scores well below average on the first test, a trend that continues throughout the first semester. Her shame feelings are further inflamed by comparing to other students and the weight of being an underrepresented student, tendencies similarly articulated by other participants: 

모니크의 소속감을 더욱 악화시키고 수치심을 동반한 것은 의과대학 그녀가 기존에 소속되어있던 공동체와의 관계 상실과 지원 관계의 상실이었다. 한 아프리카계 미국인 참가자는 자신의 삶의 여러 영역에 소속감이 손상되고 수치심이 스며드는 경향을 비슷하게 반영했다. 
Further exacerbating Monique's sense of impaired belonging and accompanying shame were the loss of supportive relationships and connection with the communities with which she was affiliated prior to medical school. An African-American participant similarly reflected on the tendency for impaired belonging and shame to seep into multiple areas of his life: 

요약하자면, 모니크의 수치심은 의과대학에 입학하여 평균 이하의 시험 성적을 기록함으로써 촉발triggered되었다. 그녀의 수치심은 과소표현, 임포스터 증후군, 기관의 기대, 의료 훈련의 엄격함, 소속감 손상, 타인과의 비교와 관련된 현상으로 인해 촉진promoted되었다.

In summary, Monique's shame was triggered by arriving to medical school and making a below-average test score. Her shame was promoted by phenomena related to underrepresentation, imposter syndrome, institutional expectations, the rigours of medical training, impaired belonging and comparisons to others.

3.3.2 | 서술 #2: 성과 기반 자존감, 고정적 사고방식, 객관적 평가 및 수치심
3.3.2 | Narrative #2: Performance-based self-esteem, fixed mindsets, objective assessment, and shame

USMLE 1단계 시험을 준비하는 데 어려움을 겪으면서 John의 수치심이 촉발되었습니다. 그의 수치심의 근원은 자긍심의 원천, [그에 대한 다른 사람들의 인상]과 [다른 학생들과의 비교]에 있다. 이것들은 모두 수치심 촉진자promoter이다. 존은 '똑똑하게 보이는 것'에 높은 가치를 두는데, 이는 수행능력-기반 자기존중감을 나타내며, 초기 교육 경험에서 기인하는 성향이다. 
John's shame is triggered by difficulty preparing for the USMLE Step 1 examination. The origins of his shame lie in his sources of selfworth, need to manage others' impressions of him and comparisons to other students—all shame promoters. The high value that John places on being seen as smart—and the degree to which his self-worth relies on feeling intelligent—indicates the presence of performance-based self-esteem, a tendency that some participants ascribed to early educational experiences: 

자존감을 유지하기 위해 존은 시험에서 계속 좋은 점수를 받아야 하고, [다른 사람들이 그에게 가지는 인상]을 관리해야 한다는 압박감을 느낀다. 즉, 그들이 존을 똑똑하고 능력 있는 사람으로 보기를 바란다. 자신을 최고의 학생이라고 알게 하기 위해서, 그리고 이러한 이미지를 반 친구들에게 투영project하기 위해서, 존은 자주 자신을 다른사람과 비교하고, 다른사람을 능가해야 한다고 느낀다. 수많은 참가자들은 자존심을 강화하려는 것 때문에 비슷한 경쟁적 압박이 있었다고 보고했지만, [상대적 우월감을 느끼고자 하는 마음]이 수치심을 유발한다는 사실도 인정했습니다. 
To maintain his self-esteem, John feels pressure to continue scoring well on tests and to manage the impressions that others have of him, namely that they see him as clever and capable. To know himself as a top student, and to project this image to classmates, John feels compelled to frequently compare himself against and outperform them. Numerous participants reported similar competitive pressures stemming from a need to bolster self-worth, but they also acknowledged that the need to feel superior drove feelings of shame: 

John이 USMLE 1단계 준비과정에서 상당한 어려움을 겪을 때, 이러한 수치심 촉진자promoters들은 각각 큰 수치심 반응을 일으킵니다. 존은 주변 사람들이 모두 여유 있게 준비하고 있다고 생각하며, 어려움을 겪는 자신의 모습이 어떤 모습으로 비춰질지 깊은 우려를 가지고 있다. USMLE 1단계 점수에 대한 학교의 기대와, 이 시험점수가 그의 미래 커리어 계획에 미치는 영향력이 크다는 점이 수치심을 증폭시킨다. 복수의 참가자들은 1단계에서 높은 점수를 얻어야 한다는 강한 압박감을 보였으며, 그 원인에는 자문 학장, 학생들의 이전 수업, 종종 공표되는 학교 평균 등이 있었다. 이로 인해 한 참가자는 Step 1 시험을 '당신이 임포스터가 될지 훌륭한 레지던트 지원자가 될지, 그것을 만들거나 무너뜨리는 것 위대한 이퀄라이져'이라고 표현했다(P14). 
When John encounters significant struggle preparing for USMLE Step 1, each of these shame promoters fuel a major shame reaction. John perceives that everyone around him is preparing with ease, and he has deep concerns over how he'll be viewed in the midst of his struggle. Amplifying his shame are the institution's expectations about USMLE Step 1 performance and the heavy influence the test has on his future career plans. Multiple participants reported intense pressure to achieve a high score on Step 1, the sources of which included advisory deans, prior classes of students and the oft-publicised school average. This caused one participant to describe the test as ‘the great equalizer [that] makes or breaks you as an imposter or a good residency applicant’ (P14). 

존은 또한 Step 1 시험에서 어려움을 겪는 것이 '나는 시험을 잘 볼 수 있는 능력을 가지고 있지 않으며', 이것을 변화시키기 위해서 스스로 할 수 있는 것은 없다는 숨겨진 진실을 드러낸다고 믿는다. 이러한 [고정 마음가짐]의 증거로는 '느린 프로세서'(P3), '절대 나아지지 않을 것'(P4)과 '[성공할] 배경 없음'(P10)과 같은 느낌을 재조명한 다른 참가자들에게서 나타났다. [고정 마음가짐]은 수치심 트리거(예: 낮은 성과)가 [본질적으로 변하지 않는 자신의 부족한 점] 때문이라는 믿음을 심화시키는 것으로 나타났다. 
John also believes that his struggle with Step 1 reveals a hidden truth: that he does not possess the ability to perform well on the test and that nothing he can do will change that. Evidence of this fixed mindset was present in other participants who recounted feeling like ‘a slow processor’ (P3), ‘never going to get better’ (P4) and ‘not having the background to [be successful]’ (P10). Fixed mindsets appeared to deepen the belief that a shame trigger (eg, low performance) was due to an inherent, unchangeable deficiency of the self: 

요약하자면, John의 수치심은 낮은 모의고사 점수와 USMLE 1단계 준비 과정에서의 어려움으로부터 비롯되었습니다. 그의 수치심은 성과에 기초한 자존감, 판단에 대한 두려움, 제도적 기대, 타인과의 비교, 고정된 사고방식과 관련된 현상들에 의해 촉진되었다.

To summarise, John's shame was triggered by his low practice scores and struggle to prepare for USMLE Step 1. His shame was promoted by phenomena related to performance-based self-esteem, fear of judgment, institutional expectations, comparisons to others and a fixed mindset.

3.3.3 | 서술 #3: 학대, 정체성 이동 및 수치심
3.3.3 | Narrative #3: Mistreatment, shifting identity, and shame

Peyton의 수치심은 상사의 학대(여러 참가자들이 보고한 수치심 유발)로 촉발되며 심리적으로 안전하지 않은 환경, 높은 개인적 성공 기대감 및 현재 로테이션에서 받는 평가의 고부담성 때문에 촉발됩니다. 사실 페이튼은 경쟁이 심한 레지던트 자리를 노리고 있고, 임상실습 첫 번째 해의 성적은 P/F로 판정되기 때문에, 임상 로테이션에서 Honor 이하의 성적을 받는 것은 사실상 실패Fail라고 믿고 있다. 
Peyton's shame is sparked by mistreatment from a supervisor—a shame trigger reported by multiple participants—and fuelled by a psychologically unsafe environment, high personal expectations of success and the high-stakes nature of assessment on her current rotation. In fact, because Peyton is seeking a competitive residency, and because the first year is pass/fail, she believes that anything less than honours on a clinical rotation is a failure.

게다가, 페이튼은 항상 좋은 사랑을 받았기 때문에, 그녀는 주변 사람들과 교류할 수 있는 그녀의 능력에 큰 자부심을 부여한다. 환자와의 관계를 희생하면서라도, 점수를 잘 받고, 레지던트에게 호감을 받고자 하는 이 강렬한 욕구는 페이튼이 지금의 자신을 바라보는 방식(즉, 자신의 교육과 성적에 지나치게 신경을 쓰는 방식)과 페이튼이 의대에 입학했을 때 자신을 바라보는 방식(즉, 환자를 모든 것보다 우선하려는 욕구) 사이에 긴장을 불러일으킨다. '환자를 위해 자신을 완전히 바꿔야 한다'(P9)는 말처럼, 참여자들은 페이튼과 비슷한 정체성 변화가 수치심 경험을 촉진했다고 이야기했다.

Further, because Peyton has always been well liked, she attaches a great deal of self-worth to her ability to interact with those around her. This intense desire to receive a good evaluation and be liked by the resident, which come at the expense of her relationships with patients, creates tension between the way Peyton views herself now (ie, as overly concerned with her own education and grades) and the way Peyton viewed herself upon entering medical school (ie, as desiring to prioritise the patient above all else). Multiple participants reported similar identity shifts as promoting their shame experiences, including one who felt that ‘you have to completely change yourself for someone else, for the better of the patient’ (P9). 

페이튼의 경험은 참가자가 보고한 수많은 수치심 유발 학대 중 하나로, 신체 수치심, 미세-공격성, '펌핑', 불필요하게 거친 커뮤니케이션, 지식 기반, 훈련 수준 또는 선택한 진로에 대한 비하 발언 등이 포함된다. 
Peyton's experience is one of numerous types of shame-catalysing mistreatment reported by participants, including body shaming, microaggressions, ‘pimping’,23 unnecessarily harsh communication and disparaging comments about knowledge base, level of training or chosen career path. 

참가자들은 또한 동료들로부터 수치심을 유발시키는 학대를 보고했으며, 이는 다음과 같은 형태를 취했다. 

  • 자신의 전공 선택 또는 학부 기관에 대한 경시. 
  • 직무 윤리에 대한 비판 
  • 시험에서 어려움을 겪은 후 지능에 대한 의심
  • 개인적 삶의 선택에 대한 비판(예: 개인적 관계)

Participants also reported shame-triggering mistreatment from peers, which took the form of

  • belittlement about their specialty choice or their undergraduate institution;
  • critiques of their work ethic;
  • questions about their intellect after struggling on a test; or
  • criticisms about personal life choices (eg, personal relationships). 

요약하자면, 페이튼의 수치심은 감독관의 학대mistreatment와 환자와의 단절로 촉발되었다. 그녀의 수치심은 심리적으로 안전하지 않은 환경, 소속감 손상, 완벽주의, 타인과의 비교, 정체성의 변화 등과 관련된 현상에 의해 촉진되었다. 
In summary, Peyton's shame was triggered by supervisor mistreatment and disconnection with patients. Her shame was promoted by phenomena related to a psychologically unsafe environment, impaired belonging, perfectionism, comparisons to others and a shifting identity. 

4 | 토론
4 | DISCUSSION


우리의 분석 과정을 통해 발전된 [불의 비유]는 참가자들의 수치심 반응의 기원의 복잡성과 의미를 이해하는 데 도움을 주었습니다. 이러한 은유를 통해 [의과대학의 경험]을 가연성combustible 물질로 개념화하고, 수치심이 발생하게 prime 되어 있다고 개념화할 수 있었다. 다시 말해, 많은 의대 학습자들에게 의대 환경을 탐색하는 것은 수치심을 경험할 수 있는 상당한 위험(필연적인 위험은 아님)을 야기하는 것으로 보입니다. 
The metaphor of fire, developed throughout our analysis processes, helped us understand the complexity and meaning of the origins of participants' shame reactions. Through this metaphor, we came to conceptualise the medical school experience as being combustible and primed for the development of shame. In other words, for many medical learners, navigating the medical school environment appears to incur substantial—but not inevitable—risk of experiencing shame. 

우리의 자료는 이러한 위험과 의대생들의 수치심 발달에 [환경적 요인]이 기여한다는 것을 강하게 시사하고 있습니다. 학대mistreatment는 강력하고 (학생과 전공의에게) 공통적인 수치심 트리거로서, 환경적 요인 중 하나입니다. 참가자가 보고한 괴롭힘, 체면치레, 핌핑, 모욕적 처우, 그리고 학문적 투쟁에 대한 지나치게 가혹한 반응은 유감스럽게도 의학 교육에서 흔하며, 학습 환경에서 불필요하게 수치심의 위험을 증가시키는 것으로 보인다. 본 연구에서는 강조하는, 현재 상당히 과소평가하고 있다고 생각하는 것은, 이러한 mistreatment가 의학 학습자에게 미칠 수 있는 엄청난 감정적 영향입니다. 실제로, 많은 참여자들은 때로는 다른 사람들을로부터, 교육학적 전략(예: 핌핑)을 가장하여, [상당한 권력이나 영향력을 가진 감독관]들의 손에 의해, 학대당하는 심대하고 장기간 지속된 수치심을 경험했습니다. 

Our data strongly suggest that factors from the environment contribute to this risk and the development of medical students' shame. Mistreatment, a potent and common shame trigger in both our participants and residents,4-6 is one such environmental factor. The harassment, body shaming, pimping, derogatory treatment and overly harsh responses to academic struggle that our participants reported are unfortunately common in medical education24,34,35 and appear to unnecessarily increase the risk of shame in the learning environment. What our study emphasises—and what we believe is significantly underrecognised—is the overwhelming emotional impact this treatment can have on medical learners. Indeed, many of our participants experienced significant and prolonged shame upon being mistreated by others, sometimes under the guise of pedagogical strategy (eg, pimping) and often at the hands of supervisors with significant power or influence over them. 

의대생들의 수치심은 단순히 환경의 특성 이상의 영향을 받는 것으로 보인다. 본 연구에서는 수많은 참가자들이 의학을 배우는 과정에서 정상적이고 충분히 있을 수 있는 사건(답을 틀리거나, 여러 사람 앞에서 struggle하거나, 부정적 피드백 을 받는 것 등)으로 촉발된 수치심 반응을 보고했습니다. 이러한 사건들이 수치심을 유발하는 경향은 고정된 사고방식의 존재와 성과에 기초한 자존감 같은 [개인적 특성]에 영향을 받는 것으로 보였다. 지적 능력은 고정되어 있고 바꿀 수 없다는 믿음으로 정의되는 고정(즉, 실체적entity) 마음가짐은 수치심의 위험을 증가시키는 것으로 보였으며(예: '나는 결코 충분히 똑똑하지 않을 것이다; 그러므로 나는 멍청하다'), 수치심 반응은 고정 마음가짐(예: '나는 멍청하다; 그러므로 결코 똑똑하지 않을 것이다')을 고착시키는 것으로 보였다. 
Shame in medical students appears to be influenced by more than just the nature of the environment. In our study, numerous participants reported shame reactions triggered by events considered normal and expected in the course of learning medicine, such as being wrong, struggling in public and receiving negative feedback. The tendency for these events to cause shame appeared to be influenced by personal characteristics such as the presence of fixed mindsets and performance-based self-esteem. Fixed (ie, entity) mindsets, defined as the belief that intellectual ability is fixed and unchangeable,36 appeared to increase the risk of shame (eg, ‘I'll never be smart enough do this; therefore, I'm stupid’), and shame reactions appeared to entrench fixed mindsets (eg, ‘I'm stupid; therefore, I'll never be smart enough to do this’).

많은 참가자들에게, [고정 마음가짐]의 존재는 정상적인 학습의 어려움을 자신에 대한 전체적인 무가치함이나 약점(수치심)의 증거로 변화시켰다. (개인의 자긍심이 성취감과 수행능력 인식 수준에 따라 좌우되는 자긍심의 한 유형으로 정의되는 )[수행능력-기반 자존감]도 연구에서 정상적인 학습 사건과 관련된 수치심을 증폭시켰다. 연구 결과에 따르면 관찰, 평가 및 수행능력 사이의 경계가 모호해지면 불안, 임포스터리즘, 자기-의심을 유발할 수 있습니다.27, 39 우리의 데이터는 이러한 발견을 반복하며 수치심을 목록에 추가할 것을 시사합니다. 

For many participants, the presence of a fixed mindset turned a normal learning struggle into proof of global unworthiness or deficiency (ie, shame). Performance-based self-esteem, defined as a type of self-esteem in which an individual's self-worth is contingent upon their sense of accomplishment and perceived level of performance,37, 38 also amplified shame related to normal learning events in our study. Research has shown that the blurred lines between observation, assessment and performance can drive anxiety, imposterism and self-doubt.27, 39 Our data reiterate these findings and suggest that shame be added to the list. 


이론적으로 수치심의 위험을 줄이기 위해서 [수행능력-기반 자존감]과 [고정 마음가짐]과 같은 특성은 [수정가능]하다 (아래 참조). 다만, 참가자가 수치심에 기여했다고 보고한 인종/인종, 성적 성향, 성 정체성, 종교적 신념, 고향, 학문적 혈통 등 [수정불가능]한 요인도 확인하였습니다. 중요한 것은 참가자들의 수치심을 자극한 것은 단순히 이러한 인구통계적 요인의 존재가 아니었다. 오히려, 이러한 인구통계학적 요인들이 (잘 표현되지 않는) 환경과의 상호작용을 통해 수치심이 유발되고 지속되었다. 우리의 underrepresent background을 가진 많은 참가자들에게, 면접 날이나 수업 첫날에 의과대학에 들어가는 것만으로도 상당한 수치심과 소속감에 대한 질문을 불러일으켰습니다. 일단 입학한 후에도, 자기-가치를 보호해주는 원천의 상실(예: 소셜 네트워크, 취미 및 가정과의 근접성), [새로운 문화 규범에 동화되어야 한다는 압박], 의대에 입학할 만큼의 [가치가 있음를 입증해야 한다는 압박]은 기존의 수치심을 증폭시키거나 새롭게 촉발시키는 데 도움을 주었다. 
Characteristics such as performance-based self-esteem and fixed mindsets can theoretically be modified to reduce the risk of shame (see below). However, we also identified non-modifiable factors that participants reported as contributing to their shame, including race/ethnicity, sexual orientation, gender identity, religious beliefs, hometown and academic pedigree. Importantly, it was not simply the presence of these demographic factors that precipitated  participants' shame. Rather, their shame was often triggered and sustained through interactions with an environment in which these demographic factors were underrepresented. For many of our participants from underrepresented backgrounds, simply walking into medical school on interview day or the first day of classes precipitated significant shame feelings and questions of belonging. Once enrolled, loss of protective sources of self-worth (eg, social networks, hobbies and proximity to home), pressure to assimilate to new cultural norms and the need to prove one's worthiness to be in medical school amplified existing shame or helped to trigger it anew. 

마지막으로, 우리는 [표준화된 시험]과 [비표준화된 시험]을 모두 포함하여 [평가]가 참가자들의 수치심 경험에 상당한 영향을 미친다는 것을 발견했습니다. 객관적 평가가 동료와의 비교를 위한 명확한 측정 척도를 제공했을 뿐만 아니라, 많은 참가자는 객관적 수행능력의 실수를 스스로의 무가치함, 소속성 결여, 임포스터 증후군에 대한 결정적인 증거로 해석했다. 객관적 평가는 전공의에 대한 최근 연구에서 간헐적인 수치심 유발 요인이었지만, 객관적 평가에서 주관적 평가로의 전환(상대적 측정 막대 부족으로 정의됨)은 특히 객관적 지표 대신 지나치게 가혹한 자기 평가에 의존할 때 전공의의 수치심에 더 큰 기여를 했다.6 따라서 의대에서 자긍심을 평가하기 위해 객관적인 수행방안에 의존하는 것은 자긍심이 성과에 좌우되지만 객관적인 조치는 사라졌을 때 레지던트에서 정서적 고통을 선사할 수 있다. 
Finally, we found that assessment—including both standardised and non-standardised testing—exerted substantial influence on our participants' shame experiences. Not only did objective assessment provide a clear measuring stick for peer-to-peer comparisons, but numerous participants interpreted lapses in objective performance as definitive proof of their perceived unworthiness, lack of belonging and imposter syndrome. While objective assessment was an infrequent shame trigger in the recent study on residents, the transition from objective to subjective assessment—defined by the relative lack of a measuring stick—was the greater contributor to resident shame, especially when they relied on overly harsh self-assessments in the place of objective markers.6 It is thus possible that relying on objective performance measures to assess self-worth in medical school presages emotional distress in residency when self-worth remains contingent on performance but objective measures disappear. 

4.1 | 의과대학에서 수치심의 위험 해결 및 완화
4.1 | Addressing and mitigating the risk of shame in medical school


수치심의 위험을 줄이고, 수치심을 느끼는 학생들을 지원하고, 교육 안전을 강화하기 위해 우리는 제안합니다.

  • (a) [진정한 포용성]을 보장하고, 우리의 학습 환경에서 [진정한 자기 표현]을 촉진한다.
  • (b) [성장 마인드셋]을 촉진하고 성과가 아닌 [리허설]을 장려한다.
  • (c) 우리 기관의 [학대 및 의도적인 수치심 주기shaming를 제거]하는 것.

To dampen the risk of shame, support students experiencing shame and enhance educational safety, we suggest

  • (a) ensuring true inclusivity and promoting authentic self-expression in our learning environments,
  • (b) facilitating growth mindsets and encouraging rehearsal, not performance, in our students and
  • (c) eliminating mistreatment and intentional shaming in our institutions. 


underrepresentation이 수치심을 유발할 수 있다는 사실을 감안할 때, 점점 더 다양한 학생들을 의과대학에 모집하려는 노력에도 불구하고, (우리가 아직) 진정한 소속감, 포용감, 진정한 자기표현을 촉진할 수 있는 환경을 조성하지 못하고 있을 수 있다고 생각합니다. 수치심의 위험을 줄이고 수치심의 회복력을 높이기 위해, 특히 URM의 학생들을 위해, 우리는 [자기표현]과 [개인적 정체성 형성]을 전문적 표준의 내면화(즉, 직업적 정체성 형성)와 같은 중요도로 높여야 합니다. 
Given our finding that underrepresentation can promote shame, we believe, like others,40 that despite efforts to recruit increasingly diverse students into medical school, we may be failing to create environments that promote true belonging, inclusion and authentic self-expression. To reduce the risk of shame and promote shame resilience, particularly for students from underrepresented backgrounds, we should elevate self-expression and personal identity formation to the same level of importance that we ascribe to the internalisation of professional standards (ie, professional identity formation).41 

[개인 정체성 형성]을 육성하기 위한 구체적인 이니셔티브는 다음을 포함할 수 있다.

  • 학생들이 학습 환경 내에서 문화적, 개인적 정체성의 측면을 실제로 표현하고 통합할 수 있는 배출구 제공.
  • 학생들이 자신의 정서적 경험을 공유할 수 있는 안전하고 지지적인 공간을 만듭니다. 
  • 학습 환경을 최적화하고 [microaggression 및 공공연한 인종차별]과 같은 수치심 유발에 직면한 학생들을 지원하기 위한 암묵적 편견, allyship, 반인종주의에 대한 교수 훈련
  • 부족한 학생들의 경험을 공감하고 지원할 수 있는 멘토의 존재를 보장합니다. 

Specific initiatives to nurture personal identity formation could include

  • providing outlets for students to authentically express and integrate aspects of their cultural and personal identities within the learning environment;
  • creating safe, supportive spaces for students to share their emotional experiences;
  • faculty training on implicit bias,42 allyship43 and anti-racism44 to optimise the learning environment and support students confronted with shame triggers such as microaggressions and overt racism; and
  • ensuring the presence of mentors who can relate to and support the experiences of underrepresented students.45

이러한 노력이 underrepresented 학생들에게 집중될 수 있지만, 기관의 모든 구성원들에게까지 확대되어야 한다.
While these efforts may focus on underrepresented students, they should extend to all members of the institution. 

[성장 마음가짐] 구축과 [학습을 (성과가 아닌) 리허설rehearsal로 재구성하는 것]은 학업적 어려움으로 인한 수치심의 위험을 줄이기 위한 두 가지 전략이다. 연구에 따르면 적어도 일시적으로만이라도 자신의 고유 역량에 대한 개인의 사고방식이 바뀔 수 있다.36 교육자는 아래 활동을 통해 성장 마음가짐을 촉진할 수 있다.

  • 현실적인 기대치를 유지하고,
  • 학업적 고군분투를 성장 기회로 재구성하고,
  • 학습 환경에서 심리적 안전성을 확립하고, 
  • 근본적인 수치심을 탐색하고 해소하는 것.

Establishing growth mindsets36 and reframing learning as rehearsal, not performance, are two strategies to reduce the risk of shame in the midst of expected academic struggle. Research indicates that individuals' mindsets about their inherent capabilities can be changed, at least temporarily.36 Educators can facilitate growth mindsets by helping learners

  • maintain realistic expectations,
  • reframing academic struggle as a growth opportunity,
  • establishing psychological safety in the learning environment and
  • identifying and addressing underlying shame.

또한 학습자에게 수행perform이 아닌 리허설을 권장함으로써 탐색, 투쟁, 실패를 허용하고, 동시에 이러한 어려움에 내재된 학습 가치를 강조합니다. 

Furthermore, by encouraging learners to rehearse—rather than perform—we grant them permission to explore, struggle and fail, simultaneously emphasising the learning value inherent in this struggle. 


의학교육의 공동 목표가 [역량있고, 참여적이며, 공감적이고, 회복탄력적인] 의사를 배출하는 것이라고 가정할 때, 우리 교육 시스템에서 수치심을 유발하는 학대(특히 의도적으로 부과된 학대)는 설 자리가 없으며, 반드시 제거되어야 합니다. 그러나 이러한 행동의 근절을 복잡하게 만드는 것은 우리가 확인한 많은 [수치심 유발자와 촉진자]가 어느정도 의학과 의학교육의 문화에 내재되어 있을 수 있기 때문이다. 학대, 가혹한 교육방법, 포괄성 결여, 높은 수준의 경쟁, 성과에 대한 과도한 의존, 완벽주의, 개인 정체성 형성에 대한 낮은 강조 등이 그것이다. 수치심 치료를 없애기 위한 노력과 함께 의학에서 수치심 문화가 존재할 가능성을 고려하고 탐구해야 한다.

Assuming that our shared goal in medical education is to produce competent, engaged, empathic and resilient physicians, shame-inducing mistreatment—especially that levied intentionally—has no place in our education system and must be eliminated. Complicating the eradication of these behaviours, however, is the degree to which many of the shame triggers and promoters we identified may be embedded in the culture of medicine and medical education, including mistreatment, harsh teaching tactics, lack of inclusivity, high levels of competition, excessive reliance on objective measures of performance, perfectionism and low emphasis on personal identity formation. Alongside efforts to eliminate treatment intended to shame, we should consider and explore the potential existence of a shame culture in medicine. 


4.2 | 한계
4.2 | Limitations



5 | 결론
5 | CONCLUSION


사실, 그것은 정상적인 인간의 감정이기 때문에, 수치심의 위험을 완전히 없애는 것이 우리의 목표가 되어서는 안 되며, 그렇게 할 수도 없습니다. 대신 우리는 이러한 위험의 원인을 식별하고 불필요한 위험 요소를 제거하며 학습자가 남아 있는 위험 요소에 완전하고 확실하게 참여할 수 있도록 지원해야 합니다.
In fact, because it is a normal human emotion, complete elimination of the risk of shame should not—and likely cannot—be our goal. We should instead strive to identify the sources of this risk, eliminate those that are unnecessary and support learners in fully and authentically engaging with those that remain. 



12. Tsuei SH, Lee D, Ho C, Regehr G, Nimmon L. Exploring the construct of psychological safety in medical education. Acad Med. 2019;94(11S):S28-S35.

 

 


Med Educ. 2021 Feb;55(2):185-197.

 doi: 10.1111/medu.14354. Epub 2020 Sep 13.

'I'm unworthy of being in this space': The origins of shame in medical students

William E Bynum 4th 1Lara Varpio 2Janaka Lagoo 3Pim W Teunissen 4

Affiliations collapse

Affiliations

  • 1Department of Family Medicine and Community Health, Duke University School of Medicine, Durham, NC, USA.
  • 2Department of Medicine, Uniformed Services University, Bethesda, MD, USA.
  • 3Duke Family Medicine Residency Program, Department of Family Medicine and Community Health, Duke University School of Medicine, Durham, NC, USA.
  • 4School of Health Professions Education, Maastricht University, Maastricht, The Netherlands.
  • PMID: 32790934
  • DOI: 10.1111/medu.14354Abstract
  • Objectives: Shame results from a negative global self-evaluation and can have devastating effects. Shame research has focused primarily on graduate medical education, yet medical students are also susceptible to its occurrence and negative effects. This study explores the development of shame in medical students by asking: how does shame originate in medical students? and what events trigger and factors influence the development of shame in medical students?Results: Data analysis yielded structural elements of students' shame experiences that were conceptualised through the metaphor of fire. Shame triggers were the specific events that sparked shame reactions, including interpersonal interactions (eg, receiving mistreatment) and learning (eg, low test scores). Shame promoters were the factors and characteristics that fuelled shame reactions, including those related to the individual (eg, underrepresentation), environment (eg, institutional expectations) and person-environment interaction (eg, comparisons to others). The authors present three illustrative narratives to depict how these elements can interact to lead to shame in medical students.
  • Conclusions: This qualitative examination of shame in medical students reveals complex, deep-seated aspects of medical students' emotional reactions as they navigate the learning environment. The authors posit that medical training environments may be combustible, or possessing inherent risk, for shame. Educators, leaders and institutions can mitigate this risk and contain damaging shame reactions by (a) instilling a true sense of belonging and inclusivity in medical learning environments, (b) facilitating growth mindsets in medical trainees and (c) eliminating intentional shaming in medical education.
  • Methods: The study was conducted using hermeneutic phenomenology, which seeks to describe a phenomenon, convey its meaning and examine the contextual factors that influence it. Data were collected via a written reflection, semi-structured interview and debriefing session. It was analysed in accordance with Ajjawi and Higgs' six steps of hermeneutic analysis: immersion, understanding, abstraction, synthesis, illumination and integration.

 

감정적 사건의 보초병: 전공의의 수치심 경험의 특징, 트리거, 효과(Acad Med, 2019)
Sentinel Emotional Events: The Nature, Triggers, and Effects of Shame Experiences in Medical Residents
William E. Bynum IV, MD, Anthony R. Artino Jr, PhD, Sebastian Uijtdehaage, PhD, Allison M.B. Webb, MD, and Lara Varpio, PhD 

 

[수치심]은 실수를 하거나 학대를 경험하는 것과 같은 부정적인 사건에 반응하여 발생하는 강력한 감정입니다.1–3 수치심이 의학 학습자에게 미치는 영향을 조사한 연구는 거의 없습니다. 우울증, 불안, 외상 후 스트레스 장애, 중독 등 정신 건강 문제와 관련된 수치심이 일반인에서 흔히 발생하는 점을 감안하면 이러한 부주의가 문제가 된다.4 
Shame is a powerful emotion that occurs in response to negative events such as making mistakes or experiencing mistreatment.1–3 Little research has investigated the influence of shame on the medical learner. This inattention is troubling, given the common occurrence of shame in the general population and its association with mental health problems, including depression, anxiety, post-traumatic stress disorder, and addiction.4 

수치심리학에 대한 연구는 이러한 감정, 특히 트레이시와 로빈스의 작품을 이해하는 귀중한 이론적 기반을 제공합니다.7-9 [자의식적 감정]으로서, 개인이 부정적인 사건에 대응하여 자기 평가를 할 때 수치심이 생긴다. 7,10 수치스러운 개인은 촉발된 사건을 [자신의 지적 능력]이나 [전체적인 능력] 등 [전반적이고 변하지 않는 무언가]에 귀속시킨다. 또한 자아를 행동으로부터 구분하지 못하게 된다.11 따라서 수치심은 자신에 대한 전체적인 부정적인 평가와 연관되며, 수치심을 느끼게 되면 스스로에 대해 결함, 결핍, 무가치함, 손상받음 등을 느끼는 어려움을 겪는다.2
Research into the psychology of shame provides a valuable theoretical foundation for understanding this emotion, particularly the work of Tracy and Robins.7–9 As a self-conscious emotion, shame arises when an individual engages in self-evaluation in response to a negative event, such as a perceived transgression or failure to reach an expectation.7,10 Shamed individuals attribute a triggering event to something global and unchanging about themselves, such as their intellect or overall capability, and fail to distinguish the self from the behavior.11 Thus, shame is associated with negative evaluations about the entire self,12 and the shamed individual struggles with feeling defective, deficient, unworthy, and/or damaged.2

중요한 것은 수치심은 죄의식guilt과 다르다.13 죄의식을 느끼는 사람은 죄의식을 느끼는 사람은 자신의 행동이나 노력 수준과 같이 자신의 구체적이고 변화 가능한 것에 탓한다.1,10 [죄책감]을 느끼는 사람은 "나는 나쁜 행동을 했어"라고, [수치심]을 경험하는 사람은 "나는 나빠"라고 말할 것이다.
Importantly, shame is different from guilt.13 Although guilt also occurs following a transgression or failure to meet an expectation, individuals experiencing guilt blame the transgression on something specific and changeable about themselves, such as their behavior or level of effort.1,10 Whereas the person experiencing guilt would say, “I did a bad thing,” the person experiencing shame would say, “I am bad.”

임상 환경에서 학습자는 일반적으로 수치심을 유발할 수 있는 상황을 경험한다: 오류를 범하거나, 지식 부족을 발견하거나, 어려운 피드백을 받거나, 낮은 환자 결과를 접하거나, 높은 수준의 성과를 달성하지 못하는 경우. 5,14–18 수치심의 영향에 대한 의학적 학습자의 민감도는 다음의 영향을 받을 수 있다.

  • 신체적 특성(예: 완벽주의 및 성격 유형 19), 
  • 환경적 영향(예: 열악한 심리적 안전 및 학습자 학대 20,21), 
  • 제도적 한계(예: 정신 건강 자원에 대한 접근 불량 22). 

In clinical environments, learners commonly experience situations that could trigger shame: making errors, uncovering knowledge deficits, receiving difficult feedback, encountering poor patient outcomes, and failing to meet high standards of performance.5,14–18 Medical learners’ susceptibility to the effects of shame may be influenced by

  • unique personal characteristics (e.g., perfectionism and personality type19),
  • environmental influences (e.g., poor psychological safety and learner mistreatment20,21), and
  • institutional limitations (e.g., poor access to mental health resources22). 

 

방법
Method


해석적 설계
Hermeneutic design

전공의들의 수치심 체험에 영향을 미치는 요소들에 대한 풍부한 이해를 쌓고 싶어서 현상학적 연구를 선택하게 되었습니다. 우리의 연구 방법으로 우리는 [살아있는 경험의 의미와 그것을 형성하는 맥락적 힘을 탐구]하는 [해석적 현상학]을 선택했다. 우리는 다음의 이유로 [서술적 접근법]이나 [초월적 접근법]보다 이것을 선택했다. 

  • 참가자의 경험을 완전히 이해하는 데 있어 맥락(예: 임상 학습 환경)의 중요성
  • 이러한 경험의 깊고 잠재적으로 숨겨진 층을 탐구할 필요성
  • 연구자가 데이터 분석 프로세스에서 개인적인 경험(이 연구에서는 '수치심')을 "괄호칠" 수 없음

Because we wanted to construct a rich understanding of the factors that influence residents’ experiences of shame, we chose to conduct a phenomenological study. As our study method, we selected hermeneutic phenomenology, which explores the meaning of lived experience and the contextual forces that shape it.23,24 We chose this over descriptive or transcendental approaches because it recognizes

  • the importance of context (e.g., the clinical learning environment) in fully understanding participants’ experiences;
  • the need to explore the deeper, potentially hidden layers of these experiences23; and
  • the inability for researchers to “bracket off ” their personal experiences—in this case, with shame—from the process of data analysis.23,25,26

 

따라서 참가자들에게 자신의 가정을 조사probe하고 맥락적 힘을 포함하여 수치심 경험의 세부사항을 찾는 질문을 했습니다. 우리의 [개인적인 수치심 경험]이 우리의 해석 노력에서 빠질 수 없다는 것을 인식하고, 우리는 [서로의 수치심 경험에 대해 토론]했고, 이것은 참가자들의 경험을 이해하고 소통할 수 있는 능력을 높여주는 연습이기도 했다.

Therefore, we asked participants questions that probed their assumptions and sought details of their shame experiences, including contextual forces. Recognizing that our personal shame experiences could not be removed from our interpretation efforts, we discussed our own shame experiences with one another, a practice that enhanced our ability to connect with and understand our participants’ experiences. 

연구참여자
Participants


이번 연구는 미국 대형 교수병원 내과 레지던트들에게 이메일과 정오 보고서 공지, 공통 지역에 게시된 전단지를 통해 '전공의 기간 중 경험한 감정 탐구'로 알려졌다. 

The study was publicized to internal medicine residents in a large U.S. teaching hospital as “an exploration of emotions experienced during residency” through e-mails, noon report announcements, and flyers posted in common areas. 



자료 수집
Data collection


2016-2017년에는 참가자들과 개별적이고 반구조적인 인터뷰를 실시하여 각각 약 2시간 동안 진행되었습니다. 각 인터뷰는 과거의 수치심 경험에 대한 적극적인 반성을 자극하기 위한 서면 성찰 연습으로 시작되었습니다.26 참가자는 "수련 중에 자신의 부족함, 결점, 무가치함 느끼게 하는 특정 상황에 대해 작성"하도록 요청받았습니다. 우리가 '수치심'이라는 단어 대신, 이러한 표현들을 사용한 것은 [스티그마를 트리거링 하지 않기 위함]이면서, [죄책감과 같이 '수치심'과 연관된 구인construct 사이의 혼동을 피하기 위해서]였다. 참가자는 30분 동안 자신의 성찰을 작성해야 했다. 
During 2016–2017, we conducted individual, semi-structured interviews with participants, lasting approximately two hours each. Each interview began with a written reflection exercise to stimulate active reflection on past shame experiences.26 The participant was asked to “write about a specific situation during your medical training that caused you to feel deficient, flawed, and/or unworthy.” We used these terms—all characteristics of shame from the psychology literature2,5— instead of the word shame to avoid triggering stigmas and to avoid confusion between shame and related constructs such as guilt.13 The participant had 30 minutes to write his or her reflections. 

그 직후, 참가자는 면접관(W.E.B.)을 만났다. 참가자가 기다리는 동안 인터뷰 진행자는 성찰 내용을 읽고 이어지는 반구조적 인터뷰 동안 심층적인 조사를 위한 영역을 파악했습니다.26 인터뷰 가이드의 샘플 질문은 보충 디지털 부록 1)에 제시되어 있습니다. 
Immediately thereafter, the participant met with the interviewer (W.E.B.). While the participant waited, the interviewer read the reflection and identified areas for deeper probing during the semi- structured interview that followed.26 Sample questions from the interview guide are presented in Supplemental Digital Appendix 1 at http://links.lww.com/ACADMED/A609. 

인터뷰는 음성녹음, 외부 전사자에 의해 기록되었고 전사에서 개인을 식별되지 않게 하였다. (참고: W.E.B.는 연구를 수행한 부서의 구성원이 아니며, 참여자에 대한 감독이나 평가를 제공한 적이 없습니다.) 

Interviews were audio- recorded, transcribed by an external transcriptionist, and de-identified during transcription. (Note: W.E.B. is not a member of the department in which the study was conducted and never provided supervision for or evaluation of the participants.) 

자료 분석
Data analysis


데이터 분석은 Ajawi와 Higgs에 의해 기술된 6단계의 해석적 분석을 따랐다. 이 접근방식은 "참여자의 해석과 구성의 체계적 식별(1차 구성)을 지원하며, 연구자 자신의 이해, 해석 및 구성(2차)과 계층화된다." 표 2는 이 접근법의 6단계와 각 단계에서의 우리의 구체적인 활동을 설명합니다.

Data analysis was informed by the six stages of hermeneutic analysis described by Ajjawi and Higgs.26,28 This approach supports “systematic identification of participants’ interpretations and constructs (first-order constructs), which [are] then layered with the researchers’ own understandings, interpretations, and constructs (second order).”26 Table 2 describes the six stages of this approach and our specific activities at each stage. 



결과
Results


수치심 경험의 본질
The nature of shame experiences


수치심 경험의 모든 기억에서, 참가자들은 촉발된 사건에 대응하여 그들 자신을 전체적globally 결함이 있고, 부족하며, 가치 없는 존재로 평가한다고 표현했다. 수치스러운 반응 동안, 참가자들은 자신들을 다음과 같이 칭했다.
In all recollections of shame experiences, participants described assessing themselves as globally flawed, deficient, or unworthy in response to a triggering event. During a shame reaction, participants (Ps) labeled themselves as

• 결핍(P7)
• 부적격(P6),
• 충분히 똑똑하지 못하고 여기서 가장 멍청한 사람(P2)
• 최악(P5)
• 불안정하고 열등함(P8)
• 결점이 있고 마치 나에게 문제가 있는 것처럼(P3)

• deficient (P7),
• undeserving and inadequate (P6),
• not smart enough and the dumbest person here (P2),
• the worst (P5),
• unlikeable and inferior (P8), and
• flawed and like there’s something wrong with me (P3).

수치심 반응은 격렬한 육체적, 감정적 경험일 수 있다. 한 참가자는 "완전히 다른 사람이었던 몇 시간 동안 완전히 쇠약해져 있었다"는 수치심 반응을 떠올렸고(P12), 또 다른 참가자는 "내 몸에서 수영하는 것 같았다"는 느낌(P8)을 떠올렸다. 참가자들은 수치심 유발에 따라 "공격과 배신"(P8)을 느끼고 "재판받는 것 같음"(P3)을 하는 등 수치심 반응에서 희생감victimized을 느끼는 경우가 많았다. 참가자들은 또한 단점들이 어떻게 인식될 것인가, 의사로서 얼마나 성공적일 것인가, 수치심을 유발한 후 훈련을 계속하도록 허락될 것인가에 대한 두려움도 표현했다. 
Shame reactions could be intense physical and emotional experiences. One participant recalled a shame reaction that was “absolutely debilitating for several hours where I was a completely different person” (P12), and another felt “like I was swimming in my own body” (P8). Participants often felt victimized during a shame reaction, feeling “attacked and betrayed” (P8) and put “on trial” (P3) following shame triggers. Participants also expressed fears: fears about how shortcomings would be perceived, how successful they would be as physicians, or whether they would be allowed to continue training following a shame trigger. 

수치심 반응은 많은 참가자들에게 신체적 불편함을 포함했다. 그들은 "침몰하는 느낌"(P7)과 "당황함"(P11), "소름끼치는 것"(P8)을 묘사했다. 참가자들은 집중력 저하, 사고력 저하, 경주 및 자극적 사고, 시간 감각 변화 등 수치심 반응 시 인식에 미치는 영향을 보고했다. 그들은 또한 식은땀, 홍조, 떨림, 빈맥, 공황 등 교감 활성과 일치하는 증상들을 보고했다. 이러한 증상은 수치심 반응이 한창일 때 종종 발생하며 급성 스트레스 반응을 일으킬 수 있습니다: "그러니까 육체적으로 스트레스가 고조되어, fight-or-flight와 같은 반응입니다." (P9) 
Shame reactions included physical discomfort for many participants. They described “a sinking feeling” (P7), like “the wind [was] taken out of you” (P11), and “like I was crawling in my skin” (P8). Participants reported effects on cognition during shame reactions, including difficulty concentrating, slowed thinking, racing and intrusive thoughts, and an altered sense of time. They also reported symptoms consistent with sympathetic activation, including cold sweats, flushing, tremor, tachycardia, and panic. These symptoms often occurred during the height of a shame reaction and could lead to acute stress responses: “So physically there’s this … heightened sense of stress, so it’s like that fight-or-flight- type response.” (P9) 

어떤 수치심 반응은 몇 달 동안 지속된 반면, 어떤 수치심은 단 몇 분 동안 지속되었고 감정적으로 덜 격렬했습니다. 참가자들은 후자의 수치심 반응에 대해 "근본적으로 문제가 있는 것이 아니라 당신이 알아차린 것"이라고 설명했다. 덜 격렬한 수치심 반응은 일반적으로 최소한의 신체적 표현과 정서적인 감정을 수반합니다.
Some shame reactions lasted months, while others were short-lived (only minutes) and less emotionally intense. Participants described the latter type of shame reaction as “small bursts of shame” (P3) that are “not foundationally troubling but that you notice” (P6). The less intense shame reactions typically involved minimal physical manifestations and affective feelings.

그러나 [덜 강렬한 수치심 사건]도 [자주 발생하거나 다른 사소한 수치심 사건과 함께 발생할 경우] 더 심하고 고통스러운 수치심 반응으로 통합될 수 있었으며, additive한 영향이 있음 시사한다. 예를 들어, 한 참가자는 업무와 가정에서 반복적으로 실패를 인지하여 상당한 수치심을 경험했습니다. 이 조합은 그가 "당신이 어디를 가든, 하루 종일 실패하는 것 같은 느낌을 갖게 했다"고 말했다. 부가적인 수치심을 경험한 참가자들은 더 심한 수치심 반응을 경험한 참가자들처럼 많은 감동적인 감정과 생리적인 징후를 표현했습니다. 
However, less intense shame events could coalesce into more significant, distressing shame reactions if they occurred frequently or in conjunction with other minor shame events, suggesting an additive effect. For example, one participant experienced significant shame due to his perceived repeated failures at work and at home. The combination made him “feel like you’re failing all the time, no matter where you go, all day” (P9). Participants who experienced additive shame expressed many of the same affective feelings and physiological manifestations as did those who experienced more intense shame reactions. 

트리거되는 이벤트 및 수치심 반응에 기여하는 요인
Events that trigger and factors that contribute to shame reactions


수치심 반응은 주로 다음과 같은 특정 사건에 의해 유발되었습니다.

  • 환자 관리와 관련된 사건(예: 환자에게 해를 입히는 의료 오류, 환자의 고통을 덜어줄 수 없는 경우)
  • 학습과 관련된 사건(예: 감독자에 의해 교정조치 절차, "파이프"되는" 29*), 
  • 개인의 목표와 관련된 사건(예: 수석 레지던트에 선정되지 않음, 학술지에 제출된 원고 거부)

가장 격렬한 반응은 종종 의미심장하고 단일한 사건으로 촉발되었지만, 다수의 작은 수치심 유발로 인해 발생할 수도 있습니다. 차트 1

Shame reactions were most often triggered by specific events, including

  • events related to patient care (e.g., a medical error causing harm to a patient, inability to relieve a patient’s suffering),
  • events related to learning (e.g., remediation proceedings, being “pimped”29* by a supervisor), and
  • events related to personal goals (e.g., failure to be selected for chief resident, rejection of a manuscript submitted to a scholarly journal).

The most intense reactions were often triggered by a significant, singular event but could also result from the accumulation of multiple, smaller shame triggers. Chart 1 

 

다른 사람과의 비교.
Comparisons to others.

자신의 능력이 떨어지거나 자신의 기대에 미치지 못했다는 인식과 더불어, 다른 사람과 자신을 비교하려는 참가자들의 성향은 수치심을 유발했다. 동료와의 비교는 특히 훈련 초기에 우세했으며, 일부 참가자는 거의 끊임없이 비교하며 평가했다. 한 참가자는 "의사로서 저는 주로 제 자신과 제 동료들을 비교했던 것 같습니다."라고 회상했다. 내 자존심은 또래에 비해 약하다는 인식에 의해 공격당했습니다." (P9) 또 다른 참가자는 "부족함을 느끼는 경우가 빈번합니다…"라고 말했습니다. 주위를 둘러보면 남들이 더 낫다는 느낌이 들기 쉽다.(P7) 타인과의 비교로 유발된 수치심은 또한 임포스터 증후군을 암시하는 감정과 함께 일어났다.
Participants’ tendency to compare themselves to others, coupled with the perception that they were less capable and/or failed to meet their own expectations, contributed to feelings of shame. Comparisons to peers were particularly prevalent early in training, with some participants engaging in comparative assessments on a near-constant basis. One participant recounted, “I think as a doctor I was comparing myself versus my peers mainly.… My ego strength was assaulted aggressively by my perceived weakness relative to my peers” (P9). Another participant identified “frequent moments where I feel deficient…. Looking around, it is easy to feel like others are just better” (P7). Shame induced by comparisons to others also co-occurred with feelings suggestive of imposter syndrome:

수행능력에 집중
Focus on performance.


특히 객관적인 기준으로 측정했을 때 [높은 수준의 성과를 달성하지 못한 것]이 참가자들에게 수치심을 느끼게 했습니다. 수치심 반응의 기원을 다시 언급하면서, 한 참가자는 "성취로부터 많은 자아의 힘을 얻었다"고 인정했고, 다른 참가자는 인정했다. 

Failure to achieve a high level of performance, particularly as measured by objective standards, contributed to feelings of shame in participants. In recounting the origins of shame reactions, one participant admitted “deriv[ing] a lot of ego strength from accomplishments” (P9), and another acknowledged that 

주관적 기준의 어려움.
Difficulty with subjective standards.

의료 교육 초기에 객관적인 성과 표준을 강조하면서 일부 참가자는 임상 영역에서 일반적으로 사용되는 주관적인 표준으로 전환하는 데 어려움을 겪었습니다. 한 참가자는 인턴 초 자신에게 "내가 맞는 수준인가? 내가 다른 사람들과 대등한가요? 왜냐하면 테스트[수행]한 것 외에 다른 방법은 없기 때문입니다."(P2). 객관적인 기준이 부족하면 자신에 대한 의심과 수치심의 문이 열리고 정확한 자기 평가는 어려워지는데, 한 참가자는 이를 "점점 측정막대를 사용하는 빈도를 줄여가면서 지속적으로 측정한다"(P3)고 설명했다.
Emphasis on objective standards of performance early in medical training caused some participants to struggle with the transition to subjective standards commonly used in the clinical realm. One participant recalled asking herself early in the intern year, “Am I at the right level? Am I on par with where everyone else is? Because there’s no other way to gauge it other than … the testing that you have [done]” (P2). Lack of objective standards opened the door for self-doubt and shame and made accurate self-assessment difficult, a phenomenon one participant described as “continually measuring yourself with less and less of a measuring stick” (P3).


완벽주의
Perfectionism.


성취할 수 없는 완벽한 수행 기준을 충족시키지 못했을 때 부족함이나 결함을 느꼈던 많은 참가자들에게 완벽주의는 수치심의 원인이 되었다. 
Perfectionism contributed to shame for many participants, who felt deficient or flawed when they failed to meet unattainable standards of perfect performance. 

수행능력 부진underperformance으로 수치심에 시달리는 한 참가자에게 수치심을 극복하는 데 어느 정도의 성과가 필요했겠느냐고 물었다. 그의 대답은 완벽주의가 그의 자기 평가를 어느 정도 물들였는지를 강조했습니다. 

We asked one participant, who struggled with shame due to perceived underperformance, what level of performance would have been enough to help him overcome his shame. His answer underscored the extent to which perfectionism colored his self-evaluation: 

판단에 대한 두려움.
Fear of judgment.


판단(받는 것)에 대한 두려움이 참가자들의 수치심 반응에 큰 영향을 미쳤다. 참가자들은 동료, 감독관, 환자 및 가족의 다양한 판단을 두려워했습니다.

  • 공공장소에서 질문에 부정확하게 답변(특히 정오 보고서),
  • M&M 컨퍼런스에서 실수를 탐문당하는 것
  • 도움을 요청하기 위해 상사에게 접근하는 것
  • 사랑하는 사람들과 실패에 대해 토론하는 것

Fear of judgment was a potent contributor to participants’ shame reactions. Participants feared judgment from peers, supervisors, patients, and families in a variety of forms:

  • answering questions inaccurately in public (particularly at noon report),
  • having errors scrutinized in morbidity and mortality conferences,
  • approaching supervisors for help, and
  • discussing failures with loved ones.

공개적 노출은 참가자들의 판단에 대한 두려움을 고조시켰고 수치심을 증폭시켰다. 평판은 다음과 같은 인식된 판단에 의해 유발되는 불안의 중심이었다.

Public exposure heightened participants’ fear of judgment and amplified feelings of shame. Reputation was central to the anxiety invoked by these perceived judgments: 


편향된 기준 프레임
Skewed frame of reference.

참가자들은 종종 맥락적 현실과 일치하지 않는 레퍼런스 프레임을 통해 자신을 분석했습니다. '왜곡된 기준틀'을 통해 자신을 평가하는 것은 지나치게 혹독한 자기평가와 수치심으로 이어질 수 있다. 이러한 [왜곡된 기준틀]은 일부 참가자로 하여금 self-blame을 할 필요가 없는 상황적 증거에조차 저항하게 만들었다. 
Participants often analyzed themselves through frames of reference that were inconsistent with contextual realities. Self-evaluating through a “skewed frame of reference” could lead to overly harsh self-assessments and feelings of shame. This skewed frame of reference led some participants to resist situational evidence that challenged their self-blame. 

실수를 저지른 후에 왜곡된 기준틀을 사용하게 되면, [서포트를 주고자 했던 사람에 대한 불신]을 불러올 수 있으며, 이는 고정적인 수치심 반응에 기여할 수 있다. 
A skewed frame of reference following an error could lead to mistrust of the people who attempted to provide support, contributing to a fixed shame reaction. 

어떤 참가자들은 그들이 [충분히 훌륭하다는 증거를 무시하거나 경시함]으로써 왜곡된 참조 틀을 드러냈습니다. 한 참가자는 "긍정적인 평가를 많이 받았지만, 나는 여전히 내 자신에 대해 개똥같은 느낌이 들었다"고 회상했다.
Other participants manifested a skewed frame of reference by ignoring or downplaying evidence that they were good enough. One participant recalled getting “a lot of positive reviews, but I still felt pretty shitty about myself ” (P9).

상사의 중요한 역할.
The critical role of supervisors.

참가자들은 감독관과의 상호작용이 수치심 반응에 반대의 영향을 미칠 수 있다고 보고했다. 즉, 감독관에 의한 대우는 그들의 수치심 반응을 증폭시키거나 완화시킬 수 있다. 첫 중환자실 순환에서 고군분투하던 한 참가자는 그의 명백한 고군분투에 대한 반응으로 환자 회진에서 그를 "헐뜯고" "호되게 비판"한 전임의로부터 가혹한 대우를 받았다. 이것은 회진할 때 그가 이미 느끼고 있었던 낮은 퍼포먼스에 대한 수치심을 상당히 고조시켰다. 그는 이어 감독관이 만든 유해하고 "심리적으로 안전하지 않은" 환경의 영향에 대해 다음과 같이 설명했습니다. 
Participants reported interactions with supervisors that could have opposite effects on their shame reactions: treatment by a supervisor could either amplify or mitigate their shame reactions. A participant struggling on his first ICU rotation encountered harsh treatment from a fellow who “picked on” and “crucified” him on patient rounds in response to his obvious struggles (P5). This significantly heightened the shame he was already feeling from his perceived low performance on rounds. He went on to recount the effects of a toxic, “psychologically unsafe” environment created by the supervisor: 

또 다른 참가자는 실수로 인한 수치심 반응으로 휘청거리다가 한밤중에 한 동료에 의해 호출되어 환자가 coded되었음을 알렸다. 다음날 아침, 그는 감독관에게 도움을 청하지 않아 질책을 받았고, M&M 회의가 열릴 것이라는 통보를 받았다. 이러한 치료는 그의 정서적 안녕을 평가하거나 지지를 제공하려고 시도하기 전에 일어났으며, 그의 기존 수치심(P3)의 효과를 현저하게 증가시키고 연장시켰다. 
Another participant, reeling from an error- induced shame reaction, was called in the middle of the night by a fellow to inform him that his patient had coded. The next morning, he was chided for not seeking help from the supervising fellow and was informed that a morbidity and mortality conference would be held. This treatment, which occurred before attempts to assess his emotional well-being or provide support, significantly heightened and prolonged the effects of his existing shame (P3). 

한편 참가자들은 수치심 반응의 심각성이나 지속시간을 [완화하고 회복에 도움이 되는 감독관과의 상호작용]도 보고했다. 이러한 상호작용에는 오류 후의 디브리핑(P11), 전공의를 개인으로 이해하려는 시도(P2), 전공의가 수행능력 어려움을 겪는 것을 인정해주고 개선해야 할 행동에 초점을 맞추는 것(P5), 전공의 성과에 대한 현실적인 기대를 설정하여 참조 틀을 "바로잡으려는" 노력(P71) 등이 포함되었습니다.

On the other hand, participants also reported interactions with supervisors that mitigated the severity or duration of their shame reactions and aided in recovery. Such interactions included

  • a debriefing session following an error (P11),
  • attempts to understand the resident as a person (P2),
  • acknowledgement of a resident’s performance struggles and a focus on specific behaviors to improve (P5), and
  • efforts to “unskew” a participant’s frame of reference by establishing realistic expectations of performance (P7). 

 

수치심 경험의 부정적 인식 효과
Negative perceived effects of shame experiences


주요 수치심 반응의 즉각적인 여파로 일부 참가자에게는 몇 시간에서 며칠, 다른 참가자에게는 몇 주부터 몇 달까지 지속되는 부정적 영향을 일관되게 표현했다.
In the immediate aftermath of major shame reactions, participants consistently articulated negative effects that persisted for hours to days for some participants and from weeks to months for others.

사회적 고립과 소속감 저하.
Social isolation and impaired sense of belonging.

참가자들은 수치스러운 반응 후에 외로움을 느끼고 사회적으로 교류할 의욕이 없다고 흔히 보고한다.
Participants commonly reported feeling alone and unmotivated to socially interact after a shame reaction.

참가자들은 수치심 반응에 이어 의학계 내 소속감 저하를 자주 표현했다.
Participants frequently expressed feelings of impaired belonging within the profession of medicine following shame reactions.

참석자들은 고립감과 소속감 때문에 다른 사람에게 도움을 청하기가 어려워져 정서적 고통이 길어지고 대인관계에 영향을 미친다고 설명했다.

Participants explained that feelings of isolation and impaired belonging made it more difficult to reach out to others for help, prolonging their emotional distress and impacting personal relationships.

배움에서 멀어짐.
Disengagement from learning.

참가자들은 수치심 반응 동안 학습 의욕을 상실했다고 설명했습니다. 예를 들어, "핌핑" 29와 관련된 수치심은 한 참가자가 라운드를 두려워하게 하고, 만약 그녀가 질문에 잘못 대답하면 반사적으로 "셧다운"하게 만든다.
Participants described a loss of motivation to learn during a shame reaction. For example, shame related to “pimping”29 caused one participant to fear rounds and reflexively “shut down” if she answered a question wrong (P2).

이러한 해제는 결국 그가 학습 환경에 관여하는 여러 영역으로 확대되었습니다.
The disengagement eventually extended into multiple areas of his involvement in the learning environment:

정신적, 육체적 건강의 저하.
Diminished psychological and physical wellness.


피로감과 우울증은 일반적으로 주요 수치심 반응을 동반한다. 부실한 경기력을 매일 느끼는 수치심에 사로잡힌 한 참가자는 "피곤하고 녹초가 됐다. 그리고 전 '내가 좋은 레지던트가 아니라는 느낌이 들 뿐' 이었습니다." (P9)
Feelings of burnout and depression commonly accompanied major shame reactions. A participant whose shame revolved around daily feelings of inadequate performance recalled, “I was tired, burnt out. And I was, like, ‘I just don’t feel like I’m a good resident’” (P9).

수면 장애는 신체 건강에 가장 많이 영향을 미치는 것으로 보고되었는데, 이는 종종 수치심과 유발 사건에 대한 반성으로 인한 것이다. 어떤 참가자들은 운동을 중단했고, 어떤 참가자들은 식습관이 달라졌다. 한 참가자가 "앉아 있는 부랑자 같은 느낌"(P8)을 느끼게 한 이러한 효과는 일부 참가자에게는 몇 시간에서 며칠까지 지속되었고 다른 참가자에게는 몇 주 동안 지속되었다. 
Impaired sleep was the most commonly reported effect on physical wellness, often due to intrusive thoughts of shame and ruminations about the triggering event. Some participants stopped exercising, and some changed their eating habits. These effects, which led one participant to “feel kind of like a sedentary bum” (P8), lasted from hours to days in some participants and weeks in others. 

자기 규제와 비전문적 행동의 감소.
Reduced self-regulation and unprofessional behavior.


참가자들은 수치심이 분노와 방어감, 정서적 자기조절 상실을 통해 전문직업적이지 못한 행동으로 이어질 수 있다고 재조명했다. 한 참가자는 "나는 용기가 전혀 없었다"며 수치심을 호소했다. 나는 스스로 조절하고 내 감정을 억누를 탄력성이 전혀 없었다"고 말했다. 이는 주치의에 대한 부적절한 행동(분노의 표출)을 유발했습니다. 
Participants recounted that shame could lead to unprofessional behaviors via feelings of anger and defensiveness and a loss of emotional self-regulation. A participant experiencing a major shame reaction recounted its effects: “I just had zero fortitude. I had zero resilience to self-regulate and to hold back my true feelings” (P8). This contributed to unprofessional behavior (lashing out in anger) toward an attending: 

수치심 반응과 관련된 다른 비전문적 행동에는 다음이 포함되었습니다. 

  • 실패를 깨달았을 때 다른 사람을 비난하고,
  • 부정적인 피드백에 맞서 방어적인 태도를 취하며,
  • 환자 진료 책임에서 손을 떼는 것

Other unprofessional behaviors associated with shame reactions included

  • blaming others for perceived failures,
  • being defensive in the face of negative feedback, and
  • disengaging from patient care responsibilities. 

공감 장애.
Impaired empathy.


[공감의 손상]은 수치심 경험의 또 다른 부정적인 영향이었다. 인턴 기간 내내 성적 부진으로 인한 만성적인 수치심을 경험했던 한 참가자는 (환자와의) 정서적 연결를 희생하면서 성적에 집착하게 되었습니다. 이러한 감정적 실수는 결국 심각한 공감 장애, 환자에 대한 경멸, 고조된 수치심 반응으로 이어졌습니다. 
Impaired empathy was another negative effect of shame experiences. One participant who experienced chronic shame from perceived underperformance throughout his intern year became obsessed with performance at the cost of his emotional connectedness. This emotional blunting eventually led to severely impaired empathy, disdain for his patients, and a heightened shame reaction: 

수치심 경험의 긍정적 인식 효과
Positive perceived effects of shame experiences

참가자들은 수치심 경험의 부정적인 영향을 더 많이 경험했지만 긍정적인 효과도 인정했습니다. 긍정적인 효과로는 회복탄력성 향상, 취약해지려는 의지 증가, 관계 개선, 다른 학습자가 수치심 반응을 처리하도록 돕고자 하는 욕구가 포함되었습니다. 시간, 감독자 지원, 도움 요청, 그리고 수치심 반응의 해결과 긍정적인 결과 개발에 도움이 되는 더 정확한 자기 평가 능력. 
Although participants more commonly experienced negative effects of their shame experiences, they also acknowledged positive effects. Positive effects included

  • enhanced resilience,
  • increased willingness to be vulnerable,
  • improved relationships, and
  • a desire to help other learners process shame reactions.

Time, supervisor support, reaching out for help, and the ability to more accurately self-assess aided in resolution of the shame reaction and development of positive outcomes. 

참가자들은 수치심이 학습에 미치는 긍정적인 영향에 대해서도 성찰했다. 참가자들은 높은 수준의 감정으로 인해 기억력이 향상되었기 때문에 수치심 경험으로부터 더 많은 것을 배웠다고 느꼈다. 
Participants also reflected on the positive effects of shame on learning. Participants felt that they learned more from shame experiences because the intensity of the emotion enhanced their memory: 

어떤 이유로든 수치심은 더 많은 것을 기억하게 만든다. 폐렴에 걸려 더 잘 치료하고 떠난 환자를 더 깊이 생각해야 할 것 같아요. 하지만 내가 너무 미안했던 건, 모든 걸 다 기억하고 있어. (P3)
For whatever reason, shame makes you remember things more. I would have to think a lot harder about the patient that came in with pneumonia that we treated and left better. But the one that I feel so bad about, I remember every detail. (P3)

다른 참가자들은 로테이션에 대한 보다 세심한 준비, 도움 요청, 인지 편향 해소 등 구체적인 학습 행동을 개선함으로써 수치심에 반응했다. 특히 참가자들은 주요 수치심 경험의 장기적인 효과는 긍정적일 수 있지만, 이와 관련된 정서적 고통은 학습 행사로서의 전반적인 가치를 감소시켰다고 강조했다. 

Other participants reacted to shame by improving specific learning behaviors, including more attentive preparations for rotations, reaching out for help, and attempting to address cognitive biases. Notably, participants emphasized that although long-term effects of major shame experiences could be positive, the associated emotional distress diminished their overall value as learning events. 

고찰
Discussion


참가자들은 심리학 문헌에 기술된 것과 유사한 방식으로 수치심을 경험했습니다.
Our participants experienced shame in ways similar to those described in the psychology literature:

그러나, 우리의 분석은 또한 전공의들에게 수치심이 어떻게 발생할 수 있는지에 대한 새로운 통찰력을 제공하는 독특한 맥락적, 개인적 요소들을 밝혀냈다.
However, our analysis also revealed unique contextual and personal factors that provide novel insights into how shame may occur in medical residents.


학습자에게 미치는 영향
Implications for learners

우리는 수치심 반응이 의학 학습자들에게 민감한 감정 사건일 수 있다는 것을 관찰했다. 보건의료에서 보초 사건sentinel event이란 [환자에게 사망이나 심각한 신체적 또는 심리적 부상을 초래하는 사건]이며, 질병의 자연적 과정과는 관련이 없습니다.32 마찬가지로 수치심 반응은 예상치 못한 것일 수 있으며, 의료 학습자의 건강, 학습 환경에서의 참여, 직업 내 소속감 등 신체적 및 심리적으로 중대한 결과를 초래할 수 있습니다.
We observed that shame reactions may be sentinel emotional events for medical learners. Sentinel events in health care are events that cause death or serious physical or psychological injury to a patient and are unrelated to the natural course of illness.32 Similarly, shame reactions can be unexpected, jarring experiences that can have significant physical and/or psychological consequences for medical learners, including negative impacts on their well-being, engagement in the learning environment, and sense of belonging within the profession.


우리의 자료는 우울한 기분, 피로감, 감정의 손상, 그리고 사회적 고립이 수치심 경험과 맞물려 있을 수 있음을 암시합니다. 이와 같이 수치심은 medical learners 사이에서의 높은 탈진 및 우울증 비율, 공감 장애, 자살률 등 지속적인 의학교육의 도전에서 공통적인 실마리가 될 수 있으며, 나아가 심리적 고통을 겪는 학습자의 도움을 구하는 데 장애물이 될 수 있다.38,39
Our data suggest that depressed mood, burnout, impaired empathy, and social isolation may be interwoven with shame experiences. As such, shame may be a common thread in persistent challenges in medical education, including high rates of burnout and depression,33–36 impaired empathy,37 and suicidality in medical learners36; further, it may be a barrier to help-seeking in learners experiencing psychological distress.38,39


우리의 자료는 수치심이 의학 학습자들의 마음 속 깊은 곳에 자리한, 고통스럽고 종종 숨겨진 감정일 수 있음을 시사합니다. 교육자들의 수치심을 인식하는 능력과 의욕은 의학 학습자의 주요 수치심 반응 중에 의미 있게 개입할 수 있게 할 수 있다. 잠재적인 수치심 유발에 따라 학습자에게 단순히 체크인을 하는 것은 학습자가 수치심을 공유하도록 장려할 수 있습니다. 교육자들은,

  • 표면적인 수준의 질문(예: "어떻게 지내세요?")을 넘어서야 한다.
  • 학습자가 자기 평가를 어떻게 하고 있는지 더 깊이 평가해야 한다 (예: "자기에 대해 어떻게 느끼십니까?").
  • 수치심을 정상화하고, 죄책감 반응으로 전환(즉, 바뀔 수 있는 특정 행동에 초점을 맞춘)하는 것도 학습자의 건설적인 정서적 반응을 촉진할 수 있습니다.5

Our data suggest that shame may be a deep-seated, painful, and oft-hidden emotion in medical learners; educators’ ability—and willingness—to recognize shame could enable them to meaningfully intervene during a major shame reaction in a medical learner. Simply checking in with a learner following a potential shame trigger may encourage the learner to share feelings of shame; however, we suggest that

  • educators go beyond surface level inquiries (e.g., “How are you doing?”) and
  • more deeply assess how a learner may be self-evaluating (e.g., “How are you feeling about yourself?”).
  • Normalizing the shame and redirecting it to a guilt response (i.e., focused on specific actions that can be changed) might also facilitate a more constructive emotional response in a learner.5 

 

더욱이, 참여자들이 보고한 수치스러운 경험은 대부분(전부는 아님) 이행transition 기간 동안 발생했다. 의대 초, 의대생으로서 임상 학습 환경으로의 전환, 인턴 연도 전체(특히 연초), 그리고 선임 레지던트로서 새로운 책임을 떠맡은 직후였다. 주관적 기준과의 어려움, 자신과 타인을 비교하는 경향, 소속감 저하, 임포스터 증후군 경험 등 이행기에는 수많은 기여요인이 결합했다. 따라서 이행기간 동안 학습자가 보고한 정서적 고통과 부정적인 결과에는 수치심이 깔려 있을 수 있다.40~42 
Furthermore, most—but not all—shame experiences reported by our participants occurred during transition periods: the beginning of medical school, the transition into the clinical learning environment as a medical student, all of the intern year (but particularly early in the year), and soon after assuming new responsibilities as a senior resident. Numerous contributing factors also coalesced during transition periods, including difficulty with subjective standards, a tendency to compare one’s self to others, a sense of impaired belonging, and experiencing imposter syndrome. Thus, shame may underlie the emotional distress and negative outcomes reported by learners during transition periods.40–42 

마지막으로 수치심은 정상적인 학습 과정에서 발생할 수 있는 것으로 보인다: 우리의 연구에서 많은 수치심 유발은 비록 종종 예상하지 못했지만, 실수를 하고, 학문적으로 고군분투하고, 집단 앞에서 틀리는 것과 같은 학습 사건들이 흔했다. 학습의 정상적인 부분이 되어서는 안 되는 학대와 같은 다른 트리거는 참가자들에게 심각하고 불필요한 정서적 고통을 야기했습니다.

Finally, it appears that shame can occur during the normal course of learning: many of the shame triggers in our study were common, albeit often unexpected, learning events such as making mistakes, struggling academically, and being wrong in front of a group. Other triggers, such as being mistreated—which should never be a normal part of learning—caused significant, unnecessary emotional distress in participants.

교육자에게 미치는 함의
Implications for educators

데이터에 따르면 이행기는 학습자가 수치심을 느낄 가능성이 높은, 특히 위험한 시기일 수 있습니다. 이전의 연구들은 이행기에 있는 의대생들에게서 높은 수준의 정서적 스트레스가 나타났으며, 여기에는 부족한 지식 보유, 더 큰 지적 능력을 가진 학생들과의 경쟁, 그리고 덜 교육적인 교수법으로의 전환이 포함된다.41 여러 보고에 따르면, 스트레스의 영향에는 교감신경 활성화, 집중력 상실, 정서적 후퇴, 일에 대한 열의 감소, 비전문적 행동이 포함됩니다.42 이러한 스트레스 요인 및 결과는 참가자들의 수치 반응의 기여자와 영향을 매우 유사합니다.
Our data suggest that being in a transition period may be a particularly high-risk period for learners to experience shame. Previous studies have shown higher levels of emotional stress in medical students at transition periods,40,41 and reported transition- related stressors, include possessing insufficient knowledge, competing with students who have greater intellectual ability, and transitioning to less didactic methods of teaching.41 The reported impacts of these stressors include sympathetic activation, loss of concentration, emotional retreat, reduced enthusiasm for work, and unprofessional behavior.42 These stressors and outcomes closely resemble the contributors to and effects of our participants’ shame reactions.

수치심이 분노, 방어, 해방을 포함한 전문가답지 않은 행동으로 가장masquerade될 수 있다는 연구결과는 의미심장한 의미를 가지고 있다. 이러한 비전문적 행동을 외견상 투영하는 학습자들은 내심 큰 수치심 반응에 시달리고 있을 가능성이 있다. 그림 1은 외부 세계가 보는 행동과 개인의 수치스러운 개인적 경험을 처리하는 자기 평가와 사고 사이의 이분법을 보여준다. 

Our finding that shame may masquerade as unprofessional behavior, including anger, defensiveness, and disengagement, has significant implications. It is possible that learners who outwardly project these unprofessional behaviors are inwardly suffering from major shame reactions. Figure 1 depicts the dichotomy between the behaviors the outside world sees and the self-evaluations and thought processes the shamed individual privately experiences. 



환자에게 미치는 영향
Implications for patients

수치심은 학습자로 하여금 고립되고, 이탈되고, 단절된 느낌을 갖게 하는 경향이 있기에, 결과적으로 역량있고 공감적인 환자 진료를 방해할 수 있습니다. 학습자가 학습 환경에서 탈퇴하는 것은 누락, 소통 불량, 공감 부족 등의 오류를 통해 환자 치료에 [즉각적이고 직접적인 영향]을 미칠 수 있습니다. 학습 동기 상실로 인한 [간접적이고 지연된 영향]을 미칠 수 있습니다. 
Shame may impede competent and empathic patient care through its tendency to cause learners to feel isolated, disengaged, and disconnected. A learner’s withdrawal from the learning environment may have immediate, direct effects on patient care through errors of omission, poor communication, and lack of empathy; it may have indirect, delayed effects from loss of motivation to learn.

[의도적인 수치심을 주는 학습 환경]이나, [수치심 반응의 정도가 완화되지 않는 환경]은 낮은 수준의 심리적 안전감을 초래할 수 있습니다. 이는 결국 학습자가 목소리를 높이거나, 오류를 인정하거나, 필요한 질문을 하려는 의지를 저해함으로써 환자 치료에 대한 다운스트림 효과로 이어진다. 예를 들어, [수치심 반응 중에 숨고 싶은 마음]은 전공의의 거의 3/4이 환자에게 의료 오류를 인정하지 않는다는 사실을 설명하는 데 도움이 될 수 있다.

Learning environments with high degrees of intentional shaming or unmitigated shame reactions may engender low levels of psychological safety and hinder learners’ willingness to speak up, admit errors, or ask necessary questions, with downstream effects on patient care.48,49 For example, the desire to hide during a shame reaction may help explain the finding that nearly three-fourths of medical residents fail to admit medical errors to patients.50,51 

수치심"방 안에 있는 코끼리"에 비유되어 왔습니다. 즉, "계속 부딪히고 있음에도, 볼 수조차 없을 정도로 크고 불안하게 만드는 것."이다. 52 참가자는 수치심이 혼란스럽고, 불안하고, 거슬릴 수 있습니다. 하지만 놀랍게도 그들은 자신의 이야기를 공개적이고 사실적으로 공유했습니다. 

Indeed, shame has been likened to the “elephant in the room: something so big and disturbing that we don’t even see it, [even though] we keep bumping into it.”52 Our participants reported similar experiences—shame could be disorienting, disturbing, and intrusive—and yet, somewhat to our surprise, they shared their stories openly and authentically. 

제한사항 및 향후 방향
Limitations and future directions

 


Acad Med. 2019 Jan;94(1):85-93.

 doi: 10.1097/ACM.0000000000002479.

Sentinel Emotional Events: The Nature, Triggers, and Effects of Shame Experiences in Medical Residents

William E Bynum 4th 1Anthony R Artino JrSebastian UijtdehaageAllison M B WebbLara Varpio

Affiliations collapse

Affiliation

  • 1W.E. Bynum IV is assistant professor, Department of Community and Family Medicine, Duke University School of Medicine, Durham, North Carolina. A.R. Artino Jr is professor, Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland. S. Uijtdehaage is professor, Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland. A.M.B. Webb is a fourth-year resident, Walter Reed National Military Medical Center Internal Medicine-Psychiatry Residency, Bethesda, Maryland. L. Varpio is professor, Department of Medicine, Uniformed Services University of the Health Sciences, Bethesda, Maryland.
  • PMID: 30277959
  • DOI: 10.1097/ACM.0000000000002479Abstract
  • Purpose: This study explores an under-investigated topic, how medical residents experience shame within clinical learning environments, by asking residents to reflect on (1) the nature of their shame experiences; (2) the events that triggered, and factors that contributed to, those shame experiences; and (3) the perceived effects of those shame experiences.Results: Participants' shame experiences ranged from debilitating emotional and physical reactions to more insidious, fleeting reactions. Participants reported shame triggers relating to patient care, learning processes, and personal goals; numerous factors contributed to their shame experiences. The effects of shame reactions included social isolation, disengagement from learning, impaired wellness, unprofessional behavior, and impaired empathy. Positive effects of shame reactions included enhanced learning, increased willingness to reach out for help, and improved relationships.
  • Conclusions: Shame reactions can be sentinel emotional events with significant physical and/or psychological effects in medical learners. This study has implications for learners, educators, and patients, and it may pave the way toward open, honest conversations about the role shame plays in medical education.
  • Method: In this hermeneutic phenomenology study, the authors recruited 12 (self-nominated) residents from an internal medicine residency at a large teaching hospital in the United States. Data collection from each participant in 2016-2017 included (1) a written reflection about an experience during medical training in which the participant felt "flawed, deficient, or unworthy," and (2) a semi-structured interview that explored the participant's shame experience(s) in depth. The data were analyzed according to hermeneutic traditions, producing rich descriptions about participants' shame experiences.

웰니스가 의사의 핵심 역량이 되어야 하는가? (Acad Med, 2020)
Should Wellness Be a Core Competency for Physicians?
Erene Stergiopoulos, MD, MA, Brian Hodges, MD, PhD, FRCPC, and Maria Athina (Tina) Martimianakis, MA, MEd, PhD

 

"의사 웰니스"의 개념은 최근 기억에서 의료 문화의 가장 큰 변화 중 하나입니다. 지난 몇 년 동안 지역 위원회, 국가 태스크포스 및 의사 건강 및 웰빙에 대한 국제 컨퍼런스가 등장하여 의료계의 전통적 스토아주의에 도전하고 있으며, 의료진의 웰빙에 대한 이전에 들어보지 못한 대화를 촉진하고 있습니다.1–3 2018년 10월, 국제 의사 건강 컨퍼런스는 500명 이상의 참석자를 소집하여 의사 건강 증진을 위한 개인 및 시스템 차원의 전략을 논의했습니다.4 
The concept of “physician wellness” represents one of the biggest shifts in medical culture in recent memory. Over the past few years, local committees, national task forces, and international conferences on physician health and wellness have emerged and have called for action, challenging the medical profession’s traditional stoicism while promoting previously unheard conversations about the well-being of its providers.1–3 In October 2018, the International Conference on Physician Health convened more than 500 attendees to discuss individual- and systems-level strategies for improving physician wellness.4 

의사에게 "역량으로서의 웰니스"라는 개념은 커리큘럼, 평가, 입학 및 자격증, 그리고 교사와 학습자에게 깊은 영향을 미칩니다. 
The concept of “wellness as a competency” for physicians holds profound implications for curricula, evaluations, admissions, and licensure, and for teachers and learners. 

그러나 '역량으로서의 웰니스' 개념이 완전히 새로운 것은 아니다. 1999년 초에, 대학원 의학 교육 인증 위원회(ACGME)는 미국 거주자를 위한 6가지 핵심 역량을 정의했다. 여섯 번째 역량인 전문직업성professionalism은 "감정, 신체적, 정신적 건강을 유지하고 지속적인 개인 및 직업적 성장을 추구"하는 하위 역량과 "자신의 건강한 라이프스타일을 유지"함으로써 "환자의 본보기가 될 수 있는" 역할 모델이라는 과제를 의사에게 제시한다.
Yet the idea of wellness as a competency is not entirely new. As early as 1999, the Accreditation Council for Graduate Medical Education (ACGME) defined 6 core competencies for residents in the United States. The sixth competency, professionalism, includes the subcompetency of “maintaining emotional, physical, and mental health and pursu[ing] continual personal and professional growth”5 and tasks the physician with becoming a role model who can “set an example for their patients” by “maintaining their own healthy lifestyle.”5 

마찬가지로 캐나다 왕립 의사 및 외과 대학(Royal College of Physicians and Surginals of Canada)은 7가지 CAN MED 역할 또는 핵심 의사 역량에 대해 간략히 설명했습니다. 2015년에 발표된 CanMEDs Physical Competency Framework 제3판에서는 특히 'Professional' 카테고리 내에서 의사 웰빙에 중점을 두고 있습니다. 여기서 의사들은 "최적의 환자 치료를 촉진하기 위해 의사 건강과 웰빙에 대한 헌신을 보여야 합니다."6 의사 웰빙의 하위 역량 하에서 예상되는 행동에는 다음을 수행할 수 있는 능력이 포함됩니다.6

  • 자기 조절,
  • 자기 인식 표시,
  • 적절한 자기 돌봄 사용,
  • 건강 및 환경 요인의 부정적 영향 완화

Similarly, the Royal College of Physicians and Surgeons of Canada has outlined 7 CanMEDS roles or core physician competencies. The third edition of the CanMEDS Physician Competency Framework, released in 2015, notably places an increased emphasis on physician well-being within the role of professional, in which doctors must “demonstrate a commitment to physician health and well-being to foster optimal patient care.”6 The expected behaviors under the subcompetency of physician well-being include the physician’s ability to self-regulate, exhibit self- awareness, use appropriate self-care, and mitigate negative effects of physical and environmental factors on wellness.6

의과대학 커리큘럼 수준에서도 웰빙을 역량으로 인식하는 방향으로의 전환이 이루어졌다.
A shift toward framing wellness as a competency has also taken place at the level of medical school curricula.

의과대학과 레지던시 프로그램이 웰빙을 어떻게 평가로 운영하여 이 영역에서 학습자의 역량을 평가할지는 불분명합니다.

It is unclear how medical schools and residency programs will operationalize wellness into evaluations to assess learners’ competence in this domain.

 

장애 및 "건강"을 정의하는 데 어려움이 있는 의학 학습자
Medical Learners With Disabilities and Challenges to Defining “Wellness”

미국 의과대학 협회는 2018년 학습자와 장애의사에 대한 획기적인 보고서를 발표했다.8 
In 2018, the Association of American Medical Colleges released a groundbreaking report on learners and doctors with disabilities.8 

2019년 미국 의대생의 4.6%가 학교에 장애를 스스로 드러내고 편의accommodation을 신청해 2016년 2.7%에 비해 증가했지만, 여전히 공개 장벽을 고려하면, 과소보고되었을 가능성이 높다.9 
In 2019, 4.6% of U.S. medical students self-disclosed a disability to their school and registered for accommodations, an increase from 2.7% in 2016, though this is still likely underreported given existing barriers to disclosure.9 

개인화된 편의시설은 일반적으로 의과대학의 전용 접근성 서비스accessibility services 오피스의 관할인 시설입니다. 이는 장애 학생이 자신의 학문적 및 임상적 역할에 참여하고 수행할 수 있도록 해주는 시설이다. 이 시설의 담당자는 종종 모든 학생들의 "웰니스"를 촉진하는 오피스와 같은 오피스인 경우가 있다. [참여와 수행에 대한 장벽을 제거하는 방법]으로 웰니스에 접근하면 장애의 공개여부와 무관하게 [모든 학습자]에게 혜택을 줄 수 있습니다.

Personalized accommodations, which allow students with disabilities to participate and perform in their academic and clinical roles, are typically the purview of dedicated accessibility services offices at medical schools—which are often the same offices that promote “wellness” among all students. Approaching wellness as a way to remove barriers to participation and performance has the potential to benefit all learners, including those learners with disclosed or undisclosed disabilities. 

그러나 건강한 식사, 규칙적인 운동, 그리고 자기 관리를 위한 활동에 초점을 맞추는 웰니스에 대한 대화에는 [장애를 가진 학습자를 위한 편이accommodations시설]이 종종 빠져 있다. AAMC의 2018년 보고서에서 전국의 학습자와의 인터뷰를 통해 감독관과 동료들로부터 장애에 대한 낙인이 자주 찍히고, 학습자가 편의/도움의 필요성을 밝히기를 주저하는 교육환경이 드러났다. 실제로, 지난 20년 동안 회의와 워킹 그룹의 보고서는 의료 문화를 강조해 왔다. 장애가 있는 의사와 학습자는 휴가를 내지 말아야 한다는 압박감을 느끼고, 도움을 요청하는 것으로부터 discourage되며, '질병은 훈련의 요구에 제대로 대처하지 못하는 것을 반영한다'는 널리 알려진 의학에 대한 믿음때문에 오명stigma을 받는다. 이러한 공개와 지지 추구에 대한 장벽은 의료계의 보편적인 "완벽의 문화culture of perfection"를 반영한다. 즉, 이곳에서의 학습자는 의사가 어떻게 수행하고 행동해야 하는지에 대한 인식된 이상perceived ideals에 기반하여 질문하기를 두려워하게 된다.

Yet accommodations for learners with disabilities are often absent from conversations about wellness, which tend to focus on healthy eating, regular exercise, and activities for self-care. In the AAMC’s 2018 report, interviews with learners across the country revealed educational environments where disability is often stigmatized by supervisors and peers and where learners are hesitant to disclose their need for accommodations. Indeed, reports from conferences and working groups over the last 2 decades have highlighted a medical culture where doctors and learners with disabilities feel pressured to not take time off, get discouraged from asking for help, and face stigma from widely held beliefs in medicine that illness reflects an inability to cope properly with the demands of training.10–12 These barriers to disclosure and support-seeking reflect a prevailing “culture of perfection”13 in medicine, where learners hesitate to ask for help based on perceived ideals of how a doctor should perform and behave.13,14 

그렇다면 우리는 웰니스를 역량으로 간주하는 것이 [장애를 가진 학습자에 대한 낙인]을 영구히 남길 수 있다고 우려한다. 즉, "well"와 "unwell"에 대한 표준화된 기대치를 설정함으로써, 우리는 장애를 가진 학습자가 의료 행위를 하기에 부적합하다는 개념을 무심코 다시 포장하고 있는 것일 수 있습니다. 이번에는 "유능하지 않다"고 표시함으로써 말입니다. 
We worry, then, that framing wellness as a competency may perpetuate stigma against learners with disabilities. That is, by setting standardized expectations for “well” and “unwell,” we may inadvertently be repackaging the notion that learners with disabilities are unsuitable to practice medicine—this time, by labeling them as “not competent.” 

그러나 이는 "역량"을 정의하는 방법과 "웰니스"의 의미에 따라 달라집니다. 최근 연구에서 우리 142명(E.S., M.A.T.M.)은 대학교 정책, 제도적 웰빙 및 학생 서비스 웹사이트, 웰빙과 관련된 학생 블로그에 대한 심층 인터뷰와 분석을 통해 캐나다 의과대학의 장애 학생들의 경험을 탐구했다. 우리는 웰빙에 대한 다양한 담론이 수련생들의 "이상적인" 의대생에 대한 인식된 기대를 어떻게 형성하는지 관찰했습니다. 

  • 어떤 경우에는, 웰니스는 균형을 이루기 위한 수단으로 프레임되었다. 즉 그 자체로 바람직한 [목적]이다.
  • 다른 경우에, (기관 웹 사이트와 학생 블로그 모두에서) 웰니스는 최고의 학업 성과를 달성하고, 산만함을 최소화하며, 학업 문제에 대처하고, 효율성을 높이기 위한 [수단]으로 제시되었습니다.
  • 어떤 경우에, 웰니스는 ["이상적인" 학생 지위]를 달성하는 방법이 되었습니다. 이는 장애 학습자가 [학업 성과]와 [자기 건강]을 모두 관리해야 한다는 경쟁적 요구를 고려할 때 거의 불가능한 것이었다. 실제로 이러한 방식으로 "웰니스"를 정의하면 [장애를 가진 학습자]는 [역량을 갖추지 못한 것]으로 평가될 수 있습니다.  

But this depends on how we define “competency” and what we mean by “wellness.” In a recent study,14 2 of us (E.S., M.A.T.M.) explored the experiences of medical students with disabilities at English-speaking Canadian medical schools, using in-depth interviews and analysis of university policies, institutional wellness and student affairs services websites, and student blogs related to wellness. We observed how various discourses of wellness framed trainees’ perceived expectations for the “ideal” medical student.

  • In some cases, wellness was framed as a means to achieve balance—a desirable end unto itself.
  • In other cases—both in institutional services websites and student blogs—wellness was framed as a means to achieve peak academic performance, to minimize distractions, to cope with academic challenges, and to increase efficiency.
  • Wellness became a method to achieve “ideal” student status—something that learners with disabilities found nearly impossible, given the competing demands of managing both their academic performance and their health.
  • Indeed, defining “wellness” in this way might lead these learners to be evaluated as not competent. 

그러나 의학 교육에서 학습자가 접하는 "웰니스"의 정의 중 많은 부분이 이러한 강점을 강화하지 못한다. Dyrbye 등이 미국 의대를 대상으로 전국 설문조사를 실시한 결과, 웰빙 커리큘럼을 시행한 학교 중 가장 보편적인 것은 명상 훈련, 신체 활동을 위한 행사, 강의 또는 재정 관련 회의, 사회 활동 조직 등이 포함된 것으로 나타났다.7 학교는 일반적으로 의무 활동과 비의무 활동을 함께 제공하며, 학습자는 종종 요가, 명상, 학생 주도 사회, 전담 상담사와의 회의와 같은 자기 관리 활동 메뉴에서 선택할 수 있습니다.15 

Many of the definitions of “wellness” that learners encounter in medical education do not reinforce this strength, however. Dyrbye et al’s national survey of U.S. medical schools found that among schools that had implemented well-being curricula, the most common offerings included mindfulness meditation training, organized events for physical activity, lectures or meetings related to finances, and organized social activities.7 Schools typically offer a combination of mandatory and nonmandatory activities,7 and learners can often select from a menu of self-care activities like yoga, meditation, student-led socials, and meetings with dedicated counselors.15

그러나 "웰니스"를 이러한 [자기 관리 활동에 참여하는 것]으로 정의하는 것은 [장애를 안고 살면서 개인의 건강을 관리해야하는 요구 때문에 이러한 활동에 시간을 할애할 수 없는 학습자]를 배제할 위험이 있다. 게다가, 여기에 "역량"을 추가하면, "웰니스"는 막연한 이상에서 [일련의 표준화된 기대치]로 전환되어 평가 및 라이센스에 대한 깊은 의미를 갖습니다.

However, defining “wellness” as participation in these self-care activities risks singling out learners who cannot spend time on such activities because of the demands of living with a disability and managing their personal health. And if we then add “competency” to the mix, “wellness” transforms from a vague ideal into a series of standardized expectations, with profound implications for evaluation and licensure.

역량 문제
The Question of Competency


"역량"은 "웰니스"와 "장애"와 같은 많은 의미를 가지고 있습니다. 즉, 역량으로서 중요한 것은 임상, 문화 및 지리적 맥락에 따라 달라진다.16,17 국제 의학 문헌으로부터, 우리 중 한 사람(B.H.)은 역량 담론이 훈련과 평가의 구조와 내용에 대한 [물질적 효과]와 함께 얼마나 다른 [내재적 가치]를 내포하는지를 보여주었다.16 예를 들어, 우리가 보는 경우 [지식으로서의 역량]은 객관식 시험을 통해 측정할 수 있는 사실 축적 능력을 통해 학습자의 역량을 결정할 수 있습니다. 반대로 [역량을 수행능력]로 볼 경우, 학습자가 역량을 달성하기 위해 수행하는 구체적인 행동을 식별해야 하며, 일반적으로 시뮬레이션과 관찰된 만남을 통해 평가됩니다. 
“Competency,” like “wellness” and “disability,” has many meanings. That is, what counts as competency varies by clinical, cultural, and geographic context.16,17 Drawing from the international medical literature, one of us (B.H.) has shown how different discourses of competency imply different inherent values with material effects for the structure and content of training and evaluation.16 For example, if we view competency as knowledge, we can determine a learner’s competence through their ability to accumulate facts, which we might measure via a multiple- choice test. If we view competency as a performance, in contrast, we must identify specific behaviors performed by the learner to achieve competence, usually evaluated via simulations and observed encounters. 

즉, 우리가 "역량"을 정의하는 방식에 따라, 학습자에게서 무엇을 평가하는지, 어떻게 평가하는지, 그리고 누가 역량있다고 생각하는지가 결정됩니다. 
In other words, the way we define “competency” determines what we evaluate in our learners, how we evaluate it, and who is considered competent. 

[객관식 시험에서 좋은 점수를 획득한 학생]은 어떤 의미에서는 유능할 수 있지만 객관적인 구조화된 임상 검사에 직면했을 때처럼 다른 의미에서는 유능하지 않을 수 있습니다. [역량 담론을 웰빙에 적용]하면 학습자가 달성하고자 하는 것이 정확히 무엇인지 확인하는 것이ascertainig 과제가 됩니다. 모든 학습자가 번아웃을 예방하는 테크닉 목록을 암송할 수 있어야 합니까? 그들이 정기적으로 운동을 해야 하는가? 자체 보고한 번아웃 척도에 대한 점수를 사용하여 "잘 있다" 또는 "잘 있지 않다"를 평가해야 하는가? 
The student who achieves a good grade on a multiple-choice test may be competent in one sense, but not competent in another, such as when faced with an objective structured clinical examination. When we apply the discourses of competency to wellness, the challenge becomes ascertaining what, exactly, we want learners to accomplish. Should all learners be able to recite lists of techniques for avoiding burnout? Should they be required to exercise regularly? Should their scores on self- reported burnout scales be used to assess whether they are “well” or “unwell”? 

만성 건강, 정신 건강, 학습, 감각 또는 거동 관련 장애를 가진 학생들에게 "웰니스"와 "역량"의 정의는 어떤 영향을 미칩니까? 

what effect would these definitions of “wellness” and “competency” have on students with chronic health, mental health, learning, sensory, or mobility- related disabilities? 

역량으로서의 웰니스: 이제 어디로 가야 하지?
Wellness as a Competency: Where Do We Go From Here?

학습자의 의료 경력 초기에 웰빙을 강조하는 데에는 분명한 이점이 있습니다. 실제로 웰빙을 역량으로 인식하는 것은 모든 의사에게 있어 개인 건강을 우선시하는 방법이 될 수 있다. 기존의 완벽주의 문화에 도전하고, 더 많은 학습자들이 어려움에 처했을 때 도움을 구하도록seek 유도할 수 있는 잠재력을 가지고 있다. 그러나 웰니스 목표와 전략의 개발, 정의 및 실행에 있어 학습자와 장애 교직원이 참여하는 것은 매우 중요합니다. 그렇게 하면 장애인들이 자신의 필요에 따라 "웰니스"를 정의할 수 있습니다. 
There are clear benefits to emphasizing wellness early in learners’ medical careers. Indeed, framing wellness as a competency could be a way of legitimizing personal health as a priority for all physicians. It has the potential to challenge the existing culture of perfection in medical education and to encourage more learners to seek support when in distress. It is critical, though, that institutions involve learners and faculty with disabilities in the development, definition, and execution of wellness goals and strategies. Doing so will ensure that people with disabilities can help define “wellness” relative to their own needs. 

요가 수업과 학생 사회 외에 의대 교육의 웰빙에 대한 대안 모델도 가능하다. Bodenheimer와 Sinsky19가 "4중 목표"에서 제안했듯이, 의료 기관은 의료 전반을 개선하기 위해 의료진과 의료진의 일과 웰빙을 개선하기 위한 [시스템 수준]에서 작업해야 합니다. 웰빙 향상을 위해 새로운 자원을 추가하는 대신 [웰빙을 저해하는 장벽을 제거하는 것]을 제안합니다. 
Alternative models of wellness in medical education, beyond yoga classes and student socials, are also possible. As Bodenheimer and Sinsky19 suggest in their “quadruple aim,” health organizations should work at a systems level to improve the work–life and well- being of clinicians and health care staff to improve health care overall. Rather than adding new resources to improve wellness, they propose removing the barriers that impede wellness in the first place. 

의료 교육에 이러한 [시스템 수준의 접근방식]을 적용하는 것은 [보편적 설계universal design]의 개념을 적용하는 것을 의미한다. 웰빙에 대한 어떤 장벽을 제거할 수 있으며, 이러한 장벽을 제거하는 것이 모든 학습자에게 어떻게 도움이 될 수 있을까요? 20 의학교육 환경에서 보편적 설계 접근방식은 커리큘럼에서 일정을 조정할 수 있는 유연성을 포함할 수 있으며, 학습자가 appointments에 참석하거나, 건강 요구 사항을 충족할 수 있도록 빈 공간blank space을 할당할 수 있습니다. 결정적으로, 웰빙에 대한 [보편적 설계 접근법]은 모든 학습자에게 유익할 것이다. 그들은 장애를 가진 학생이나 전공의를 선별하거나 배제하지 않을 것이다. 
Applying this systems-level approach to medical education would mean applying concepts of universal design: What barriers to wellness could we remove, and how might removing these barriers benefit all learners?20 Universal design approaches in the medical education setting might include flexibility in the curriculum to adjust schedules, with blank space allotted to allow learners to attend appointments or attend to their health needs. Critically, universal design approaches to wellness would benefit all learners; they would not single out or exclude students or residents with disabilities. 


궁극적으로, 현재의 역량 기반 의료 교육 시대에 우리는 '웰니스'와 '역량'의 의미 변화를 주의 깊게 살펴보고 이들 중 어느 것이 지배적인지를 이해해야 한다. 우리는 또한 [새로운 학습 활동과 웰니스에 대한 평가]가 어떠한 방식으로 새로운 "이상적인" 학생을 표현하는지, 일부 학습자에게 의도하지 않은 장벽을 만들고 있지는 않은지에 주의를 기울여야 합니다. 결국, 이는 [누가 유능한 의사로 간주되고] [누가 의도치 않게 직업에서 배제될 수 있는지]를 결정할 수 있다.

Ultimately, in the current era of competency-based medical education, we must be careful to take stock of the shifting meanings of “wellness” and “competency” and understand which among these are dominant. We must also pay attention to the ways in which new learning activities and evaluations of wellness articulate a new “ideal” student and perhaps create unintended barriers for some learners. In the end, these meanings may determine who is considered a competent physician—and who may be inadvertently excluded from the profession. 




Acad Med. 2020 Sep;95(9):1350-1353.

 doi: 10.1097/ACM.0000000000003280.

Should Wellness Be a Core Competency for Physicians?

Erene Stergiopoulos 1Brian Hodges 2Maria Athina Tina Martimianakis 3

Affiliations collapse

Affiliations

  • 1E. Stergiopoulos is a first-year resident, Department of Psychiatry, Faculty of Medicine, University of Toronto, Toronto, Ontario, Canada.
  • 2B. Hodges is professor, Faculty of Medicine and Ontario Institute for Studies in Education, University of Toronto, and chief medical officer and executive vice president of education, University Health Network, Toronto, Ontario, Canada.
  • 3M.A. Martimianakis is associate professor and director of medical education scholarship, Department of Pediatrics, and scientist and associate director, The Wilson Centre, University of Toronto, Toronto, Ontario, Canada.
  • PMID: 32134774
  • DOI: 10.1097/ACM.0000000000003280Abstract
  • There has been a recent rise in calls for action around wellness and physician health. In medical education, wellness has been proposed as a physician competency. In this article, the authors review the history of the "wellness as a competency" concept within U.S. and Canadian residency programs and medical schools. Drawing from literature on the discourses of wellness and competence in medical education, they argue that operationalizing wellness as a physician competency holds profound implications for curricula, admissions, evaluation, and licensure. While many definitions of "wellness" and "competency" are used within medical training environments, the authors argue that the definitions institutions ultimately use will have significant impacts for trainees who are considered "unwell." In particular, medical learners with disabilities-including those with mental health, chronic health, learning, sensory, and mobility disabilities-may not conform to dominant conceptions of "wellness," and there is a risk they will become further stigmatized or even be considered unsuitable to practice in the profession. The authors conclude that framing wellness as a competency has the potential to legitimize support-seeking and prioritize physician health, yet it may also have the potential unintended effect of excluding certain learners from the profession. They propose a universal design approach to understand wellness at a systems level and to remove barriers to wellness for all medical learners.

3학년 학생의 임상수행능력평가와 학생과 평가자 성별의 관계(Acad Med, 2017)

Clinical Performance Evaluations of Third-Year Medical Students and Association With Student and Evaluator Gender
Alison Riese, MD, MPH, Leah Rappaport, MD, Brian Alverson, MD, Sangshin Park, DVM, MPH, PhD, and Randal M. Rockney, MD 

 

 

 

의대 졸업생을 레지던트 과정으로 선발하는 것은 여러 가지 요인에 의해 추진된다. 그러나 프로그램 책임자에 따르면 가장 중요한 선발 기준은 필수 핵심 임상실습의 성적이다.1 대부분의 핵심 임상 임상실습에서 의대생을 위한 평가 및 채점 도구로 임상 성과 평가(CPE)가 사용된다. 의대생들과 함께 일하는 임상의들은 지식 및 전문직업성은 물론, 병력 청취, 사례 발표 등 각 학생의 기본적인 임상 능력에 대한 공식적인 평가를 완료해야 한다. 대부분의 임상실습에서 이러한 평가는 표준화된 서면 검사 및 객관적인 구조화 임상 검사(OSCE)와 함께 학생들의 최종 임상실습 성적이 결정되는 데이터를 제공합니다. 
Selection of graduating medical students into residency programs is driven by multiple factors. However, according to program directors, the most important selection criteria are students’ grades on required core clerkships.1 Clinical performance evaluations (CPEs) are used in most core clinical clerkships as assessment and grading tools for medical students. Clinicians who work with medical students are asked to complete formal evaluations of each student’s basic clinical skills, such as history taking and case presentation, as well as fund of knowledge and professionalism. In most clerkships, these evaluations, along with standardized written examinations and objective structured clinical examinations (OSCEs), provide the data from which students’ final clerkship grades are determined. 

의대에 입학하는 과정과 임상실습 이전학년에 걸쳐 발생하는 수많은 평가는 대체로 표준화되었으며, 평가자-의존적 편향을 보이지 않을 것 같다. 반면 임상실습 성과에 대해서는 보다 주관적인 방식으로 평가된다. 
The numerous evaluations that occur over the course of attaining entrance to medical school and during the preclinical years are largely standardized and unlikely to exhibit grader-dependent bias. In contrast, medical students are evaluated in a more subjective manner when being assessed on their clinical performance. 

교육 분야의 문헌에 따르면, 학생의 성별은 종종 학생들을 대하고 점수를 매기는 데 있어 중요한 역할을 한다.5,6

  • 초등학교에서는 비슷한 시험 점수에도 불구하고 여학생들이 남학생들보다 더 좋은 점수를 받게 되는데, 일부 연구자들은 이러한 점수를 "비인지적 기술"로 보고 있다. 구체적으로 말하자면, "배움에 대한 더 발전된 태도"입니다.
  • 또한, 교사의 성별은 교육 역량과 성과에 대한 [기대와 인식]에 영향을 미칠 수 있습니다.
  • 나아가, 연구들은 성별 짝짓기가 "역할 모델 효과"를 통해 학생들의 참여와 행동을 향상시킬 수 있다고 제안한다. 반대로 성별 불일치는 "고정관념 위협"을 유발할 수 있다. 부정적인 고정관념을 확인시켜줄 것 같은 불안감이 성능 저하로 이어질 수 있다.

Literature from the education field has shown that student gender often plays a role in how students are treated and graded.5,6

  • In primary schools, girls are awarded better grades than boys, despite similar test scores, which some researchers attribute to “noncognitive skills”—specifically, “a more developed attitude towards learning.”6
  • Additionally, teachers’ gender can affect their expectations and perceptions of educational competence and performance.7,8
  • Furthermore, studies9–11 suggest that gender pairing can enhance, through a “role-model effect,” student engagement and behavior, or, conversely, gender noncongruence may induce “stereotype threat,” in which anxiety that one will confirm a negative stereotype can lead to a decrement in performance. 


일부 소규모 연구는 표준화된 환자(SP)에 의한 의대생들의 OSCE에 대한 임상 성과 시뮬레이션의 점수에서 학생과 평가자 성별 간의 상호작용을 제안했다. 
A few small studies12–14 have suggested an interaction between student and evaluator gender in the grading of medical students’ simulated clinical performance on OSCEs by standardized patients (SPs). 

학생과 평가자의 성별에 대한 유사한 점수 차이가 nonsimulated 임상 환경에 대한 몇 가지 소규모 연구에서 발견되었다.

  • 작은 연구결과, 남자 프리셉터가 여학생들에게 가장 높은 평균 점수를 매긴 것으로 나타났다. 그리고 가장 낮은 평균 점수는 여자 프리셉터가 남학생에게 준 점수였다.
  • 내과 레지던트 평가 연구에서는, 남성 레지던트는 (여성 주치의보다) 남성 주치의에게서 더 높은 점수를 받았다.
  • 반대로 산부인과 의대생 평가에 대한 연구 결과 여학생들이 필기시험과 OSCE에서 더 나은 성적을 보였지만, 교수에 의한 평가는 남학생들이 받은 점수와 비슷했다.

Similar disparities in grading regarding student and evaluator gender have been found in a few small studies of nonsimulated clinical settings.15,16

  • A small study showed that the highest mean grade was given by male preceptors to female students, and the lowest mean grade was given by female preceptors to male students.
  • In a study of evaluations of internal medicine residents, male residents received higher grades from male attendings than from female attendings.17
  • Conversely, a study of medical student grading in obstetrics– gynecology18 found that female students performed better on written exams and OSCEs; however, they were graded similarly to male students by their faculty evaluators. 

임상등급 과제의 객관성을 높이기 위한 모든 노력의 첫 단계로, 평가자의 학생 임상성적 채점에 어떤 문제가 영향을 미치는지 충분히 이해할 필요가 있다. 

As a first step in any effort to increase objectivity in clinical grade assignment, it is necessary to fully understand what issues influence evaluators’ grading of student clinical performance. 

방법
Method

이것은 Alpert 의과대학(AMS)에서 시행된 후향적 연구였다. 2013-2014학년도 동안 3학년 핵심 임상실습에서 의과대학 채점 데이터베이스(OASIS)에 기록된 CPE 4,462개가 처음에 포함되었다. AMS에서 핵심 임상실습과 연구 기간 동안의 기간은 내과(12주)와 수술, 산부인과, 가정의학과, 소아과, 정신의학과(매 6주)로 구성되었다.  
This was a retrospective study conducted at the Alpert Medical School (AMS). All 4,462 CPEs recorded in the medical school’s grading database (OASIS) from third-year core clerkships during the 2013–2014 academic year were initially included. At AMS, the core clerkships and their duration during the study period consisted of internal medicine (12 weeks) and surgery, obstetrics– gynecology, family medicine, pediatrics, and psychiatry (each 6 weeks). 


CPE 이수시점에 각 평가자가 선택할 수 있는 성적은 '특수', '기대 이상', '기대 미달', '기대 미달'이었다. 중복 항목이거나 일차 결과 또는 예측 변수에 대한 데이터가 불완전할 경우 평가는 제외되었습니다. 또한, "기대 미만" 등급의 CPE는 이 등급의 드문 발생(<1%) 때문에 제외되었다. 
The possible grades that could be selected by each evaluator completing a CPE were “exceptional,” “above expectations,” “meets expectations,” and “below expectations.” An evaluation was excluded if it was noted to be a duplicate entry or if data were incomplete for the primary outcome or predictor variables. Additionally, CPEs with a grade of “below expectations” were excluded because of the rare occurrence (< 1%) of this grade. 

우리는 식별되지 않은 데이터를 제공받았기 때문에 객관적인 비임상 평가와 그 데이터를 일치시킬 수 없었다. 그러나 우리는 2015년 수업의 미국 의료면허시험(USMLE) 1단계 점수를 남성과 여성의 점수로 비교했다. 
Because we were provided deidentified data, we were not able to match those data with any objective nonclinical evaluations. However, we did compare the United States Medical Licensing Examination (USMLE) Step 1 scores for men versus women in the class of 2015. 

모든 통계 분석은 SAS 9.4(SAS Institute, Carry, North Carolina)를 사용하여 수행되었다. P 값 ..05는 통계적으로 유의한 것으로 간주되었다. 이 연구에서는 카이-제곱 검정을 사용하여 최종 등급과 성별 및 공변량과의 연관성을 조사했습니다. 계층적 순서형 회귀 모형화는 학생과 평가자 특성이 학생의 성적에 미치는 영향("예외", "기대 이상", "기대 충족")을 조사하기 위해 수행되었으며, 둘 이상의 학생을 평가한 평가자의 비독립성 또는 "클러스터링"에 대해 조정되었습니다. 

All statistical analyses were performed using SAS 9.4 (SAS Institute, Cary, North Carolina). A P value < .05 was considered to be statistically significant. This study examined the associations of final grade with gender and covariates using chi-square tests. Hierarchical ordinal regression modeling was conducted to examine the effects of student and evaluator characteristics on a student’s grade (“exceptional,” “above expectations,” or “meets expectations”), adjusting for nonindependence, or “clustering,” of evaluators who rated more than one student.

일변량 모형에서 P 값이 .05인 성별 및 공변량은 단계적 선택 절차에 의해 구축된 다중 변수 회귀 모형에 통합되었습니다. 잔차 분산을 유의하게 감소시킨 변수는 최종 모형에서 유지되었습니다. 
Gender and covariates with a P value < .05 in the univariable model were incorporated into a multivariable regression model, which was built by the stepwise selection procedure. Variables that significantly reduced residual variance were retained in the final model.

동시성을 피하기 위해 두 독립 변수에 대해 파이 계수를 추정했습니다. 변수 간의 높은 공리성이 관측된 경우(r > 0.6) 다중 변수 모형화에 대한 학생의 성적과 가장 관련된 변수를 선택했습니다. 가정의학과 정신의학 분야에서의 평가 횟수가 적기 때문에, 다변수 모델링을 위해 이러한 전문 분야의 데이터가 결합되었습니다. 주효과 모형을 만든 후 유의성에 대한 교호작용 항이 탐색되었습니다. 
To avoid colinearity, phi coefficients were estimated for two independent variables. If high colinearity among variables was observed (r > 0.6), we selected the most relevant variable to the student’s grade for multivariable modeling. Because of the small number of evaluations in family medicine and psychiatry, data from these specialties were combined for the multivariable modeling. After the main effects model was built, interaction terms were explored for significance. 

결과
Results

따라서 최종 연구 데이터 세트는 4,272개의 CPE로 구성되었으며, 이는 155명의 학생의 성과와 관련하여 829명의 평가자가 완료하였다. 평균(SD) USMLE 단계(학생 및 평가자 통계는 표 1 참조)
Thus, the final study dataset comprised 4,272 CPEs, which were completed by 829 evaluators regarding the performance of 155 students. The mean (SD) USMLE Step (See Table 1 for student and evaluator demographics.)



학생당 CPE 수(중간값 27, IQR 6–39)와 평가자당 CPE 수(중간값 3, IQR 1–7)에 변동이 있었다. 각 임상실습, 학생 및 평가자 특성은 받은 성적 분포에서 통계적으로 유의한 차이와 관련이 있었다. (표 2 참조) 
There was variability in the number of CPEs per student (median 27, IQR 6–39) and CPEs per evaluator (median 3, IQR 1–7). Each clerkship, student, and evaluator characteristic examined was associated with a statistically significant difference in the distribution of grades received. (See Table 2.) 



단일 변수 모형에서는 모든 예측 변수가 등급과 연관되었습니다. 교수 연령과 교육 수준(파이 계수 0.84) 간의 상관관계가 높기 때문에 다변수 모형에는 평가자 연령만 고려되었습니다. 점수 변동의 총 32.9%는 다중 변수 모델에서 within-evaluator nesting of grades(내포 등급 상관 계수 = 0.329, P < 0.001)에 의해 설명되었다. 일변량 모형의 모든 유의한 차이는 다변량 모형에서 유지되었습니다. 다중 변수 모형에서 여학생 성별은 더 높은 성적과 연관되었습니다(수정 오즈비[AOR], 1.30; 95% CI, 1.13–1.50). 여성 교수진의 성별은 낮은 성적과 관련이 있었다(AOR, 0.72, 95% CI, 0.55–0.93). 관찰 시간이 길어진 것, 학생 연령이 높은 것, 평가자 연령이 낮은 것 모두 높은 성적과 관련이 있었다. 내과 평가자는 더 나은 점수를 줄 확률이 가장 높았고 산부인과 평가자는 가장 낮았다. (표 3 참조) 
In univariable models, all predictors were associated with the grade. Because of high correlation between faculty age and training level (phi coefficient 0.84), only evaluator age was considered for the multivariable model. A total of 32.9% of the variability in the grades was accounted for by within-evaluator nesting of grades in the multivariable model (intraclass correlation coefficient = 0.329; P < .001). All significant differences in the univariable models were retained in the multivariable model. In the multivariable model, female student gender was associated with higher grades (adjusted odds ratio [AOR], 1.30; 95% CI, 1.13–1.50). Female faculty gender was associated with lower grades (AOR, 0.72; 95% CI, 0.55–0.93). Longer observation time, older student age, and younger evaluator age were all associated with higher grades. Evaluators in internal medicine had the highest odds of giving a better grade, while those in obstetrics–gynecology had the lowest odds. (See Table 3.) 

다른 모든 주효과에 대해 보정했을 때, [학생과 교수 성별 간의 교호작용]도 유의했습니다(P = 0.03; 그림 1 참조). 남성 평가자는 남학생과 여학생의 점수(P = .29)에서 큰 차이는 없었지만, 여성 평가자는 여학생에 비해 남학생에게 낮은 점수를 주었다(P <.001).
The interaction between student and faculty gender, adjusted for all other main effects, was also significant (P = .03; see Figure 1). Male evaluators did not significantly differ in their grading of male and female students (P = .29); however, female evaluators gave lower grades to male students compared with female students (P < .001). 

또한, [교수 연령과 교수 성별 간에 유의한 교호작용]이 발견되었으며(P = .047), 나이 든 남성 평가자는 젊은 남성(P = 0.001)에 비해 현저히 낮은 점수를 주었지만(P = .71) 여성 연령대의 성적 차이는 유의하지 않았다. (그림 2 참조). 학생 성별과 학생 연령 사이에는 교호작용이 없었습니다(P = .63).  
Additionally, a significant interaction between faculty age and faculty gender was found (P = .047), with older male evaluators giving significantly lower grades than younger men (P = .001), while there was no significant difference in grading for the female age groups (P = .71). (See Figure 2). There was no interaction between student gender and student age (P = .63). 

 

 

고찰
Discussion

그러나, 우리의 연구 결과는 의대생과 의대생 사이의 임상실습 성적등급의 불일치discrepancy가 주로 여성 평가자에 의해 발생했음을 보여준다.
However, our findings show that the discrepancy in clinical performance grades between male and female medical students was driven primarily by female evaluators. 

의대생 임상성과에 대한 남녀 평가자의 평가 차이가 가장 복잡하다. 의대생들의 임상 성과는 의학적 지식과 임상 통찰력 이외의 속성에 의해 영향을 받는다. 실제로 두 연구에서 공감을 보인 의대생들이 임상평가에서 더 좋은 평가를 받았고, 여성이 남성보다 공감 척도에서 더 높은 점수를 받았다고 보고했다.  
The discrepancy between male and female evaluators’ assessment of medical students’ clinical performance is most perplexing. Medical students’ clinical performance is influenced by attributes outside of medical knowledge and clinical acumen. Indeed, two studies22,23 reported that medical students who showed empathy received better clinical evaluations, and women scored higher on empathy scales than men did. 

임상환경에서 여성이 남성을 능가한다는 문헌의 본문을 적용한다면, 

  • 여성 평가자는 여학생에서 우수한 성적을 정확하게 검출한 반면 
  • 남성 평가자는 이러한 차이를 감지하지 못했거나 채점방식에 치우쳤다는 것을 알 수 있다. 

If the body of literature showing that women outperform men in the clinical setting is applied, our findings suggest

  • that female evaluators accurately detected superior performance in their female students,
  • while male evaluators either were unable to detect these differences or were biased in their grading methods. 

그러나 이번 연구 결과는 성별과 학업 성취도, 평가 간의 훨씬 더 복잡한 상호작용을 부각시킬 가능성이 높다. 초등교육계와 마찬가지로 여학생의 '학습 태도'도 한몫할 수 있고, 동성 평가자의 역할 모델 가능성과 이성 평가생의 고정관념적 위협도 있어 평가자의 성별에 따라 학생에게 영향을 미칠 수 있다. 또 다른 문제가 될 수 있는 것은 환자가 학생의 성별에 따라 의대생과 다르게 상호작용할 수 있다는 점이며, 이로 인해 의대생들의 성과 평가에도 영향을 미칠 수 있다는 점이다.
However, it is likely that this finding highlights an even more complicated interplay between gender and academic performance and assessment. As in the primary education world, female students’ “learning attitude” may also play a role, as well as the possible role modeling of same-gender evaluators and the stereotype threat of opposite-gender graders, which may influence students to perform differently depending on the gender of their evaluators. Another potential complicating matter is that patients may interact differently with medical students depending on the student’s gender, which could also affect the assessment of their performance.

원인이 무엇이든 간에, 우리의 연구결과는 남녀 학생들이 각기 다른 임상성과를 경험하고 있으며, 평가자의 성별이 이러한 차이를 일으키는 독립적인 동인임을 시사하고 있다는 점에서 우려된다.
Whatever the cause, it is concerning that our study findings suggest that male and female students experience different gradings of their clinical performances, and that the gender of the evaluator is an independent driver of this difference. 

우리의 데이터는 또한 [평가자 연령과 성별 간에 유의한 상호작용]을 발견했으며, 젊은 남성 평가자가 모든 연령 그룹에서 나이 든 남성 평가자보다 높은 점수를 수여했다. 젊은 평가자들이 다른 연구에서 더 관대한 학년인 것으로 밝혀진 반면, 우리가 아는 바로는 연령-성별 상호작용은 다른 연구에서는 조사되지 않았기에, 이러한 발견은 추가적인 조사를 필요로 한다. 다시 한 번, 내적 평가자의 특성이 학생들의 차별성 평가를 초래했다는 점을 우려한다. 평가자들에 대한 훈련이 필요하거나, [평가자가 공정한 임상실습 점수를 줄 능력이 있는지]를 고려할 때 [평가자의 특성]을 고려해야 한다.
Our data also found a significant interaction between evaluator age and gender, with younger male evaluators awarding higher grades than older male evaluators and than female evaluators in all age groups. While younger evaluators have been found to be more lenient graders in other studies,27,28 to our knowledge the age–gender interaction has not been examined elsewhere, and this finding warrants additional investigation. Again, it is concerning that intrinsic evaluator characteristics have led to differential grading of students. Either improved training of graders is needed, or the characteristics of the evaluators must be taken into account when considering their ability to give fair clerkship grades. 

우리의 자료는 또한 우리 학교의 임상실습에서 [전공과목별로 평가등급에 상당한 차이]를 보여주는데, 이 결과는 다른 많은 학교에도 적용될 것이다. CPE에 대한 일관된 접근법을 제공하기 위해 이러한 가변성을 검사해야 한다. CPE를 살펴볼 때 학생들이 평가자와 함께 보내는 시간뿐만 아니라 서로 다른 핵심 임상실습의 구조와 기간의 차이를 고려해야 한다. 
Our data also demonstrate substantial differences in the way clerkship students are graded by department at our school, a finding that we suspect applies to many schools. This variability should be examined to provide a consistent approach to CPEs. Differences in the structure and duration of the different core clerkships, as well as the time students spend with evaluators, must be taken into consideration when looking at CPEs.

데이터 집합에서 개별 수준 데이터를 사용할 수 없기 때문에 임상 성과 등급을 표준화된 테스트 점수와 조정하거나 비교할 수 없었습니다. 또한, 우리는 성별 표현과 2013-2014년 의과대학에서의 성별 상호작용이 성별 관계와 세대 차이가 다른 방식으로 데이터를 왜곡할 수 있는 예년과 매우 다를 수 있다는 것을 인정한다.

We were not able to adjust for or compare clinical performance grades with standardized test scores, since the individual-level data were not available in our dataset. Further, we recognize that gender representation, and thus gender interactions at a medical school in 2013–2014, might be very different from what was obtained in previous years, when gender relationships and generational differences would perhaps skew data in other ways. 

 


Acad Med. 2017 Jun;92(6):835-840.

 doi: 10.1097/ACM.0000000000001565.

Clinical Performance Evaluations of Third-Year Medical Students and Association With Student and Evaluator Gender

Alison Riese 1Leah RappaportBrian AlversonSangshin ParkRandal M Rockney

Affiliations collapse

Affiliation

  • 1A. Riese is assistant professor, Department of Pediatrics and Medical Science, Section of Medical Education, Alpert Medical School of Brown University, Providence, Rhode Island.L. Rappaport is a first-year pediatrics resident, University of Michigan Medical School, Ann Arbor, Michigan.B. Alverson is associate professor, Department of Pediatrics and Medical Science, Section of Medical Education, Alpert Medical School of Brown University, Providence, Rhode Island.S. Park is postdoctoral research associate, Alpert Medical School of Brown University and Center for International Health Research at Rhode Island Hospital, Providence, Rhode Island.R.M. Rockney is professor, Department of Pediatrics, Family Medicine, and Medical Science, Section of Medical Education, Alpert Medical School of Brown University, Providence, Rhode Island.
  • PMID: 28099178
  • DOI: 10.1097/ACM.0000000000001565Abstract
  • Purpose: Clinical performance evaluations are major components of medical school clerkship grades. But are they sufficiently objective? This study aimed to determine whether student and evaluator gender is associated with assessment of overall clinical performance.Results: Female students were more likely to receive a better grade than males (adjusted odds ratio [AOR] 1.30, 95% confidence interval [CI] 1.13-1.50), and female evaluators awarded lower grades than males (AOR 0.72, 95% CI 0.55-0.93), adjusting for department, observation time, and student and evaluator age. The interaction between student and evaluator gender was significant (P = .03), with female evaluators assigning higher grades to female students, while male evaluators' grading did not differ by student gender. Students who spent a short time with evaluators were also more likely to get a lower grade.
  • Conclusions: A one-year examination of all third-year clerkship clinical performance evaluations at a single institution revealed that male and female evaluators rated male and female students differently, even when accounting for other measured variables.
  • Method: This was a retrospective analysis of 4,272 core clerkship clinical performance evaluations by 829 evaluators of 155 third-year students, within the Alpert Medical School grading database for the 2013-2014 academic year. Overall clinical performance, assessed on a three-point scale (meets expectations, above expectations, exceptional), was extracted from each evaluation, as well as evaluator gender, age, training level, department, student gender and age, and length of observation time. Hierarchical ordinal regression modeling was conducted to account for clustering of evaluations.

의과대학이라는 형상화된 세계에서 의사가 되기 전 정체성 저술하기(Perspect Med Educ, 2018)

Authoring the identity of learner before doctor in the figured world of medical school
Evangeline Stubbing1 · Esther Helmich2 · Jennifer Cleland3

 

도입
Introduction

정체성 형성이란 다음에 대한 것이다

  • 사람들이 어떻게 자기 자신을 이해하게 되는지,
  • 자기자신을 [자신이 속한 '세계'와 및 세계 내외부에 존재하는 다른 사람들과 상호작용하면서] 자신이 누구인지 어떻게 '추정figure' out할 것인지

Identity formation is about

  • how people come to make sense of themselves,
  • how they ‘figure’ out who they are as they interact with the ‘world’(s) they are part of and with others who both exist within and outside of these worlds [1, 2].

의대생은 여러 세계 사이에 위치한다. [환자라는 일반인 세계lay world의 성인으로서being adolescents]와 [의사 및 전문직이 되어가는 것becoming] 사이에 위치한다. 이러한 과도기적 입장의 결과는 의대생들이 [자신의 교육 및 미래의 의사]와 관련하여 [자신이 누구라고 생각하고, 다른 사람들에게 자신을 어떻게 표현할지]에 대해 지속적으로 협상하거나 자신의 정체성을 작성authoring하는 것입니다 [5]. 

Medical students are positioned between worlds, between being adolescents [3] in the lay world of patients and becoming doctors and professionals [4]. A consequence of this transitional position is that medical students are continually negotiating or authoring their identities in terms of who they think they are and how they portray themselves to others in relation to their training and as future doctors [5].  

지금까지의 연구는 정체성 형성과 관련된 의학교육의 세계 속에 존재하는 [외부적 사회적 요인]들을 밝혀냈다. 예를 들어, 의과대학 문화로의 사회화[6–8] 또는 환자와의 만남의 정서적 경험[9–11]이 그것이다.
Research to date has illuminated the external social factors within the world of medical education implicated in identity formation: for example, socialization into the culture of medical school [6–8] or the emotional experience of patient encounters [9–11].

더 최근의 연구는 [내부 요인]의 영향을 탐구했다. 이러한 내부 요인에는 의대생들이 의사의 정체성과 이타적으로 연관짓는 [초기 선입견이나 상상력]이 포함된다(예: 사람들을 돕고 아픈 사람들을 치료하는 것). 하지만 여기에는 바람직하지 않은 선입견(예: 권력과 지위를 소유하는 것)도 있습니다. 학생들이 world of medicine 내에서 자신이 누구인지 '추정figure'하려고 할 때, 초기 선입견preconception은 강화되거나(유익한 '조화'), 경쟁될 수 있습니다(정서적으로 충돌하는 '불화').
More recent studies have explored the influence of internal factors. These internal factors include the early preconceptions or imaginations that medical students associate altruistically with the identities of a doctor (such as to help people and cure the sick) [4, 12–15], but also less desirable preconceptions (for example to possess power and status) [13–15]. As students try to ‘figure’ who they are within the world of medicine their early preconceptions may be reinforced (beneficial ‘consonance’), or contested (emotionally conflicting ‘dissonance’) [16, 17].

불화dissonance 경험의 결과로 학생들은 자신의 세계관과 포부를 의심하고, 자신의 가치를 의심하며, 전문직에서 요구되는 바를 충족시키기 위해 고군분투할 수 있습니다 [16]. 따라서, 전문가 정체성에 대한 이러한 지속적인 협상은 [정서적 비용]을 수반하지만, 정체성 형성에 관련된 감정은 의학교육 연구에서 종종 간과된다[18]. 
As a consequence of the experience of dissonance students may doubt their world-views, aspirations, question their self-worth and may then struggle to succeed in meeting the requirements of their profession [16]. It is clear, therefore, that this continual negotiation of a professional identity has an emotional cost, yet the emotions involved in identity formation are often overlooked in medical education research [18].

더욱이 학생들이 의과대학에서 [(의사가 되는 것에 대한) 초기 선입견]을 자신의 정체성과 통합하려고 할 때 긴장감이나 불화가 있는 경우, 초기 선입견은 전문직 정체성 형성에 (도움을 주기보다는) 방해가 될 수 있다.
Moreover, where there is tension or dissonance as students attempt to integrate their early preconceptions about being a doctor with their developing identities once at medical school (for example; when being unable to cure the sick [4] and when facing the expectation that a clinician should be emotionally detached) [19, 20], early preconceptions may hinder rather than help students form their professional identities. 

의대생들이 의대에 '빈 석판'으로 입학하는 것이 아니라면, 그러한 내부 긴장과 관련 감정을 어떻게 경험하고 관리하는지를 더 깊이 탐구하는 것이 중요하다. 이러한 현상에 대한 우리의 이해를 증진시키면 복잡한 정체성 형성 과정에 대한 새로운 통찰을 제공하고 교육자들이 이러한 경험을 통해 학생들을 가장 잘 지원할 수 있는 방법을 도울 수 있을 것입니다. 
If medical students are not entering medical school as ‘blank slates’, it is crucial to explore further how such internal tensions and associated emotions are experienced and managed. Advancing our understanding of this phenomena will provide new insights into the complex process of identity formation and assist educators in how best to support students through this experience. 

따라서 [의대 내에서 감정의 역할]을 인정해야 한다는 요구에 대응하고자, 우리의 목표는 의대 학생들이 의대 초기에 새로운 신분을 형성하기 시작할 때 경험하는 감정을 탐구하는 것이었다. 우리는 정체성 형성과 감정 사이의 연결을 명확히 하고[22] 우리의 발견을 일관성 있게 설명하기 위해 '그림화된 세계' 이론[1]을 사용했습니다. 
Thus, and responding to calls to acknowledge the role of emotion within medical education [17, 18, 21], our aimwas to explore the emotions medical students experience when starting to form new identities early in medical school. We used ‘figured worlds’ theory [1] to help make explicit the links between identity formation and emotions [22], and to help us explain our findings in a coherent way. 

방법
Methods



연구 패러다임/방법론
Study paradigm/methodology


이는 구성주의적 인식론에 의해 뒷받침된 질적 해석적 연구였다[23].
This was a qualitative, interpretative study underpinned by a constructivist epistemology [23].

컨텍스트
Context


이 연구는 5년제 학부 과정을 제공하는 영국의 한 의과대학에서 이루어졌다. 이 프로그램은 시스템과 사례 기반이며, 급성 병원 병동에 조기에 임상적으로 노출되고 첫 해에 환자가 가정을 방문합니다. 

The study took place at one medium-sized UK medical school offering a five-year undergraduate program (the norm in the UK). The program is systemsand case-based, with early clinical exposure to acute hospital wards and a patient home visit in the first year. 

참가자
Participants


2013년에는 전체 학급 프레젠테이션, 포스터 광고 및 학급 이메일을 통해 1학년 의대생 169명이 5년 종별 연구에 참여하도록 초대되었습니다 [24]. 
In 2013, all 169 first year medical students were invited to participate in a five-year longitudinal study via a wholeclass presentation, poster advert, and class email [24]. 

데이터 수집
Data collection


데이터 수집을 위해 포커스 그룹을 사용하여 참가자들이 대응, 토론을 주도할 수 있도록 하고 [26] 접근 불가능한 잠재적 사고를 자극했다[27]. 23명의 참가자는 최적의 그룹 크기에 기초하여 네 개의 포커스 그룹으로 구성되었습니다 [23]. 6인 2조, 5인 1조, 4인 1조로 구성됐다. 이후 4인 1조로 참석할 수 없는 참가자 2명이 짝을 지어 인터뷰했다. 모든 참가자들이 참여했으며, 연구 내내 같은 그룹/쌍에 머물렀다. 데이터 수집은 두 가지 포커스 그룹으로 구성되었습니다. 첫 번째 포커스 그룹은 의대를 시작한 지 몇 주 내에 이루어졌고 두 번째 포커스 그룹은 1학년 말에 이루어졌습니다. 약 1시간 동안 지속된 포커스 그룹은 의과대학 구내에서 수행되었다. 참가자들은 간단한 다과를 제공받았지만 다른 인센티브는 받지 않았다. ES는 참가자의 경험과 감정을 유도하기 위해 반구조적이고 개방형 질문 가이드를 사용하여 포커스 그룹을 수행했습니다 [28]. 
We used focus groups for data collection to allow participants to lead responses, discussion [26],andalsotostimulate potentially inaccessible thoughts [27]. The 23 participants were formed into four focus groups on the basis of optimal group size [23]. Two groups of six, one group of five and a group of four were formed. Two participants unable to attend with the group of four were interviewed later as a pair. All participants attended and remained in the same groups/pairs throughout the study. Data collection was longitudinal with two sets of focus groups: the first within a few weeks of starting medical school and the second at the end of Year 1. Focus groups, lasting around 1 h, were undertaken on medical school premises. Participants received light refreshments but no other incentives. ES conducted the focus groups using a semi-structured and openended question guide to elicit participants’ experiences and emotions [28].

데이터 관리 및 분석
Data management and analysis


포커스 그룹은 텍스트 데이터에 익명으로 참여하기 위해 이름을 제거하여 음성 메시지를 녹음하고 기록했습니다 [29]. 
Focus groups were audio recorded and transcribed verbatim, with names removed, to engage anonymously with textual data [29]. 

책임연구자(ES)가 예비 코딩 과정을 맡았다. 그런 다음, 작성자 팀이 이 코드를 논의하고 포커스 그룹 집합 전체에 걸쳐 그리고 종방향으로 분석을 수행하기 위해 포커스 그룹 데이터 집합 1차(2013년 10월)와 포커스 그룹 데이터 2차(2014년 6월) 각각에 대해 하나씩, 두 개의 별도 '코딩 템플릿'을 개발하는 데 사용했다. 이러한 템플릿은 참가자 계정의 반복적 특징에 대한 기반과 구성 수단을 형성했습니다 [32]. 코딩과 분석은 반복적이고 귀납적이었다: 데이터에 대한 풍부한 표현이 있을 때까지 템플릿을 수정하기 위한 팀 토론이 정기적으로 있었다[33]. 
The lead researcher (ES) undertook the process of preliminary coding. These codes were then discussed by the author team and used to develop two separate ‘coding templates’, one for each set of focus groups, the first round (October 2013) and second round of focus group data (June 2014) to conduct analysis both across the set of focus groups and longitudinally. These templates formed the foundation and means of organization for recurrent features of the participant accounts [32]. Coding and analysis were iterative and inductive: with teamdiscussions at regular intervals to modify the templates until we had a rich representation of the data [33]. 

정성적 데이터의 해석은 연구자의 관점과 연구가 수행되는 사회적 맥락에 따라 달라진다 [33]. 구성주의적 관점에서 [연구 결과]는 [연구자의 편견, 가정 및 특성]과 결코 분리되지 않을 것이다 [34]. 따라서, 연구 내내 ES는 성찰 일지를 유지했고, 팀으로서 우리는 이러한 일지가 연구 과정과 결과에 어떻게 영향을 미칠 수 있는지를 인지하는 우리의 입장과 가능한 편견을 정기적으로 고려했다. 
Interpretation of qualitative data is dependent upon the researcher standpoint and the social context in which the research is undertaken [33]. From a constructivist perspective, research outcomes will never separate from the biases, assumptions and the characteristics of the researcher [34]. Thus, throughout the study, ES maintained a reflexive diary and as a team we regularly considered our stances and possible biases recognizing how these may be influential to the research process and findings. 

이론적 프레임워크
Theoretical framework

Holland 외 연구진들은 '형상화된 세계figured worlds'를 광범위하게 '사회적으로 생산되고, 문화적으로 구성된 활동'(P. 40-41)으로 정의했으며, 이 곳에서 사람들은 [새로운 자기 이해(정체성)를 생산(수행)]한다. [형상화된 세계]는 개인의 가능성의 장소, 즉 'as if' 세계의 장소이지만, 홀랜드 등은 형상화된 세계는 문화적, 사회적 기반을 갖기 때문에, 일상 활동에 수반되는 [권력, 지위, 계급 관계]에 의해 조정된다는 점을 분명히 한다. 다시 말해, 이러한 [형상화된 세계] 또는 맥락 안에서, [특정한 사회적 행위는 의미]를 가지며 [사람들의 위치가 중요]합니다. 
Holland et al. broadly defined figured worlds as ‘socially produced, culturally constituted activities’ (P. 40–41) where people produce (perform) new self-understandings (identities). Figured worlds are sites of individual possibility, or ‘as if’ world(s) but Holland et al. also make clear that because figured worlds are culturally and socially based, they are mediated by relations of power, status, and rank, implicated through daily activities. In other words, within these figured worlds, or contexts, certain social acts have significance and people’s positions matter. 

각 [형상화된 세계]는 사회적으로 구성된 [마스터 내러티브] 또는 [세계의 바탕이 되는 선입견]에 의해 조직됩니다(예: 의사들이 병자를 치료할 수 있어야 함). 일상적인 사회적 관행과 활동은 이러한 서술에 반하여against 해석됩니다. 형상화된 세계는 [일상적인 행동]과 ['위치성positionality'의 과정]을 통해 구성되고 재구성됩니다. '위치성Positionality'이란, 특정한 형상화된 세계(예: 환자, 의사 또는 의대생)에 있는 사람들에게 그들이 받아들이거나 거부하거나 협상할 수 있도록 '제공offered'되는 위치position을 말한다. [형상화된 세계 이론]에서 이것은 '저작의 공간space of authoring'으로 지칭되며, 이는 사람들이 그들에게 제공된 정체성을 받아들이거나/거부하거나/협상함으로써 응답하고 대답하는 것이다. 
Each figured world is organized by socially constructed master narratives or preconceptions on which the world is based (such as doctors should be able to cure the sick). Day-to-day social practices and activities are interpreted against these narratives. Figured worlds are constructed and reconstructed through daily actions and a process of ‘positionality’; that is, the positions ‘offered’ to people in a certain figured world (such as patient, doctor or medical student) which they may accept, reject, or negotiate. This is referred to in figured worlds theory as the ‘space of authoring’, or of people answering and responding by accepting, rejecting or negotiating the identities offered to them.

즉, 사람들은 자신이 누구인지 '자기 저술'한다.

  • 그들이 중요하게 여기는 활동들을 통해서,
  • 이 상상된 세계를 채우는 사회적 유형들과 관련하여,
  • 이 세계를 수행하는 사람들과의 사회적 관계에서,

In other words, people ‘self-author’ who they are

  • through activities that they attach significance to,
  • in relation to the social types that populate these figured worlds and
  • in social relationships with the people who perform these worlds. 


예를 들어 의사가 되는 것은 [병자를 치료하는 것 뿐만 아니라 편안하고 품위 있는 죽음을 보장해주는 것]이라는 선입견처럼, [형상화된 세계]가 [원래 만들어진 것]과 다를 때 도전이나 긴장을 불러일으킬 수 있다. 그러한 긴장에 대응하여, 자기자신을 세상에 대하여 재작성re-write하는 자기-저술self-authroing이 일어날 수 있다. 이를 통해서 개개인은 사회적 자원을 사용하여 반응을 만들어낸다. 

Figured worlds can create a challenge or tension when they are different to what was originally constructed, as in preconceptions, for example, that being a doctor is not only about curing the sick but is also about providing support to ensure a comfortable and dignified death. In response to such tensions, ‘self-authoring’ may take place, where individuals use their social resources to craft a response, to re-write themselves into the world [1]. 

윤리
Ethics


결과
Results


템플릿 분석 결과, 세 가지 중요한 주제와 관련된 하위 주제가 발견되었습니다.

  • 의사가 되는 것에 대한 선입견(예: 변화를 돕고 리더가 되는 것)
  • 선입견으로 경험하는 긴장감(변화를 만들거나 돕지 못하는 것, 변화를 만들거나 도와야 하는 압박감, 무력감)
  • 긴장과 자기저술 정체성self-authoring identities을 협상하는 참가자들의 모습이 드러났습니다.

Template analysis revealed three overarching themes and associated subthemes:

  • preconceptions of being a doctor, e. g. to help/make a difference and to be a leader.
  • Tensions experienced with preconceptions included being unable to help/make a difference, feeling a sense of pressure to help/ make a difference and lacking power.
  • Moreover, analysis revealed participants negotiating tensions and self-authoring identities. 

 

의사가 되는 것에 대한 선입견
Preconceptions of being a doctor

의대에 도착하자마자, 초기 정체성 형성의 일환으로 참가자들은 [의학의 세계]와 [의사의 위치]와 관련된 많은 선입견을 형성했다. 두 가지 유의적인 선입견이 표현되었다.

  • 첫 번째는 다소 이타적인 것으로, 의사가 되기 위한 근본적인 것이었다: '나의 관점은 국경 없는 의사와 같은 존재가 되기 위해 노력하는 것이며, 무력한 사람들을 돕겠다는 생각'이었다.
  • 둘째, 참가자들은 의사가 '리더'가 되는 것이라고 생각했다: '하지만 진정한 변화를 만들기 위해서는 의사가 되어야 한다고 생각한다. 왜냐하면 팀 리더이기 때문이다. 그들은 결정을 내리고 모든 것은 그들로부터 따라온다.  

On arrival to medical school, as part of their early identity formation participants had formed a number of preconceptions associated with the figured world of medicine and the position of a doctor. Two significant preconceptions were expressed.

  • The first somewhat altruistic, participants considered ‘to help/make a difference’ was fundamental to being a doctor: ‘I think my angle will be trying to be something like a doctor without borders or something like that, and so the idea of helping the helpless’ (MP11-FG2-T1).
  • Second, participants considered that a doctor is ‘to be a leader’: ‘But I think to make a real difference, you have to be a doctor because they’re the team leader; they make the decisions and everything follows down from them’ (FP2FG1-T1). 

 

선입견으로 인한 긴장감
Tensions experienced with preconceptions


'도움을 주고 변화를 만드는' 의사라는 선입견과 '리더'라는 선입견과 달리, 새롭게 경험하는 의학계의 현실은 [분명한 긴장감]을 만들어냈다.
In contrast to their preconceived figured world of a being a doctor to ‘help/make a difference’ and a ‘to be a leader’, the realities of the newly experienced world of medicine created an evident tension (dissonance).

1학년 내내 참가자들은 [부족한 지식]과 관련하여 '도움이 안 되고 변화를 일으킬 수 없는 것'에 대해 토론했다. '아직도 경험이 없는 1학년 의대생이고 아무것도 할 수 없고 아무것도 할 수 있는 지식이 없는 것 같다.'(FP16-FG3-T1) 그리고 '저희들은 제가 그것에 대해 잘 모르거나 어떻게 치료해야 할지 모른다는 사실에 정말 짜증이 났습니다.' (MP10-FG2-T2) 
Participants throughout their first year discussed ‘being unable to help/make a difference’ with reference to a lack of knowledge: ‘I’ll still feel like I’m an inexperienced first year medical student and I can’t do anything and I don’t have the knowledge to do anything’ (FP16-FG3-T1). And ‘We were really annoyed by the, uh, fact that I don’t know much about it, or don’t know how to treat it (referring to a patient condition) ...’ (MP10-FG2-T2). 

1학년 말에도 참가자들은 지식이 부족하여 변화를 도울 수 없음에도 불구하고, [환자들이 여전히 신뢰를 부여했다고 생각]했다. 이로 인해 '도움을 주어야 한다는 하는 압박감'이 생겼고 긴장감을 더했습니다.

  • '당신이 무엇을 하고 있는지 알고 있다는 (환자들의) 믿음입니다. 사실, 나는 아마 아는 것이 없는데도...' (MP8-FG2-T2)
  • 아니면, '... 한 사람에게 많은 신뢰를 주는 것은 그 사람에게 부담을 줄 수 있고, 만약 실수를 하게 되면 그 환자가 당신을 정말 믿었기 때문에 기분이 백만 배 더 나빠질 것이다.' (FP17-FG3-T2) 

At the end of Year 1 participants considered that, despite lacking the knowledge and thus being unable to help/make a difference, patients still granted them their trust. This created ‘feeling a sense of pressure to help/make a difference’ and added to the tension.

  • ‘It’s that trust that you know what you’re doing, when in actual fact, you probably don’t [laughs]’ (MP8-FG2-T2).
  • Or: ‘... putting so much trust in a single person can add pressure to that person too and if you mess up then you’ll feel a million times worse because that patient really trusted you’ (FP17-FG3-T2). 

1학년 내내 참가자들은 [의대 1학년이라는 그들의 위치]와 [의학계의 리더]라는 초기 선입견 사이에 긴장감을 표현했다.

  • 이런 긴장감은 '생각만큼의 파워가 없다는 것을 깨닫게 된다'(MP8-FG2-T1)는 인식을 통해 표출됐다.
  • 존경심이 부족하다는 인식도 '권한이 부족하다'는 긴장의 원인이 되었다. '넌 아무도 널 존중하지 않을 어린 소녀야'

Throughout their first year participants expressed a tension between their position as a first year medical student and their earlier preconception of being a leader in the figured world of medicine.

  • This tension was expressed through their recognition of ‘lacking power’: ‘You realize you don’t have as much power as you think’ (MP8-FG2-T1).
  • A perceived lack of respect also contributed to the tension of ‘lacking power’: ‘I got told ... you’re a little girl no one will ever respect you’ (FP5-FG1-T2).


긴장의 협상 및 자체 작성
Negotiating tensions and self-authoring


참가자들은 의과대학 1학년을 여행하면서 [self-authoring 과정]을 통해 위에서 설명한 긴장감을 협상했다. 1년 말, 참가자들은 [자신들의 부족한 지식들을 해결하기 위해 열심히 하는 것]만으로는 [변화를 일으킬 수 없다는 긴장감]을 협상하려는 시도를 표현했다. 이것은 의학이라는 형상화된 세계에 자신을 써넣는 방법이었다.

  • '더 많은 것을 알고 더 많은 것을 할 수 있기를 바라는 것 같다' (FP4-FG1-T2)
  • 동시에 참가자들은 이 긴장감을 해소하려면 [자기 위치의 재구성이 필요로 한다는 것]을 깨달았다. 이 단계에서 그들은 모든 것을 알 수 없다는 것은 인식하고 받아들여야 했다. '우리도 인간이다. 우리가 모든 걸 알 수는 없다'

As the participants journeyed through Year 1 at medical school, they negotiated the tensions outlined above through a process of self-authoring. By the end of Year 1, participants expressed an attempt to negotiate the tension of being unable to help/make a difference by being eager to address their lack of knowledge, a way in which to write one’s self into the figured world of medicine: 

  • ‘I kind of feel like I want to be able to know more and start to be able to do more’ (FP4-FG1-T2).
  • At the same time, participants realized that addressing this tension required reconstructing their position, by recognizing and accepting they cannot know everything at this stage: ‘It’s only human. We, we can’t know everything’ (MP7-FG2-T2).

1학년 말에 참가자들은 의대생으로서의 자신의 위치가 의사의 권위와 리더십이 아니더라도 [책임이 부여된다는 것]을 깨달았다. '아마도, 의과대학생으로서, 권한은 가질 수 없지만, 책임은 있습니다' (MP9-FG2-T2) 참가자들은 '2학년은 좀 더 높은 지위가 있고, 사람들은 의학 지식이 있고, 자신들이 무엇을 하고 있는지 안다'는 생각을 하며, 리더로서의 개념을 강화할 수 있는 더 강력한 한 해를 내다본다. 
By the end of Year 1 participants also recognized that their position as a medical student does grant responsibilities, if not the authority and leadership of a doctor: ‘Maybe, now that you’re, like, a medical student ... you can have, not authority, but you’ve got responsibility ...’ (MP9-FG2-T2). Participants look to the year ahead imagining a stronger position that might enhance the notion of being a leader: ‘I think second year has more of a standing, people are like, oh they’ve got some medical knowledge, they know what they’re doing’ (FP1-FG1-T2). 

고찰
Discussion

우리는 학생들이 의학의 세계로 들어갈 때 [의대생으로서의 위치적 정체성]과 [변화를 돕고 선도하는 의사라는 초기 내부 선입견 또는 상상력] 사이에서 긴장을 느낀다는 것을 발견했다. 그 대신 의대 1학년 학생들은 스스로가 변화를 돕고 이끌 지식과 힘이 부족하다는 것을 알게 되었다. 
We found that, on entering the figured world of medicine, students experience tensions between their positional identities as medical students and their earlier internal preconceptions or imaginations of being doctors who help/make a difference and are leaders. Instead, being ‘just’ first year medical students they found themselves lacking both the knowledge and power to be able to help/make a difference and to lead. 

의과대학 1학년이 끝날 무렵, 비록 지식과 권력은 부족하지만, 우리의 학생들은 지식과 권력의 한계를 인정하는 법을 배우면서 그들이 경험했던 긴장감을 해소하는 것처럼 보입니다. 그러나 의과대학은 그들에게 [특권과 책임을 부여]해 주지만 [아직 권한은 부여하지 않았습니다]. 
By the end of the first year of medical school, although still lacking knowledge and power, our students appear to resolve the tensions they had experienced, learning to acknowledge limitations of knowledge and power, yet recognized that being a medical student granted them privileges and responsibilities (but not yet authority). 

의사라는 'as if'나 상상 속의 정체성에만 초점을 맞추지 않고, 학습자와 의대 1학년이라는 self-authored 정체성으로 위치를 재정비했다. 의대 1학년 학생으로서의 정체성은, 그 이상도 이하도 아닌, 우리 학생들에게 합법적인 지위를 부여했고, 그 결과 그들은 미래의 직업적 정체성을 더욱 발전시킬 수 있는 의학의 세계로 진입할 수 있게 되었습니다.

Instead of focusing only on the ‘as if’ or imagined identities of being a doctor, they re-aligned their position into the self-authored identity as learner and first year medical student. The very identity as a first year medical student, nothing more, nothing less, granted our students a legitimate position, which in turn allowed them to enter the world of medicine in which they could further develop their future professional identities. 

환자들로부터 신뢰를 받는 것은 우리 참가자들에게 부적절하게 느껴졌다. [신뢰는 전문가 지위의 기초]이며 환자와 의사 사이의 사회적, 도덕적 계약의 일부로 인정됩니다 [42, 43]. 그러나 1학년 학생들은 필요한 지식과 기술이 부족하여 이 '계약'을 이행할 수 없었다. 이로 인해 긴장감이 생겼고, 압력감으로 표현되었습니다. 이는 초기 연구(예: Lingard 등)의 연구 결과를 반영합니다. 이 연구에서는, 사례 발표 중의 불확실성과 지식의 한계와 관련한 의대 3학년 학생들의 긴장을 식별했다. 
Being trusted by patients felt inappropriate to our participants. Trust is fundamental to the status of a professional, and granted as part of a social and moral contract between patients and doctors [42, 43]. Yet, year 1 students felt unable to fulfil their end of this ‘contract’, because of lacking necessary knowledge and skills. This resulted in a tension, articulated as a sense of pressure. This reflects the findings of earlier studies: for example Lingard et al. (2003) identified tensions in third year medical students, concerning uncertainty and limitations of knowledge during case presentations ([44], see also [45]). 

참가자가 보기에 [신뢰는 획득해야 하는 것]이며, 역량(충분한 지식)이라는 수단으로 얻어야 한다. 또한 [사람들을 돌보고자 하는 희망(환자를 돕고 변화를 만드는 것)]이나 [변화를 만들 수 있도록 의사에게 부여된 지위나 힘]을 통해 얻을 수 있어야 합니다. 이러한 '토론' 중 두 가지는 이전에 McLeod(2011)가 설명했으며, 그녀는 학생들이 [(지배적인) 역량 담론]과 [(덜 가치롭게 여겨지는) 돌봄 담론] 사이에서 긴장을 경험할 수 있는 방법을 탐구했다[20]. 우리의 연구는 학생들이 'as if' 정체성에 대해 협상할 때 사용될 수 있는 세 번째 이슈를 추가하는데, 이 이슈는 [권력의 담론]이라고 불릴 수 있다. 
In the eyes of our participants, trust needs to be gained, by means of competence (having enough knowledge), in their wish to take care for people (helping patients, making a difference), or through the position or power granted to doctors enabling them to make a difference. Two of these ‘discourses’ were previously described by MacLeod (2011), when she explored how students may experience tensions between the dominant discourse of competence, and the less valued discourse of caring [20]. Our study adds a third issue that might be in play when students negotiate ‘as if’ identities, one which might be called a discourse of power.

우리가 아는 한, 우리의 연구는 학생들이 [의과대학에 입학할 때 이미 가지고 있는 선입견의 일부]이며, 의과대학 1학년 때 경험하는 [긴장감의 중심에는 권력 부족이 있다는 것]을 보여주는 첫 번째 연구에 속한다. 이전의 연구에서는 '권한/권력'을 부정적인 선입견으로 식별했다[13–15]. 그러나, 우리의 참가자들에게 힘은 다른 사람들보다 지배적이고 우월한 위치를 차지하거나, 그 자체로 지위를 갖는 것에 대한 것이 아니라, 변화를 만드는 수단으로서 여기는 것처럼 보였다. 이것은 더 조사해 볼 가치가 있다. 

As far as we know, our study is among the first showing that power is already part of the preconceptions students have as early as entering medical school, and that lacking power is central to the tensions they experience in the first year of medical school. Previous studies have identified ‘power’ as a negative preconception [13–15]. However, for our participants power seemed less about assuming a dominant and superior position over others, or having status per se, and more as a means to make a difference. This merits further investigation. 

의학 교육에서 [형상화된 세계 이론]을 사용한 연구는 일반적으로 담론[22, 40] 또는 언어 분석 형식을 채택했다[38]. 그러나, 우리의 연구에서와 같이, 그림화된 세계 이론과 다른 방법론의 결합은 더 넓은 문헌에서 성공적으로 활용되었습니다 [35–37]. 이러한 방법론적 '가져오기importing'(한 분야에서 잘 알려지지 않은 다른 분야로 개념과 도구를 이전하는 것)는 오래된 문제를 새로운 방식으로 해결할 수 있는 기회를 제공하기 때문에 가치가 있다[49]. 
Studies using figured worlds theory in medical education have typically employed discourse [22, 40] or linguistic forms of analysis [38]. However, the combination of figured worlds theory and other methodologies, as in our study, has been successfully utilized in the wider literature [35–37]. This methodological ‘importing’ (the transference of concepts and tools from one field where it is well known to another field where it is less known) is valuable because it provides opportunities for addressing old problems in new ways [49]. 

[도움을 줄 충분한 지식과 힘이 없다는 긴장감]은 학생들이 [의사에 대해 상상한 'as if' 정체성]과는 반대로, 학습자로서 그들의 [위치적 정체성]에 대해 더 강한 확신을 갖도록 돕는 것의 중요성을 시사한다. 이는 의과대학에 입학한 첫 달 동안의 정체성 형성 과정에 대한 학생들의 인식을 높이고 이 과정에 대한 성찰을 장려함으로써 뒷받침될 수 있다[50]. 개인적 성찰을 통해 정체성 형성 과정에 대한 인식을 높이는 것은 학생들이 초기 내부 정체성 및 선입견과 관련된 딜레마와 긴장을 극복하는 데 도움이 될 수 있습니다. 이것은 전문적 정체성에 대한 긍정적인 개발을 향상시킬 수 있다[19].
The tension of not having enough knowledge and power to help suggests the importance of helping students to affirm a stronger sense of their positional identity as a learner as opposed to an imagined ‘as if’ identity of a doctor. This may be supported through increasing students’ awareness of the process of identity formation in their first months of medical school, and encouraging reflection on this process [50]. Raising awareness of the process of identity formation through personal reflection may help students to work through dilemmas and tensions associated with early internal identities and preconceptions. This may enhance positive development for a professional identity [19].

40. Helmich E, Yeh HM, Yeh CC, de Vries J, Tsai DF, Dornan T. Emotional learning and identity development in medicine: a cross-cultural qualitative study comparing Taiwanese and Dutch medical undergraduates. Acad Med. 2017;92:853–9.

 

 


Perspect Med Educ. 2018 Feb;7(1):40-46.

 doi: 10.1007/s40037-017-0399-0.

Authoring the identity of learner before doctor in the figured world of medical school

Evangeline Stubbing 1Esther Helmich 2Jennifer Cleland 3

Affiliations collapse

Affiliations

  • 1School of Medicine, Medical Sciences and Nutrition, University of Aberdeen, Foresterhill, Aberdeen, UK. evangeline.stubbing@abdn.ac.uk.
  • 2Center for Education Development and Research in Health Professions, University Medical Center Groningen, Groningen, The Netherlands.
  • 3Centre for Healthcare Education Research and Innovation, Institute of Education for Medical and Dental Sciences, University of Aberdeen, Foresterhill, Aberdeen, UK.

Free PMC article

Abstract

Introduction: Students enter the 'figured world' of medical school with preconceptions of what it means to be a doctor. The meeting of these early preconceptions and their newly developing identities can create emotional tensions. The aim of this study was to advance our understanding of how such tensions were experienced and managed. Using figured worlds as a theoretical framework we explored students' interactions of preconceptions with their newly developing professional identities in their first year at medical school. Advancing our understanding of this phenomena provided new insights into the complex process of identity formation.

Methods: This was a qualitative study underpinned by a constructivist epistemology. We ran biannual focus groups with 23 first year students in one UK medical school. Data were recorded, transcribed and then template analysis used to undertake an inductive, iterative process of analysis until it was considered the template provided a detailed representation of the data.

Results: Significant preconceptions associated with the identity of a doctor were 'to help' and 'to be a leader'. These early preconceptions were in conflict with realities of the figured world of medical school creating the emotional tensions of 'being unable to help' and 'lacking power', with implications for interactions with patients. By the end of year one students' negotiated tensions and 'self-authored' their identity as a learner as opposed to an imagined 'as if' identity of a doctor.

Discussion: We revealed how preconceptions associated with becoming a doctor can conflict with a newly developing professional identity highlighting the importance of supporting students to embrace the formation of a 'learner' identity, a necessary part of the process of becoming a doctor.

Keywords: Emotion; Figured worlds; Medical students; Professional identity formation; Qualitative research.

 

의사의 정체성 이행: '이도저도 아닌' 상태에 있기로 선택하다 (Med Educ, 2019)

Doctors’ identity transitions: Choosing to occupy a state of ‘betwixt and between’
Lisi Gordon1,2 | Charlotte E. Rees2,3 | Divya Jindal-Snape4

 

1 | 소개
1 | INTRODUCTION


의료 전문가는 자신의 경력 동안 수많은 이행transition을 경험한다.1-3 [사회 구성주의 관점]에서 이행은 [맥락, 대인 관계 및 정체성의 변화로 인해 시간이 지남에 따라 발생하는 심리, 사회 및 교육적 적응의 지속적인 과정]으로 정의할 수 있다.4 의사들의 전이 경험을 다중적이고 복잡하고 지속적인 것으로 개념화함으로써, 우리는 이러한 경험을 집중적인 학습을 위한 시기로 간주할 수 있다.4-10
Health care professionals experience numerous transitions during his or her career.1-3 From a social constructionist viewpoint, transitions can be defined as ongoing processes of psychological, social and educational adaptations over time necessitated by changes in context, interpersonal relationships and identities.4 By conceptualising doctors’ experiences of transitions as multiple, complex and ongoing, we can regard these experiences as times for intensive learning, but also as periods of increased stress and burnout.4-10

이전의 이행 연구는 [새로운 역할에 대한 공식 및 비공식 학습 기회의 증가]를 중심으로, [의사의 이행에 대한 개인화된 접근 방식]을 우선시하는 것으로 나타났습니다. 이는 의사 입장에서 [이행 경험을 탐색하는 과정]으로써, 의사의 안녕과 조직, 그리고 궁극적으로 환자에게 필수적인 것으로 여겨집니다. 이전의 연구는 [의사들의 과도기 경험]에 대한 지원과 도전들에 초점을 맞추었다면, 본 연구는 상위 단계 수련생의 [전문직업적 정체성 전환]과, 이 수련생들이 [이행 중의 의사]에 대한 이해를 높이고, 이에 대비하기 위해 [어떻게 한계성liminality을 경험하는지]에 초점을 맞추어 연구를 확대한다.

Previous transitions research suggests that priority be given to personalised approaches to doctors’ transitions, with increased opportunities for formal and informal learning about new roles.8 This is seen as fundamental to doctors’ well-being, to his or her organisation and ultimately to patients as doctors navigate transition experiences.8 Whereas previous research has centred on the support for, and challenges of, doctors’ transition experiences,5-10 this study extends this research by focusing on higher-stage trainees’ professional identity transitions and how such trainees experience liminality in order to better enhance understandings of, and provisions for, doctors in transition. 

즉각적인 명확화를 위해, [사회 구성주의 관점]에서, 우리는 [전문직업적 정체성]을 [역동적으로, 대화와 상호작용을 통해 형성되고 재형성formed and reformed되는 것]으로 개념화합니다(정체성 작업identity work이라고도 함, 아래 참조).11 전통적 인류학적 의미에서 [한계성liminality]은 (여성 사춘기 통과의례와 같이) [의식화된 사건이 기존의 지위에서 새로운 지위로의 전환을 용이하게 하는 맥락에서 두 지위(예: 소녀도 아니지만, 아직 여성이 아닌) 사이에 존재하는 상태]를 설명하는 것으로 정의된다.12,13 따라서 상급 단계 수련생의 이행과정이라는 맥락에서, 리미널리티는 [수련생에서 훈련받은 의사로 이행하는 동안(예: 의사가 컨설턴트가 되는 경우)] 경험하게 되며, 이 때 의사에 대한 기대치의 변화가 수반된다. 그러나 우리는 한계성을 이 인류학적 정의보다 더 복잡한 방식으로 개념화하며, 이것을 아래에 상세히 기술한다.
To offer immediate clarification, from a social constructionist perspective, we conceptualise professional identities as dynamic, and as formed and reformed through dialogue and interaction (also known as identity work; see below).11 Liminality, in the traditional anthropological sense, is defined as describing the condition of being betwixt and between two positions (eg, as not a girl but not yet a woman) in a context in which a ritualised occurrence facilitates the shift from an old to a new status, such as in female puberty rites of passage.12,13 Thus, within the context of higher-stage trainees’ transitions, liminality may be experienced during the transition from trainee to trained doctor (such as when a doctor becomes a consultant), alongside changing expectations of doctors that support these liminal experiences. We conceptualise liminality in a more complex manner than this anthropological definition, however, and we articulate this in detail below. 

 

1.1 | 신원 확인 작업
1.1 | Identity work

첫째, 우리는 '정체성 작업identity work'이 의미하는 바를 명확히 표현합니다. 정체성 작업은 [전문직과 같은 특정 사회 집단의 구성원이 되는 사람들이 경험하는 지향적 과정orienting process]이라고 볼 수 있다.14 직업적 전환기 동안에 정체성 작업은 전면에 드러납니다.

  • 개인적, 가족 구성원과 같은 중요한 타인으로써(개인적),
  • 옛 동료와 새 동료로서(전문직업적),
  • 여러 영역에서 복잡하고 역동적인 변화의 씨름으로써(사회적, 문화적, 심리적, 물리적).

First, we articulate what we mean by ‘identity work.' Identity work can be considered an orienting process experienced by people through which people become members of particular social groups such as professional ones.14 During times of workplace transition, identity work comes to the fore as

  • individuals and his or her significant others such as family members (personal), and
  • old and new colleagues (professional),
  • grapple with complex and dynamic changes in multiple domains (eg, social, cultural, psychological and physical).4,8 

사회 구성주의 관점에서, [정체성]은 [언어, 상징, 의미와 가치의 집합을 포함한 다양한 방법으로 개인적 경험, 타인 및 조직을 통해 함께 그려진다].15 [정체성 작업]'...사람들이 그들의 정체성을 형성, 수리, 유지, 강화 및 수정하는 데 관여하는 것'을 말한다.16 
From a social constructionist perspective, identities are drawn together through personal experiences, others and organisations in numerous ways, including through language, symbols, sets of meanings and values.15 Identity work refers to ‘… people being engaged in forming, repairing, maintaining, strengthening and revising their identities.'16

따라서, [정체성 작업]은 새로운 정체성을 개발하고, 묘사하고, 지원하기 위한 노력이다. 또한 정체성 작업은 [경합적인 대화]와 [다양한 경험] 사이의 상호작용에서 의미가 도출되는 성찰적 서술로 개념화할 수 있다. 개인은 특정 정체성 투사project할 수 있으며(즉, 정체성 주장claim identities), 다른 사람들은 이렇게 '투사된 정체성projected identities'를 진실authentic하다고(또는 진실되지 않다고) 지지하거나(예: 허용grant), 혹은 주장되거나 거절될claimed or rejected 특정한 정체성을 개개인에게 부여bestow on할 수도 있다.
Thus, identity work endeavours to develop, portray and support new identities, and can be conceptualised as a reflexive narrative in which meaning is derived from interaction between contending dialogues and a range of experiences.17 Individuals will project certain identities (ie, claim identities), as others simultaneously support (ie, grant) those projected identities as authentic (or not) and may also bestow on individuals certain identities that may be either claimed or rejected.17-20 


정체성 구성 과정에서 필수적인 요소로서, 이러한 [정체성 주장과 허용claims and grants]자아로부터 비롯되거나, 다른 사람의 말에서부터 비롯되거나, 그리고 비언어적 커뮤니케이션에서 비롯될 수 있다.21,22 그러한 정체성 구성은 그것이 [공동 구성]이든 [다른 사람과 경쟁을 벌이는 것]이든 간에 개인의 [자기 서술]의 일부가 된다.20,23 따라서 정체성 작업의 성과는 '맥락적 담론의 강점과 유연성pliability'에 의해 협상되고, 부여된 정체성에 대한 개개인의 해석을 통해 협상된다. 더욱이, 정체성 작업을 [개개인이 안전한secure 자아 의식sense of self을 위해 노력하는 일시적인, 선형적 과정]으로 개념화하는 것은 옳지 않다. 실제로, [직업적 불안]이나 [경력 전환]과 같은 상황은 사람들이 '자기 의식을 만들고, 확인하고, 분쇄하기 위해' 노력을 기울이는 정체성 작업를 촉진할 수 있다.

As vital elements in identity construction processes, these identity claims and grants can stem from self and other talk, plus non-verbal communication.21,22 Such identity construction, whether it is co-constructed or contested by others, becomes part of an individual’s self-narrative.20,23 The outcomes of identity work are, therefore, negotiated by the ‘strength and pliability of contextual discourses’ and through individual interpretations of identities granted.20 Furthermore, conceptualisations of identity work as a transient, linear process in which individuals strive towards a secure sense of self can be challenged.24 Indeed, situations such as job insecurity or career transitions may actually catalyse identity work, whereby people expend efforts to ‘create, confirm and disrupt a sense of self.'24 

1.2 | 정체성과 경계성
1.2 | Identities and liminality


더 넓은 문헌을 탐구하면서 우리는 [커리어 전환]은 종종 ['내가 누구인가']에 대한 감각이 ['내가 누가 되고 있는가']라는 감각에 자리를 내주는 [역동적인 경계 단계dynamic liminal phase]에 의해 정의될 수 있음을 발견한다.25 경계성liminality에 대한 기존의 선형적 개념에서 벗어나, 현재는 [정체성 전환]이 덜 의식화되며, 새로운 정체성으로의 집합은 종종 불완전하게be partial 이뤄진다고 본다.

  • 예를 들어, 경영학 문헌의 한 연구는 [낙하산 대원 지망생]에서 [낙하산 대원]으로의 전환을 묘사하고 있는데, 새로운 정체성에 대한 인식은 [대중 앞에서의 임관식]을 거치며 만들어지는 것이 아니라, [조용한 심사숙고 중]에 일어난다.
  • 마찬가지로 영국(영국)에서도 의사들의 transitions out of traning은 교육 수료증(CCT)을 발급받고 전문의 등록부에 포함되는 [의례적인 절차]를 수반한다. 그러나, 의사들은 이러한 전환을 [지속적이고 복잡한 것]으로 경험하며, 단순히 CCT를 받는 것을 넘어서, [자기자신의 전문의로서의 새로운 의사 정체성을 인지]하는 데 어느정도의 시간이 걸린다는 것을 암시합니다.

 


Exploring the wider literature, we find that career transitions can often be delineated by a dynamic liminal phase, in which the sense of ‘who I am’ gives way to a sense of ‘who I’m becoming.'25 Moving away from traditional, linear notions of liminality, current conceptualisations suggest that identity shifts are less ritualised and aggregation to new identities can often be partial.26

  • For example, a study from the management literature articulates the shift from aspiring paratrooper to paratrooper, in which recognition of the new identity happens during quiet contemplation rather than through a public passing out ceremony.27
  • Similarly, in the United Kingdom (UK) doctors’ transitions out of training involve the ceremonial process of receiving a certificate of completion of training (CCT) and inclusion on the specialist register.
  • However, our research suggests that doctors experience this transition as ongoing and complex such that his or her personal recognition of his or her new specialist doctor identity takes time beyond the simple receiving of a CCT.8

 

이러한 [중간상태in-betweenness]는 시공간적으로 한정되어 불확실성과 연계되어 있는 듯 하다.26-30 따라서, [리미널리티]는 종종 '사회 제도에서 자신의 내면적 자아와 위치에 대한 현저한 교란'으로 묘사된다. 26-30 연구자들은 그러한 교란이 개인들로 하여금 [강렬한 정체성 작업]을 통해 [리미널(경계적) 지위를 해결할 필요]가 있게 할 수 있다고 주장한다.30 실제로, 개인은 이러한 [경계 공간을 가로질러 이동]하기 위해 자신과 다른 사람들에게 중요한 방식으로 정체성을 개발합니다. Beech는 상당한 경계 기간을 경험하는 사람들은 과거, 현재, 미래를 언급함으로써 [시간순적으로 위치를 잡기도position themselve 한다]고 주장한다. [(과거에 대한) 자기 성찰]과 [미래 자아 투사]를 통해 리미너liminar는 리미너 공간liminal space을 벗어나기 위해 [앞뒤를 동시에 바라보는 것]으로 볼 수 있다. 이러한 방식으로 개념화된 리미널리티는 ['일시적'인 것]으로 생각된다.
This state of in-betweenness is seen as bounded in space and time and linked to uncertainty.26-30 Thus, liminality is often portrayed as something that ‘significantly disrupts one’s internal sense of self and place in a social system.'26-30 Researchers argue that such disruptions can bring individuals to need to resolve his or her liminal status through intense identity work.30 Indeed, individuals develop identities in ways that are important to themselves and others in order to move across these liminal spaces.23,26 Beech argues that people experiencing significant periods of liminality also position themselves chronologically by referring to the past, present and future.26 Through engagement in self-reflection and projecting a future-self, these liminars can be seen as simultaneously looking forwards and backwards in order to move out of the liminal space. Liminality, conceptualised in this way, is thought to be 'temporary.'26,31,32 

그러나 Ybema 등은 [영구적 리미널리티perpetual liminality]의 개념을 도입함으로써 리미널리티에 대한 보다 복잡하고 사회적인 이해를 설명하였다. [영구적 경계성]은 개인이 [상황적, 사회적, 시간적 관련성relevant을 갖기 위해 정체성 확인 작업을 수행하는 상태]를 말한다.23 영구적 경계성은 [비정규직 근로자(예: 대리 의사)]와 [이중 역할 전문가(예: 의사-관리자)]와 같이 지속적인 중간 상태를 경험하는 근로자에게 가장 뚜렷하게 나타난다.32-34 일시적 경계성은 '더 이상 X-가 아니지만 아직 Y도 아니다'라는 느낌을 만드는 반면, 영구 한계성은 'X-도 아니고 Y도 아닌 존재' 또는 'X-와 Y가 모두 되는 것'이라는 [지속적인 느낌]을 만들어낸다.23 일시적 경계성과 마찬가지로, 영구적 경계성은 흔히 다른 사람들에 의해 부과되며, 소위 경계의 브리콜루어(브리콜라지를 하는 사람)라고 불리는 사람이 되는 것이다. 브리콜루어는 [정체성 작업]을 사용하여 '시시각각 시간에 서로 다른 관객들에 따라 자신에게 다른 역할을 주기cast and recast'를 한다.


Ybema et al,23 however, have described more complex and social understandings of liminality by introducing the notion of perpetual liminality. Perpetual liminality is a state in which individuals undertake identity work to make themselves contextually, socially and temporally relevant.23 This perpetual liminality is most evident in workers experiencing enduring in-betweenness, such as impermanent workers (eg, locum doctors) and dual-role professionals (eg, clinician-managers).32-34 Whereas temporary liminality creates a feeling of ‘not-X-anymore-butnot-yet-Y,' perpetual liminality creates an ongoing sense of ‘being neither-X-nor-Y’ or ‘being both-X-and-Y.'23 As with temporary liminality, perpetual liminality is often imposed by others, with individuals becoming so-called boundary bricoleurs, who use identity work to ‘cast and re-cast themselves to different audiences at different times.'23,35 

[일시적 경계성]에 대한 이해가 선형적이라면, [영구적 경계인]은 [이전과 새로운 자아에 대한 시간적 성찰에 덜 의존]한다.23 대신, 그들은 [지속적으로 정체성을 전환]함으로써 즉각적인 경쟁적 요구와 충성도에 대응하고, 따라서 [지속적인 예측 불가능을 경험]하고 사회적인 '노맨스 랜드'에 거주하는 것에 익숙해진다. 그들은 '노맨스 랜드'를 '충성을 쌓는 운영 기반'으로 활용한다. 문헌에 따르면, 이러한 장기간 지속되는 경계감은 [불확실성과 중간성의 지속적인 감정]을 통해서 [부정적인 정서적 결과]를 초래할 수 있다.

In a manner that differs from more linear understandings of temporary liminality, perpetual liminars rely less on temporal reflections of their old and new selves.23 Instead, they respond to immediate competing demands and loyalties by continuously switching identities, thus experiencing lasting unpredictability and growing accustomed to inhabiting a social ‘no-man’s land,' which they employ as an ‘operating base to build allegiances.'23 The literature suggests that this long-lasting sense of liminality can lead to negative emotional consequences as a result of ongoing feelings of uncertainty and in-betweenness.'29, 35 


1.3 | 리미날리티 및 의료 교육
1.3 | Liminality and health care education


상위 의학 교육 저널의 키워드 검색('리미날*' 용어를 사용)에서는 학습자가 전문적 정체성을 개발하는 데 어려움을 겪는 어려운 지식troublesome knowledge에 어떻게 직면하는지에 대해 [학부 학습의 임계값 개념]에 대해 상당한 연구가 존재한다는 것을 보여줍니다.36,37 [지식의 임계값 개념]은 학습자가 (종종 적절하다고 여겨지는 행동을 모방하는 것처럼) 진실성 부족을 경험할 때 [반드시 거쳐야 하는 포털]에 비유되며, [경계성 시기liminal phase]로 묘사될 수 있다.38 학습자의 초점은 이러한 [문턱을 넘어서 학습자가 개념과 세계를 인식하는 방식을 바꾸는 [변혁적 학습]]에 있습니다. .37 이러한 의료 교육 연구 영역은 종종 정확한 임계 개념의 목록(예: 돌봄 또는 책임)을 얻는 데 초점을 맞춘다.39-42
A keyword search (using the term ‘liminal*’) of top medical education journals reveals that considerable research exists around threshold concepts in undergraduate learning with reference to how learners are confronted with troublesome knowledge that challenges his or her developing professional identities.36,37 The notion of knowledge as threshold is likened to a portal through which learners must travel when experiencing a lack of authenticity, often imitating behaviours considered appropriate, and described as a liminal phase.38 The focus for learners is on moving through these thresholds and on to transformational learning, which changes the ways learners perceive concepts and the world around them.37 This sphere of health care education research often centres on obtaining a definitive list of threshold concepts (eg, caring or responsibility).39-42 

그러나 여기에는 확인되지 않은 질문이 있다. 바로 학습자가 [문제 지식]에서부터 [경계 단계]를 거쳐 [혁신적 학습]에 다다를 것이라는 생각(즉, 일시적 경계성)이다.를 들어, 브라운 외 연구진은 두 정체성 사이의 일시적 경계성 단계를 stressful하다고 표현하기 위해 [의료 전문가에서 교육자로의 전환]에 대한 선형적 개념화를 사용했다.43 다른 이들은 논의 물리적 공간을 [경계적liminal]이라고 초점을 두었다. 예를 들어서, 병원 복도와 같은 곳을 토론과 지식 교환과 비공식 학습을 위한 [경계성 공간]으로 본다거나, 어떻게 새로운 의과대학 건물이 [전문직]과 [대학] 사이의 경계 공간이 되는가를 연구했다.44,45 

Relevant here, however, is the unquestioned notion in this literature that learners will progress from troublesome knowledge through a liminal phase to transformational learning (so, temporary liminality).36 For example, Browne et al used a linear conceptualisation of the transition from medical professional to educator to describe the temporary liminal phase between the two identities as stressful.43 Others have focused on physical spaces as liminal, such as the hospital corridor as a liminal space for discussion, knowledge exchange and informal learning, or how a new medical school building becomes a liminal space between the profession and the university.44,45 


1.4 | 연구 목적 및 연구 질문
1.4 | Study aims and research questions


우리의 연구 질문은 다음과 같습니다.
Our research questions are:

1. 수련생이 훈련한 전환 과정을 거치면서 의사가 설명하는 경계적 경험(및 이와 관련된 정체성 작업)은 무엇입니까?
1. What liminal experiences (and associated identity work) do doctors narrate as he or she moves through trainee-trained transitions?

2. 훈련생으로 전환되는 동안 경계적 경험(및 이와 관련된 정체성 작업)은 시간이 지남에 따라 어떻게 변화합니까?2. How do liminal experiences (and associated identity work) change over time during trainee-trained transitions?

2 | 방법
2 | METHODS


2.1 | 연구 설계
2.1 | Study design


본 논문은 수련생으로 양성된 의사들의 전환을 탐구하는 보다 폭넓은 종단적 서술연구에서 나온 것이다.8 종단적 서술 탐구를 통해 시간이 지남에 따라 각 참가자들의 독특한 경험을 탐구할 수 있었다.46 종방향 오디오 다이어리(LAD)는 스토리텔링을 전경화하고 출입구 인터뷰와 함께 참가자가 세로 방향으로 깊이 있는 경험을 탐색할 수 있도록 지원하기 때문에 변경 시 감지 도구로 특히 적합합니다.46,47 
This paper comes from a wider longitudinal narrative study exploring trainee-trained doctors’ transitions.8 Longitudinal narrative inquiry allowed us to explore the unique experiences of each participant over time.46 Longitudinal audio-diaries (LADs) are particularly applicable as sense-making tools during times of change because they foreground storytelling and, used alongside entrance and exit interviews, help participants to explore his or her experiences in depth longitudinally.46,47 

2.2 | 샘플링 및 모집
2.2 | Sampling and recruitment


영국 의사들은 대학 졸업 후 일반적으로 2년간의 Foundation 교육을 받은 후 [전공과목specialty 교육]으로 옮기기 시작하는데, 전문 분야에 따라 3년에서 8년 사이의 기간이 소요될 수 있습니다. 전문대학 평가의 성공적인 완료에 따라, 수습생은 [CCT를 취득]하고 [전문의 등록부specialty register]에 등록됩니다. 우리는 의도적으로 향후 6개월 이내에 CCT를 확보할 것으로 예상되는 영국의 수련의들을 표본 추출하여 수련의들이 수련을 받은 경험을 종적으로 탐구할 수 있도록 했습니다. 본 논문의 목적상, 우리는 이러한 의사들을 전체적으로 '훈련된 의사들trained doctor'이라고 설명한다. 훈련 완료 후 여러 가능한 목적지를 설명하는 일반 용어이기 때문이다(예: 컨설턴트, 일반의사 [GP], 임상 펠로우). 

Following university graduation, UK doctors typically begin postgraduate training with 2 years of Foundation training before moving to specialty training, which can take anything between 3 and 8 years (depending on the specialty). Following the successful completion of specialty college assessments, the trainee achieves a CCT and is placed on the specialty register. We purposely sampled UK trainee doctors expected to secure CCTs within the following 6 months to allow us to longitudinally explore doctors trainee-trained experiences. For the purposes of this paper, we describe these doctors throughout as ‘trained doctors’ as this is a generic term accounting for multiple possible destinations following completion of training (eg, consultant, general practitioner [GP], clinical fellow). 

2.3 | 데이터 수집
2.3 | Data collection

초기 면접에서 참가자들은 전환에 대한 이해도와 다가오는 전환에서 기대하는 바를 질문 받았다. 참가자들은 또한 지금까지의 훈련 경험을 되새기고, 훈련된 전환 준비에 어떤 영향을 미쳤는지에 대해 토론했습니다. 그런 다음 참가자들은 LAD 단계에 참여하도록 초대되었습니다. 이 단계에서 참가자들은 6~9개월에 걸쳐 훈련받은 전환 경험과 관련된 이야기, 생각, 성찰 등을 기록하도록 요청받았다.
At entrance interview, participants were asked about his or her understanding of transitions and what he or she expected from his or her upcoming transitions. Participants also reflected on his or her training experiences to date and discussed what influenced his or her readiness for trainee-trained transitions. Participants were then invited to participate in the LAD phase. During this phase, participants were asked to record stories, thoughts and reflections pertaining to trainee-trained transition experiences over 6-9 months.

표 1은 세 단계에 걸쳐 수집된 데이터와 각 참가자에 대한 인구통계 정보를 보여줍니다.
Table 1 depicts the data collected across the three phases, as well as demographic information for each participant.

 

2.4 | 데이터 분석
2.4 | Data analysis


우리는 먼저 프레임워크 분석을 사용하여 데이터 집합의 광범위한 테마를 유도적으로 식별했다.51 이 테마 분석에는 여러 단계가 포함되었다. 

  • (a) 광범위한 연구팀(승인서 참조)의 구성원은 반복적인 기록 탐사와 오디오 녹음을 통해 데이터에 익숙해졌다.
  • (b) 주제 프레임워크는 각 연구팀이 데이터의 하위 집합을 별도로 분석하고 주요 테마를 제안하도록 한 다음, 팀이 코딩 프레임워크에 대한 고차 주제를 함께 협상할 수 있도록 함으로써 개발되었다.
  • (c) 이러한 고차 테마는 atlas.ti 버전 7.0(ATLAS.ti, 과학 소프트웨어 개발 GmbH, 독일 베를린)을 사용하여 모든 데이터를 코드화하기 위해 사용되었다. 가장 중요한 주제는 의사 수련생이 훈련한 전환의 다양한 경험에 보다 광범위하게 초점을 맞추고 전환에 대한 촉진자 및 억제자를 식별했다.8

We first used framework analysis to inductively identify broad themes in our dataset.51 This thematic analysis involved several stages:

  • (a) members of the wider research team (see Acknowledgements) familiarised themselves with the data through repeated explorations of transcripts and audiorecordings;
  • (b) a thematic framework was developed by having each research team member separately analyse a subset of data and propose key themes and then allowing the team to negotiate higher-order themes for the coding framework together, and
  • (c) these higher-order themes were utilised to code all data using atlas.ti Version 7.0 (ATLAS.ti, Scientific Software Development GmbH, Berlin, Germany). The overarching themes focused more broadly on the multiple experiences of doctors’ trainee-trained transitions, identifying facilitators and inhibitors to transitions.8 

 

3 | 결과
3 | RESULTS

세 가지 학습 단계를 모두 마친 참가자들은 [전공의trainee]에서 [전문의trained doctor]로의 이행과정에서 자신의 정체성과 관련된 경계성을 경험했다. 이전 문헌과 일관되게 데이터 분석을 통해 참가자의 경험에서 일시적이고 영구적인 경계성을 파악할 수 있었습니다. 그러나 참가자의 정체성 대화에 대한 세분화된 분석을 통해 우리는 새로운 한계 경험, 즉 훈련된 의사 지위와 관련된 [다른 사람들로부터의 정체성 부여를 적극적으로 거부]하는 일부 참가자의 여정에서 포인트를 식별할 수 있었습니다. 대신, 참가자들은 (수련생도 훈련된 의사도 아닌) 자신의 [경계적 지위를 유지]하거나 [적극적으로 수련생 신분을 유지]하는 정체성 작업에 착수했다. 우리는 이러한 새로운 유형의 리미날리티를 [점유적 리미날리티occupying liminality]로 설명한다. 
All participants completing the three study stages experienced liminality related to his or her identity as he or she moved from trainee to trained doctor. Consistent with previous literature, our data analysis enabled us to identify temporary and perpetual liminality in participants’ experiences. However, fine-grained analysis of participants’ identity talk also enabled us to identify novel liminal experiences: points in some participants’ journeys at which he or she actively rejected identity grants from others associated with his or her trained doctor status. Instead, participants undertook identity work that either maintained his or her liminal positions (as neither trainee nor trained doctor) or that actively maintained a trainee identity; we describe this novel type of liminality as occupying liminality. 

3.1 | 일시적인 한계성을 설명하는 의사들
3.1 | Doctors narrating temporary liminality


대부분의 의사들은 자신의 이행단계에 걸쳐 [일시적 경계성 정체성]을 서술했다; 이것은 이미 자리trained post를 확보했지만, 아직 시작을 기다리고 있는 의사들에게 특히 관련이 있었다. 이 시점에서 이들 참가자들은 CCT에 대한 서류 작업을 완료하고 새로운 역할에 대한 기대를 가지고 있었지만, 또한 경험에 대한 반성을 하고 있었다. 예를 들어, Andrew는 [정체성 작업]을 통해 컨설턴트로서 첫 당직 근무를 할 수 있다는 자신감을 나타냈습니다(표 2, 견적 1). 돌이켜보면, 그는 (다른 사람들이 그에게 컨설턴트 신분을 부여하는 것과 함께) 컨설턴트 역할을 했던 이전의 경험이 자신을 잘 준비시켜주었다는 것을 깨달았다.

Most doctors narrated temporary liminal identities at some point across his or her transitions; this was particularly pertinent for doctors who had already secured trained posts but were waiting to start them. At this point, these participants had completed the paperwork for the CCT and were looking forward to the new roles but were also reflecting backward on the experiences. For example, Andrew used identity work to project his confidence in doing his first on-call shift as a consultant (Table 2, Quote 1). Looking backwards, he recognised that his previous experiences of acti ng up as a consul tant (wi th others granti ng hi m a consul tant identity) had prepared him well.


[일시적 경계성 단계]에서, 일부 의사들은 [공식적인 CCT 서류 작업]이 어떻게 완료되었는지 설명했지만, 아직 공식적인 역할을 시작하지는 못했다고 말했습니다([서류 작업 완료]와 [실질적인 '훈련된trained' 직책을 맡는 것] 사이의 이 시차time lag는 영국에서 일반적이다). Steven's와 Arun의 경험에서 확인된다 (표 2, 인용문 2, 3). 임상진료clinical practice에 초점을 맞춘 이러한 각각의 경험에서, 두 의사는 자신의 [훈련된 의사]의 신분을 주장하면서도, 여전히 다른 사람의 신분을 허락받기를 기다리고 있었다.
Some doctors in this temporary liminal phase described how his or her formal CCT paperwork was complete, but that he or she were yet to start his or her formal roles (this time lag between the completion of paperwork and the taking up of a substantive ‘trained’ post is common in the UK), as illustrated by Steven’s and Arun’s experiences (Table 2, Quotes 2 and 3). In each of these experiences, focused on clinical practice, both doctors claimed his or her trained doctor identities but were still waiting for others’ grants of these identities.


다른 의사들은 이 경계성 기간liminal period 동안 그들이 새로운 [컨설턴트 신분]을 주장할 수 있도록 돕는 [의식ritual의 중요성]을 설명했습니다. 이는 특히 George가 논의한 바와 같이, 아직 수련 현장에 남아 있는 상황에서 [시니어 역할]로 이동하는 것을 보여준다signify는 점에서 중요했습니다(표 2, 인용 4).
Other doctors described the importance of rituals (eg, celebrations with colleagues) in helping them claim his or her new consultant identities through this liminal period. This was especially important to signify doctors moving into senior roles in contexts in which he or she remained at the site of his or her training, as discussed by George ( Table 2, Quote 4).

어떤 이들은 일시적인 경계성의 경험을 [긍정적으로 묘사]한 반면(예: Andrew, Steven, Arun 및 George[표 2, 인용문 1-4]), 다른 이들은 [trained doctor 신분의 부여가 다른 사람들에 의해 억제된다]고 인식하면서 좌절감을 경험했다. 예를 들어, 헤더는 자신이 컨설턴트로서 기능하고 있다고 설명함으로써 컨설턴트 신분을 스스로 주장했지만, 그녀는 또한 자신이 여전히 훈련생이라고 설명했으며, 다른 사람들이 [중요한 의사결정 회의에서 자신을 배제함]으로써 컨설턴트 정체성 인정identity grants를 보류했다고 보고했다(표 2, 인용 5).
Whereas some described the experiences of temporary liminality positively (eg, Andrew, Steven, Arun and George[Table 2, Quotes 1-4]), others experienced frustration as he or she perceived that grants of trained doctor identities were withheld by others. For example, although Heather claimed a consultant identity for herself by explaining that she was functioning as a consultant, she also described that she was still a trainee and reported that others withheld consultant identity grants to her by excluding her from important decision-making meetings (Table 2, Quote 5). 

3.2 |영구적 한계성을 설명하는 의사들
3.2 | Doctors narrating perpetual liminality


어떤 의사들은 종종 [이중 역할의 소유]를 통해 [영속적 경계성]을 이야기했다. 예를 들어, 임상 관리자 역할을 맡았던 Petra는 다른 사람들이 다양한 환경에서 자신을 어떻게 보는지에 대해 논의했습니다(표 3, 인용문 1). 영국에서 새로 교육을 받은 의사에게 이러한 역할은 드문 일이지만, 국유화되지 않은 의료 시스템에서 의사가 교육 후 즉시 관리 책임을 지는 것은 드문 일이 아닙니다. 먼저, 페트라는 managerial role을 수행함에 있어서, 자신이 그 팀이나 직장의 [확고한fixed 구성원이 아니라는 점]을 감안하여 임상의로서의 [집중적인 정체성 작업]을 사용하여 [다른 임상의와 관계를 구축]하는 방법에 대해 이야기했습니다.
Some doctors narrated perpetual liminality, often through the possession of dual roles. For example, Petra, who had a clinical manager role, discussed how others saw her in the different environments (Table 3, Quote 1). Note that although this role is unusual in the UK for a newly trained doctor, it is not unusual in non-nationalised systems of health care for doctors to have management responsibilities immediately post-training. First, Petra talked about how, in her managerial role, she used intensive identity work as a clinician to build relationships with other clinicians given that she was not a fixed member of that team or workplace. 

둘째, 패트라는 자신이 운영회의management meeting에 참석했을 때 다른 사람들이 자신을 매니저로만 생각해서, 그녀도 임상의라는 사실을 잊은 채 어떻게 다른 임상의들에 대해서 불만을 늘어놓았는지를 이야기했다. 그러나 페트라는 자신을 임상의이자 관리자로 보았고, 이러한 두 세계의 경험을 통해 [서로 다른 집단의 관점을 중개하려고 노력]했습니다. 또 다른 참가자인 [GP 임상 학자clinical academic]인 프레디는 Petra와는 다른 방식으로 영구적 경계성을 경험했습니다. 가정의학 개업의 자격을 갖춘 GP로 매주 하루씩 소속된 Freddie는 근무 시간 이외의 회의에 참석하는 등 임상 팀의 일원으로 자리매김하기 위해 정체성 작업에 착수했습니다(표 3의 인용문 2). 이와 함께 그는 임상학자의 역할 8개월 만에 연구 기간이 끝날 때까지 임상학자clinical academic로서 자신의 정체성에 의문을 품었다. 실제로, 그의 정체성 투쟁은 [임상 실무의 정규직]도 아니고, [학계의 정회원도 아닌] 그의 감정을 반영했다(표 3, 인용 3). 
Second, she described how, when sitting in management meetings, others saw her as a manager, forgetting that she was also a clinician as the others complained about clinicians. Petra, however, saw herself as someone who was both a clinician and a manager and used this experience of both worlds to try and broker the different group views. Another participant, Freddie, a GP clinical academic, experienced perpetual liminality in a different way to Petra. Affiliated for 1 day per week as a qualified GP to a family medicine practice, Freddie undertook identity work to try to establish himself as part of the clinical team, such as by going to meetings outside his working hours (Table 3, Quote 2). Alongside this, he questioned his identity as a clinical academic until the very end of his time in the study, 8 months into his clinical academic role. Indeed, his identity struggles mirrored his feelings of being neither a full-time member of the clinical practice nor a full member of the academic community (Table 3, Quote 3).

3.3 | 점유적 경계성을 설명하는 의사들
3.3 | Doctors narrating occupying liminality

일부 참가자가 [점유적 경계성]을 서술하는 것으로 판명된 한 가지 방법은, [영구적 경계인]으로 능동적으로 포지셔닝하는 커리어 선택을 통해서였다. 이러한 선택의 이유에는 [훈련된 의사 책임]에 대해 더 준비가 되어 있다고 느낄 때까지 기다리려는 욕구와 유연하게 일하고 싶은 욕구가 있었다. 예를 들어, Julie는 자신을 '물 건너가기treading water'라고 표현했습니다(더 영구적인 자리를 원할 때까지 지역 훈련 기관에서 시간제로 일하도록 지원하는 GP). 그녀는 아직 자녀가 매우 어리고, 파트타임으로 일했기 때문에, GP 파트너가 됨으로써 따르는 책임을 원치 않았고, 그래서 그녀는 경계적인 역할을 선택했습니다(표 4). 인용문 1). 

One way by which we identified some participants as narrating occupying liminality was through his or her career choices as participants actively positioned themselves as perpetual liminars. The reasons for these choices included a desire to wait until he or she felt more ready for trained doctor responsibilities and a wish to work flexibly. For example, Julie described herself as ‘treading water’ as a retained GP (a GP funded by the local training body to work part-time until he or she wants a more permanent position), and as choosing to be in a liminal role as she did not want the responsibility of being a GP partner as her children were very young and she worked part-time (Table 4, Quote 1).

마찬가지로, 외과의사인 루시는 자신의 전공분야specialty에 머물고 싶은지 결정하기 위해 1년 동안 임상연구원을 선택했다(표 4, 인용문 2). 또 다른 GP인 Jason은 업무 유연성을 유지하고 다양한 직업 환경을 경험하기 위해 대리의사locum으로 일하기로 결정했습니다(표 4, 견적 3). 흥미롭게도, 모든 종단적 데이터 집합에서, 우리는 연구참여자들이 [훈련된 의사로서의 정체성에 대한 주장 또는 인정을 거부rejected]한 무수한 사례를 확인할 수 있었다. 예를 들어, Morag와 Megan은 [전문의 정체성의 수여grants를 거부하기 위해] 정체성 작업을 사용했다. 

Similarly, Lucy, a surgeon, chose to be a clinical fellow for a year in order to decide whether she wanted to stay in her specialty (Table 4, Quote 2). Another GP, Jason, chose to work as a locum to maintain work flexibility and to experience different occupational environments (Table 4, Quote 3). Interestingly, across our longitudinal dataset, we were able to identify numerous occurrences within and across participants in which he or she rejected claims and/or grants of his or her trained identities. For example, both Morag and Megan used identity work to reject grants of the consultant identities; 

더욱이, 일부 참여자들은 [과거에 동료]였지만 [지금은 후배]가 된 동료들과의 관계 변화에 대응하기 위해 정체성 작업을 수행했음을 이야기했다. 예를 들어, Anna는 동료들 중 한 명이 이제 Anna가 컨설턴트가 된 것을 '무서워했음'을 알게 되었다고 설명했으며, Anna는 이러한 동료 관계를 유지하기 위해 정체성 작업을 사용했다고 한다(표 4, 인용 6). 에이미의 일기장에서, 그녀는 이전에 그녀의 [교육 감독관]이었던 컨설턴트 동료와의 관계가 변한 것에 대해 논의했다. 이 일기들을 통해 에이미는 이런 상황에서, 자신의 [컨설턴트 정체성을 거부하는 것을 선택]했다고 밝히면서, 이전 교육 감독관과의 관계에서는 연습생trainee 정체성을 차지occupy하는 것을 선호했다. 에이미는 자신의 다이어리에 정체성 작업을 통해 이를 통해 컨설턴트 동료의 지원을 여전히 원하지만, [더 이상 감독받고자 해서는 안 된다는 생각]에 대해서 어려움을 겪고 있다고 주장했다(표 4, 인용문 7). 
Moreover, some participants discussed undertaking identity work in order to respond to changing relationships with colleagues who had previously been peers but were now more junior. For example, Anna explained that one of her peers found it ‘scary’ that Anna was now a consultant, and Anna employed identity work to try and maintain this peer relationship (Table 4, Quote 6). In Amy’s diaries, she discussed the changed relationship she had with a consultant colleague who had previously been her educational supervisor. Through these diaries, Amy revealed that she was choosing to reject her consultant identity in this circumstance, preferring to occupy a trainee identity in her relationship with her previous educational supervisor. Amy employed identity work in her diaries to talk through this, positioning herself as a trainee by claiming that she still wanted support from her consultant colleague and was struggling with the (self-imposed) notion that she should not be seeking supervision anymore (Table 4, Quote 7). 



3.4 | 카렌의 종단적 이야기
3.4 | Karen’s longitudinal story

3.4.1 | 카렌의 일시적 한계: 더 이상 연습생도 아니고 컨설턴트도 아닙니다.
3.4.1 | Karen’s temporary liminality: No longer a trainee but not a consultant either

카렌이 연구를 시작한 지 두 달째 되던 해, 그녀는 CCT를 받는 공식적인 의식을 거쳤다. 그녀는 그것을 '약간의 안티-클라이막스(LAD 4)'라고 묘사했고, 그녀의 훈련 병원에서의 유예 기간grace period으로 들어갔다(그림 1). 이번 유예기간 동안 카렌은 경계적이었다. 더 이상 trainee는 아니었지만, 아직 consultant도 아니었다. 이 경계 단계(시간 제한적이고 일시적) 동안, Karen은 자신을 유능하고 대학적인 사람으로 강조함으로써 미래의 컨설턴트 자신을 투영하기 위한 자신의 정체성 작업을 설명했습니다(표 5, 인용문 2, 3). 
In Karen’s second month in the study, she moved through the formal ritual of receiving her CCT, which she described as ‘a slight anticlimax’ (LAD 4) and into her grace period at her training hospital (Figure 1). Through this grace period, Karen was liminal; she was no longer a trainee, but she was not yet a consultant. During this liminal phase (time-bound and thus temporary), Karen described her identity work to project her future consultant self through emphasising herself as competent and collegiate (Table 5, Quotes 2 and 3).

카렌이 이 유예 기간을 거치면서, 그녀의 어조는 리미나로서의 불확실성을 강조하기 위해 바뀌었다. 카렌은 자신이 유예기간에 갇혔으며 컨설턴트로서의 일을 제안하기 위해 (높은 지위의) 다른 사람들에게 완전히 의존하고 있다고 자신을 표현했다. 

As Karen moved through this grace period, the tone of her LADs shifted to emphasise her uncertainty as a liminar (and its associated stresses). Karen presented herself as trapped in her grace period and as having complete reliance on others (of higher status) to offer her work as a consultant.

이 기간 동안 카렌은 자신의 유예 기간이 끝날 때까지의 기간에 대해 모든 일기에서 언급했다(표 5, 인용문 4). 또한, 카렌의 정체성 작업은 가속화되었습니다. 예를 들어, 그녀는 자신이 팀 플레이어이며 일을 완수하는 리더임을 보여줄 수 있는 기회로 보았기 때문에 연례 직원 이벤트를 이끌겠다고 자원했습니다(예: 시간이 제한에도 불구하고). 게다가 카렌은 자신의 일기에서 자신의 훈련 환경에서 컨설턴트 자리를 확보할 수 있는 가능성에 대해 많은 대화를 나누었다고 보고했다.

During this, Karen remarked in every diary on how long it was until the end of her grace period (Table 5, Quote 4). Additionally, Karen’s identity work accelerated; for example, she volunteered to lead an annual staff event (despite having limited time) because she saw this as an opportunity to show herself to be a team player and a leader who gets things done (Table 5, Quote 5). Furthermore, Karen reported in her diaries numerous conversations about the possibility of securing a consultant position in her training setting.

 


카렌의 정체성 작업을 볼 때, 카렌이 (스스로를) 그 부서 내에서 '컨설턴트 의사'로 주장하였음을 볼 수 있는데, 이 주장은 의사결정 과정에서 중요한 다른 이해관계자들에 의해 인정되고 있었다(표 5, 인용문 6). 카렌은 일자리를 찾기 위한 다른 사람들의 불확실한 '망토와 단도' 성격으로 묘사된 것과 씨름했다. 정보에 부분적으로만 접근할 수 있었던 그녀는 정보를 공유하는 데 다른 사람들에게 의존했고, 선임 컨설턴트로부터 중요한 리더십 정체성 부여를 거절당했음이 틀림없었다(표 5, 견적 7). 

In terms of her identity work in her audio-diaries, we can see Karen’s claims as ‘consultant doctor’ within that unit, which were being acknowledged by other stakeholders important in the decision-making process (Table 5, Quote 6). Karen struggled with what she described as the uncertain ‘cloak and dagger’ nature of others’ attempts to find her a job. Having only partial access to information, she relied on others to share information, and was arguably denied important leadership identity grants from senior consultants (Table 5, Quote 7).

마침내, 다행스럽게도, 그녀의 유예 기간이 끝난 다음날 그녀는 안식년을 보내는 또 다른 컨설턴트의 자리를 대신할 하숙 컨설턴트 자리를 제안받았다. 이것은 캐런이 새로운 컨설턴트 일을 시작하는 것과 그녀가 대신할 사람의 퇴사 사이에 겹치는 것을 의미했다. 카렌은 이 소식에 의기양양했지만 일기장에서 유예기간이 얼마나 스트레스가 많았는지 되새겨 보았다(표 5, 인용문 8).  

Finally, and much to Karen’s relief, the day after her grace period ended she was offered a job as a locum consultant, covering for another consultant who was going on sabbatical. This meant that there was an overlap between Karen’s starting of her new consultant job and the leaving of the individual she was replacing. In her diary entry, although elated by this news, Karen reflected back on how stressful the grace period had been (Table 5, Quote 8). 

 

3.4.2 | 카렌은 경계성을 점유하였다: 컨설턴트가 되지만 아직 컨설턴트가 되지 않음
3.4.2 | Karen occupies liminality: Being a consultant but not yet becoming a consultant

새로운 컨설턴트 역할을 시작한 후, 카렌은 한 달 동안 오디오 일기를 제출하지 않았다. 다음 일기에서 그녀는 컨설턴트로서 첫 경험을 되새겼다. 카렌의 정체성 작업은 그녀가 유능하고 팀플레이어이며 리더라는 것을 입증하는 일에서 '컨설턴트라고 불리는 것이 마치 거짓말을 하는 것 같음'를 느끼고, 다른 사람들이 자신에게 컨설턴트 신분을 부여하는 것을 거부하였다. 실제로, 그녀는 [간단한 환자를 맡고 싶다는 자신의 희망]과 [복잡한 환자를 맡아서 변화를 일어켜주길 바라는 동료의 신념]을 대조했다. 따라서 우리는 그녀가 다른 사람이 부여하는 컨설턴트 정체성을 거절하는 것을 목격하였으며, 카렌은 스스로 이 정체성을 주장할 때 까지는 시간이 필요하다고 말한다(표 5, 인용구 9). 
After starting her new consultant role, Karen did not submit an audio-diary for a month. In her next diary, she reflected on her first experiences as a consultant on call. Karen’s identity work shifted in emphasis from working to demonstrate that she was competent, a team player and a leader (as discussed previously) to someone who ‘felt a bit of a fraud being called the consultant’ and rejected others’ grants of her new consultant identity (LAD 15, Month 9). Indeed, she contrasted her hopes for simple cases when on call with her colleague’s beliefs that she should be hoping for complicated cases so that she could make a difference. We therefore see her rejecting others’ granting of her consultant identity, stating that she requires time to claim this identity for herself (Table 5, Quote 9). 

카렌은 직장 내 선배 trainee들과의 관계와 컨설턴트가 되는 데 내재된 교육자 역할에 자신이 발을 들여놓을 것이라는 기대감에 대해서도 이야기했다. 캐런은 퇴사 인터뷰에서, 현재 다른 사람이 자신에게 [교육자-컨설턴트 정체성]을 부여하는 것을 거부하고 있으며, 자신의 외과적 자신감과 전문지식을 키우기 위해 시니어 수련생들과 어려운 수술 사례를 놓고 경쟁하고 있다고 설명했습니다(표 5, 인용문 10). 
Karen also talked about her relationships with senior trainees within the workplace and the senior trainees expectations that she would step into the educator role inherent in being a consultant. In her exit interview, Karen simultaneously claimed a learner-trainee identity and rejected others’ grants of her now educator-consultant identity, describing herself as in competition with her senior trainees for difficult theatre cases in order to develop her own surgical confidence and expertise (Table 5, Quote 10). 

마지막으로, [자기 자신]과 [그녀가 대신하는 동료] 간의 오버랩은 캐런이 직장 내에서 자신의 위치에 대해 느끼는 감정에 영향을 미치는 것으로 보였습니다. 카랜은 [점유적 경계성] 상태일 뿐만 아니라, 대리의사라는 지위 때문에 [영구적 경계인 상태]이기도 했다. 카렌은 이러한 중복된 지원에 안도감을 표시했다. 비록 이러한 오버랩때문에 그녀는 아직도 '조금은 registrar처럼 느꼈다'라고 하지만, registrar처럼 행동해서는 안 되었고, 따라서 self-imposed occupation of liminality에 대한 불안을 보였다. 

Finally, the overlap between herself and the colleague she was replacing seemed to affect how Karen felt about her position within the workplace. As well as occupying liminality here, she was also a perpetual liminar as a result of her locum status. Karen expressed relief in the support this overlap provided. Although this overlap meant that she still felt ‘a bit like a registrar,' she felt she should not be behaving like a registrar, thus indicating her anxieties about her self-imposed occupation of liminality (Table 5, Quote 11). 

4 | 토론
4 | DISCUSSION

우리는 훈련된 전환 과정을 통해 의사들에 의해 서술된 한계적 경험을 탐구했다. 첫 번째 연구 질문에 답한 결과, 참가자들은 세 가지 방법으로 한계성을 경험했다는 것을 알게 되었습니다.

  • 첫째, 가장 많은 사람들이 어느 순간 [일시적 경계성]을 경험했다. 정체성 작업을 통해 참가자들은 이러한 또는 그녀의 새로운 정체성으로의 전환을 촉진하기 위해 자기 성찰에 참여하고 과거, 현재, 미래의 자신을 고려하며, 종종 한계에서 벗어나기 위해 타인의 '컨설턴트' 정체성 부여에 의존합니다. 
  • 둘째, 일부 의사들은 이중 역할 속에서 지속적인 중간 관계in-betweenness를 겪으며, 즉 [영속적 경계성]을 경험했음을 시사한다.23 참가자들은 상황별로 그리고 사회적으로 관련성을 갖기 위해 정체성 작업을 사용하는 것으로 보였으며, 지속적으로 정체성을 전환함으로써 경쟁하는 충성심과 요구에 대응하는 경계선 브리콜러가 되었다.예를 들어, 임상에서 학술에 이르기까지).
  • 셋째, 이것은 리미널리티에 대한 이론적 개념에 있어 새로운 것으로, 개인들은 때때로 경계성의 적극적인 창조와 유지를 통해 [경계성을 의도적으로 점유]하곤 했다. 예를 들어, 의사들은 훈련된 의사와 훈련된 의사 사이의 경계 공간을 의도적으로 차지하기 위해 [훈련된 신임의사trained doctor 정체성이 부여되는 것을 거부]하는 정체성 작업을 수행하였다. 우리는 일시적 경계성이나 영구적 정체성이 외부적으로 부여되는 것external imposition과는 달리, 개인이 [경계인liminar]이 되는 것을 적극적으로 선택할 수 있으며, 이에 따라 자신의 리미널리티에 대한 행위자성과 통제권을 행사할 것을 제안한다.

We explored liminal experiences narrated by doctors across traineetrained transitions. Answering our first research question, we found that participants experienced liminality in three ways.

  • First, most experienced temporary liminality at some point. Through identity work, participants engaged in self-reflection and considered past, present and future selves in order to expedite shifts towards this or her new identity, often relying on ‘consultant’ identity grants from others to move them out of liminality. 26
  • Second, our findings suggest that some doctors experienced perpetual liminality, undergoing enduring in-betweenness through dual roles.23 Participants were seen to use identity work to make themselves contextually and socially relevant, becoming boundary bricoleurs responding to competing loyalties and demands by continuously switching identities (eg, from clinician to academic).23,32–35
  • Third, and novel to theoretical notions of liminality, individuals would sometimes purposely occupy liminality through its active creation and maintenance. For example, doctors would engage in identity work to reject grants of his or her new trained doctor identities in order to purposely occupy the liminal space between trainee and trained doctor. We suggest that, in a manner contrary to the external imposition of temporary and perpetual liminality, individuals can and do actively choose to be liminars, thereby exerting agency and control over his or her own liminality. 

두 번째 연구 질문의 관점에서, [하나의 전문적 정체성(예: 수련 의사)]에서 [다른 전문적 정체성(예: 훈련된 의사)]으로 정체성이 선형적으로 진행된다는 것은, 지나치게 경계성을 단순화하여 개념화한 것임을 밝혀냈다. 실제로, 종단적 데이터셋 전체에 걸친 개인의 경험에 대한 시간적 분석 결과, 참가자들이 [항상 리미날 단계를 통해 선형으로 진행되지는 않는다는 점]에 주목했다. Karen의 경험이 보여주듯이, 맥락, 관계(대인관계와 조직관계 모두)와 시스템은 종종 이리저리로 오락가락하는 우리의 참가자들에 의해 [주장되고 부여된claimed by, and granted to 직업적 정체성]에 영향을 주었고, 따라서 항상 훈련된 의사 정체성으로 곧바로directly 진척되지는 않았습니다. 
In terms of our second research question, our analysis revealed that a conceptualisation of liminality as a linear progression from one professional identity (eg, trainee doctor) to another (eg, trained doctor) is overly simplistic. Indeed, through our temporal analysis of individuals’ experiences across the longitudinal dataset, we noted that participants did not always proceed in a linear manner through the liminal phase. As Karen’s experiences illustrate, context, relationships (both interpersonal and organisational) and systems also influenced the professional identities claimed by, and granted to, our participants, which often fluctuated from one diary to the next, and thus did not always progress directly towards a trained doctor identity. 

[왜 사람들이 경계성을 점유하기로 선택했는지]에 대해서, 우리는 [어떻게 transition이 개념화되는가]를 생각해볼 필요가 있다. Jindal-Snape는 이행transition을 다차원적(다차원적 및 다차원적 전환 이론)으로 간주하며, 개인의 삶의 한 맥락(예: 새로운 직업)에서의 전환이 다른 맥락(예: 홈 무브)에서의 전환을 트리거한다고 보았다.4 의사들의 직업 전환에 대한 연구는 이러한 개념적 사고와 일치하며, 그러한 과도기적인 단계들을 [복잡하고 종종 비선형적]이라고 파악한다.5-10 When we consider why people might choose to occupy liminality, we need to return to how transitions are conceptualised. Jindal-Snape considers transitions as multiple and multidimensional (multiple and multidimensional transitions theory), with transitions in one context of an individual’s life (eg, a new job) triggering transitions in other contexts (eg, a home move).4 Research on doctors’ career transitions aligns with this conceptual thinking, identifying such transitional phases as complex and often non-linear.5-10

호이어와 슈타이어트는 커리어의 변화기간에 사람들은 때때로 [일관성]과 [모호함]에 대한 상반된 욕구를 가지고 있다고 제안한다. 여기에는 불안과 상실감이 끼어들고, 개개인은 그러한 감정에 방어적인 반응을 보인다. [경계성 공간]은 이러한 감정에 대응하기 위하여 개인이 머물 수 있는 장소를 나타낸다고 할 수 있다. 실제로 [경계성 공간]은 중요한 다중 전환의 복잡성을 경험하면서 [개인의 성찰과 계획에 안전한 공간]이 될 수 있다. 우리의 종적 사례를 사용하여 이 점을 설명하기 위해, 카렌은 자신의 [경계성 공간]을 컨설턴트로 일했던 초기 경험과 이 새로운 컨설턴트 정체성에 익숙해진 경험을 되새기는데 사용했습니다. 따라서, [경계성 공간]을 점유하는 것은 (연구참여자들이) 자신의 정체성을 발전시킬 수 있는 시간을 가질 수 있게 했다.

Hoyer and Steyaert suggest that during career changes, individuals sometimes have conflicting desires for coherence and ambiguity, which can be punctuated by feelings of anxiety and loss, with individuals developing defensive responses to such feelings.28 We suggest, therefore, that liminal spaces can come to represent places in which individuals can dwell to respond to these feelings. Indeed, liminal spaces can become safe spaces for individuals’ reflection and planning as he or she experience the complexity of significant multiple transitions. To illustrate this point using our longitudinal case, Karen used her liminal space to reflect on her early experiences of being a consultant and getting used to this new consultant identity. Therefore, we argue that occupying of liminal spaces, as our data illustrate, allowed our participants time to make sense of his or her developing identities.

4.1 | 과도기 및 한계성 문헌에 대한 기여
4.1 | Contribution to the literature on transitions and liminality

요약하자면, 이 연구는 수련생으로 전환되는 동안 의사들이 겪었던 종말적 경험을 종적으로 탐구한 최초의 연구입니다. 또한, 우리의 연구 결과는 [경계성 점유]에 대한 개념을 추가하여 경계성에 대한 보다 광범위한 문헌에 새로운 기여를 한다. [점유적 경계성occupying liminality]는 개개인이 새로운 경험을 성찰하고 이해하여 경계적 정체성을 능동적으로 유지할 수 있는 안전한 공간이다.
To summarise, this study is the first of its kind to explore longitudinally the liminal experiences of doctors during trainee-trained transitions. Furthermore, our findings make a novel contribution to the wider literature on liminality23,35 by adding this notion of occupying liminality, whereby individuals actively maintain liminal identities as safe spaces in which to reflect and make sense of new experiences.

4.2 | 방법론적 강점과 한계
4.2 | Methodological strengths and limitations


우리의 연구는 다양한 방법론적 강점을 가지고 있다.

  • 첫째, 우리의 정성적 데이터는 비교적 크고 다양한 표본(예: 성별 및 전문성)에서 방대한 종적 데이터(인터뷰 및 다이어리)를 수집했기 때문에 충분한 정보력을 가지고 있으며, 이는 연구 결과가 다른 영국 의사들에게 전달될 가능성을 증가시킨다.50
  • 둘째, 이 연구의 세로적 성격은 또한 시간이 지남에 따라 참가자들의 독특한 경험을 탐구할 수 있게 해주었습니다. 실제로, 일기는 참가자들이 성찰을 위한 안전한 공간(그리고 어쩌면 그 자체로 한계 공간)을 확보할 수 있는 중심 메커니즘이 되었다. 이는 자신의 전환과 관련된 생각과 느낌을 공유하고 다시 볼 수 있는 영역입니다.
  • 셋째, 다이어리 내에서 수집된 데이터는 현재의 생각과 감정이었고, 따라서 인터뷰, 특히 사건이 발생한 지 오래 후에 수행된 인터뷰에서는 이러한 것들이 자주 있기 때문에 기억에 의해 필터링되지 않았다.
  • 넷째, 출구면접을 포함함으로써 우리는 참가자들과 함께 다이어리로 돌아갈 수 있었고, 그들은 시간이 지남에 따라 경험을 명확히 하고 확장할 수 있었다.
  • 마지막으로, 데이터 분석에 대한 팀 기반 접근방식은 엄격함과 반사성을 장려했다.52 실제로 모든 연구자(LG, CER, DJ-S)가 여성이지만, 우리의 다양한 배경(예: 임상, 심리학, 교육 등)은 분석에 다양성을 가져와서 데이터에 대한 보다 다면적인 해석으로 이어졌다.53

Our study has various methodological strengths.

  • First, our qualitative data have sufficient information power because we collected voluminous longitudinal data (interviews and diaries) from a relatively large and diverse sample (eg, in terms of gender and specialty), which increases the potential transferability of the findings to other UK doctors.50
  • Second, the longitudinal nature of this study also allowed us to explore participants’ unique experiences over time.46,47 Indeed, the diaries became a central mechanism through which participants were able to secure a safe space for reflection (and possibly a liminal space in itself), in which he or she could share (and revisit) his or her thoughts and feelings pertaining to his or her transitions.8
  • Third, the data collected within the diaries were current thoughts and feelings, and therefore were not filtered by memory as these so often are in interviews, particularly those conducted long after events have taken place.46,47
  • Fourth, the inclusion of exit interviews allowed us to return to the diaries with participants, enabling them to clarify and expand on his or her experience over time.46
  • Finally, our team-based approach to data analysis encouraged rigour and reflexivity.52 Indeed, although all of the researchers (LG, CER and DJ-S) are female, our diverse backgrounds (eg, clinical, psychology, education, etc.) meant that we brought diversity to the analysis, leading to a more multifaceted interpretation of the data.53 


4.3 | 교육 실천에 미치는 영향
4.3 | Implications for education practice


우리의 연구 결과는 [의사들이 중요한 커리어 전환 동안 복잡하고 종종 비선형적인 방법으로 경계성을 경험할 것]이라는 것을 인식할 필요가 있음을 강조한다. 따라서 우리의 연구 결과는 이행 중in transition인 개인을 지원하는 개인화된 접근법에 우선순위를 부여할 것을 시사한다.8 실제로, 데이터의 사례 연구는 전환 경험에 대한 공개 토론을 용이하게 하기 위해 학습자와 교육자에게 한계성의 다양한 측면을 설명하는 데 도움이 될 수 있습니다.
Our findings emphasise a need to recognise that doctors will experience liminality in complex and often non-linear ways during significant career transitions. Our findings suggest therefore that priority be given to personalised approaches to supporting individuals in transitions.8 Indeed, case studies from our data could be used for teaching purposes to help explain the different facets of liminality to learners and educators in order to facilitate open discussion about transition experiences. 

따라서 의사들이 경험하고 직업 여정 동안 적극적으로 점유할 수 있는 리미널리티에 대한 준비와 수용도를 높여 수련생과 트레이너 모두 리미너 이전과 수련생이 리미너일 때 모든 우려를 성찰하고 표현하는 기회로 활용해야 한다. 예를 들어 멘토, 동료 및 경험이 풍부한 동료와의 지원 대화를 통해 이를 달성할 수 있습니다.
Increased preparation for and acceptance of the liminality doctors will experience and may actively occupy during his or her career journey should thus be developed amongst trainees and trainers alike and used as an opportunity to reflect on and articulate any concerns before and when trainees are liminars. This could be achieved through, for example, supportive conversations with mentors, peers and more experienced colleagues. 

또한, (이중 또는 임시 역할을 수행하는 경우와 같이) 영구적 경계성 경험에 대한 인식을 개선하면 그러한 영구성과 여러 역할이 수반되는 책임을 관리하는 방법에 대한 멘토링 논의를 용이하게 할 수 있습니다. 복수의 전환에 적응하기 위한 경계성 점유의 가능성도 강조해야 한다. 실제로 [경계성 점유occupying liminality]는 [의료 경력 전반에 걸친 고위험적 전환에 대한 반응]으로써, 조직과 시스템이 인식하고 지원해야 할 사항이다. 더 계획적이고 지지적인 접근법은 의사들이 한계 경험을 긍정적으로 활용하고 동시에 어떤 도전도 헤쳐나갈 수 있도록 해야 한다.

Additionally, better awareness of perpetual liminal experiences (such as when undertaking dual or temporary roles) should facilitate mentorship discussions around how to manage such perpetuity and the responsibilities that come with multiple roles. The possibility of occupying liminality to adapt to multiple transitions shoul d also be emphasised. Indeed, occupying liminality, as a response to high-stakes transitions across medical careers, is something that organisations and systems should recognise and support. A more planned and supportive approach should allow doctors to make positive use of liminal experiences and simultaneously navigate any challenges. 

4.4 | 추가 연구를 위한 의미
4.4 | Implications for further research

 


Med Educ. 2020 Nov;54(11):1006-1018.

 doi: 10.1111/medu.14219. Epub 2020 Jun 23.

Doctors' identity transitions: Choosing to occupy a state of 'betwixt and between'

Lisi Gordon 1 2Charlotte E Rees 2 3Divya Jindal-Snape 4

Affiliations collapse

Affiliations

  • 1Centre for Medical Education, School of Medicine, University of Dundee, Dundee, UK.
  • 2Monash Centre for Scholarship in Health Education (MCSHE), Faculty of Medicine, Nursing and Health Sciences, Monash University, Clayton, Victoria, Australia.
  • 3College of Science, Health, Engineering and Education (SHEE), Murdoch University, Murdoch, Western Australia, Australia.
  • 4Transformative Change: Education and Life Transitions (TCELT) Research Centre, School of Education and Social Work, University of Dundee, Dundee, UK.
  • PMID: 32402133
  • DOI: 10.1111/medu.14219Abstract
  • Context: During transitions, doctors engage in identity work to adapt to changes in multiple domains. Accompanied by this are dynamic 'liminal' phases. Definitions of liminality denote a state of being 'betwixt and between' identities. From a social constructionist perspective, being betwixt and between professional identities may either involve a sense of disrupted self, requiring identity work to move through and out of being betwixt and between (ie, temporary liminality), or refer to the experiences of temporary workers (eg, locum doctors) or those in dual roles (eg, clinician-managers) who find themselves perpetually betwixt and between professional identities (ie, perpetual liminality) and use identity work to make themselves contextually relevant. In the health care literature, liminality is conceptualised as a linear process, but this does not align with current notions of transitions that are depicted as multiple, complex and non-linear.Results: All participants experienced liminality. Our analysis enabled us to identify temporary and perpetual liminal experiences. Furthermore, fine-grained analysis of participants' identity talk enabled us to identify points in participants' journeys at which he or she rejected identity grants associated with his or her trained status and instead preferred to remain in and thus occupy liminality (ie, neither trainee nor trained doctor).
  • Conclusions: This paper is the first to explore longitudinally doctors' liminal experiences through trainee-to-trained transitions. Our findings also make conceptual contributions to the health care literature, as well as the wider interdisciplinary liminality literature, by adding further layers to conceptualisations and introducing the notion of occupying liminality.
  • Methods: We undertook a longitudinal narrative inquiry study using audio-diaries to explore how doctors experience liminality during trainee-to-trained transitions. In three phases, we: (a) interviewed 20 doctors about his or her trainee-to-trained transitions; (b) collected longitudinal audio-diaries from 17 doctors for 6-9 months, and (c) undertook exit interviews with these 17 doctors. Data were analysed thematically, both cross-sectionally and longitudinally, using identity work theory as an analytical lens.

 

+ Recent posts